Explorer les Livres électroniques
Catégories
Explorer les Livres audio
Catégories
Explorer les Magazines
Catégories
Explorer les Documents
Catégories
qui vont…
- De l’infini petit
À l’infiniment grand
- Du plus quotidien
Au plus technologique
- Du plus ouvert
Au plus sécuritaire
- Du plus industriel
Au plus théorique
- et du plus alimentaire
Au plus divertissant
Introduction
A cette simple énumération, on devine que le
spectre des applications du data mining et de la
statistique est très large…
…on souhaite par exemple trouver des règles recelées dans les
masses de données dont on dispose sur les anciens souches
bactériennes, afin de les appliquer à de nouvelles souches
bactériennes et prendre les meilleures décisions possibles.
La régression linéaire
Regression to the mean
Modélisation statistique
Lorsque nous ajustons par une droite les données, nous
supposons implicitement qu’elles étaient de la forme.
Y = β1 + β2X.
Modélisation statistique
Modélisation statistique
Nous supposons alors que la concentration d’ozone dépend
linéairement de la température mais cette liaison est perturbée
par un « bruit ». Nous supposons en fait que les données
suivent le modèle suivant :
Y = β1 + β2X + ε. (1.2)
yi = β1 + β2xi + εi, i = 1, · · · , n
Modélisation statistique
Modélisation statistique
Où
– les xi sont des valeurs connues non aléatoires ;
– les paramètres βj, j = 1,2 du modèle sont inconnus ;
– les εi sont les réalisations inconnues d’une variable aléatoire ;
– les yi sont les observations d’une variable aléatoire.
Estimateurs des moindres carrés
yi = β1 + β2xi + εi, i = 1, · · · , n
Estimateurs des moindres carrés