Académique Documents
Professionnel Documents
Culture Documents
𝑌 = 𝑋𝛽 + 𝜀
où
Remarque :
𝑠
Remarque : Nous pouvons remarquer que le dénominateur est un estimateur
√∑𝑛
𝑖=1(𝑥𝑖 −𝑥̅ 𝑛 )
2
̂𝟏 ), l’écart-type de 𝜷
de √𝕧(𝜷 ̂𝟏 .
Nous utilisons la statistique suivante :
4. Coefficient de détermination
5. Prévision d’une valeur ultérieure
Nous désirons prévoir à l’aide du modèle la valeur de la variable y pour une valeur non
observée 𝑥0 de x.
Nous pouvons noter que 𝑦0 est une variable aléatoire et non un paramètre. L’intervalle de
prédiction est donc un intervalle dans lequel une future observation 𝑦0 va tomber avec une
certaine probabilité.
Nous en déduisons l’intervalle de prédiction pour 𝑦0 au niveau de confiance 1 − 𝛼 suivant :
Remarque : La variance de l’erreur de prévision dépend
Exemple : Nous cherchons à modéliser la relation en poids des bébés à la naissance et l’âge,
le poids et le statut tabagique de la mère durant la grossesse. Nous posons
- Y= poids à la naissance en grammes (bwt)
- 𝑋1= age de la mère (age)
- 𝑋2= poids de la mère en kilos (weight)
- 𝑋3= statut tabagique de la mère pendant la grosse (smoke) codée en 1=oui et 0=non.
Nous supposons que cette relation est linéaire de la forme :
𝑦 = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑥2 + 𝛽3 𝑥3
Nous utilisons un échantillon de n=1174 naissances pour lesquelles le poids du bébé, l’age, le
poids et le statut tabagique de la mère, ont été observés.
Nous pouvons également écrire le modèle (2) de la manière suivante :
𝑌 = 𝑋𝛽 + 𝜀
Où
2. Estimation des paramètres 𝜷𝟎 , 𝜷𝟏 , …, 𝜷𝒑 et 𝝈𝟐
A partir d’un échantillon (aléatoire) de n observations {(𝑥𝑖1 , 𝑥𝑖2 , … , 𝑥𝑖𝑝 , 𝑦𝑖 ), 𝑖 = 1,2, … , 𝑛},
nous voulons estimer les paramètres 𝜷𝟎 , 𝜷𝟏 , … , 𝜷𝑝 , et 𝝈𝟐 .
Pour estimer les paramètres 𝛽 = (𝜷𝟎 , 𝜷𝟏 , … , 𝜷𝑝 ), nous pouvons utiliser la méthode des
moindres carrés qui ne nécessite pas d’hypothèses supplémentaires sur la distribution de 𝜀𝑖
(ou 𝑦𝑖 ), contrairement à la méthode du maximum de vraisemblance qui est fondée sur
l’hypothèse de normalité de de 𝜀𝑖 (ou 𝑦𝑖 ).
La méthode des moindres carrés ne fournit pas l’estimateur de 𝝈𝟐 .
Cette écriture du tableau est dite désempilée., Nous pouvons l’écrire sous forme standard (empilée),
c’est-à-dire avec deux colonnes, une pour le laboratoire et une pour la valeur de la teneur en sodium
de lasalocide mesurée, et trente lignes pour chacune des observations réalisées.
Définition : Sur chaque essai, on observe deux variables.
a. Le laboratoire. Il est totalement contrôlé. La variable "Laboratoire" qualitative avec trois
modalités bien déterminées : A, B, et C. Nous l’appelons le facteur. Ici, le facteur
"Laboratoire" est à effets fixes.
b. La quantité de sodium de lasalocide. La variable "Lasalocide" est considérée comme
quantitative comme généralement tous les résultats obtenus par une mesure. Nous
l’appelons la variable réponse.
La variable mesurée dans un tel schéma expérimental sera notée Y. Pour les observations,
nous utilisons deux indices :
1. Le premier indice indique le numéro du groupe dans la population ("Laboratoire");
2. Le second indice indique le numéro de l’observation dans l’échantillon ("Essai"). Pour
le premier indice, nous utiliserons en général l’indice i. Pour le second indice, nous
utiliserons en général l’indice j. Ainsi, les observations seront notées en général :
𝑦𝑖,𝑗 𝑖 = 1,··· , 𝐼 ; 𝑗 = 1,··· , 𝐽(𝐼).
Définition : Lorsque les échantillons sont de même taille, à savoir J(i) = I et ce, quel que soit i,
nous disons alors que l’expérience est équilibrée.
Objectif :
ANOVA : Pour étudier l'effet des variables qualitatives sur une variable quantitative
Terminologie
• Facteur (variable qualitative) : prend un nombre ni de valeurs,
• Une valeur = une classe. Exemple : facteur " Engrais"
• Niveau (ou population) : les différentes valeurs prises par un facteur. Ex : niveaux A, B,
C
• Test de l'effet d'un facteur : tester si les moyennes des populations sont égales.
• La variable étudiée : Y, a valeurs numériques (note).
1.3. Modèle
a- PREMIER MODELE
1.4. Estimation des paramètres
b- Le deuxième modèle
Variabilité et signicativité
Tableau d'Analyse de la Variance (ANOVA)
La plupart des logiciels de statistiques présentent leurs sorties d'ANOVA de la manière
suivante :
Référence bibliographique