Académique Documents
Professionnel Documents
Culture Documents
LE MODELE LINEAIRE
SIMPLE
CHAPITRE III: LA REGRESSION LINEAIRE SIMPLE ET L’ANALYSE DE LA
VARIANCE
Un des objectifs d’une étude de régression est de déterminer dans quelle mesure la droite de
régression permet d’expliquer les variations existantes dans les observations Yi.
Cette approche nous permet :
de quantifier la qualité de la régression (1) et
de présenter une autre façon de tester si la régression est significative (2)
Les mesures de la qualité de la régression : la
variance résiduelle
L’indicateur de dispersion le plus utilisé est la variance ou sa racine carrée, l’écart-type.
Ainsi, sur un échantillon, on peut calculer la variance de la variable expliquée Y et son écart-type.
Dans la mesure où on suppose une relation de cause à effet entre X et Y, une part de la dispersion des Y
est logiquement imputable à cette liaison. Il semble alors naturel de calculer une variance qui prenne
comme référence la valeur calculée dans la régression à la place de la moyenne . La variance ainsi
définie est dite variance résiduelle et notée :
On reconnait là, au facteur 1/n près la critère que l’on minimise par la méthode des MCO.
Par ailleurs, l’appellation variance est parfaitement justifiée puisque la moyenne des écarts étant nulle on
a bien :
Les mesures de la qualité de la régression :
variances totale, résiduelle et expliquée
On peut vouloir comparer la variance résiduelle à la variance des Y, que nous appellerons variance
totale, pour éviter toute confusion.
On peut également définir la variance expliquée comme la variance des
On a : ⤳ et ⤳ indépendamment de b1
Et on sait que le rapport de deux khi2 indépendants divisés par leur degré de liberté suit une loi
de Fisher, donc :
⤳ F(1, n-2)
Sous H0 : F*= =
On rejette H0 avec 5% de risque si F* = >
Où est la valeur de F ayant une probabilité de 5% d’être dépassée