Vous êtes sur la page 1sur 8

ECONOMETRIE I

LE MODELE LINEAIRE
SIMPLE
CHAPITRE III: LA REGRESSION LINEAIRE SIMPLE ET L’ANALYSE DE LA
VARIANCE
Un des objectifs d’une étude de régression est de déterminer dans quelle mesure la droite de
régression permet d’expliquer les variations existantes dans les observations Yi.
Cette approche nous permet :
 de quantifier la qualité de la régression (1) et
 de présenter une autre façon de tester si la régression est significative (2)
Les mesures de la qualité de la régression : la
variance résiduelle
L’indicateur de dispersion le plus utilisé est la variance ou sa racine carrée, l’écart-type.
Ainsi, sur un échantillon, on peut calculer la variance de la variable expliquée Y et son écart-type.
Dans la mesure où on suppose une relation de cause à effet entre X et Y, une part de la dispersion des Y
est logiquement imputable à cette liaison. Il semble alors naturel de calculer une variance qui prenne
comme référence la valeur calculée dans la régression à la place de la moyenne . La variance ainsi
définie est dite variance résiduelle et notée :

On reconnait là, au facteur 1/n près la critère que l’on minimise par la méthode des MCO.
Par ailleurs, l’appellation variance est parfaitement justifiée puisque la moyenne des écarts étant nulle on
a bien :
Les mesures de la qualité de la régression :
variances totale, résiduelle et expliquée
On peut vouloir comparer la variance résiduelle à la variance des Y, que nous appellerons variance
totale, pour éviter toute confusion.
On peut également définir la variance expliquée comme la variance des

Il s’agit bien d’une variance également puisqu’on démontre que


(= 0 donc )
On montre l’égalité:
VARIANCE TOTALE = VARIANCE EXPLIQUEE + VARIANCE RESIDUELLE (1)
Les mesures de la qualité de la régression :
équation fondamentale d’analyse de la variance

SCT = SCE + SCR


Les mesures de la qualité de la régression :
coefficients de détermination et de corrélation
 Coefficient de détermination :
R²= r²== avec 0 ≤ R² ≤ 1
Interprétation : le modèle retenu explique R²% de la dispersion observée des Y
 Coefficient de corrélation :
Il s’agit de la racine carrée de r². Il est compris entre -1 et +1 et est toujolurs supérieur au
coefficient de détermination.
Il n’est pas nécessaire de connaître les valeurs de prises théoriquement par la variable Y dans
la régression pour obtenir le coefficient de corrélation puisque
r=
Significativité de la régression
Tableau d’analyse de la variance
Les ddl correspondent au nombre de valeurs que nous pouvons choisir arbitrairement ou encore au nombre de
variables indépendantes nécessaires à la détermination de la somme des carrés. Ainsi,
a) Variation totale : il y a n écarts (yi-mais ils ne sont pas tous indépendants. Il existe une contrainte , il y a par
conséquent n-1 ddl dans les n écarts
b) Variation résiduelle : il y a n écarts ( (ou n résidus) mais on perd deux degrés de libertés en raison des deux
contraintes (équations normales) : , donc n-2 ddl
c)Variation expliquée par la régression : le calcul des écarts fait intervenir la droite de régression qui comporte deux
ddl. Mais les écarts étant soumis à la contrainte =0. SCE n’a qu’un ddl

SOURCE DE SOMME DES DEGRE DE CARRES MOYENS


VARIATION CARRES LIBERTE
X SCE 1 SCE/1
Résidu SCR n-2 SCR/n-2
Total SCT n-1 *****
Significativité de la régression
Test d’analyse de la variance : H0 :

 On a : ⤳ et ⤳ indépendamment de b1
Et on sait que le rapport de deux khi2 indépendants divisés par leur degré de liberté suit une loi
de Fisher, donc :
⤳ F(1, n-2)
Sous H0 : F*= =
On rejette H0 avec 5% de risque si F* = >
Où est la valeur de F ayant une probabilité de 5% d’être dépassée

Vous aimerez peut-être aussi