Académique Documents
Professionnel Documents
Culture Documents
Emmanuel Flachaire
conomtrie Applique
Le modle de rgression
Le modle de rgression est l'outil principal de l'conomtre Qu'est ce que l'analyse de rgression ? L'analyse de rgression est l'tude de la relation entre une variable dpendante ( ) et une ou plusieurs autres variables
k
Dans le cas d'une rgression simple, nous nous limitons au cas d'une seule variable explicative ( ). Il est alors possible de reprsenter graphiquement le nuage de points des donnes observes.
Emmanuel Flachaire
conomtrie Applique
La relation entre les 2 variables peut tre exprime par une droite
Emmanuel Flachaire
conomtrie Applique
Dans cet exemple, l'quation d'une droite permet d'exprimer la relation entre les deux variables :
y =+x
Nanmoins, tous les points ne passent pas par cette droite On introduit un terme d'erreur dans la relation :
y =+x +
est un terme alatoire ayant des proprits statistiques La relation n'est plus dterministe, elle devient stochastique, les coecients
et
Emmanuel Flachaire
conomtrie Applique
y =+x +
L'analyse de rgression comporte deux aspects essentiels :
et
dans le nuage de points Infrence : l'infrence consiste dterminer dans quelle mesure les valeurs estimes de adquat
et
Emmanuel Flachaire
conomtrie Applique
et
et
Emmanuel Flachaire
conomtrie Applique
La mthode des Moindres Carrs Ordinaires (MCO) est la plus couramment employes pour trouver la droite qui passe au mieux dans un nuage de points On mesure les carts de chaque points la droite (en vertical), que l'on lve au carr pour obtenir une distance. La mthode des MCO consiste minimiser la somme de ces distances Notation:
yi est la i
me
est le rsidu, yi
Emmanuel Flachaire
conomtrie Applique
Emmanuel Flachaire
conomtrie Applique
Pour un chantillon de
2 + 2 + 2 + 2 + 2 + + 2 , 1 2 3 4 5
n
2 =1 i , la y
Qu'est ce que
i
Autrement dit: Minimiser est quivalent Minimiser ou encore Minimiser SCR par rapport
n i n i
=1 (i
y )2
i
= 1 i
et
Emmanuel Flachaire
conomtrie Applique
et
et
2. on pose la drive de cette fonction p/r 3. on pose la drive de cette fonction p/r
gale 0 gale 0
4. on rsoud ce systme de 2 quations 2 inconnues Les valeurs qui rsolvent ce systme de 2 quations 2 inconnues, nots
et
Emmanuel Flachaire
conomtrie Applique
1.
Sachant que
=y + =+x + ,
i i i i
on a :
SCR
2.
=
i
(y x )2
i i
=1
est gale :
SCR = 2
3.
(y x ) = 0
i i
=1
est gale :
SCR = 2
x (y
i
x )=0
i
=1
Emmanuel Flachaire
conomtrie Applique
4.
SCR / = 0 SCR / = 0
Comme
et
y n x y x
i i i
=0
x2 = 0
i
= ny
= nx ,
y x =0
On peut ensuite remplacer
=y x y x :
xy
i
( x ) nx y
x2 = 0
i
et
x.
Emmanuel Flachaire
conomtrie Applique
xy
i
( x ) nx y ny x + nx 2
i i
x2 = 0
i
xy
i
x2 = 0
i
On montre
i
x 2 nx 2
xy
i
ny x
i
x 2 nx = nVar (x ) et
xy
i
ny x = nCov (x , y ).1
Par consquent, on a :
y =+x +
Les estimateurs MCO des paramtres sont :
Cov (x , y ) Var (x )
et
=y x
(1)
Sur la base d'un chantillon de valeurs observes, les paramtres estims par MCO de la droite de rgression sont obtenus en appliquant ces formules.
Emmanuel Flachaire
conomtrie Applique
y =+x +
L'estimation par MCO fournit les rsultats suivants :
y =+x
1. Le coecient unit,
y augmente de units
x x
augmente de 1
est gal 0,
Emmanuel Flachaire
conomtrie Applique
y =+x +
Si on applique une esprance conditionnelle
(2)
aux 2 termes, on a :
E (y |x ) = E ( + x + |x ) = + x + E (|x )
Si
E (y |x ) = + x = y
Emmanuel Flachaire conomtrie Applique
y =+x +
y =+x
1. Si
E (y |x ) = + x E (y |x ) = + x
x augmente de 1 unit, y augmente de units Si x augmente de 1 unit, y augmente en moyenne de units Si x augmente de 1 unit, l'augmentation espere de y est
Si
2. Si
x x
Emmanuel Flachaire
conomtrie Applique
Emmanuel Flachaire
conomtrie Applique
Soit un chantillon sur le salaire horaire en euros ( ) et le nombre d'anne d'tudes au del du baccalaurat ( ) d'un grand nombre de personnes ayant le bac. Les rsultats de l'estimation par MCO d'un modle de rgression linaire sont les suivants :
y = 9.74 + 1.25 x
1.
augmente en moyenne de 1.25 euros 2. : le salaire horaire moyen des individus ayant juste le bac est
Emmanuel Flachaire
conomtrie Applique
suivants :
y = 0.24 + 1.64 x
1.
nul, celui du titre IBM est en moyenne de -0.24. Si un analyste nancier s'attend ce que l'an prochain le march donne un rendement 20% plus lev que pour un placement sans risque, vous pouvez lui dire que le rendement espr du titre IBM serait pour sa part 32.8% plus lev (=100*[1.64*0.2]) .
c'est la dirence entre le taux de rendement du titre IBM et celui obtenu avec un placement sans risque
Emmanuel Flachaire conomtrie Applique
y =+x +
On suppose que le processus qui a gnr les donnes (PGD) est
y = 0 + 0 x +
o
et
y =+x +
Autrement dit, Question:
et
et
et
sont-elles de bonnes
et
Emmanuel Flachaire
conomtrie Applique
Question:
et
sont-elles de bonnes
et
Pour rpondre cette question, il faut tudier 1. les proprits des estimateurs MCO Gauss-Markov 2. la prcision des estimateurs MCO 3. laabilit des estimateurs MCO
thorme de
carts-type
infrence statistique
Emmanuel Flachaire
conomtrie Applique
y
Le terme d'erreur
=+x +
i
E ( ) = 0 : la moyenne des erreurs est nulle Var ( ) = : la variance des erreurs est constante Cov ( , ) = 0 : les erreurs sont satistiquement indpendantes Cov ( , x ) = 0 : pas de relation entre l'erreur et le rgresseur3
i i i j i i
et
les
Best : ce sont les estimateurs qui ont la plus petite variance, parmi la classe des estimateurs sans biais Linear : ils sont linaires par rapport Unbiased : en moyenne, les valeurs de vraies valeurs Estimator : et
y
et
0 et 0 et sont des
Autrement dit, il n'existe pas d'autres estimateurs sans biais qui soient plus prcis que ceux des MCO
Emmanuel Flachaire
conomtrie Applique
n augmente l'inni
lim Pr
n
| 0 | > = 0
> 0
C'est une hypothse de validit, sinon l'estimateur est inutile 2. Sans biais : convergence 3. Ecients : un estimateur est ecient s'il est sans biais et de variance minimale estime
= 0 ,
est minimise
Emmanuel Flachaire
conomtrie Applique
et
avec un chantillon dirent on obtient des valeurs direntes 2. Une mesure de leur prcision est indispensable : sans elle, aucune conclusion ne peut etre tire 3. La prcision d'une valeur estime est donne par son cart-type 4. L'cart-type indique quelle est, en moyenne, la distance entre les valeurs estimes
et la vraie valeur
Emmanuel Flachaire
conomtrie Applique
IID (0, 2 )
et
=y x
2 = 2
et
2 = 2
nVar (x )
Emmanuel Flachaire
conomtrie Applique
2 = Var () = E ( E ())2 = E 2
Elle peut etre estime par la moyenne des
2
i
2. La moyenne des carrs des rsidus est un estimateur convergent de cette variance :
2 =
n
1
2 =
i
SCR n SCR n2
2 =
4
n2
i
2 =
i
est un estimateur convergent de qui lui, est inobservable Emmanuel Flachaire conomtrie Applique
i
y =+x +
paramtres sont
IID (0, 2 )
(4)
et
=y x
et
nVar (x )
Emmanuel Flachaire
conomtrie Applique
x2 n2 Var (x )
i
et
nVar (x )
n est grand la taille de l'chantillon est leve Var (x ) est grand les valeurs de x
est petit sont disperses
Emmanuel Flachaire
conomtrie Applique
L'estimateur est d'autant plus prcis que autrement dit les valeurs de
sont disperses
Emmanuel Flachaire
conomtrie Applique
L'estimateur est d'autant plus prcis que les rsidus sont peu disperses
Emmanuel Flachaire
conomtrie Applique
y =+x +
sont habituellement prsents comme suit :
y = 0.5912 +
(0.034)
ou encore
(0.011)
0.35
y = 0.5912 +
(0.034)
(0.011)
0.35
x +
Emmanuel Flachaire
conomtrie Applique
L'infrence statistique
Emmanuel Flachaire
conomtrie Applique