Vous êtes sur la page 1sur 16

Exercices de travaux dirigs

Cours dconomtrie
Matrise dconomtrie
September 21, 2004

Le modle linaire - Rendements dune fonction de


production Cobb-Douglas

Prsentation du problme: On considre la fonction de production suivante deux


facteurs, le travail L et le capital K, correspondant une technologie de type Cobb-Douglas:
Y (L, K) = AL K

(1)

o et sont des rels compris entre 0 et 1.


Soit un chantillon {(yi , i , ki ) , i = 1, ..., n} dobservations indpendantes de logarithmes
doutputs et dinputs de n entreprises. On suppose que
yi = a + li + ki + ui ,

(2)

o les ui sont iid et normaux desprance nulle et de variance 2 . On supposera de plus ui


orthogonal li et ki .
Donnes
numriques : n = 1000
P
Pi i = 500
Pi ki = 490
Pi y2i = 1490
Pi i2 = 330
Pi ki2 = 320
Pi yi = 3200
Pi i yi = 800
i ki yi = 770
Questions:

1. Justifier lquation (2). Interprter en particulier le sens de la variable ui . Le fait de la


traiter comme une variable alatoire signifie-t-il que la valeur de ui est le produit du
hasard pour lentreprise i?
1

2. Ecrire le modle (2) sous la forme matricielle suivante :


(3)

y = Xb + u,

o y, X, b et u sont des matrices que lon dterminera et dont on indiquera les


dimensions.
b de b en fonction de y et de X.
3. Donner lexpression de lestimateur des MCO b

4. Estimation des coecients: Dans cette question, on cherche estimer les coeb et b
cients
b,
a. On centre les variables du problme. Pour cela, on dfinit :
yei = yi y,

ei =

et e
ki = ki k,

o y, et k sont les moyennes arithmtiques de yi ,

et ki dans lchantillon.

e
e
(a) Dduire du modle (2) le modle des variables yei , i , ki .
i

(b) Lcrire sous forme matricielle :

e+u
eb
e=X
e.
y

(4)

e et X.
e
Prcisez les dimensions de b

(c) On fait lhypothse :

X
i

eie
ki =

X
i

( i )(ki k) = 0.

(5)

Interprter cette hypothse.


e 0X
e , ainsi que son inverse, sachant que lhypothse (5) est
(d) Calculer la matrice X
vrifie. En dduire lestimateur des MCO des coecients de la rgression de yei
sur ei et e
ki sans constante.

(e) En dduire, par lapplication du thorme de rgression partitionne, lestimateur


des MCO des coecients de la rgression de yi sur i et ki avec constante.
(f) Application numrique.

b
5. Significativit des coecients: On teste ici la significativit de
b et .
b et y Xb.
b
(a) Ecrire lquation dorthogonalit entre Xb

(b) Donner lexpression de la somme des carrs des rsidus, SCR, en fonction de yi ,
b En dduire lexpression de lestimateur
y, i , , ki , k,
b et .
b2 . Application
numrique.
(c) Donner lexpression de
b2e et
b2e en fonction de
b2 , i , , ki et k. Application
numrique.
b 10% et 5% prs. Conclusion?
(d) Tester la significativit de
b et de
2

6. Test de lhypothse de rendements constants: On teste lhypothse nulle suivante


(H0 ) : + = 1
Contre lalternative :
(Ha ) : + 6= 1
(a) Ecrire le modle contraint associ H0 , modle dans lequel nintervient plus.
Quelles sont les variables dpendantes et indpendantes de ce nouveau problme?
(b) Calculer la somme des carrs des rsidus du modle contraint SCRc . Application
numrique : On vrifiera que c ' 0.594.
(c) Calculer alors la statistique de Fischer associe au test de rendements constants.
Tester H0 5% prs. Conclusion ?

Thorie asymptotique des MCO

2.1

Lancer dune pice de monnaie pipe

On lance un grand nombre de fois une pice de monnaie dsquilibre, dont la probabilit
dobtenir "face" est gale [0, 1].
1. On modlise le problme par le modle suivant:
y = + ,
o y est la ralisation du lancer (y = 0 si "pile", y = 1 si "face"), et est desprance
nulle.
Que vaut le scalaire ? Dessiner la fonction de rpartition de . Sa loi est-elle normale?
Prciser les hypothses ("naturelles") que
2. Calculer lestimateur des MCO de : .
vous faites sur les rsidus.
Vers quelle valeur converge lorsque le nombre de lancers tend vers +?
3. Donner lexpression de la variance de en fonction de .
4. Dduire de la question prcdente la densit asymptotique de (NB: on pourra noter
n le nombre de lancers).

2.2

Inclusion et oubli de variables non pertinentes

On dispose dun chantillon {(yi , x1i , x2i ) , i = 1, ..., n} dobservations indpendantes.


1. On suppose tout dabord que le modle de yi sachant x1i , x2i est
yi = + 1 x1i + ui ,

(6)

avec E (ui |x1i , x2i ) = 0. On cherche mesurer les consquences de lintroduction dune
seconde variable explicative, x2i .
b1 et
b2 des coecients de x1i et x2i dans la
(a) Calculer les estimateurs des MCO
rgression de yi sur x1i et x2i .
b est asymptotiquement quivalent lestimateur des MCO de
(b) Montrer que
1
la rgression de yi sur x1i sans x2i . Ces deux estimateurs sont-ils pour autant
identiques?
2. On suppose maintenant que le vrai modle est
yi = + 1 x1i + 2 x2i + vi

(7)

avec E (vi |x1i , x2i ) = 0.


(a) Poser ui = 2 x2i + vi et calculer E (ui |x1i , x2i ). A quelle condition E (ui |x1i , x2i ) =
0?
4

(b) On suppose dabord que x1 et x2 sont orthogonaux (cov(x1 , x2 ) = 0). Montrer


que lestimateur des MCO du coecient de x1i dans la rgression de yi sur x1i
sans x2i est convergent mais moins ecace (asymptotiquement moins prcis) que
lestimateur des MCO du coecient de x1i dans la rgression de yi sur x1i et x2i .
(c) Si x1 et x2 sont corrls, montrer que lestimateur des MCO du coecient de x1i
dans la rgression de yi sur x1i sans x2i est non convergent (asymptotiquement
biais).

2.3

Test dgalit de deux moyennes

On cherche tester linfluence du sexe sur le salaire. Soit {w1i , i = 1, ..., T1 } un chantillon
de salaires dhommes et {w2i , i = 1, ..., n2 } un chantillon de salaires de femmes. On suppose
les observations iid. Pour cela, on divise le panel en deux sous-chantillons, femmes (1, taille
n1 ) et hommes (2, taille n2 ). On considre alors les deux modles suivants
Le modle non contraint scrit :
w1i = 1 + u1i ,

Eu1i = 0,

w2i = 2 + u2i ,

Eu2i = 0,

o 1 et 2 ne sont pas supposs gaux a priori.


Le modle contraint impose lgalit des coecients 1 et 2 :
H0 : 1 = 2 .
Donnes numriques: n1 = 32728
n2 = 35144
P
8
Pi w1i = 2.11 10 8
= 2.865 10
Pi w2i
2
= 1.66 1012
Pi w1i
2
12
i w2i = 2.84 10
b1 = 916
b2 = 1266
Questions:

1. On empile les deux chantillons pour former lchantillon {wi , i = 1, ..., n} o n =


n1 + n2 et

w , i = 1, ..., n1 ,
wi = 1i
w2i , i = n1 + 1, ..., n,
(a) Ecrire le modle de wi sous la forme:

wi = 1 Si + 2 (1 Si ) + ui ,
o lon prcisera Si et ui .
5

i = 1, ..., n

(8)

(b) Comment sinterprtent les variables Si et 1 Si et combien vaut E (ui |Si )?

(c) Montrer que lestimateur des MCO de 1 (resp. de 2 ) dans la rgression de wi


sur Si et 1 Si est identique lestimateur des MCO de 1 dans la rgression de
w1i (resp. de w2i ) sur la constante 1. Expliciter
b 1 et
b2.

2. Le test distance finie (rappels de licence).


(8) sont iid et normaux, de variance Vui = 2 .

On suppose les rsidus du modle

(a) Lhypothse Vui = 2 pour tout i = 1, ..., n vous parat-elle discutable?


(b) Ecrire le modle non contraint sous forme matricielle.
(c) Montrer que la somme des carrs des rsidus non contraints SCRnc scrit trs
simplement en fonction des sommes des carrs des rsidus u1 et u2 . La calculer.
nc
Montrer de plus que SCR
suit un 2 dont on prcisera le nombre de degrs de
2
libert.
(d) Montrer que, sous lhypothse dabsence de changement structurel que lon prcisera, lestimateur (b
1 ,
b 2 ) suit une loi normale dont on calculera la moyenne et
la variance.

(e) Exprimer la dirence SCRc SCRnc en fonction de n1 , n2 , et de la dirence

b1
b2.
(f) En dduire que cette quantit, convenablement normalise, suit un 2 un degr
de libert. Interprter.

(g) Calculer la statistique de Fischer associ au problme. Tester 5% lgalit entre


1 et 2 . Conclusion?
3. Le test asymptotique.
ceux-ci restant iid.

On abandonne ici lhypothse de normalit des rsidus,

(a) Calculer lestimateur des MCO de 1 2 .

(b) Sous quelle


quant au comportement asymptotique de la statistique
Pn hypothse
n1
1
S = n i=1 Si = n cet estimateur est-il convergent? Interprter.
(c) Sous ces hypothses, montrer que

L
n\
1 2 N
n

0,

2
p (1 p)

o p = ESi .
Pour cela, montrer successivement que:
P

i. S p.
n

2
P
2 P
ii. n1 ni=1 Si S = S S p (1 p) .
n

1 Pn
L
iii. n n i=1 Si S (ui u) N (0, 2 p (1 p)) .
n

(d) Comment estimer la variance asymptotique de \


1 2 , Vas \
1 2 ?

(e) Tester alors labsence de changement structurel, 5%, laide dun test de Student
(asymptotique).

Le Modle Htroscdastique

3.1

Test dgalit de deux moyennes (suite de (2.3))

On suppose mantenant que Vu1i = 21 et Vu2i = 22 avec 1 et 2 quelconques. On estime


1 et 2 sparment sur les chantillons de filles et de garons.
1. Montrer que
b 1 et
b 2 sont deux variables alatoires indpendantes et que

L
n1 (b
1 1 ) N 0, 21 ,
n1

L
n2 (b
2 2 ) N 0, 22 .
n2

2. Montrer de plus que

b21

n1
1 X
P
=
(w1i
b 1 )2 21 ,
n

n1 i=1
1

b22 =

n1
1 X
P
(w12
b 2 )2 22 .
n2
n2 i=1

3. On suppose que n1 /n2 k 6= 0 lorsque n1 .


(a) Montrer que

L
n1 (b
1
b 2 ) N 0, 21 + k 22 .
n1

(b) En dduire que

b1
b2
L
T =q 2
N (0, 1)

e1

e22 n1
+ n2
n1

sous lhypothse nulle H0 : 1 = 2 .


(c) Vrifier que

si 1 = 2 = .

b2 P

b21
2
+ 2
n1 n2 n1 np (1 p)

4. On suppose que n1 et n1 /n2 k = 0.


(a) Interprter.
(b) Montrer que

b1
b2

e21
n1

N (0, 1).

n1

3.2

Un test de Goldfeld-Quandt

Dans cet exercice, on cherche quantifier linfluence du diplme sur le salaire. On considrera
donc le modle linaire suivant :
wi = xi + + ui
O xi repre le niveau dducation de lindividu i. On supposera les rsidus ui inid et
orthogonaux aux variables explicatives.
On teste lhtroscdasticit des rsidus en divisant lchantillon en deux sous-chantillons
I1 et I2 correspondant aux "non-diplms" (niveau infrieur au bac) et aux "diplms" (au
moins le bac). On retire ensuite de ces deux sous-chantillons une proportion des individus
telle que tous deux aient la mme taille. On calcule ensuite les sommes des rsidus des deux
sous-modles, soit SR1 et SR2 .
2
suit, sous lhypothse dhomoscdasticit, une loi de Fisher dont on
1. Montrer que SR
SR1
prcisera le nombre de degrs de libert.

2. Tester lhypothse dhomoscdasticit aux niveaux 1%, 5% et 10%. Quen dduire ?


3. On considre alors le modle :
ln(wi ) = xi + + ui .

(9)

Justifier la forme choisie: pourquoi utilise-t-on le logarithme?


4. Tester lhypothse dhomoscdasticit sur ce modle. Conclusion ?

3.3

Utilisation tort des MCO

On value lerreur qui est faite lorsque lon estime un modle linaire htroscdastique par
les MCO.
On considre le modle htroscdastique :
yi = a + bxi + ui ,

(10)

o la matrice de variance-covariance des ui est diagonale, gale 2 diag( 1 , ..., n ). On


suppose que les poids j sont positifs, et somment 1.
1. Calculer bMCO . Est-il sans biais? Convergent?
2. Mmes questions pour bMCP , lestimateurs des Moindres Carrs Pondrs du paramtre
b.
3. Calculer les variances de bMCO et bMCP .
4. Montrer que bMCP est plus prcis.
5. On calcule un estimateur de la variance de bMCP par la mthode des MCP. Montrer
que cet estimateur nest pas biais.
6. On calcule maintenant un estimateur de la variance de bMCO par les MCO. Montrer
que cet estimateur est biais. Dans quelle direction?
9

3.4

Observations Groupes

Soit un chantillon dobservations iid {(yi , di ), i = 1, ..., N }, avec yi R et di {1, ..., J}.
La variable di est une variable discrte qui indique un groupe social dappartenance de
lindividu i (les diplms par opposition aux non diplms, direntes PCS, etc.). Chaque
groupe social j {1, ..., J } est caractris par un vecteur de constantes zj RK (revenu
moyen, ge moyen, etc.). Pour tout j {1, ..., J}, on note Nj le nombre dindividus i dans
le groupe j et y j la moyenne de yi dans le groupe j. Enfin, ji = 1 {di = j} dnote la variable
indiquant si le groupe dappartenance est le groupe j ( ji = 1 si di = j, = 0 sinon).
b = (
b1 , ...,
bJ )0 lestimateur des MCO de la rgression de yi sur le vecteur xi =
1. Soit
1
J 0
( i , ..., i ) .
(a) Remplacer les ? dans les deux quations suivantes par lexpression approprie:
Nj

N
X
=
?
i=1

yj =

PN

Pi=1
N

?yi

i=1 ?

(b) Interprtez gomtriquent le systme des quations normales dfinissant lestimateur


des MCO:
N

X
b = 0.
xi yi x0i
i=1

bj = y j .
(c) Dduire des quations normales que

2. On considre maintenant le modle de rgression linaire suivant:

o zdi =

PJ

yi = a + zd0 i b + ui

j
j=1 zj i

(11)

et avec E (ui |di ) = 0 et V (ui |di ) = 2 .

(a) Montrer que les quations normales dfinissant lestimateur des MCO de a et b
scrivent:
P

0b
J Nj y j b
a

z
b
=0
j
j=1

(12)
0b
PJ Nj zj y j b
a

z
b
=
0
j
j=1

o Nj est le nombre dindividus i appartenant au groupe j.


(b) Combien y-a-til dquations et de variables dans le systme (12)?
(c) Montrer que

b
a = y z 0bb.,
J
!1 J
!
X
X

bb =
Nj (zj z) (zj z)0
Nj (zj z) y j y ,
j=1

j=1

o y et z sont les moyennes de yi et zdi dans lchantillon,.


10

(13)
(14)

3. On considre ensuite le modle de rgression linaire suivant:


y j = a + zj0 b + vj ,

j = 1, ..., J.

(15)

(a) Montrer que lquation (15) se dduit de lquation (11) pour un choix de vj que
vous expliciterez.
(b) Montrer que E (vj |X) = 0 o X = ( 1i , ..., Ji )i=1,...,N .
(c) Montrer que V (vj |X) =

2
.
Nj

(d) Montrer que Cov(vj , vj 0 |X) = 0, j 6= j 0 {1, ...J} .

(e) Calculer lestimateur des MCO de la rgression de y j sur 1 et zj .


(f) Calculer lestimateur des MCG et montrer que cest le mme estimateur que celui
obtenu dans la question 2c.

11

Endognit des variables explicatives

4.1

Rendements de lducation

On considre lquation de salaire suivante :


yi = a + bxi + ui ,
o xi reprsente le niveau dducation de lindividu i, et yi le logarithme de son salaire. On
sintresse aux ventuels problmes dendognit poss par cette formulation.
1. Pour mettre ces problmes en vidence, on postule dans cette question lexistence dune
caractristique inobserve, zi , qui influence la fois ui et xi . Soit :

ui = bzi + i ,
xi = + zi + ei .
(a) Interprter ce modle structurel.
(b) En supposant i et ei non corrls et de moyenne nulle, dterminer le biais asymtotique de lestimateur des MCO bMCO . Montrer quil est vraisemblablement
positif.
(c) On calcule empiriquement le biais de b. Quelle mthode peut-on utiliser?
On trouve alors un biais significativement ngatif.
2. On interprte le paradoxe des questions prcdentes en postulant la prsence derreurs
de mesure. On suppose que le vrai modle scrit :
yi = a + bxi + ui ,
o yi est le salaire mesur par yi avec erreur:
yi = yi + i ,
et xi le vrai niveau dducation mesur avec erreur par xi :
xi = xi + i .
On suppose les erreurs de mesure i et i non corrles entre elles, iid et non corrles
avec xi .
(a) Soit bb lestimateur des MCO du coecient de xi dans la rgression de yi sur xi
avec constante. Exprimer le biais asymptotique sur b et montrer que lerreur de
mesure biaise lestimateur vers 0.
(b) Soit b
c lestimateur des MCO du coecient de yi dans la rgression de xi sur yi
avec constante. Exprimer le biais asymptotique de 1/b
c sur b. Montrer que le biais
est positif.
(c) En dduire que lon peut obtenir un encadrement du vrai rendement de lducation,
et discuter la prcision de cet encadrement. Montrer en particulier que 1/b
c reste
biais mme lorsquil ny a pas derreur de mesure.
12

4.2

Un modle dore de travail

Dans cet exercice, on considre le modle suivant:


(16)

yi = a + bxi + ui .

La variable yi reprsente le nombre dheures travailles par lindividu i dans la semaine


prcdant lenqute, et xi est le salaire horaire de ce mme individu.
1. Quelles sont les deux interprtations possibles du rsidu ui vues en cours. Pour quelle
raisons, dans lventualit dune interprtation causale de cette relation, la variable xi
est-elle susceptible dtre corrle au rsidu ui ?
2. On suppose dans cette question que xi est endogne dans lquation (16). Montrer
qualors lestimateur des MCO b de b est biais, et calculer son biais en fonction de xi
et ui . Sattend-on un biais positif ou ngatif? Justifier.
3. Parmi les variables suivantes, lesquelles peut-on rejeter immdiatement comme ntant
pas des instruments convenables pour le modle (16) : indicatrice de temps partiel,
profession de lindividu, rgion de rsidence, diplme, salaire hebdomadaire. Justifier
chacune de vos armations.
4. On retient dans cette question et la suivante la profession des parents comme instrument. Expliquer comment on obtient lestimateur des doubles moindres carrs de b,
associ au modle (16) et linstrument considr (que lon pourra noter zi pour les
besoins de lexplication).
On eectue le calcul de b2MC sur un chantillon de 10000 individus. La rgression
augmente de yi sur xi , vbi et la constante donne :
yi = 174xi 204vbi + 14,
(12)

(12)

(3)

o les carts-types sont entre parenthse. Que reprsente la variable vi ? Donner la


moyenne et lcart-type de b2MC . Tester ensuite lexognit de xi pour le modle (1)
5%. Dans quel sens lestimateur des MCO est-il biais? Commenter.
5. Peut-on tester la validit de linstrument "profession des parents" partir des informations contenues dans lnonc ? Comment pourrait-on sy prendre pour la tester?
Expliquer.
6. On sintresse maintenant lventuelle htroscdasticit du modle (16). Expliquer
pourquoi la variance conditionnelle V(yi |xi ) est vraisemblablement monotone en xi .
Quelle mthode peut-on appliquer pour tester lhtroscdasticit du modle?
7. On suppose le modle (16) htroscdastique. On instrumente alors par la profession
des parents, comme dans la question 4. Le coecient b2MC est-t-il convergent? Que
dire de son cart-type?
8. Donner une mthode permettant dliminer asymptotiquement le biais mis en vidence
la question prcdente. Expliquer son fonctionnement.
13

9. Daprs les conclusions de lexercice, quel eet, revenu ou substitution, est dominant
dans lchantillon? Proposer une autre forme pour le modle (16) qui permette de
prendre en compte ces deux eets simultanment.

4.3

Rgression vers la Moyenne?

Soit un chantillon dobservations iid {(yi , xi ), i = 1, ..., N }, avec yi R, xi R. On suppose


quil existe une variable di {1, ..., J}, inobserve, qui partitionne les individus en J groupes.
La variable xi est la taille du pre de lindividu i et yi est sa propre taille. En rgressant
yi y sur xi x le statisticien Galton a trouv un coecient infrieur un, phnomne quil
a qualifi de rgression vers la moyenne. En ralit, il sagit dun artefact statistique quon
va chercher comprendre.
Soit z1 , ..., zJ R. On suppose vrifi le modle suivant:
yi y = zdi + ui ,
xi x = zdi + vi ,
o ui et vi sont deux perturbations de moyennes nulle et de variances constantes non nulles
conditionnellement di :
E (ui |di ) = 0 et V (ui |di ) = 2u ,
E (vi |di ) = 0 et V (vi |di ) = 2v .
1. Calculer E (yi y|di = j) et E (xi x|di = j).
2. Interprtez zj . Quelle justification donner au fait que lon suppose que cest le mme
zj qui apparat dans les deux quations?
3. Calculer lestimateur des MCO bb du coecient de la rgression sans constante de yi y
sur xi x.

4. Montrer que 0 < plimN bb < 1.

5. Les conomistes de la croissance ont souvent rgress le taux de croissance moyen du


PIB (sur une priode donne) sur le PIB de dbut de priode:
ln P IBi1 ln P IBi0 = a + b ln P IBi0 + ui
pour un chantillon de pays i = 1, ..., N . Une estimation ngative du coecient b est
souvent interprte comme le signe dune convergence vers un niveau de PIB commun.
Montrer laide du modle prcdent quune telle interprtation peut tre fallacieuse.

14

Equations simultanes

5.1

Modle de Haavelmo

On considre le modle dquilibre gnral form des deux quations suivantes:


c = y + + u,
y = c + i,
o y est la production, c la consommation et linvestissement i est considr comme exogne.
1. Interprter ces deux quations.
2. Exprimer les formes rduites de ce systme.
3. Calculer la limite en probabilit de
b MCO , lestimateur de par les MCO.

4. Quelles remarques pouvez-vous faire sur lestimation des modles dquilibre gnral.
Proposez une mthode destimation convergente des paramtres.

5.2

Ore et demande

On estime dans cet exercice un modle Ore/Demande. Soit :


Si (pi , vi ) = + pi + vi ,
Di (pi , ui ) = a + bpi + ui .
On suppose de plus que les rsidus suivent une loi normale bivarie dont les paramtres sont
:
E(ui ) = E(vi ) = 0,
V (ui ) = 2u

V (vi ) = 2v

Cov(ui , vi ) = u v .

1. La loi conditionnelle vi |ui est normale. Calculer sa moyenne et sa variance. En dduire


par symtrie la loi de ui |vi .
2. Calculer la loi marginale du prix dquilibre pi .
3. Calculer E(ui |pi ) et E(vi |pi ).
4. Vrifier que :
a + bpi + E(ui |pi ) = + pi + E(vi |pi )

15

5.3

Identification

1. Soit le systme dquations simulatanes :

y1t = a1 + b1 y2t + c1 x1t + u1t


y2t = a2 + b2 y1t + c2 x2t + u2t
avec u1t et u2t corrls.
(a) Ecrire les formes structurelle et rduite correspondantes.
(b) Que veut dire : "les paramtres du modle sont identifis." Donner la dfinition.
(c) A laide de la condition dordre, dire si les quations sont identifiables.
(d) Montrer laide de la forme rduite que les paramtres sont en eet identifis.
2. Soit le modle :

y1t = a1 + b1 y2t + c1 x1t + u1t


y2t = a2 + c2 x1t + u2t

(a) La condition dordre reste-t-elle satisfaite pour chaque quation ?


(b) Quels paramtres ou fonctions des paramtres sont identifiables?

16

Vous aimerez peut-être aussi