Vous êtes sur la page 1sur 12

Le modle linaire - Rendements dune fonction de production Cobb-Douglas

Prsentation du problme: On considre la fonction de production suivante deux facteurs, le


travail L et le capital K, correspondant une technologie de type Cobb-Douglas:

Y (L, K) = ALK (1)

o et sont des rels compris entre 0 et 1.

Soit un chantillon {(yi, i, ki) , i = 1, ..., n} dobservations indpendantes de logarithmes doutputs


et dinputs de n entreprises. On suppose que

yi = a + li + ki + ui, (2)

o les ui sont iid et normaux desprance nulle et de variance 2. On supposera de plus


ui orthogonal li et ki.

Donnes numriques : n = 1000

=
i i 500

=
P
i ki 490

=
y 149
i 0

i 2

P i =
i 2 330

P k
=
i i 320

2 =
320
P y
i i 0

P yi =
i

i 800

i kiyi = 770

Questions:

1. Justifier lquation (2). Interprter en particulier le sens de la variable u i. Le fait de la


traiter comme une variable alatoire signifie-t-il que la valeur de ui est le produit du hasard
pour lentreprise i?

2. Ecrire le modle (2) sous la forme matricielle suivante :

y = Xb + u, (3)

o y, X, b et u sont des matrices que lon dterminera et dont on indiquera les dimensions.

3. Donner lexpression de lestimateur des MCO b de b en fonction de y et de X.

Interprter cette hypothse.

e0 e

(d) Calculer la matrice X X , ainsi que son inverse, sachant que lhypothse (5) est vrifie. En
dduire lestimateur des MCO des coecients de la rgression de yei sur i et ki sans constante.

1. En dduire, par lapplication du thorme de rgression partitionne, lestimateur des MCO


des coecients de la rgression de yi sur i et ki avec constante.

1. Application numrique.

b .

5. Significativit des coecients: On teste ici la significativit de et b

1. b

2. Ecrire lquation dorthogonalit entre Xb et y Xb.

1. Donner lexpression de la somme des carrs des rsidus, SCR, en fonction de y i,

1. b
2. Tester la significativit de et de 10% et 5% prs. Conclusion?

6. Test de lhypothse de rendements constants: On teste lhypothse nulle suivante

(H0) : + = 1

Contre lalternative :

(Ha) : + 6= 1

1. Ecrire le modle contraint associ H0, modle dans lequel nintervient plus. Quelles sont
les variables dpendantes et indpendantes de ce nouveau problme?

1. Calculer la somme des carrs des rsidus du modle contraint SCR c. Application
numrique : On vrifiera que c ' 0.594.

2. Calculer alors la statistique de Fischer associe au test de rendements constants. Tester


H0 5% prs. Conclusion ?

2 Thorie asymptotique des MCO

2.1 Lancer dune pice de monnaie pipe

On lance un grand nombre de fois une pice de monnaie dsquilibre, dont la probabilit dobtenir
"face" est gale [0, 1].

1. On modlise le problme par le modle suivant:

y = + ,

o y est la ralisation du lancer (y = 0 si "pile", y = 1 si "face"), et est desprance nulle.

Que vaut le scalaire ? Dessiner la fonction de rpartition de . Sa loi est-elle normale?

2. Calculer lestimateur des MCO de : . Prciser les hypothses ("naturelles") que vous faites sur
les rsidus.

Vers quelle valeur converge lorsque le nombre de lancers tend vers +?

3. Donner lexpression de la variance de en fonction de .

4. Dduire de la question prcdente la densit asymptotique de (NB: on pourra noter n le


nombre de lancers).

2.2 Inclusion et oubli de variables non pertinentes

On dispose dun chantillon {(yi, x1i, x2i) , i = 1, ..., n} dobservations indpendantes.

1. On suppose tout dabord que le modle de yi sachant x1i, x2i est

yi = + 1x1i + ui, (6)

avec E(ui|x1i, x2i) = 0. On cherche mesurer les consquences de lintroduction dune seconde
variable explicative, x2i.
1. b

2. Calculer les estimateurs des MCO 1 et 2 des coecients de x1i et x2i dans la rgression de
yi sur x1i et x2i.

(b) Montrer que 1 est asymptotiquement quivalent lestimateur des MCO de la rgression de
yi sur x1i sans x2i. Ces deux estimateurs sont-ils pour autant identiques?

2. On suppose maintenant que le vrai modle est

yi = + 1x1i + 2x2i + vi (7)

avec E(vi|x1i, x2i) = 0.

1. Poser ui = 2x2i + vi et calculer E(ui|x1i, x2i). A quelle condition E(ui|x1i, x2i) = 0?

1. On suppose dabord que x1 et x2 sont orthogonaux (cov(x1, x2) = 0). Montrer que
lestimateur des MCO du coecient de x1i dans la rgression de yi sur x1i sans x2i est
convergent mais moins ecace (asymptotiquement moins prcis) que lestimateur des
MCO du coecient de x1i dans la rgression de yi sur x1i et x2i.

1. Si x1 et x2 sont corrls, montrer que lestimateur des MCO du coecient de x1i dans la
rgression de yi sur x1i sans x2i est non convergent (asymptotiquement biais).

2.3 Test dgalit de deux moyennes

On cherche tester linfluence du sexe sur le salaire. Soit {w 1i, i = 1, ..., T1} un chantillon de
salaires dhommes et {w2i, i = 1, ..., n2} un chantillon de salaires de femmes. On suppose les
observations iid. Pour cela, on divise le panel en deux sous-chantillons, femmes (1, taille n 1) et
hommes (2, taille n2). On considre alors les deux modles suivants

Le modle non contraint scrit :

w1i = 1 + u1i, Eu1i = 0,

w2i = 2 + u2i, Eu2i = 0,

o 1 et 2 ne sont pas supposs gaux a priori.

Le modle contraint impose lgalit des coecients 1 et 2:

(a) Ecrire le modle de wi sous la forme:

wi = 1Si + 2 (1 Si) + ui, i = 1, ..., n (8)

o lon prcisera Si et ui.

1. Comment sinterprtent les variables Si et 1 Si et combien vaut E(ui|Si)?


1. Montrer que lestimateur des MCO de 1 (resp. de 2) dans la rgression de wi sur Si et 1
Si est identique lestimateur des MCO de 1 dans la rgression de w1i (resp. de w2i) sur la
constante 1. Expliciter b1 et b2.

1. Le test distance finie (rappels de licence). On suppose les rsidus du modle

1. sont iid et normaux, de variance Vui = 2.

1. Lhypothse Vui = 2 pour tout i = 1, ..., n vous parat-elle discutable?

1. Ecrire le modle non contraint sous forme matricielle.

1. Montrer que la somme des carrs des rsidus non contraints SCR nc scrit trs simplement
en fonction des sommes des carrs des rsidus u 1 et u2. La calculer.

Montrer de plus que SCRnc


suit un 2 dont on prcisera le nombre de degrs de 2 libert.

(d) Montrer que, sous lhypothse dabsence de changement structurel que lon pr-cisera,
lestimateur (b1, b2) suit une loi normale dont on calculera la moyenne et la variance.

(e) Exprimer la dirence SCRc SCRnc en fonction de n1, n2, et de la dirence b1 b2.

(f) En dduire que cette quantit, convenablement normalise, suit un 2 un degr de libert.
Interprter.

(g) Calculer la statistique de Fischer associ au problme. Tester 5% lgalit entre 1 et 2.


Conclusion?

3. Le test asymptotique. On abandonne ici lhypothse de normalit des rsidus, ceux-ci restant iid.

(a) Calculer lestimateur des MCO de 1 2.

(b) Sous quelle hypothse quant au comportement asymptotique de la statistique

S= n
1 P
i=1 Si = n 1
n cet estimateur est-il convergent? Interprter.

Sous ces hypothses, montrer que

\ L n
1
2
n
N

o p = ESi.

Pour cela, montrer successivement que:

1. Comment estimer la variance asymptotique de \12, Vas\12?

1. Tester alors labsence de changement structurel, 5%, laide dun test de Student
(asymptotique).
3 Le Modle Htroscdastique

3.1 Test dgalit de deux moyennes (suite de (2.3))

1. On suppose que n1 et n1/n2 k = 0.

1. Interprter.

3.2 Un test de Goldfeld-Quandt

Dans cet exercice, on cherche quantifier linfluence du diplme sur le salaire. On considrera donc
le modle linaire suivant :

wi = xi + + ui

O xi repre le niveau dducation de lindividu i. On supposera les rsidus u i inid et orthogonaux


aux variables explicatives.

On teste lhtroscdasticit des rsidus en divisant lchantillon en deux sous-chantillons I 1 et


I2 correspondant aux "non-diplms" (niveau infrieur au bac) et aux "diplms" (au moins le bac).
On retire ensuite de ces deux sous-chantillons une proportion des individus telle que tous deux
aient la mme taille. On calcule ensuite les sommes des rsidus des deux sous-modles, soit SR 1 et
SR2.

1. Montrer que SR2 suit, sous lhypothse dhomoscdasticit, une loi de Fisher dont on SR 1
prcisera le nombre de degrs de libert.

1. Tester lhypothse dhomoscdasticit aux niveaux 1%, 5% et 10%. Quen dduire ?

1. On considre alors le modle :

ln(wi) = xi + + ui. (9)

Justifier la forme choisie: pourquoi utilise-t-on le logarithme?

1. Tester lhypothse dhomoscdasticit sur ce modle. Conclusion ?

3.3 Utilisation tort des MCO

On value lerreur qui est faite lorsque lon estime un modle linaire htroscdastique par les
MCO.

On considre le modle htroscdastique :

yi = a + bxi + ui, (10)

o la matrice de variance-covariance des ui est diagonale, gale 2diag(1, ..., n). On suppose
que les poids j sont positifs, et somment 1.

1. Calculer bMCO. Est-il sans biais? Convergent?


2. Mmes questions pour bMCP , lestimateurs des Moindres Carrs Pondrs du paramtre b.

3. Calculer les variances de bMCO et bMCP .

4. Montrer que bMCP est plus prcis.

5. On calcule un estimateur de la variance de bMCP par la mthode des MCP. Montrer que cet
estimateur nest pas biais.

6. On calcule maintenant un estimateur de la variance de b MCO par les MCO. Montrer que cet
estimateur est biais. Dans quelle direction?

3.4 Observations Groupes

Soit un chantillon dobservations iid {(y i, di), i = 1, ..., N }, avec yi R et di {1, ..., J}. La
variable di est une variable discrte qui indique un groupe social dappartenance de lindividu i (les
diplms par opposition aux non diplms, direntes PCS, etc.). Chaque groupe social j {1, ...,
J} est caractris par un vecteur de constantes zj RK (revenu N le nombre dindividus i dans
moyen, ge moyen, etc.). Pour tout j {1, ..., J}, on note j le groupe j et j la moyenne de yi dans
le groupe j. Enfin, i y = 1 {di = j} dnote la variable indiquant si le groupe dappartenance est le
groupe j (ij = 1 si di = j, = 0 sinon).

, ... )0 lestimateur des MCO de la rgression de y sur le


1. Soit = ( , vecteur x =

(i , b
i 0
b
1 bJ i i

1
..., J ) .

(a) Remplacer les ? dans les deux quations suivantes par lexpression approprie:

2. On considre maintenant le modle de rgression linaire suivant:

(a) Montrer que les quations normales dfinissant lestimateur des MCO de a et b

o Nj est le nombre dindividus i appartenant au groupe j.

1. Combien y-a-til dquations et de variables dans le systme (12)?

3. On considre ensuite le modle de rgression linaire suivant:

y j = a + z0 b + vj , j = 1, ..., J. (15)

(a) Montrer que lquation (15) se dduit de lquation (11) pour un choix de v j que vous
expliciterez.

(b) Montrer que E(vj |X) = 0 o X = (1i, ..., Ji )i=1,...,N .

(c) Montrer que V(vj|X) = 2


. Nj
1. Montrer que Cov(vj, vj0 |X) = 0, j 6= j0 {1, ...J} .

1. Calculer lestimateur des MCO de la rgression de y j sur 1 et zj.

1. Calculer lestimateur des MCG et montrer que cest le mme estimateur que celui obtenu
dans la question 2c.

4 Endognit des variables explicatives

4.1 Rendements de lducation

On considre lquation de salaire suivante :

yi = a + bxi + ui,

o xi reprsente le niveau dducation de lindividu i, et yi le logarithme de son salaire. On


sintresse aux ventuels problmes dendognit poss par cette formulation.

1. Pour mettre ces problmes en vidence, on postule dans cette question lexistence dune
caractristique inobserve, zi, qui influence la fois ui et xi. Soit :

ui = bzi + i,

xi = + zi + ei.

1. Interprter ce modle structurel.

1. En supposant i et ei non corrls et de moyenne nulle, dterminer le biais asymtotique de


lestimateur des MCO bMCO. Montrer quil est vraisemblablement positif.

(c) On calcule empiriquement le biais de b. Quelle mthode peut-on utiliser? On trouve alors un
biais significativement ngatif.

2. On interprte le paradoxe des questions prcdentes en postulant la prsence derreurs de


mesure. On suppose que le vrai modle scrit :

yi = a + bxi + ui,

o yi est le salaire mesur par yi avec erreur:

yi = yi + i,

et xi le vrai niveau dducation mesur avec erreur par xi:

xi = xi + i.

On suppose les erreurs de mesure i et i non corrles entre elles, iid et non corrles avec x i.

(a) Soit b lestimateur des MCO du coecient de xi dans la rgression de yi sur xi avec constante.
Exprimer le biais asymptotique sur b et montrer que lerreur de mesure biaise lestimateur vers 0.

(b) Soit bc lestimateur des MCO du coecient de yi dans la rgression de xi sur yi avec constante.
Exprimer le biais asymptotique de 1/bc sur b. Montrer que le biais est positif.

(c) En dduire que lon peut obtenir un encadrement du vrai rendement de lducation, et discuter
la prcision de cet encadrement. Montrer en particulier que 1/bc reste biais mme lorsquil ny a
pas derreur de mesure.
4.2 Un modle dore de travail

Dans cet exercice, on considre le modle suivant:

yi = a + bxi + ui. (16)

La variable yi reprsente le nombre dheures travailles par lindividu i dans la semaine prcdant
lenqute, et xi est le salaire horaire de ce mme individu.

1. Quelles sont les deux interprtations possibles du rsidu u i vues en cours. Pour quelle
raisons, dans lventualit dune interprtation causale de cette relation, la variable x i est-
elle susceptible dtre corrle au rsidu ui?

1. On suppose dans cette question que x i est endogne dans lquation (16). Montrer qualors
lestimateur des MCO b de b est biais, et calculer son biais en fonction de x i et ui.
Sattend-on un biais positif ou ngatif? Justifier.

1. Parmi les variables suivantes, lesquelles peut-on rejeter immdiatement comme ntant pas
des instruments convenables pour le modle (16) : indicatrice de temps partiel, profession
de lindividu, rgion de rsidence, diplme, salaire hebdomadaire. Justifier chacune de vos
armations.

1. On retient dans cette question et la suivante la profession des parents comme instru-ment.
Expliquer comment on obtient lestimateur des doubles moindres carrs de b, associ au
modle (16) et linstrument considr (que lon pourra noter z i pour les besoins de
lexplication).

On eectue le calcul de b2MC sur un chantillon de 10000 individus. La rgression augmente de


yi sur xi, vbi et la constante donne :

yi = 174xi 204vbi + 14,

(12) (12) (3)

o les carts-types sont entre parenthse. Que reprsente la variable vi? Donner la moyenne et
lcart-type de b2MC . Tester ensuite lexognit de xi pour le modle (1) 5%. Dans quel sens
lestimateur des MCO est-il biais? Commenter.

1. Peut-on tester la validit de linstrument "profession des parents" partir des infor-mations
contenues dans lnonc ? Comment pourrait-on sy prendre pour la tester? Expliquer.

1. On sintresse maintenant lventuelle htroscdasticit du modle (16). Expliquer


pourquoi la variance conditionnelle V(yi|xi) est vraisemblablement monotone en xi. Quelle
mthode peut-on appliquer pour tester lhtroscdasticit du modle?

1. On suppose le modle (16) htroscdastique. On instrumente alors par la profession des


parents, comme dans la question 4. Le coecient b2MC est-t-il convergent? Que dire de son
cart-type?

1. Donner une mthode permettant dliminer asymptotiquement le biais mis en vidence la


question prcdente. Expliquer son fonctionnement.

1. Daprs les conclusions de lexercice, quel eet, revenu ou substitution, est dominant dans
lchantillon? Proposer une autre forme pour le modle (16) qui permette de prendre en
compte ces deux eets simultanment.
4.3 Rgression vers la Moyenne?

Soit un chantillon dobservations iid {(y i, xi), i = 1, ..., N}, avec yi R, xi R. On suppose quil
existe une variable di {1, ..., J}, inobserve, qui partitionne les individus en J groupes. La
variable xi est la taille du pre de lindividu i et yi est sa propre taille. En rgressant y i y sur xi x
le statisticien Galton a trouv un coecient infrieur un, phnomne quil a qualifi de rgression
vers la moyenne. En ralit, il sagit dun artefact statistique quon va chercher comprendre.

Soit z1, ..., zJ R. On suppose vrifi le modle suivant:

yi y = z
di + ui,

xi x = z
di + vi,

o ui et vi sont deux perturbations de moyennes nulle et de variances constantes non nulles


conditionnellement di:

E(ui| e
di) = 0 t V(ui|di) = u2,

E(vi| e
di) = 0 t V(vi|di) = v2.

1. Calculer E(yi y|di = j) et E(xi x|di = j).

1. Interprtez zj . Quelle justification donner au fait que lon suppose que cest le mme z j qui
apparat dans les deux quations?

3. Calculer lestimateur des MCO b du coecient de la rgression sans constante de yi y sur xi


x.

4. Montrer que 0 < plimN b < 1.

5. Les conomistes de la croissance ont souvent rgress le taux de croissance moyen du PIB (sur
une priode donne) sur le PIB de dbut de priode:

ln P IBi1 ln P IBi0 = a + b ln P IBi0 + ui

pour un chantillon de pays i = 1, ..., N. Une estimation ngative du coecient b est souvent
interprte comme le signe dune convergence vers un niveau de PIB commun. Montrer laide du
modle prcdent quune telle interprtation peut tre fallacieuse.

5 Equations simultanes

5.1 Modle de Haavelmo


On considre le modle dquilibre gnral form des deux quations suivantes:

y + +
c = u,

y = c + i,

o y est la production, c la consommation et linvestissement i est considr comme exogne.

1. Interprter ces deux quations.

1. Exprimer les formes rduites de ce systme.

1. Calculer la limite en probabilit de bMCO, lestimateur de par les MCO.

1. Quelles remarques pouvez-vous faire sur lestimation des modles dquilibre gnral.
Proposez une mthode destimation convergente des paramtres.

5.2 Ore et demande

On estime dans cet exercice un modle Ore/Demande. Soit :

Si(pi, vi) = + pi + vi,

Di(pi, ui) = a + bpi + ui.

On suppose de plus que les rsidus suivent une loi normale bivarie dont les paramtres sont :

E(ui) = E(vi) = 0,

V (ui) = 2u ; V (vi) = 2v ; Cov(ui, vi) = uv.

1. La loi conditionnelle vi|ui est normale. Calculer sa moyenne et sa variance. En dduire par
symtrie la loi de ui|vi.

2. Calculer la loi marginale du prix dquilibre pi.

1. Calculer E(ui|pi) et E(vi|pi).

1. Vrifier que :

a + bpi + E(ui|pi) = + pi + E(vi|pi)

5.3 Identification

1. Soit le systme dquations simulatanes :

y1t = a1 + b1 y2t + c1 x1t + u1t y2t = a2 + b2 y1t + c2 x2t + u2t

avec u1t et u2t corrls.

1. Ecrire les formes structurelle et rduite correspondantes.


1. Que veut dire : "les paramtres du modle sont identifis." Donner la dfinition.

1. A laide de la condition dordre, dire si les quations sont identifiables.

1. Montrer laide de la forme rduite que les paramtres sont en eet identifis.

2. Soit le modle :

y1t = a1 + b1 y2t + c1 x1t + u1t y2t = a2 + c2 x1t + u2t

1. La condition dordre reste-t-elle satisfaite pour chaque quation ?

1. Quels paramtres ou fonctions des paramtres sont identifiables?