Vous êtes sur la page 1sur 4

TD 2 - Inférence et interprétation

1. Voici les résultats d'une régression du logarithme du salaire horaire (lnwage ) sur les années d'éducation
(eduy ) et l'âge age en utilisant la base de données de l'Enquête Emploi de 2007:

. reg lnw eduy

Source | SS df MS Number of obs = 31237


--- ---- ---- --+- ---- ---- ---- ---- ---- ---- ---- - F( 1, 31235) = 4498.68
Model | 633.04524 1 633.04524 Prob > F = 0.0000
Residual | 4395.32675 31235 .140718001 R - squared = 0.1259
--- ---- ---- --+- ---- ---- ---- ---- ---- ---- ---- - Adj R - squared = 0.1259
Total | 5028.37199 31236 .160980023 Root MSE = .37512

------------------------------------------------------------------------------
lnwage | Coef . Std . Err . t P >| t| [95% Conf . Interval ]
--- ---- ---- --+- ---- ---- ---- ---- ---- ---- ---- --- ---- ---- ---- ---- ---- ---- ---- ----
eduy | .0528497 .000788 67.07 0.000 .0513053 .0543941
_cons | 1.602484 .0097426 164.48 0.000 1.583388 1.62158
------------------------------------------------------------------------------

. reg lnw eduy age

Source | SS df MS Number of obs = 31237


--- ---- ---- --+- ---- ---- ---- ---- ---- ---- ---- - F( 2, 31234) = 4299.80
Model | 1085.5649 2 542.782451 Prob > F = 0.0000
Residual | 3942.80709 31234 .126234459 R - squared = 0.2159
--- ---- ---- --+- ---- ---- ---- ---- ---- ---- ---- - Adj R - squared = 0.2158
Total | 5028.37199 31236 .160980023 Root MSE = .35529

------------------------------------------------------------------------------
lnwage | Coef . Std . Err . t P >| t| [95% Conf . Interval ]
--- ---- ---- --+- ---- ---- ---- ---- ---- ---- ---- --- ---- ---- ---- ---- ---- ---- ---- ----
eduy | .0629493 .0007651 82.27 0.000 .0614496 .0644489
age | .0145086 .0002423 59.87 0.000 .0140336 .0149836
_cons | .9515069 .0142606 66.72 0.000 .9235556 .9794582
------------------------------------------------------------------------------

. sum lnw eduy age

Variable | Obs Mean Std . Dev . Min Max


--- ---- ---- --+- ---- ---- ---- ---- ---- ---- ---- --- ---- ---- ---- ---- ---- ----
lnw | 31237 2.240249 .4012232 -.7533873 6.214762
eduy | 31237 12.06752 2.693686 5 17
age | 31237 36.4681 8.505208 20 50

(a) Pouvez-vous dire quelque chose sur la corrélation entre -age- et -eduy-? Expliquez

(b) Interprétez le coecient de l'age dans la deuxième régression.

(c) Nous estimons lnw = β0 + β1 eduy + β2 age + β3 age2 + u.


. g age2 = age ^2

. reg lnw eduy age age2

Source | SS df MS Number of obs = 31237


-- ---- ---- ---+- --- ---- ---- ---- ---- ---- ---- -- F( 3, 31233) = 2965.09
Model | 1114.64492 3 371.548308 Prob > F = 0.0000
Residual | 3913.72702 31233 .125307432 R - squared = 0.2217
-- ---- ---- ---+- --- ---- ---- ---- ---- ---- ---- -- Adj R - squared = 0.2216
Total | 5028.37194 31236 .160980021 Root MSE = .35399

------------------------------------------------------------------------------
lnw | Coef . Std . Err . t P >| t| [95% Conf . Interval ]
-- ---- ---- ---+- --- ---- ---- ---- ---- ---- ---- ---- ---- ---- ---- ---- ---- ---- ---- ----
eduy | .0618749 .0007656 80.82 0.000 .0603744 .0633754
age | .0473089 .0021666 21.84 0.000 .0430622 .0515555
age2 | -.0004588 .0000301 -15.23 0.000 -.0005178 -.0003997
_cons | .4115976 .0381834 10.78 0.000 .3367567 .4864385
------------------------------------------------------------------------------

Quel est l'eet marginal de l'âge? Et pour quelqu'un âgé de 20 ans ? de 50 ans ?

1
(d) Construisez la variable de l'expérience potentielle , pexp = age - année d'éducation - 6. C'est
une variable proxy de l'expérience sur le marché du travail des individus (pouvez-vous expliquer
pourquoi ?). Nous estimons la régression suivante lnw = β0 + β1 eduy + β2 age + β3 pexp + u.
Expliquez ce qui va se passer.

2. Considérons une équation qui explique les salaires des PDG en fonction des vente annuelles de l'entreprise,
des rendements des actions (roe, en pourcentage) qui mesurent la protabilité à court terme et les ren-
dements de l'investissement de l'entreprise (ros, en pourcentage) qui mesurent la protabilité à long
terme
log(salary) = β0 + β1 log(sales) + β2 roe + β3 ros + u

(a) En fonction des paramètres du modèle, écrivez l'hypothèse nulle suivante : après avoir contrôlé
pour les ventes et le rendement des actions, le rendement de l'investissement de l'entreprise n'a
pas d'eet sur les salaires des PDG. Écrivez l'hypothèse alternative que de meilleurs rendements
de l'investissement augmentent les salaires des PDG.

(b) L'équation précédente estimée par les MCO donne

\
log(salary) = 4.32 + .280 log(sales) + .174 roe + .00024 ros
(.320) (.035) (.0041) (.00054)

où n = 209, R2 = .283. Quelle est l'augmentation prédite du salaire si le ros augmente de 50


points de pourcentages ? Est-ce que le ros a un eet important sur le salaire ?

(c) Testez l'hypothèse nulle que le ros n'a pas d'eet sur le salaire contre l'hypothèse alternative qu'il
a un eet positif. La valeur critique au seuil de signicativité de 10% est 1.282.

(d) Est-ce qu'il faut inclure la variable ros dans le modèle nal qui explique le salaire des PDG en
termes de performance de l'entreprise ? Expliquez

3. Supposons que vous collectiez des données dans le cadre d'une enquête sur les salaires, l'éducation,
l'expérience et le sexe. En plus, vous demandez des informations sur la consommation de marijuana.
La question initiale est la suivante : En combien d'occasions distinctes le mois dernier avez-vous fumé
de la marijuana ?

(a) Écrivez une équation qui vous permettrait d'estimer les eets de la l'usage de la marijuana sur
les salaires, tout en contrôlant pour d'autres facteurs. Vous devriez être en mesure de faire des
armations telles que : Nous estimons que fumer de la marijuana cinq fois de plus par mois
modie le salaire de x%

(b) Donnez un modèle qui vous permettrait de vérier si l'usage de drogues a des eets diérents sur
les salaires des hommes et des femmes. Comment testeriez-vous qu'il n'y a pas de diérences dans
les eets de la consommation de drogue entre les hommes et les femmes ?

(c) Supposons que vous pensiez qu'il est préférable de mesurer l'usage de la marijuana en classant les
personnes dans l'une des quatre catégories suivantes : non-consommateur, petit consommateur
(1 à 5 fois par mois), consommateur modéré (6 à 10 fois par mois) et gros consommateur (plus
de 10 fois par mois). Écrivez maintenant un modèle qui vous permet d'estimer les eets de la
consommation de marijuana sur le salaire.

(d) Quels sont les problèmes potentiels liés à l'inférence causale à l'aide des données d'enquête que
vous avez collectées ?

(e) Voudriez-vous contrôler pour l'éducation ? Pourquoi ou pourquoi pas ?

2
4. Un modèle simple pour déterminer l'ecacité de l'utilisation du préservatif sur la réduction des maladies
sexuellement transmissibles chez les lycéens sexuellement actifs est

inf rate = β0 + β1 conuse + β2 percmale + β3 avginc + β4 city + u1

où infrate est le pourcentage d'étudiants sexuellement actifs qui ont contracté une maladie vénérienne,
conuse est le pourcentage de garçons qui déclarent utiliser régulièrement des préservatifs, avginc est le
revenu familial moyen, et city est une variable indicatrice indiquant si l'école se trouve une grande ville
(1 ou 0). Les observations sont des observations par école.

(a) En interprétant l'équation précédente de manière causale, ceteris paribus, quel devrait être le signe
de β1 ?

(b) Pourquoi infrate et conuse pourraient-ils être déterminés conjointement ?

(c) Si l'utilisation du préservatif augmente avec le taux de maladie vénérienne, de sorte que γ1 > 0
dans l'équation
conuse = γ0 + γ1 inf rate + autres f acteurs,
quel est le biais probable de l'estimation de β1 par MCO ?

(d) Soit condis une variable binaire égale à 1 si une école a un programme de distribution de préservatifs
et 0 sinon. Expliquez comment cette variable peut être utilisée pour estimer β1 (et les autres β)
par variable instrumentale. Que devons-nous supposer à propos de condis dans chaque équation ?

5. Nous utilisons une base de données avec les prix et les caractéristiques des logements (de wooldridge:
()http://fmwww.bc.edu/ec-p/data/wooldridge/hprice1). Nous voulons tester la rationalité des évalua-
tions des prix des logements. Pour cela, on peut régresser les prix des logements sur leurs évaluations.

price = β0 + β1 assess + u

(a) L'estimation de cette équation par les MCO sur les données donne les résultats suivants (avec les
écarts-types des coecients estimés entre parenthèses).

[ = −14.47 + .976 assess


price R2 = .82, n = 88, SSR = 165644
(16.27) (.0349)

L'évaluation est rationnelle si β1 = 1 et β0 = 0. Premièrement, testez (au seuil de 5% ) l'hypothèse


H0 : β0 = 0 contre l'alternative bilatérale Ha : β0 6= 0. Ensuite, testez H0 : β1 = 1 contre
l'alternative bilatérale Ha : β1 6= 1 au seuil de 5%. Quelle est votre conclusion ?
(b) Eectuez le test F (au seuil de 1%) de l'hypothèse jointe H0 : β0 = 0, β1 = 1. Nous avons
2
P
i (pricei − assessi ) = 209448. Pouvez-vous rejeter l'hypothèse nulle au seuil de 5% ? Et au
seuil de 1% ? Vous devez calculer la somme des carrés du modèle non restreint et du modèle
restreint pour construire la statistique de test.

(c) Nous estimons maintenant

price = β0 + β1 assess + β2 sqrf t + β3 lotsize + β4 bdrms + u

Nous observons que le R-carré est de 0,829. Calculez la statistique du test F pour l'hypothèse
conjointe H0 : β2 = 0, β3 = 0, β4 = 0. Quelle est votre conclusion (pour un seuil de 10%) ?

(d) Si la variance du prix change avec assess, sqrft, lotsize, ou bdrms, que pouvez-vous dire de la
statistique de test F calculée en (c) ?

3
(e) Maintenant, nous utilisons le logarithme du prix du logement comme variable dépendante et
estimons l'équation suivante

ln price = β0 + β1 sqrf t + β2 lotsize + β3 bdrms + γ1 {t = 1} + u

avec deux périodes d'observation (t = 0 ou 1). Quelle est la prédiction optimale prédiction optimale
ˆ ?
P rice Dénissez 3 méthodes pour estimer cette prédiction optimale. Conseil : Calculez E (Y /X)

dans un modèle log (Y ) = X · β + u. et u ∼ N 0, σ 2 i.i.d.

E(price/X−1 ,t=1)
(f ) Calculez et interprétez
E(price/X−1 ,t=0) . Quelles sont les hypothèses (économiques et techniques)
utilisées dans ce modèle ?

Vous aimerez peut-être aussi