Académique Documents
Professionnel Documents
Culture Documents
TD 1
TD 1
Université UICI
Talnan Hongwopena Evrard 2018-2019
TD 1
Le modèle de régression linéaire simple
Exercice 1 La variable kids inclut le nombre d’enfants par femme et educ correspond à leur
niveau d’instruction (en nombre d’années d’études). Un modèle de régression simple de la
fécondité peut consister à régresser la fécondité sur le niveau d’instruction :
kids = 0 + 1 educ +u
où u est le terme d’erreur (non observé).
1. Quels types de facteurs sont inclus dans u ? Sont-ils susceptibles d’être corrélés avec le
niveau d’instruction ?
2. Cette analyse de régression simple permet-elle d’identi…er l’e¤et ceteris paribus du niveau
d’instruction sur la fécondité ? Expliquez.
Exercice 2 Le tableau suivant contient le résultat obtenu par huit étudiants au test « ACT
» (American College Testing) ; ce test est basé sur des QCM et sa note maximale est 36. Le
tableau reprend également la moyenne « GPA » (Grade Point Average) obtenue aux examens
à la sortie du lycée (soit à la …n du secondaire supérieur), dont la note maximale est 4. Ces
deux évaluations sont notamment utilisées aux États-Unis pour accéder aux universités.
Étudiant GPA ACT
1 2,8 21
2 3,4 24
3 3 26
4 3,5 27
5 3,6 29
6 3 25
7 2,7 25
8 3,7 30
XN
(xi x)(yi y)
Rappel : b 0 = y b x et b =
1 1
i=1
X
N
(xi x)2
i=1
1
1. Estimez la relation entre GP A et ACT en utilisant la méthode des moindres carrés ordin-
aires. Autrement dit, calculez les estimations de la constante et de la pente de l’équation
[
GP A = b 0 + b 1 ACT
2. Calculez les valeurs ajustées et les résidus pour chaque observation. Véri…ez que la somme
des résidus est (approximativement) égale à zéro.
Étudiant GP A [
GP A b
u
1
2
3
4
5
6
7
8
2
Exercice 3 On utilise une base de données contenant des informations sur les naissances aux
États-Unis. Les deux variables qui nous intéressent ici sont le poids du nouveau-né (bwght), en
kg, et le nombre de cigarettes fumées en moyenne chaque jour par la mère durant la grossesse
(cigs). La régression simple, estimée sur N = 1388 naissances, donne les résultats suivants :
\ = 3; 40
bwght 0; 015cigs
1. Quel est le poids du nouveau-né estimé par le modèle lorsque cigs = 0 ? Qu’en est-il
lorsque cigs = 20 (un paquet par jour) ? Commentez.
2. Pensez-vous que cette régression simple capture la relation causale qui existe entre le poids
du nouveau-né et la consommation de tabac de la mère ? Expliquez.
3. Quelle est la valeur de cigs si l’estimation du poids du nouveau-né est égale à 3,5 kg ?
Commentez.
4. Dans l’échantillon, la proportion de femmes qui ne fument pas durant leur grossesse
est égale à 0; 85. Cela vous aide-t-il à mieux expliquer le résultat obtenu à la question
précédente ?
5. Si le poids avait été mesuré en grammes, quelles auraient été les valeurs estimées de la
constante et de la pente ?
3
Exercice 4 Considérez la fonction d’épargne :
p
sav = 0 + 1 inc + u; u= inc e
où inc est le revenu, sav est l’épargne, et e est une variable aléatoire pour laquelle E(e) = 0
et V ar(e) = 2e . Supposez que e est indépendant de inc.
1. Montrez que E(ujinc) = 0, c’est-à-dire que l’hypothèse RLS.4 est satisfaite. [Astuce : Si
e est indépendant de inc, alors E(ejinc) = E(e).]
2
2. Montrez que V ar(ujinc) = inc e , c’est-à-dire que l’hypothèse RLS.5 n’est pas véri…ée.
En particulier, montrez que la variance de sav augmente avec inc. [Astuce : V ar(ejinc) =
V ar(e), si e et inc sont indépendants.]
3. Identi…ez les arguments en faveur de l’idée selon laquelle la variance de l’épargne augmente
en fonction du revenu.
Exercice 5 Sur la base des données de Kiel et McClain (1995) portant sur 135 transactions
immobilières e¤ectuées en 1988 à Andover au Massachusetts, on obtient l’équation suivante,
qui explique le prix de vente des biens immobiliers (price) par la distance qui les sépare d’un
incinérateur de déchets (dist) :
\
log(price) = 0; 40 + 0; 312 log(dist)
N = 135; R2 = 0; 162
1. Interprétez le coe¢ cient de log(dist). S’agit-il du signe auquel vous vous attendiez ?
4
3. La variable dist est exprimée en miles. Quelles auraient été les valeurs estimées de la
constante et de la pente si la variable était exprimée en km sachant que 1 km 0,621
mile ?
d =
cons 124; 84 + 0; 853inc
N = 100; R2 = 0; 692:
3. En utilisant inc sur l’axe des abscisses, construisez un graphique pour représenter la P M C
et la P mC que vous avez estimées précédemment.