Vous êtes sur la page 1sur 5

Licence 3ème année Econométrie

Université UICI
Talnan Hongwopena Evrard 2018-2019

TD 1
Le modèle de régression linéaire simple

Exercice 1 La variable kids inclut le nombre d’enfants par femme et educ correspond à leur
niveau d’instruction (en nombre d’années d’études). Un modèle de régression simple de la
fécondité peut consister à régresser la fécondité sur le niveau d’instruction :

kids = 0 + 1 educ +u
où u est le terme d’erreur (non observé).

1. Quels types de facteurs sont inclus dans u ? Sont-ils susceptibles d’être corrélés avec le
niveau d’instruction ?

2. Cette analyse de régression simple permet-elle d’identi…er l’e¤et ceteris paribus du niveau
d’instruction sur la fécondité ? Expliquez.

Exercice 2 Le tableau suivant contient le résultat obtenu par huit étudiants au test « ACT
» (American College Testing) ; ce test est basé sur des QCM et sa note maximale est 36. Le
tableau reprend également la moyenne « GPA » (Grade Point Average) obtenue aux examens
à la sortie du lycée (soit à la …n du secondaire supérieur), dont la note maximale est 4. Ces
deux évaluations sont notamment utilisées aux États-Unis pour accéder aux universités.
Étudiant GPA ACT
1 2,8 21
2 3,4 24
3 3 26
4 3,5 27
5 3,6 29
6 3 25
7 2,7 25
8 3,7 30
XN

(xi x)(yi y)

Rappel : b 0 = y b x et b =
1 1
i=1
X
N

(xi x)2
i=1

1
1. Estimez la relation entre GP A et ACT en utilisant la méthode des moindres carrés ordin-
aires. Autrement dit, calculez les estimations de la constante et de la pente de l’équation

[
GP A = b 0 + b 1 ACT

Décrivez la nature de cette relation. L’interprétation de la constante est-elle utile ? Ex-


pliquez. Quelle est la variation estimée de GP A si la note obtenue à l’ACT augmente de
5 points ?

2. Calculez les valeurs ajustées et les résidus pour chaque observation. Véri…ez que la somme
des résidus est (approximativement) égale à zéro.
Étudiant GP A [
GP A b
u
1
2
3
4
5
6
7
8

3. Quelle est la valeur estimée (ou « valeur prédite » ) de GP A lorsque ACT = 20 ?

4. Quel pourcentage de la variance de GP A est expliqué par le modèle ? Expliquez.

2
Exercice 3 On utilise une base de données contenant des informations sur les naissances aux
États-Unis. Les deux variables qui nous intéressent ici sont le poids du nouveau-né (bwght), en
kg, et le nombre de cigarettes fumées en moyenne chaque jour par la mère durant la grossesse
(cigs). La régression simple, estimée sur N = 1388 naissances, donne les résultats suivants :

\ = 3; 40
bwght 0; 015cigs

1. Quel est le poids du nouveau-né estimé par le modèle lorsque cigs = 0 ? Qu’en est-il
lorsque cigs = 20 (un paquet par jour) ? Commentez.

2. Pensez-vous que cette régression simple capture la relation causale qui existe entre le poids
du nouveau-né et la consommation de tabac de la mère ? Expliquez.

3. Quelle est la valeur de cigs si l’estimation du poids du nouveau-né est égale à 3,5 kg ?
Commentez.

4. Dans l’échantillon, la proportion de femmes qui ne fument pas durant leur grossesse
est égale à 0; 85. Cela vous aide-t-il à mieux expliquer le résultat obtenu à la question
précédente ?

5. Si le poids avait été mesuré en grammes, quelles auraient été les valeurs estimées de la
constante et de la pente ?

3
Exercice 4 Considérez la fonction d’épargne :
p
sav = 0 + 1 inc + u; u= inc e

où inc est le revenu, sav est l’épargne, et e est une variable aléatoire pour laquelle E(e) = 0
et V ar(e) = 2e . Supposez que e est indépendant de inc.

1. Montrez que E(ujinc) = 0, c’est-à-dire que l’hypothèse RLS.4 est satisfaite. [Astuce : Si
e est indépendant de inc, alors E(ejinc) = E(e).]

2
2. Montrez que V ar(ujinc) = inc e , c’est-à-dire que l’hypothèse RLS.5 n’est pas véri…ée.
En particulier, montrez que la variance de sav augmente avec inc. [Astuce : V ar(ejinc) =
V ar(e), si e et inc sont indépendants.]

3. Identi…ez les arguments en faveur de l’idée selon laquelle la variance de l’épargne augmente
en fonction du revenu.

Exercice 5 Sur la base des données de Kiel et McClain (1995) portant sur 135 transactions
immobilières e¤ectuées en 1988 à Andover au Massachusetts, on obtient l’équation suivante,
qui explique le prix de vente des biens immobiliers (price) par la distance qui les sépare d’un
incinérateur de déchets (dist) :

\
log(price) = 0; 40 + 0; 312 log(dist)
N = 135; R2 = 0; 162

1. Interprétez le coe¢ cient de log(dist). S’agit-il du signe auquel vous vous attendiez ?

2. Pensez-vous que la régression simple permette d’obtenir un estimateur sans biais de


l’élasticité de price par rapport à dist, toutes choses étant égales par ailleurs (ceteris
paribus) ? (Pensez à la diversité des quartiers dans une ville et à la décision de l’autorité
politique portant sur le lieu d’implantation de l’incinérateur.)

4
3. La variable dist est exprimée en miles. Quelles auraient été les valeurs estimées de la
constante et de la pente si la variable était exprimée en km sachant que 1 km 0,621
mile ?

Exercice complémentaire La fonction linéaire de consommation suivante est estimée sur


base d’un échantillon de 100 familles dont la consommation annuelle (cons) et le revenu annuel
(inc) sont mesurés en dollars :
d = b 0 + b 1 inc
cons
où la propension marginale à consommer (P mC) est estimée par la pente, b 1 , alors que la
d
propension moyenne à consommer (P M C) est égale à cons=inc = b 0 =inc + b 1 .
L’estimation de l’équation par les MCO donne :

d =
cons 124; 84 + 0; 853inc
N = 100; R2 = 0; 692:

1. Interprétez l’estimation de la constante de cette équation. Quel est votre commentaire


sur son signe et son ampleur ?

2. Quelle est la consommation à laquelle on doit s’attendre lorsque le revenu annuel de la


famille est égal à 30 000 dollars ?

3. En utilisant inc sur l’axe des abscisses, construisez un graphique pour représenter la P M C
et la P mC que vous avez estimées précédemment.

Vous aimerez peut-être aussi