Vous êtes sur la page 1sur 6

Econométrie

Cours 5

• Matière du cours :
— Prévision

— Le coefficient de détermination : R2
— Unités de mesure
— Forme fonctionnelle

1. Prévision
• On distingue 2 types de prévision :
— une prévision de l’espérance de y sachant x0 : E(y0) = β 1 + β 2x0
— une prévision de la valeur de y sachant x0 : y0 = β 1 + β 2x0 + e0

1.1. Prévision de l’espérance de y sachant x0


• Un estimateur / prédicteur naturel de E(y0) = β 1 + β 2x0 = X0β est donné par :
ŷ0 = β̂ 1 + β̂ 2x0 = X0β̂ , où X0 = 1 x0

• Lespropriétés de cet estimateur / prédicteur sont déterminées par la distribution


d’échantillonnage de l’erreur de prévision p̂0 = ŷ0 − E(y0)
• Sous les hypothèses A1 à A5, on a :
E(p̂0) = 0, → ŷ0 est un estimateur / prédicteur non biaisé de E(y0)
V ar(p̂0) = X0V (β̂)X0′ , → dépend de x0 et V (β̂)
3
• Sous l’hypothèse A6 de normalité, on a encore :
ŷ0 − E(y0)
p̂0 ∼ N(0, V ar(p̂0)) ⇔ ẑp0 = ∼ N(0, 1)
s.e.(p̂0)

où s.e.(p̂0) = V ar(p̂0) = X0V (β̂)X0′ = σ 2X0(X ′X)−1X0′

• Le remplacement de σ 2 par ŝ2 fait passer d’une loi normale à une loi de Student :
ŷ0 − E(y0) ŷ0 − E(y0)
ẑp0 = ∼ N(0, 1) → t̂p0 = ∼ t(n − 2)
s.e.(p̂0) s.ê.(p̂0)

où s.ê.(p̂0) = V âr(p̂0) = X0V̂ (β̂)X0′ = ŝ2X0(X ′X)−1X0′

• Pour α fixé, on a ainsi :


ŷ0 − E(y0)
IP −tn−2;1− α2 ≤ ≤ tn−2;1− α2 =1−α
s.ê.(p̂0)
→ un intervalle un intervalle de prévision à (1 − α) × 100% pour E(y0) :
ŷ0 − tn−2;1− α2 s.ê.(p̂0) ; ŷ0 + tn−2;1− α2 s.ê.(p̂0)

1.2. Prévision de la valeur de y sachant x0


• Un prédicteur de y0 = β 1 + β 2x0 + e0 = X0β + e0 est encore donné par :
ŷ0 = β̂ 1 + β̂ 2x0 = X0β̂ , où X0 = 1 x0

• Les propriétés de ce prédicteur sont déterminées par la distribution d’échantillonnage


de l’erreur de prévision fˆ0 = ŷ0 − y0

• Sous les hypothèses A1 à A5, on a :


E(fˆ0) = 0, → ŷ0 est un prédicteur non biaisé de y0
V ar(fˆ0) = σ 2 + X0V (β̂)X0′ , → dépend de σ 2, x0 et V (β̂)

• Sous l’hypothèse A6 de normalité, on a encore :


ŷ0 − y0
fˆ0 ∼ N(0, V ar(fˆ0)) ⇔ ẑf0 = ∼ N(0, 1)
s.e.(fˆ0)

où s.e.(fˆ0) = V ar(fˆ0) = σ 2 + X0V (β̂)X0′ = σ 2(1 + X0(X ′X)−1X0′ )


5
2 2
• Le remplacement de σ par ŝ fait passer d’une loi normale à une loi de Student :
ŷ0 − y0 ŷ0 − y0
ẑf0 = ∼ N(0, 1) → t̂f0 = ∼ t(n − 2)
s.e.(fˆ0) s.ê.(fˆ0)

où s.ê.(fˆ0) = V âr(fˆ0) = ŝ2 + X0V̂ (β̂)X0′ = ŝ2(1 + X0(X ′X)−1X0′ )

• Pour α fixé, on a ainsi :


ŷ0 − y0
IP −tn−2;1− α2 ≤ ≤ tn−2;1− α2 =1−α
ˆ
s.ê.(f0)

→ un intervalle un intervalle de prévision à (1 − α) × 100% pour y0 :


ŷ0 − tn−2;1− α2 s.ê.(fˆ0) ; ŷ0 + tn−2;1− α2 s.ê.(fˆ0)

1.3. Prévision et non-normalité


• L’intervallede prévision pour E(y0) reste valable asymptotiquement, pour n grand,
sous les seules hypothèses A1 à A5
• Ce n’est pas le cas de l’intervalle de prévision pour y0 !

2. Le coefficient de détermination : R2
• Une fois le modèle estimé, chaque observation yi peut être décomposée en une partie
expliquée par le modèle ŷi, et une partie non expliquée ou résiduelle êi :
yi = ŷi + êi, où ŷi = β̂ 1 + β̂ 2xi et êi = yi − ŷi

• De cette décomposition, on peut tirer :


n n n
2 2
(yi − ȳ) = (ŷi − ŷ) + ê2i
i=1 i=1 i=1

SCT SCE SCR

⇔ V are(yi) = V are(ŷi) + V are(êi)


Variance totale Variance expliquée Variance résiduelle

• Le coefficient de détermination est défini par :


SCE SCR V are(ŷi)
R2 = =1− =
SCT SCT V are(yi)
→ Le R2 mesure la part de la variance des yi expliquée par la régression
7

• Par construction, le R2 est toujours compris entre 0 et 1 :


0 ≤ R2 ≤ 1, avec : - R2 = 0 ssi SCE = 0
- R2 = 1 ssi SCR = 0

ne faut pas surestimer l’importance du R2. Il s’agit simplement d’une mesure


• Il
descriptive

• On peut encore montrer que :


— leR2 est égal au carré du coefficient de corrélation empirique ρe(xi, yi)
entre xi et yi :
R2 = (ρe(xi, yi))2
→ les régressions linéaires simples de yi sur xi et de xi sur yi ont le même R2

— leR2 est égal au carré du coefficient de corrélation empirique ρe(yi, ŷi)


entre yi et ŷi :
R2 = (ρe(yi, ŷi))2

3. Unités de mesure
• Lesparamètres et les statistiques calculés dans le cadre du modèle de régression ne
sont pas sans unités de mesure : ils dépendent des unités de mesure de xi et de yi
→ Si on modifie les unités de mesure de xi et/ou de yi, les valeurs des paramètres
et statistiques calculés seront similairement modifiées

• Exemple : P oidsi = β 1 + β 2 T aillei + ei , V ar(ei) = σ 2


↓ ↓ ↓ ↓ ↓ ↓
kg kg kg/cm cm kg kg2

- Si on mesure le poids en grammes plutôt qu’en kilogrammes, on aura :


P oidsi → ×1000, β 1 → ×1000, β 2 → ×1000, ei → ×1000 et σ 2 → ×106

- Si on mesure la taille en mètres plutôt qu’en centimètres, on aura :


T aillei → ÷100, β 1 → idem, β 2 → ×100, ei → idem et σ 2 → idem
9

• Formellement :
yi = β 1 + β 2xi + ei
avec :
E(ei) = 0, V ar(ei) = σ 2 et Cov(ei, ej ) = 0

Nouvelles unités de mesure : yi∗ = ayi et x∗i = cxi


yi∗ x∗i
Le modèle devient : = β 1 + β 2 + ei
a c
⇔ yi∗ = β ∗1 + β ∗2 x∗i + e∗i
avec :
a
β ∗1 = aβ 1 , β ∗2 = β 2 , e∗i = aei ,
c
E(ei ) = 0 , V ar(ei ) = a2σ 2 et Cov(e∗i , e∗j ) = 0
∗ ∗

• Lesvaleurs estimées des paramètres et autres statistiques du modèle se modifient


de façon semblable
• L’ajout d’une constante à xi et/ou yi s’analyse de façon similaire

10

4. Forme fonctionnelle
• Le modèle de régression linéaire suppose uniquement une linéarité dans les paramètres

• Des relations non-linéaires entre variables peuvent être modélisées en transformant


les variables du modèle
4.1. Le modèle lin-log
• Le modèle s’écrit : yi = β 1 + β 2 ln xi + ei , (xi > 0)
Graphiquement :
2 0 2 0
y y

0 1
0 1

e 2 x e 2 x

dy dy
— β2 s’interprète comme une semi-élasticité : β 2 = d ln x = dx
x

— β2 est insensible à une modification des unités de mesure de xi


11

4.2. Le modèle log-lin


• Le modèle s’écrit : ln yi = β 1 + β 2xi + ei , (yi > 0)
Graphiquement :
2 0 2 0
y y 1
e

1
e

0 0
x x
dy
d ln y
— β2 s’interprète comme une semi-élasticité : β 2 = dx = dx
y

— β2 est insensible à une modification des unités de mesure de yi

• Ce modèle correspond, pour yi, à un modèle non-linéaire à erreur multiplicative :


yi = eβ 1+β 2xi vi , où vi = eei ≃ 1 + ei
tel que :
2
E(yi) ≃ eβ 1+β 2xi et V ar(yi) ≃ σ 2 eβ 1+β 2xi = σ 2 [E(yi)]2

12

4.3. Le modèle log-log


• Le modèle s’écrit : ln yi = β 1 + β 2 ln xi + ei , (xi > 0, yi > 0)
Graphiquement :
2 0 2 1 2 0
2 1
y 1
y
2

0 0
x x
dy
d ln y
— β2 s’interprète comme une élasticité : β 2 = d ln x = y
dx
x

— β2 est insensible à une modification des unités de mesure de xi et de yi

• Ce modèle correspond, pour yi, à un modèle non-linéaire à erreur multiplicative :


yi = eβ 1 xβi 2 vi , où vi = eei ≃ 1 + ei
tel que :
2
β β
E(yi) ≃ eβ 1 xi 2 et V ar(yi) ≃ σ 2
eβ 1 xi 2 = σ 2 [E(yi)]2

Vous aimerez peut-être aussi