Vous êtes sur la page 1sur 9

Économétrie

Exercice avec corrigé

(Cet exercice est tiré d’un examen d’économétrie posé en 2015-2016 à la FSJES-Souissi)

Exercice :

Un économiste cherche à expliquer le salaire horaire moyen (𝑌𝑖 � en dollars US) dans une entreprise en
fonction du niveau d’éducation (𝑋𝑖 : mesurée en nombre d’années de scolarité), pour 𝑖 = 1, 2, …, 𝑛. On
considère le modèle de régression linéaire :

𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝜖𝑖

Où les variables aléatoires (𝜖𝑖 ) sont supposées i.i.d (indépendantes et identiquement distribuées) suivant la
même loi Normale centrée de variance 𝜎2 .
En se basant sur un échantillon de taille 𝑁 = 10 d’employés, on obtient les résultats suivants :

Nombre d’années de scolarité Salaire horaire moyen


9 7.33
10 7.31
11 6.58
12 7.82
13 7.84
14 11.02
15 10.67
16 10.84
17 13.61
18 13.53

Dans cet exercice, on utilise un risque de première espèce 𝛼 = 5 % et on donne 𝑇𝑐𝑟𝑖𝑡𝑖𝑞𝑢𝑒 = 2.306 qui
correspond à 𝛼 = 5 % et 𝐷𝐷𝐿 = 8.
1. Déterminer la variable explicative et la variable expliquée en question.
2. Calculer les moyennes de 𝑋 et 𝑌 , notées respectivement par 𝑋̄ et 𝑌 ̄ .
3. Calculer la covariance entre 𝑋 et 𝑌 , notée par 𝐶𝑜𝑣(𝑋, 𝑌 ).
4. Déduire et interpréter le coefficient de corrélation entre 𝑋 et 𝑌 .
5. Estimer les paramètres 𝛽0 et 𝛽1 , par la méthode des moindres carrés. Commenter.
6. Calculer la somme des carrés expliqués 𝑆𝐶𝐸 et la somme des carrés résiduels 𝑆𝐶𝑅.
7. Déterminer et interpréter le coefficient de détermination.
8. Déterminer l’estimation de la variance 𝜎̂ 2 . En déduire l’estimation de la variance de
l’estimateur de 𝛽1 , que l’on notera 𝜎̂ 2 (𝛽1̂ ).

1
9. Construire les intervalles de confiance de 𝛽0 et 𝛽1 de niveau 95 %.
10. Tester si la régression est significative (c’est-à-dire tester 𝐻0 : 𝛽1 = 0 contre 𝐻1 ∶ 𝛽1 ≠ 0).
Commenter.

2
Correction :
1. Déterminer la variable explicative et la variable expliquée en question.

• La variable explicative : nombre d’années de scolarité 𝑋𝑖 .

• La variable expliquée : le salaire horaire moyen 𝑌𝑖 .

2. Calculer les moyennes de X et Y, notées respectivement par 𝑋̄ et 𝑌 ̄ .


𝑁
∑𝑖=1 𝑋𝑖
• Pour 𝑋̄ nous avons la formule de calcule suivante : 𝑋̄ = 𝑁
𝑁
∑𝑖=1 𝑌𝑖
• Pour 𝑌 ̄ nous avons la formule de calcule suivante : 𝑌 ̄ = 𝑁

Nous avons : 𝑁 = 10
Donc :

9 + 10 + 11 + 12 + 13 + 14 + 15 + 16 + 17 + 18
𝑋̄ = = 13.5
10
7.33 + 7.31 + 6.58 + 7.82 + 7.84 + 11.02 + 10.67 + 10.84 + 13.61 + 13.53
𝑌̄ = = 9.655
10

Commentaire :

• 𝑋̄ : en moyenne, le nombre d’années de scolarité des employés est de : 13.5 ans.


• 𝑌 ̄ : en moyenne, le salaire horaire moyen en dollars US est de : 9.655

3. Calculer la covariance entre 𝑋 et 𝑌 , notée par 𝐶𝑜𝑣(𝑋, 𝑌 ).

La covariance est calculée par la formule suivante :

𝑁 ̄ ̄ 𝑁
∑𝑖=1 (𝑋𝑖 −𝑋)(𝑌 𝑖 −𝑌 ) ∑𝑖=1 𝑋𝑌
𝐶𝑜𝑣𝑋,𝑌 = 𝑁
ou 𝐶𝑜𝑣𝑋,𝑌 = 𝑁
− 𝑋̄ 𝑌 ̄

Donc :

𝑁 ̄ 𝑖 − 𝑌̄ )
∑𝑖=1 (𝑋𝑖 − 𝑋)(𝑌
𝐶𝑜𝑣𝑋,𝑌 = = 6.65
𝑁
Commentaire :

• La covariance est positive alors les variables évoluent dans le même sens.

3
4. Déduire et interpréter le coefficient de corrélation entre 𝑋 et 𝑌 .

Le coefficient de corrélation se calcule à travers la relation suivante (bien que il y a d’autres formules de
calcule sont liées à l’estimateur 𝛽1̂ ) :

𝑁 ̄ 𝑖 − 𝑌̄ )
𝜎𝑋,𝑌 ∑𝑖=1 (𝑋𝑖 − 𝑋)(𝑌
𝜌𝑋,𝑌 = =
𝜎𝑋 𝜎𝑌 √∑𝑁 (𝑋𝑖 − 𝑋)̄ 2 √∑𝑁 (𝑌𝑖 − 𝑌 ̄ )2
𝑖=1 𝑖=1

𝑁
̄ 𝑖 − 𝑌̄ )
𝜎𝑋,𝑌 ∑𝑖=1 (𝑋𝑖 − 𝑋)(𝑌
𝜌𝑋,𝑌 = = = 0.929
𝜎𝑋 𝜎𝑌 √∑𝑁 (𝑋𝑖 − 𝑋)̄ 2 √∑𝑁 (𝑌𝑖 − 𝑌 ̄ )2
𝑖=1 𝑖=1

Commentaire :

• Une corrélation linéaire positive forte entre le nombre d’années de scolarité (X) et le salaire horaire
moyen (Y).

5. Estimer les paramètres 𝛽0 et 𝛽1 , par la méthode des moindres carrés. Commenter.

La méthode des moindres carrées consiste à minimiser la somme des carrées des résidus :

𝑁 𝑁
𝑀 𝑖𝑛 ∑ 𝜇2𝑖 = 𝑀 𝑖𝑛 ∑(𝑌𝑖 − 𝑌𝑖̂ )2
𝑖=1 𝑖=1

La minimisation de cette formule (c’est-à-dire la dérivée par rapport à 𝛽0̂ et par rapport 𝛽1̂ ) nous donne les
formules des deux estimateurs.
Pour la pente :

𝑁 ̄ ̄ 𝑁
∑𝑖=1 (𝑋𝑖 −𝑋)(𝑌 𝑖 −𝑌 ) ∑𝑖=1 𝑋𝑖 𝑌𝑖 −𝑛𝑋̄ 𝑌 ̄
𝛽1̂ = 𝑁 ou 𝛽1̂ = 𝑁
∑ (𝑋𝑖 −𝑋)
𝑖=1
̄ 2 ∑ 𝑖=1
𝑋2 −𝑛𝑋2̄
𝑖

Pour la constante (intercepte) :

𝛽0̂ = 𝑌 ̄ − 𝛽1̂ 𝑋̄

En utilisant la formule de la pente :

𝑌𝑖 𝑋𝑖 𝑋𝑖 − 𝑋̄ 𝑌𝑖 − 𝑌 ̄ ̄ 𝑖 − 𝑌̄ )
(𝑋𝑖 − 𝑋)(𝑌 (𝑋𝑖 − 𝑋)̄ 2
7.33 9 -4.5 -2.325 10.4625 20.25
7.31 10 -3.5 -2.345 8.2075 12.25
6.58 11 -2.5 -3.075 7.6875 6.25
7.82 12 -1.5 -1.835 2.7525 2.25
7.84 13 -0.5 -1.815 0.9075 0.25
11.02 14 0.5 1.365 0.6825 0.25
10.67 15 1.5 1.015 1.5225 2.25
10.84 16 2.5 1.185 2.9625 6.25
13.61 17 3.5 3.955 13.8425 12.25
13.53 18 4.5 3.875 17.4375 20.25

4
La pente sera égale à :

𝑁 ̄ ̄
∑𝑖=1 (𝑋𝑖 −𝑋)(𝑌 𝑖 −𝑌 )
𝛽1̂ = 𝑁 ̄ 2
= 0.8056
∑ (𝑋𝑖 −𝑋)
𝑖=1

Pour la constante :

𝛽0̂ =9.655 -0.8056 × 13.5=-1.2211

Après l’estimation des paramètres notre modèle sera de la forme suivante :

𝑌𝑖̂ = −1.221 + 0.805𝑋𝑖

Commentaire :

• 𝛽1̂ : s’interprète comme l’effet marginal d’une année supplémentaire de nombre d’années de scolarité
(𝑋) sur le salaire horaire moyen (𝑌 ).

• 𝛽0̂ : la constante correspond au salaire horaire moyen (𝑌 ) des employés lorsque le nombre d’années de
scolarité (𝑋) égale à 0.

6.Calculer la somme des carrés expliqués 𝑆𝐶𝐸 et la somme des carrés résiduels 𝑆𝐶𝑅.

Pour calculer la 𝑆𝐶𝐸 (la somme des carrées expliqués), nous allons utiliser la formule suivante :

𝑁
𝑆𝐶𝐸 = 𝛽1̂ ∑(𝑋𝑖 − 𝑋)(𝑌
̄ 𝑖 − 𝑌̄ ) (1)
𝑖=1

𝑁 ̄
Pour prouver cette formule (1) il faut la développer, car : 𝑆𝐶𝐸 = ∑𝑖=1 (𝑌𝑖̂ − 𝑌 ̂ ).
Nous avons :

𝑁 ̄ 𝑖 − 𝑌̄ )
∑𝑖=1 (𝑋𝑖 − 𝑋)(𝑌
𝛽1̂ = 𝑁
∑ (𝑋𝑖 − 𝑋)̄ 2
𝑖=1

𝑁 𝑁
𝛽1̂ ∑(𝑋𝑖 − 𝑋)̄ 2 = ∑(𝑋𝑖 − 𝑋)(𝑌
̄ 𝑖 − 𝑌̄ ) (2)
𝑖=1 𝑖=1

Nous remplaçons (2) dans (1) :

𝑁
𝑆𝐶𝐸 = 𝛽1̂ 𝛽1̂ ∑(𝑋𝑖 − 𝑋)̄ 2
𝑖=1

2 𝑁
𝑆𝐶𝐸 = 𝛽1̂ ∑(𝑋𝑖 − 𝑋)̄ 2
𝑖=1

Nous obtenons :

5
𝑁
𝑆𝐶𝐸 = ∑(𝛽1̂ 𝑋𝑖 − 𝛽1̂ 𝑋)̄ 2 (3)
𝑖=1

Un modèle estimé s’écrit :

𝑌𝑖̂ = 𝛽0̂ + 𝛽1̂ 𝑋𝑖

𝑌𝑖̂ − 𝛽0̂ = 𝛽1̂ 𝑋𝑖 (4)

̄
𝑌 ̂ = 𝛽0̂ + 𝛽1̂ 𝑋̄

̄
𝑌 ̂ − 𝛽0̂ = 𝛽1̂ 𝑋̄ (5)

Nous remplaçons (4) et (5) dans (3) :

𝑁
̄
𝑆𝐶𝐸 = ∑(𝑌𝑖̂ − 𝛽0̂ − 𝑌 ̂ + 𝛽0̂ )
𝑖=1

Et nous obtenons donc :

𝑁
̄
𝑆𝐸𝐶 = ∑(𝑌𝑖̂ − 𝑌 ̂ )
𝑖=1

Alors :

𝑆𝐸𝐶 = 0.805 × 66.465 = 53.504

Pour 𝑆𝐶𝑅 (somme des carrés résiduels) :


Pour calculer 𝑆𝐶𝑅 nous devons appliquer la formule suivante :

𝑁 𝑁
𝑆𝐶𝑅 = ∑ 𝜇2𝑖 = ∑(𝑌𝑖 − 𝑌𝑖̂ )2
𝑖=1 𝑖=1

6
𝑌𝑖 𝑋𝑖 𝑌𝑖̂ 𝑌𝑖 − 𝑌𝑖̂ 𝜇2𝑖
7.33 9 6.03 1.300 1.691
7.31 10 6.83 0.475 0.225
6.58 11 7.64 -1.061 1.126
7.82 12 8.45 -0.627 0.393
7.84 13 9.25 -1.412 1.994
11.02 14 10.06 0.962 0.926
10.67 15 10.86 -0.193 0.037
10.84 16 11.67 -0.829 0.687
13.61 17 12.47 1.135 1.289
13.53 18 13.28 0.250 0.062

Pour calculer 𝑌𝑖̂ , il suffit de remplacer chaque élément par sa valeur dans le modèle estimé suivant :

𝑌𝑖̂ = 𝛽0̂ + 𝛽1̂ 𝑋𝑖

Pour calculer 𝑌1̂ qui correspond à la première observation : 𝑌1̂ =-1.221 + 0.806 × 9 = 6.03
La somme des carrés résiduels égale à la somme de la colonne qui contient 𝜇2𝑖 , donc :

𝑆𝐶𝑅 = 8.43

7. Déterminer et interpréter le coefficient de détermination.

𝑆𝐶𝐸
𝑅2 =
𝑆𝐶𝑇

Et nous avons :

𝑆𝐶𝑇 = 𝑆𝐶𝐸 + 𝑆𝐶𝑅

Donc :

𝑆𝐶𝐸
𝑅2 = 𝑆𝐶𝐸+𝑆𝐶𝑅 = 0.864

Commentaire :

• 86.4 % de la variabilité dans le salaire horaire moyen peut s’expliquer par la variabilité du nombre
d’années de scolarité.

8. Déterminer l’estimation de la variance 𝜎̂ 2 . En déduire l’estimation de la variance de


l’estimateur de 𝛽1 , que l’on notera 𝜎̂ 2 (𝛽1̂ ).

L’estimation de la variance 𝜎̂ 2 :

𝑁 𝑁
2
∑𝑖=1 𝜇2𝑖 ∑𝐼=1 (𝑌𝑖 − 𝑌𝑖̂ )2 𝑆𝐶𝑅
𝜎̂ = = =
𝑁 −2 𝑁 −2 𝑁 −2

Et nous avons calculer déjà la 𝑆𝐶𝑅 dans la question 6, donc la variance de l’erreur est :

7
𝑆𝐶𝑅
𝜎̂ 2 = 𝑁−2 = 1.054

L’estimation de la variance de l’estimateur de 𝛽1 (la pente) :


𝑁
Nous avons : ∑𝑖=1 (𝑋𝑖 − 𝑋)̄ 2 = 82.5

𝜎̂ 2
𝜎̂𝛽2 ̂ = 𝑁
1
∑𝑖=1 (𝑋𝑖 − 𝑋)̄ 2

Donc :

𝜎̂ 2
𝜎̂𝛽2 ̂ = 𝑁 ̄ 2
= 0.013
1 ∑𝑖=1 (𝑋𝑖 −𝑋)

9. Construire les intervalles de confiance de 𝛽0 et 𝛽1 , de niveau 95 %.

𝛽𝑖̂ −𝛽𝑖
𝑇𝑖 = 𝜎̂ 𝛽̂ , (𝑖 = 0, 1) suit une loi de Student à (𝑁 − 2) degrés de liberté (DDL) : 𝑇𝑖 ∼> 𝑇𝑁−2 . Pour trouver
𝑖
l’intervalle de confiance de 𝑇𝑖 au risque 1 − 𝛼,nous allons déterminer dans la table de la loi de Student la
valeur 𝑡 𝛼2 , (où 𝜈 = 𝑛 − 1) telle que :

𝐼𝑃 (−𝑡 𝛼2 ≤ 𝑇𝑖 ≤ 𝑡 𝛼2 ) = 1 − 𝛼
𝛽𝑖̂ − 𝛽𝑖
𝐼𝑃 (−𝑡 𝛼2 ≤ ≤ 𝑡 𝛼2 ) = 1 − 𝛼
𝜎̂𝛽 ̂
𝑖

𝐼𝑃 (𝛽𝑖̂ − 𝑡 𝛼2 𝜎̂𝛽 ̂ ≤ 𝛽𝑖 ≤ 𝛽𝑖̂ + 𝑡 𝛼2 𝜎̂𝛽 ̂ ) = 1 − 𝛼


𝑖 𝑖

𝛼/2
Suite à l’énoncé nous avons : 𝛼 = 0.05 et donc 1 − 𝛼 = 0.95 , ainsi que nous avons 𝑡𝑁−2 = 2.3061 .
Pour l’intercepte (𝛽0 ) :
il faut tout d’abord calculer 𝜎̂𝛽 ̂ .
0

Nous avons :


√ 1 𝑋̄ 2
𝜎̂𝛽 ̂ = √𝜎̂ 2 [ + 𝑁 ]
0 𝑁 ∑𝑖=1 (𝑋𝑖 − 𝑋)̄ 2

Donc :

𝑋̄ 2
𝜎̂𝛽2 ̂ = √𝜎̂ 2 [ 𝑁1 + 𝑁 ̄ 2
] = 1.56
0 ∑𝑖=1 (𝑋𝑖 −𝑋)

𝐼𝑃 (𝛽0̂ − 𝑡 𝛼2 𝜎̂𝛽 ̂ ≤ 𝛽0 ≤ 𝛽0̂ + 𝑡 𝛼2 𝜎̂𝛽 ̂ ) = 0.95


0 0
𝐼𝑃 ( -1.221 −2.306× 1.56 ≤ 𝛽0 ≤ -1.221+2.306× 1.56) = 0.95
𝐼𝑃 (-4.818≤ 𝛽0 ≤2.376)= 0.95

Commentaire :

• Nous avons une chance de 0.95 pour que la variable 𝛽0 se trouve à l’extérieur de l’intervalle de confiance
[-4.818;2.376].
1 il faut diviser 𝛼 sur 2 pour trouver la valeur 2.306 dans la table de Student avec 𝐷𝐷𝐿 = 8.

8
Pour la pente (𝛽1 ) :

𝐼𝑃 (𝛽1̂ − 𝑡 𝛼2 𝜎̂𝛽 ̂ ≤ 𝛽1 ≤ 𝛽1̂ + 𝑡 𝛼2 𝜎̂𝛽 ̂ ) = 1 − 𝛼


1 1
𝐼𝑃 (0.545≤ 𝛽1 ≤1.066)= 0.95

Commentaire :

• Nous avons une chance de 0.95 pour que la variable 𝛽1 se trouve à l’extérieur de l’intervalle de confiance
[0.545;1.066].

10. Tester si la régression est significative (c’est-à-dire tester 𝐻0 : 𝛽1 = 0 contre 𝐻1 ∶ 𝛽1 ≠ 0).


Commenter.

Formulation des hypothèses :

𝐻0 ∶ 𝛽1 = 0
{
𝐻1 ∶ 𝛽1 ≠ 0

Il s’agit d’un test bilatéral au seuil 𝛼 = 0.05.


𝛽𝑖̂ −𝛽𝑖
Et nous savons que 𝑇𝑖 = 𝜎̂ 𝛽̂ , (𝑖 = 0, 1) suit une loi de Student à (𝑁 − 2) degrés de liberté (DDL) :
𝑖
𝑇𝑖 ∼> 𝑇𝑁−2 .
Donc sous 𝐻𝑜 nous obtenons le ratio de Student :

𝛽1̂ − 0 𝛽̂
𝑡∗𝛽 ̂ = = 1
1 𝜎̂𝛽 ̂ 𝜎̂𝛽 ̂
1 1

Test statistique :
Étant donné que le test est bilatérale, nous allons calculer donc le ratio de Student empirique désigné par
|𝑡∗𝛽 ̂ | :
𝑖

|𝛽1̂ |
|𝑡∗𝛽 ̂ | = ∼ 𝑡(𝐷𝐷𝐿 = 8)
1 𝜎̂𝛽 ̂
1

|𝛽1̂ |
|𝑡∗𝛽 ̂ | = 𝜎̂ 𝛽̂ =7.128
1 1

Règle de décision :
Nous rejetons l’hypothèse nulle 𝐻0 si :

𝛼/2
|𝑡∗𝛽 ̂ | > 𝑡𝑁−2
1

Suite à la règle de décision nous rejetons l’hypothèse nulle 𝐻0 (7.128 > 2.306) et nous acceptons l’hypothèse
alternative 𝐻1 , et nous disons que la régression est significativement différent de 0.

Vous aimerez peut-être aussi