Académique Documents
Professionnel Documents
Culture Documents
L’ENTREPRISE
MODULE : Économétrie
Élaboré Par :
CHARRI Ouassima
LAGHRIB Souhaila
Encadré Par :
Dr.EL KHARRIM Mouad
Partie 1 : QCM
Question 1
La réponse est (A) L'estimateur MCO sera biaisé si l'hypothèse selon laquelle l'espérance des
erreurs est nulle (E(εi) = 0 pour tout i = 1,...,n) est violée.
En effet, dans ce cas, les coefficients estimés par la méthode MCO ne seront pas les vraies
valeurs des coefficients dans le modèle linéaire sous-jacent. Le biais peut être soit positif soit
négatif, ce qui signifie que l'estimateur MCO peut surestimer ou sous-estimer les vraies
valeurs des coefficients.
Question 2
La réponse est (C) La taille de l'intervalle de prévision augmente.
L'hypothèse d'homoscédasticité dans la régression linéaire stipule que la variance du terme
d'erreur est constante pour toutes les observations de l'échantillon. Cela signifie que l'erreur
aléatoire de chaque observation a la même variance σ2. Si cette hypothèse est violée et que la
variance de l'erreur aléatoire est différente pour différentes observations, cela est appelé
hétéroscédasticité.
Question 3
La réponse est (C) Les termes de la matrice des variances-covariances (à l'exclusion des
termes de la diagonale) du terme d'erreur sont non nuls.
Partie 2 i Y X1 X2 X3
1 15 4 35 96
Énoncé 1
2 17 3 33 107
3 13 5 33 129
4 19 8 37 120
5 17 9 32 104
6 22 10 31 131
7 24 10 22 107
8 22 7 23 122
9 24 7 31 103
10 19 10 28 138
11 22 6 22 136
12 24 11 21 147
13 28 14 25 149
14 24 9 19 155
Table de données
1- Mettre le modèle sous forme matricielle puis estimer les paramètres du modèle.
Le modèle peut être écrit sous forme matricielle comme suit :
Y = Xβ + ε
Alors, notre modèle est comme suit :
15 1 4 35 96 ε1
17 1 3 33 107 ε2
13 1 5 33 129 ε3
19 1 8 37 120 ε4
17 1 9 32 104 ε5
22 1 10 31 131 𝛽0 ε6
24 = 1 10 22 107 𝛽1 + ε7
22 1 7 23 122 𝛽2 ε8
24 1 7 31 103 𝛽3 ε9
19 1 10 28 138 ε10
22 1 6 22 136 ε11
24 1 11 21 147 ε12
28 1 14 25 149 ε13
24 1 9 19 155 ε14
Nous utilisons la méthode des moindres carrés ordinaires (MCO) pour estimer les paramètres
du modèle, qui consiste à minimiser la somme des carrés des résidus :
SSR(β) = (Y - Xβ)T(Y - Xβ)
En dérivant par rapport à β et en égalisant à zéro, nous obtenons :
β = (XTX)-1XTY
Nous pouvons calculer les estimations de β comme suit :
1 4 35 96
1 3 33 107
1 5 33 129
1 8 37 120
1 9 32 104
1 10 31 131
X= 1 10 22 107
1 7 23 122
1 7 31 103
1 10 28 138
1 6 22 136
1 11 21 147
1 14 25 149
1 9 19 155
Y = [15 17 13 19 17 22 24 22 24 19 22 24 28 24] T
XTX = X' * X XTY =
X' * Y invXTX =
inv(XTX) beta =
invXTX * XTY
Les valeurs estimées des coefficients de régression sont :
β0 = 3.0693
β1 = -0.1564
β2 = 0.1421
β3 = 0.1217
3- Calculer le R2 et le R2 corrige.
On utilise la formule suivante :
R2 = 1 - (SCE/SCT)
Où SCE représente la somme des carrés des résidus (erreur de prédiction) et SCT représente
la somme des carrés totaux (variation totale de Y par rapport à sa moyenne).
On peut calculer ces deux sommes avec les formules suivantes :
SCE = Σ (yi - ŷi)² SCT = Σ (yi - ȳ)²
Enoncé 2
1- Est ce que l’ajout des variables explicatives X2 et X3 dans le modèlè amélioré́ -t-il
significative- ment la qualité ́ de l’estimation par rapport a ̀ X1 seul ?
Pour répondre à cette question, nous pouvons utiliser le test de Fisher qui permet de tester si
l'ajout de variables dans le modèle améliore significativement la qualité de l'estimation par
rapport au modèle initial.
La statistique de test est donnée par : F = [(SCR1 - SCR 2) / q] / [SCR 2 / (n - p - 1)] où :
• SCR 1 est la somme des carrés des résidus du modèle avec X1 seul,
• SCR 2 est la somme des carrés des résidus du modèle avec X1, X2 et X3,
• q est le nombre de variables supplémentaires ajoutées (2 dans notre cas),
• n est le nombre d'observations (14),
• p est le nombre de variables explicatives dans le modèle final (3 dans notre cas).
La distribution de F suit une loi de Fisher avec q et n - p - 1 degrés de liberté.
On peut alors comparer la valeur de F observée avec la valeur critique de la loi de Fisher pour
un niveau de confiance donné. Si la valeur observée est supérieure à la valeur critique, on peut
rejeter l'hypothèse nulle selon laquelle l'ajout de variables n'améliore pas significativement la
qualité de l'estimation.
Calculons d'abord les RSS pour les deux modèles :
• Avec X1 seul : SCR 1 = 141.7857
• Avec X1, X2 et X3 : SCR 2 = 74.0535
Calculons ensuite la valeur observée de la statistique de test F : F = [(SCR 1 - SCR 2) / q] /
[SCR 2 / (n - p - 1)] = [(141.7857 - 74.0535) / 2] / [74.0535 / 10] = 6.181
En utilisant une table de valeurs critiques pour la loi de Fisher avec 2 et 10 degrés de liberté
(ou un logiciel statistique), on trouve que la valeur critique pour un niveau de confiance de
95% est d'environ 4.10.
Puisque la valeur observée de la statistique de test F est supérieure à la valeur critique, on peut
conclure que l'ajout des variables explicatives X2 et X3 améliore significativement la qualité
de l'estimation par rapport à X1 seul.
En d'autres termes, le modèle avec X1, X2 et X3 explique mieux les variations de Y que le
modèle avec X1 seul.
2- Peut-on considérer le modèle ( a ̀ trois variables explicatives) comme stable sur
l’ensemble de la période, ou doit́ -on procéder ́ a ̀ deux estimations, l’une de la
période 1 ́ à 7, et l’autre de la période 8 ́ à 14 ?
La statistique de test de Chow suit une loi de F avec (k+1) et (n-k-2) degrés de liberté, où k
est le nombre de variables explicatives (3 dans ce cas) et n est le nombre total d'observations
(14 dans ce cas).
En utilisant une valeur seuil de 0,05, on peut comparer la valeur de la statistique de test de
Chow à la valeur critique de la loi de F pour déterminer si le modèle doit être considéré
comme stable sur l'ensemble de la période ou s'il est préférable de procéder à deux
estimations.
La valeur de la statistique de test de Chow est de 0,714 avec une valeur critique de la loi de F
de 3,62 pour 3 et 10 degrés de liberté. Étant donné que la valeur de la statistique de test est
inférieure à la valeur critique, on ne peut pas rejeter l'hypothèse nulle selon laquelle les
coefficients du modèle sont stables sur l'ensemble de la période.
Par conséquent, on peut considérer que le modèle à trois variables explicatives est stable sur
l'ensemble de la période. Il n'est pas nécessaire de procéder à deux estimations pour les
périodes 1 à 7 et 8 à 14.
3- Un économiste suggère que dans ce mod̀ ele ̀ β1 = 1 et β2 = β3, qu’en pensez-vous
?
Le modèle proposé par l'économiste est différent de celui utilisé actuellement, car les
coefficients β1, β2 et β3 sont modifiés. Si nous remplaçons ces coefficients dans le modèle
actuel, nous obtenons :
Yi = β0 + β1Xi1 + β2Xi2 + β3Xi3 + εi
Yi = 3.0693 + (1)Xi1 + (β3)Xi2 + (β3)Xi3 + εi
Yi = 3.0693 + Xi1 + (0.1217)Xi2 + (0.1217)Xi3 + εi
Le modèle proposé par l'économiste suppose que la variable X1 a une influence directe sur Y,
tandis que les variables X2 et X3 ont une influence indirecte via β2 et β3. Cela peut ne pas
être réaliste car il est peu probable que les coefficients soient exactement égaux. De plus, il est
important de rappeler que les coefficients dans un modèle de régression doivent être estimés à
partir des données, et il est peu probable que les données soutiennent l'hypothèse que β1 = 1 et
β2 = β3.
En fin de compte, il serait préférable de continuer à utiliser le modèle actuel, car il a été
estimé à partir des données et il fournit une bonne représentation des relations entre les
variables explicatives et la variable dépendante.