Académique Documents
Professionnel Documents
Culture Documents
EXERCICE N°2
1 2
2) Expliquer la différence entre le terme résiduel 𝜺𝒊 et l’erreur de la régression 𝜺𝒊 . 3) Quelles conditions doit vérifier le terme d’erreur du modèle afin de pouvoir
appliquer la méthode de moindre carrés ordinaires (MCO)?
Le terme résiduel 𝜀̂ est la contrepartie empirique du terme d’erreur théorique 𝜀 . Le terme résiduel pour
Afin d’obtenir des estimateurs de a et b sans biais et convergents, nous faisons des hypothèses sur
la ième observation est la différence entre 𝑦 et sa valeur estimée 𝑦
l’erreur 𝜀
𝜀̂ = 𝑦 − 𝑦 = 𝑎 + 𝑏𝑥 + 𝜀 − 𝑎 + 𝑏𝑥 = 𝑎−𝑎 + 𝑏−𝑏 𝑥 +𝜀
- 𝐸(𝜀 ) = 0 . En moyenne les erreurs sont nulles, le modèle est bien spécifié. Cette hypothèse signifie
Donc 𝜀̂ = 𝜀 + erreurs de spécification par rapport à l’estimation. que les facteurs secondaires n’ont pas un effet systématique jouant à la hausse ou à la baisse sur la
variable y.
- 𝑉𝑎𝑟(𝜀 ) = 𝜎 . La variance de l’erreur est constante. Cette hypothèse, souvent appelée la propriété de
l’homoscédasticité, traduit l’idée que l’amplitude de la variabilité de l’aléa provenant des facteurs
secondaires est invariante à travers les individus ou à travers le temps.
- 𝑐𝑜𝑣 𝜀 , 𝜀 = 0 𝑝𝑜𝑢𝑟 𝑖 ≠ 𝑖′ . Les erreurs ne sont pas corrélées (liées).
3 - 𝑐𝑜𝑣 𝑥 , 𝜀 = 0. Le terme d’erreur est indépendant de la variable explicative. 4
17/10/2023
4) Quel est l’interet de l’hypothèse supplémentaire de la normalité des erreurs? 5) Quel est le principe de la régression par les MCO?
Le principe de base de la méthode des MCO est de choisir parmi toutes les droites possibles celle qui
minimise l’écart entre les réalisations de la variable expliquée et les valeurs prévus par le modèle estimé.
L’hypothèse de la normalité des erreurs n’est pas indispensable afin d’obtenir des estimateurs Mais pour éviter la compensation entre les écarts négatifs et positifs, la minimisation porte sur les erreurs
convergents mais elle va nous permettre de construire des tests statistiques concernant la validité quadratiques comptées parallèlement à l’axe de la variable expliquée. La figure suivante schématise ce
du modèle estimé. Dans le cas de normalité des termes d’erreur, il est aussi possible d’estimer les principe pour une régression linéaire simple.
5 6
5) Quel est le principe de la régression par les MCO? 5) Quel est le principe de la régression par les MCO?
On cherche une droite, d’équation : 𝑦 = 𝑎 + 𝑏𝑥 qui approche « au mieux » les données. On Pourquoi utiliser les estimateurs des MCO ?
l’appelle droite des moindres carrées de y en x ou droite de régression de y en x. On utilise les estimateurs des MCO,𝑎 et 𝑏, pour des raisons aussi bien pratiques que théoriques. La
Si on désigne par 𝜀̂ l’écart entre le point observé et le point théorique :
méthode des MCO est la plus utilisée dans la pratique ; elle est, en effet, considérée comme le langage
𝜀̂ = 𝑦 − 𝑦 = 𝑦 − 𝑎 + 𝑏𝑥
commun pour les modèles de régression utilisées dans le domaine de l’économie, de la finance, et plus
L’estimateur des MCO est dérivé de la minimisation de la somme des carrés des aléas
généralement des sciences sociales. La formalisation des MCO a été reprise par la quasi-totalité des
𝑀𝑖𝑛 𝑦 − 𝑎 − 𝑏𝑥 = 𝑀𝑖𝑛 𝜀̂ = 𝑀𝑖𝑛 𝑆
logiciels de statistiques, ce qui rend facile son utilisation.
Ce qui conduit à :
Ces estimateurs sont aussi les meilleurs, au sens de critère de la variance minimale, parmi les estimateurs
linéaires et sans biais. C’est pou cela qu’on les qualifie d’estimateurs BLUE (Best Linear Unbiased
Estimator).
7 8
17/10/2023
𝛽= 𝑤𝑌 = 𝑤 𝛼 + 𝛽𝑋 + 𝜀 =𝛼 𝑤 +𝛽 𝑤 𝑋 + 𝑤𝜀
∑
∑
On a ∑ 𝑤 = 0 (𝑝𝑢𝑖𝑠𝑞𝑢𝑒 ∑ 𝑤 =∑ = 0) et ∑ 𝑤 𝑋 = 1 (𝑝𝑢𝑖𝑠𝑞𝑢𝑒 ∑ 𝑤 𝑋 = ∑
=
∑ ² ∑ ∑ ² ² ∑
∑
=∑ =∑ = 1)
9 Donc 𝛽 = ∑ 𝑤 𝑌 =𝛽+∑ 𝑤 𝜀 et puisque 𝜀 est une variable aléatoire donc 𝛽 est aussi aléatoire 10
2- Calculer les estimateurs des M.C.O des coefficients 𝛼 et 𝛽 fournis par les données. En déduire la série des 2- Calculer les estimateurs des M.C.O des coefficients 𝛼 et 𝛽 fournis par les données. En déduire la série des
résidus. résidus.
𝜀̂ = 𝑦 − 𝑦
∑ (1) (2) (3) (9) (10) (11)
𝛽= ∑
= = 0.572 t 𝑦 𝑥 𝑦 𝜀̂ 𝜀̂ ²
.
1 20 54 19,871 0,129 0,02
2 19 53 19,299 -0,299 0,09
𝛼 = 𝑌 − 𝛽 𝑋 = 24.3 − 0.572 ∗ 61.8 = −11.017 3 21 59 22,731 -1,731 3,00
4 21 66 26,735 -5,735 32,89
5 23 63 25,019 -2,019 4,08
6 20 62 24,447 -4,447 19,78
7 25 65 26,163 -1,163 1,35
8 24 60 23,303 0,697 0,49
9 28 59 22,731 5,269 27,76
10 27 65 26,163 0,837 0,70
11 31 70 29,023 1,977 3,91
12 33 65 26,163 6,837 46,74
13
somme 292 291,648 140.80 14
3- Calculer la variance estimée des erreurs. En déduire la variances de ̂. 4- Calculer le coefficient de détermination R 2.
1 140.80
𝜎 = 𝜀̂ = = 14.08
𝑇−2 12 − 2
𝑅 =1− ; 𝑆𝐶𝑅 = ∑ 𝜀̂ = 140.8 et 𝑆𝐶𝑇 = ∑ 𝑌 −𝑌 = 230.67
.
𝑉 𝛽 =∑ = = 0.051 donc 𝜎 = 0.226 Donc 𝑅 = 1 −
.
= 0.389. Le pouvoir explicatif de ce modèle est faible.
² . .
.
𝑉 𝛼 =𝜎 +∑ =14.08 ∗ + = 196.92 donc 𝜎 = 14.03
² .
15 16
17/10/2023
5- Vérifier, à partir des valeurs numériques, que 𝒚 = 𝒚 ̅ 6- Le prix unitaire des ventes a-t-il un effet significatif (au seuil de 5%) sur le niveau de profil ?
.
𝑡 % 𝛽 = = = 2.53 la valeur calculée de la statistique est supérieur à la valeur tabulée de la loi de Student
. .
𝑡 % 𝛼 = = = −0.785, en terme de valeur absolue, la valeur calculée de la statistique est inférieure à
.
(2.228). Donc on rejette H0 est le coefficient 𝛽 est significatif.
la valeur tabulée de la loi de Student (2.228). Donc on accepte H0 est le coefficient 𝛼 n’est pas significatif.
.
𝑡 % 𝛼 = = = −0.785, en terme de valeur absolue, la valeur calculée de la statistique est inférieure à
.
la valeur tabulée de la loi de Student (2.228). Donc on accepte H0 est le coefficient 𝛼 n’est pas significatif.
17 18
l’intervalle de confiance de 𝛽 au niveau 95% est 𝐼𝐶 % = 𝛽 −𝑡 ∗𝜎 ; 𝛽 +𝑡 ∗𝜎 l’intervalle de confiance de 𝛼 au niveau 95% est 𝐼𝐶 % = 𝛼 −𝑡 ∗𝜎 ; 𝛼 +𝑡 ∗𝜎
= 0.572 − 2.228 ∗ 0.226 ; 0.572 + 2.228 ∗ 0.226 = [ 0.068; 1.075] = −11.017 − 2.228 ∗ 14.03 ; −11.017 + 2.228 ∗ 14.03 = [−42.275; 20.241]
19 20