Vous êtes sur la page 1sur 5

17/10/2023

EXERCICE N°2

1) Quel est le rôle du terme d’erreur aléatoire dans une régression?

Le terme d’erreur 𝜀 représente l’ensemble des facteurs spécifiques à l’individu ou à la période,


autres que la variable x et qui ont un effet favorable ou défavorable sur l’évolution de la variable y.
Le terme d’erreur regroupe trois erreurs :
Modèle linéaire simple - Une erreur de spécification, c'est-à-dire il existe toujours des variables cachées qui expliquent la
variable y mais ne sont pas retenues dans le modèle ;
- Une erreur de mesure ;
Module : TD Econométrie appliquée à la finance
3éme LFF
- Une erreur de fluctuation d’échantillonnage, d’un échantillon à un autre les observations, et donc
2023----2024 les estimations, sont légèrement différentes.

1 2

EXERCICE N°2 EXERCICE N°2

2) Expliquer la différence entre le terme résiduel 𝜺𝒊 et l’erreur de la régression 𝜺𝒊 . 3) Quelles conditions doit vérifier le terme d’erreur du modèle afin de pouvoir
appliquer la méthode de moindre carrés ordinaires (MCO)?
Le terme résiduel 𝜀̂ est la contrepartie empirique du terme d’erreur théorique 𝜀 . Le terme résiduel pour
Afin d’obtenir des estimateurs de a et b sans biais et convergents, nous faisons des hypothèses sur
la ième observation est la différence entre 𝑦 et sa valeur estimée 𝑦
l’erreur 𝜀
𝜀̂ = 𝑦 − 𝑦 = 𝑎 + 𝑏𝑥 + 𝜀 − 𝑎 + 𝑏𝑥 = 𝑎−𝑎 + 𝑏−𝑏 𝑥 +𝜀
- 𝐸(𝜀 ) = 0 . En moyenne les erreurs sont nulles, le modèle est bien spécifié. Cette hypothèse signifie
Donc 𝜀̂ = 𝜀 + erreurs de spécification par rapport à l’estimation. que les facteurs secondaires n’ont pas un effet systématique jouant à la hausse ou à la baisse sur la
variable y.
- 𝑉𝑎𝑟(𝜀 ) = 𝜎 . La variance de l’erreur est constante. Cette hypothèse, souvent appelée la propriété de
l’homoscédasticité, traduit l’idée que l’amplitude de la variabilité de l’aléa provenant des facteurs
secondaires est invariante à travers les individus ou à travers le temps.
- 𝑐𝑜𝑣 𝜀 , 𝜀 = 0 𝑝𝑜𝑢𝑟 𝑖 ≠ 𝑖′ . Les erreurs ne sont pas corrélées (liées).
3 - 𝑐𝑜𝑣 𝑥 , 𝜀 = 0. Le terme d’erreur est indépendant de la variable explicative. 4
17/10/2023

EXERCICE N°2 EXERCICE N°2

4) Quel est l’interet de l’hypothèse supplémentaire de la normalité des erreurs? 5) Quel est le principe de la régression par les MCO?

Le principe de base de la méthode des MCO est de choisir parmi toutes les droites possibles celle qui
minimise l’écart entre les réalisations de la variable expliquée et les valeurs prévus par le modèle estimé.
L’hypothèse de la normalité des erreurs n’est pas indispensable afin d’obtenir des estimateurs Mais pour éviter la compensation entre les écarts négatifs et positifs, la minimisation porte sur les erreurs
convergents mais elle va nous permettre de construire des tests statistiques concernant la validité quadratiques comptées parallèlement à l’axe de la variable expliquée. La figure suivante schématise ce
du modèle estimé. Dans le cas de normalité des termes d’erreur, il est aussi possible d’estimer les principe pour une régression linéaire simple.

paramètres du modèle par la méthode du Maximum de Vraisemblance (MV).

5 6

EXERCICE N°2 EXERCICE N°2

5) Quel est le principe de la régression par les MCO? 5) Quel est le principe de la régression par les MCO?
On cherche une droite, d’équation : 𝑦 = 𝑎 + 𝑏𝑥 qui approche « au mieux » les données. On Pourquoi utiliser les estimateurs des MCO ?
l’appelle droite des moindres carrées de y en x ou droite de régression de y en x. On utilise les estimateurs des MCO,𝑎 et 𝑏, pour des raisons aussi bien pratiques que théoriques. La
Si on désigne par 𝜀̂ l’écart entre le point observé et le point théorique :
méthode des MCO est la plus utilisée dans la pratique ; elle est, en effet, considérée comme le langage
𝜀̂ = 𝑦 − 𝑦 = 𝑦 − 𝑎 + 𝑏𝑥
commun pour les modèles de régression utilisées dans le domaine de l’économie, de la finance, et plus
L’estimateur des MCO est dérivé de la minimisation de la somme des carrés des aléas
généralement des sciences sociales. La formalisation des MCO a été reprise par la quasi-totalité des
𝑀𝑖𝑛 𝑦 − 𝑎 − 𝑏𝑥 = 𝑀𝑖𝑛 𝜀̂ = 𝑀𝑖𝑛 𝑆
logiciels de statistiques, ce qui rend facile son utilisation.
Ce qui conduit à :
Ces estimateurs sont aussi les meilleurs, au sens de critère de la variance minimale, parmi les estimateurs
linéaires et sans biais. C’est pou cela qu’on les qualifie d’estimateurs BLUE (Best Linear Unbiased
Estimator).

7 8
17/10/2023

EXERCICE N°2 EXERCICE N°3


1)
6) Rappeler la définition d’un estimateur BLUE
∑ ∑ ∑ ∑
On a 𝛽 = ∑
= ∑
= ∑
puisque ∑ X −X =0
Meilleur estimateur linéaire sans biais (BLUE) : estimateur qui admet, parmi tous les estimateurs
fonctions linéaires de Y et sans biais, la variance la plus petite. Sous les conditions de Gauss-Markov Soit 𝑤 = ∑ donc 𝛽 = ∑ 𝑤𝑌
(𝐸(𝜀 ) = 0 ,𝑉𝑎𝑟(𝜀 ) = 𝜎 et 𝑜𝑣 𝜀 , 𝜀 = 0 𝑝𝑜𝑢𝑟 𝑖 ≠ 𝑖′ ), l’estimateur des MCO est un estimateur donc 𝜷 est un estimateur linéaire
BLUE.

𝛽= 𝑤𝑌 = 𝑤 𝛼 + 𝛽𝑋 + 𝜀 =𝛼 𝑤 +𝛽 𝑤 𝑋 + 𝑤𝜀



On a ∑ 𝑤 = 0 (𝑝𝑢𝑖𝑠𝑞𝑢𝑒 ∑ 𝑤 =∑ = 0) et ∑ 𝑤 𝑋 = 1 (𝑝𝑢𝑖𝑠𝑞𝑢𝑒 ∑ 𝑤 𝑋 = ∑
=

∑ ² ∑ ∑ ² ² ∑

=∑ =∑ = 1)

9 Donc 𝛽 = ∑ 𝑤 𝑌 =𝛽+∑ 𝑤 𝜀 et puisque 𝜀 est une variable aléatoire donc 𝛽 est aussi aléatoire 10

EXERCICE N°3 EXERCICE N°3


2- Calculer les estimateurs des M.C.O des coefficients 𝛼 et 𝛽 fournis par les données. En déduire la série des résidus.

1) (1) (2) (3) (4) (5) (6) (7) (8)


t 𝑦 𝑥 𝑦 −𝑌 𝑥 −𝑋 (4)*(5) (4)*(4) (5)*(5)
Propriété 2 : Les estimateurs de MCO sont sans biais.
1 20 54 -4.3 -7.8 33.58 18.78 60.06
2 19 53 -5.3 -8.8 46.67 28.44 76.56
3 21 59 -3.3 -2.8 9.17 11.11 7.56
∗𝐸 𝛽 =𝐸 𝛽+ 𝑤𝜀 =𝛽+ 𝑤 𝐸(𝜀 ) = 𝛽 donc l’estimateur de MCO 𝛽 est sans biais 4 21 66 -3.3 4.3 -14.17 11.11 18.06
5 23 63 -1.3 1.3 -1.67 1.78 1.56
6 20 62 -4.3 0.3 -1.08 18.78 0.06
7 25 65 0.7 3.3 2.17 0.44 10.56
8 24 60 -0.3 -1.8 0.58 0.11 3.06
9 28 59 3.7 -2.8 -10.08 13.44 7.56
10 27 65 2.7 3.3 8.67 7.11 10.56
11 31 70 6.7 8.3 55.00 44.44 68.06
12 33 65 8.7 3.3 28.17 75.11 10.56
11 Somme 292 741 157.00 230.67 274.25 12
17/10/2023

EXERCICE N°3 EXERCICE N°3

2- Calculer les estimateurs des M.C.O des coefficients 𝛼 et 𝛽 fournis par les données. En déduire la série des 2- Calculer les estimateurs des M.C.O des coefficients 𝛼 et 𝛽 fournis par les données. En déduire la série des
résidus. résidus.
𝜀̂ = 𝑦 − 𝑦
∑ (1) (2) (3) (9) (10) (11)
𝛽= ∑
= = 0.572 t 𝑦 𝑥 𝑦 𝜀̂ 𝜀̂ ²
.
1 20 54 19,871 0,129 0,02
2 19 53 19,299 -0,299 0,09
𝛼 = 𝑌 − 𝛽 𝑋 = 24.3 − 0.572 ∗ 61.8 = −11.017 3 21 59 22,731 -1,731 3,00
4 21 66 26,735 -5,735 32,89
5 23 63 25,019 -2,019 4,08
6 20 62 24,447 -4,447 19,78
7 25 65 26,163 -1,163 1,35
8 24 60 23,303 0,697 0,49
9 28 59 22,731 5,269 27,76
10 27 65 26,163 0,837 0,70
11 31 70 29,023 1,977 3,91
12 33 65 26,163 6,837 46,74
13
somme 292 291,648 140.80 14

EXERCICE N°3 EXERCICE N°3

3- Calculer la variance estimée des erreurs. En déduire la variances de ̂. 4- Calculer le coefficient de détermination R 2.

1 140.80
𝜎 = 𝜀̂ = = 14.08
𝑇−2 12 − 2
𝑅 =1− ; 𝑆𝐶𝑅 = ∑ 𝜀̂ = 140.8 et 𝑆𝐶𝑇 = ∑ 𝑌 −𝑌 = 230.67
.
𝑉 𝛽 =∑ = = 0.051 donc 𝜎 = 0.226 Donc 𝑅 = 1 −
.
= 0.389. Le pouvoir explicatif de ce modèle est faible.
² . .

.
𝑉 𝛼 =𝜎 +∑ =14.08 ∗ + = 196.92 donc 𝜎 = 14.03
² .

15 16
17/10/2023

EXERCICE N°3 EXERCICE N°3

5- Vérifier, à partir des valeurs numériques, que 𝒚 = 𝒚 ̅ 6- Le prix unitaire des ventes a-t-il un effet significatif (au seuil de 5%) sur le niveau de profil ?

On 𝑦 = 24.304 et 𝑦 = 24.333 donc 𝑦 ≈ 𝑦


.
𝑡 % 𝛽 = = = 2.53 la valeur calculée de la statistique est supérieur à la valeur tabulée de la loi de Student
.
6- Le prix unitaire des ventes a-t-il un effet significatif (au seuil de 5%) sur le niveau de profil ?
(2.228). Donc on rejette H0 est le coefficient 𝛽 est significatif.

.
𝑡 % 𝛽 = = = 2.53 la valeur calculée de la statistique est supérieur à la valeur tabulée de la loi de Student
. .
𝑡 % 𝛼 = = = −0.785, en terme de valeur absolue, la valeur calculée de la statistique est inférieure à
.
(2.228). Donc on rejette H0 est le coefficient 𝛽 est significatif.
la valeur tabulée de la loi de Student (2.228). Donc on accepte H0 est le coefficient 𝛼 n’est pas significatif.
.
𝑡 % 𝛼 = = = −0.785, en terme de valeur absolue, la valeur calculée de la statistique est inférieure à
.

la valeur tabulée de la loi de Student (2.228). Donc on accepte H0 est le coefficient 𝛼 n’est pas significatif.

17 18

EXERCICE N°3 EXERCICE N°3

7- Tester la significativité globale du modèle au seuil de significativité de 5%


8- Déterminer l’intervalle de confiance de coefficient 𝛽 au niveau 95%.
. ⁄
𝐹 % = = = . = 6,366 or la valeur tabulée est 𝐹( %, ) = 4.96. Donc la valeur calculée est
l’intervalle de confiance de 𝛽 au niveau 95% est 𝐼𝐶 = 𝛽 −𝑡 ∗𝜎 ; 𝛽 +𝑡 ∗𝜎
supérieure à la valeur tabulée donc on rejette l’hypothèse nulle. Le modèle est globalement significatif. %

= 0.572 − 2.228 ∗ 0.226 ; 0.572 + 2.228 ∗ 0.226 = [ 0.068; 1.075]

8- Déterminer l’intervalle de confiance de coefficient 𝛽 au niveau 95%.

l’intervalle de confiance de 𝛽 au niveau 95% est 𝐼𝐶 % = 𝛽 −𝑡 ∗𝜎 ; 𝛽 +𝑡 ∗𝜎 l’intervalle de confiance de 𝛼 au niveau 95% est 𝐼𝐶 % = 𝛼 −𝑡 ∗𝜎 ; 𝛼 +𝑡 ∗𝜎

= 0.572 − 2.228 ∗ 0.226 ; 0.572 + 2.228 ∗ 0.226 = [ 0.068; 1.075] = −11.017 − 2.228 ∗ 14.03 ; −11.017 + 2.228 ∗ 14.03 = [−42.275; 20.241]

l’intervalle de confiance de 𝛼 au niveau 95% est 𝐼𝐶 % = 𝛼 −𝑡 ∗𝜎 ; 𝛼 +𝑡 ∗𝜎

= −11.017 − 2.228 ∗ 14.03 ; −11.017 + 2.228 ∗ 14.03 = [−42.275; 20.241]

19 20

Vous aimerez peut-être aussi