Vous êtes sur la page 1sur 9

Académie d’Études Économiques, Bucarest.

Faculté :Administrations des affaires en langues étrangères


Section :Français

Projet économétrie

Coordonateur :Conf. Univ. Dr. Andreea Iluzia Iacob

Étudiant :
Alexandra-Oana Marinescu
Groupe 232

Bucarest
2014
La thème 13
On demande:
 Spécifiez et identifiez le modèle de régression qui décrit la liaison entre les deux
variables;
 Estimez les paramètres du modèle et calculez les valeurs théoriques de la variable
endogène;
 Vérifiez l’hypothèse d’indépendance des erreurs, la signifiance des estimateurs et la
vérosimilité (similitude) du modèle;
 Quel poids de la variation de la variable effet est expliqué par la variation de la
variable cause?
 Réalisez la prévision pour la valeur de la variable dépendante pour la Roumanie.

Le modèle économétrique qui peut être construit à partir des données présentées est un modèle de
régression simple, ayant la forme suivante :
y=-f(x) +u
On identifie y: variable dépendante, résultative, endogène – produit national net;
x: variable indépendante, factorielle, exogène – les dettes publiques le;
u: variable résiduelle, c’est-à-dire l’influence des autres facteurs de la
variable y, autres que x.
Une fois déterminé le modèle économétrique, il faut choisir une fonction mathématique -f(x)
qui devrait expliquer le modèle, la liaison entre les deux variables. Pour estimer les paramètres du
modèle, dans ce cas, régression simple, la plus utilisée méthode est celle de la représentation
graphique des deux séries de valeurs à l’aide du « nuage de points ».

30.0000

25.0000

20.0000 f(x) = − 0.920643324255842 x + 22.9388073212904


R² = 0.860984139089327

15.0000

10.0000

5.0000

0.0000
0.0000 5.0000 10.0000 15.0000 20.0000 25.0000 30.0000

Ce graphique nous permet d’estimer la distribution des points empiriques (xi, yi) par une
droite. Dans ces conditions, le modèle économétrique qui décrit la liaison entre les variables devient
un modèle de régression simple linéaire, ayant la forme : y = a -bx +u, où a et b représentent les
paramètres du modèle.
SUMMARY OUTPUT
Regression Statistics Signification des indicateurs

√ √
n n

Multiple R 0,9279
∑ ( ^y i− ȳ ) 2 ∑ ( y i − ^y i )2
i =1
Ry ,x= = 1− i=1
Rapport de corrélation (R) n n
∑ ( y i− ȳ ) 2
∑ ( y i− ȳ ) 2
i =1 i=1
n

R Square V 2x V u2 ∑ ( ^y i − y )2
0,8610 R2 = =1− = i=1
Coefficient (degré) de V 2
V 20 n
détermination 0
∑ ( y i − y )2
i=1

Adjusted R Square n−k


0,8540 R2c =1− ( 1−R2 )
La valeur ajustée (corrigée) du
n−1
coefficient de détermination


n
Standard Error
∑ ( y i− y^ i )2

2,8772
L’écart-type des erreurs de V 2u i=1
l’échantillon su= =
n−2 n−2
Observations =n
22
Le nombre des observations (n)

ANOVA
Source de df Nombr SS Somme des MS Moyenne F Significan Seuil de
variation e de carrées des ce F signification
degrés (Mesure de la carrées
de variation) (Dispersio
liberté ns
corrigées)
Régression
1025,3 0,0000
(variation 1025,3976 V 2x=∑ ( ^y i− ȳ ) 2 123,8685
2
1 =k 976 =s y/x Fc <0,05
due à la
régression)
Résiduel
165,5623 V 2u =∑ ( y i − ^y i ) 8,2781
2
(variation 20 =n−k−1 =s2u - -
résiduelle)
Total 1190,9600
V 20=∑ ( y i − ȳ )
2
(variation 21 =n−1 - - - -
totale)

Variable Coefficients Coef. L’écart t Stat Statistique t Probabilité


Standard Error type P- critique du
value
test
Intercept
(Terme libre 22,9388 a^ 1,2689 s a^ 18,0774 t ^a 0,0000 <0,05
ou constante)

b^
xi -0,9206 0,0827 s b^ -11,1296 t ^b <0,05
0,0000
Lower < 95% Upper >95%
95% 95%
20,2919 a ∈ [ a^ −t 0 , 05; 20⋅sa^ ] 25,5857 a ∈ [ a^ +t 0, 05 ; 20⋅s a^ ]

-1,0932 ^
[
b ∈ b−t 0 ; 05; 20⋅sb^ ] -0,7481 ^
[
b ∈ b+t 0; 05 ; 20⋅s b^ ]

RESIDUAL
OUTPUT

Predicted Y Residuals
(Y estimé ou (Résidus)
Observation ajusté) ui = y i− y^ i
^y i= a^ + b^ x i

1 4,6288 -1,4551
2 18,5847 0,9379
3 7,4545 1,3311
4 11,2217 -5,5713
5 2,1718 1,6345
6 3,9858 -2,8815
7 1,2277 0,3571
8 5,4714 0,5276
9 12,7059 3,2799
10 21,5986 0,6577
11 1,1105 1,3102
12 15,2030 2,0176
13 10,4863 0,7219
14 11,2155 -0,9367
15 19,8109 0,0203
16 -0,7724 5,4438
17 9,5181 -4,8831
18 6,5973 -3,0362
19 20,0706 4,2733
20 14,5179 -1,1867
21 16,2219 -3,9594
22 19,6414 1,3970
Total 232,6720 0,0000

L’interprétation des résultats du première tableau - SUMMARY OUTPUT:


 R= 0,9279 montre qu’entre le produit national brut et les dettes publiques existe une liaison
puissante, significative;
 R2 =0,8610 montre qu’approximatif 86,10% de la valeur du produit national brut est
expliquée par le produit national brut;
 L’écart type des erreurs, su = 2,8772.Si la valeur de cet indicateur est égale à zéro, ça
signifie que tous les points sont situés sur la droite de régression

L’interprétation des résultats du deuxième tableau -ANOVA:


Dans ce tableau est calculée la statistique F (le test F) pour valider le modèle de régression. Parce que
Fc=123,8685>= F 0 ,05 ; 1; 20 =4.35 ou Fc=123,8685> = F 0 ,01 ; 1; 20 =8.10 et Significance F (le seuil de
signification) est 0,0000 (valeur inferieure a (plus petite que) 0,05) le modèle de régression construit
est valide et il peut être utilisé pour analyser la dépendance entre les deux variables.
L’interprétation des résultats du troisième tableau:
 L’intercept est la constante, c'est-à-dire le coefficient a^ =22,9388 . La constante est le point
où la variable exogène (factorielle) est égale à zéro. Donc, le produit national brut , si les
dettes publiques sont égaux à zéro, est égale à 22,9388 mil. u.m.
t
Parce que ^a = 18,0774
¿2.086=t t
0,05 ; 20 ou ^a = 18,0774¿2.845=t 0 , 01;20 et la probabilité
critique du test, P-value, est 0,0000<0,05, ça signifie que le coefficient est significativement
différent de zéro pour un seuil de signification (confiance) de 5%. L’intervalle de confiance
pour ce paramètre est 21,0609 ¿ a≤ 25,5773pour un seuil de signification (confiance) de 5%
ou pour une probabilité de 95%.

^
Le coefficient b=-0,9206 , surnommé coefficient de régression, c'est-à-dire, quand les
dettes publiques augmentera avec 1 mil., le produit national brut se diminuera à -0,9206
mil.u. m. Mais cette affirmation n’est pas logique du point de vue économique.
t
Parce que ^b = -11,1296
¿−2.086=t t
0 ,05 ;20 ou ^b =-11,1296 ¿−2.845=t 0 ,01; 20 et la probabilité
critique du test, P-value, est 0.0000<0,05, ça signifie que le coefficient n’est pas
significativement différent de zéro pour un seuil de signification (confiance) de 5%.
L’intervalle de confiance pour ce paramètre est-1,1105 ¿ b≤ -0,7599 pour un seuil de
signification (confiance) de 5%.

L’hypothèse d’indépendance des erreurs: Les valeurs de la variable aléatoire U sont


indépendantes, respectivement il n’existe pas un phénomène d’autocorrélation des erreurs,

cov(u 1, u n) = 0. Pour prouver l’inexistence du phénomène d’autocorrélation des erreurs on utilise le


test DURBIN-WATSON.

Ainsi, on calcule une valeur empirique :


n
∑ ( u^ i−u^i −1 )2
d= i =2 n
∑ u^ 2i
i=1 et on la fait comparer à deux valeurs théoriques d1 et d2, prises du tableau
DURBIN-WATSON, en fonction d’un seuil de signification (confiance) α choisi arbitrairement. Il faut
tenir compte du nombre de variables exogènes (k) et des valeurs observées (n), où n > 15.
En fonction des relations entre ces trois grandeurs, on accepte ou on rejette l’hypothèse
d’indépendance des erreurs.
Ainsi, si 0 < d < d1 on a une autocorrélation positive, si d1 ≤ d ≤ d2 on a une indécision, mais on
recommande l’acceptation de l’autocorrélation positive, si d2 < d < 4 – d2 les erreurs sont
indépendantes, si 4-d2 ≤ d ≤ 4-d1 on a de nouveau une indécision, mais on recommande d’accepter
l’autocorrélation négative et, enfin, si 4-d1 < d < 4 on a une autocorrélation négative.

Dans notre cas, la valeur empirique de la variable Durbin-Watson est la suivante :


n
∑ ( u^ i−u^ i −1 )2
1276037,7935
d= i =2 = =0,5012
n 2148357,4595
∑ u^ 2i
i=1 .
Avec un seuil de signification (confiance) de α = 0,05, pour k = 1 – le nombre de variables exogènes
et pour n = 10 observations, on obtient de la table de la distribution Durbin–Watson (pour n = 15) les
deux valeurs théoriques : d1 = 1,08 et d2 = 1,36. Puisque la relation enregistrée est
0 < d= 0,5012< d1=1.08, on conclut qu’on peut accepter l’hypothèse d’indépendance des erreurs.
Pour vérifier la signification (confiance) des estimateurs, dans le sens qu’ils soient différents de zéro,
pour un certain seuil de signification (confiance) α, on doit prouver les relations suivantes :
|^a|
>t
s a^ α
^
|b|
>t
s b^ α s
Cela suppose de calculer d’abord les valeurs de s â et b^ . Ces calculs fournissent les
suivants résultats, pour k = 1, le nombre des variables exogènes

Dans le quatrième tableau on a les informations suivantes : les observations (première colonne),
les valeurs ajustées ou estimées de la variable endogène Y (deuxième colonne) et les résidus u (la
troisième colonne).

Vérification de la signification des paramètres a et b:


1) on établie l’hypothèse nulle: H0: a = 0 et H0: b = 0;
2) on établie l’hypothèse alternative: H1: a  0 et H1: b  0;
3) on calcule le test statistique

a^ −a a^ −0 a^ 22,9388
t ^a= = = = =18. 0777>2 . 845=t 0 , 01; 20 >2. 086=t 0, 05 ; 20
s a^ s a^ s a^ 1,2689
^
b−b ^
b−0 b^ -0,9206
t ^b= = = = =-11,1318<−2. 845=t 0 , 01 ;20 <−2 . 086=t 0 , 05 ;20
s b^ s b^ s ^b 0,0827

t
Donc l’estimateur a^ est significativement différent de zéro pour un seuil de signification
t
(confiance) de 0,05 et, aussi, pour un seuil de signification (confiance) de 0,01 et l’estimateur ^b n’est
pas significativement différent de zéro pour un seuil de signifiance de 0.05 et, aussi pour un seuil de
signifiance de 0.01
Pour vérifier la vérosimilité du modèle, on va utiliser la méthode ANOVA. Mais tout d’abord
on va calculer le coefficient de corrélation linéaire ry/x:
cov ( y ; x ) ∑ ( y i− y )⋅( x i−x ) -1113,7838
r y /x= = = =-0,9279
σ x⋅σ y n⋅σ x⋅σ y 22⋅7,4156⋅7,3576

Le coefficient de corrélation linéaire étant défini dans l’intervalle [-1 ; 1], la valeur obtenue de
-0,9279 indique une corrélation linéaire inverse entre les deux variables.

Vérification de la signification du coefficient de corrélation linéaire:


- on établie l’hypothèse nulle: H0: r = 0;
- on établie l’hypothèse alternative: H1: r≠0.
- on calcule le test statistique t:

t r= = √
r r n−2 -0,9279⋅√ 20
= =−11. 2351
s r √ 1−r 2 √ 1−0,92792

Parce que r
t =−11.2351<t α ;n−k−1 =t0 ,05; 20=−2.086 ou t r =−11. 2351<t α ; n−k−1 =t0 , 01 ; 20 =−2.845 
le coefficient de corrélation linéaire n’est est pas significativement différent de zéro pour un seuil de
signification (confiance) α = 0,01 et, aussi pour α = 0,05.

La vérification de la vérosimilité du modèle est réalisée à l’aide de l’analyse dispersionnelle :

Mesure de la variation Nombre Variances corrigées


Source de
(Somme des carrées) de degrés (Moyenne des carrées) Fcalc
variation
de liberté
V 2x=∑ ( ^y i− y ) 2
Variation d’Y
i V 2x F α ;v ; v =
expliquée par la = s 2x= 1 2
k=1 k =1025,3976
régression (le =1025,3976 =F 0 ,05; 1; 20=
modèle) ¿4.35
2 ou
Variation d’Y V 2u =∑ ( y i − ^y i ) 2 s 2u =
Vu
i = n−k−1 = ¿ F0 ,01;1 ;20=
expliquée par la
=165,5623 n-k-1=20 =8,2781 ¿8.10
variable
résiduelle s2x
F c= 2 =
V 20 =∑ ( y i − y ) =
2 su
i ¿123,8685
Variation totale =1190,9600 n-1=21 v1 = k=1
v2 = n-k-1=20

A l’aide des données


2
de 2tableau peuvent être vérifiées les hypothèses suivantes:
 H 0 : s y /x =s u => le deux variances sont approximatif égales, c’est à dire
l’influence du facteur x ne diffère pas de l’influence des facteurs accidentels et ça
signifie que le modèle n’est pas valide;
2 2
H 1 :s y / x≠s u
 => l’influence du facteur x et celle des facteurs accidentels– mesurée
par les deux variances – diffère significatif et, donc, on peut passer à la discussion de
la similitude ou signifiance du modèle théorétique par rapport au modèle réel (dans ce
cas le modèle est valide).
2
sx
F c= =123,8685
On calcule le test F : s 2u .

Le test Fisher-Snedecor indique le fait que les résultats obtenus antérieurement soient significatifs :

 pour un seuil de signification (confiance) de 0,01 :


( s 2x
F c= 2 =123,8685> F 0, 01 ;1 ; 8=8. 10
su )
 tant que pour un seuil de signification (confiance) de 0,05 :

( s 2x
F c= 2 =123,8685 >= F 0 ,05 ; 1; 8 =4 . 35
su )
Vérification de la signification du rapport de corrélation:
- on établie l’hypothèse nulle: H0: R = 0;
- on établie l’hypothèse alternative: H1: R≠0.
- on calcule le test statistique F.

La vérification de la signification du rapport de corrélation est réalisée à l’aide du test Fisher-


Snedecor:
2 2
R n−k −1 R
F c=( n−2 )⋅ = ⋅
1−R 2 k 1−R 2 , R étant significatif si F c ³ Fα ; v1 ; v2 .
0,8610
F c=20∗ =20∗6,1942=123,8685 >F 0 ,01; 1;20=8.10ou Fc =123,8685>F 0,05 ;1;20=4 .35
Parce que 0,139
 le rapport de corrélation est significativement différent de zéro pour un seuil de signification
(confiance) α = 0,01 et, aussi pour α = 0,05 dans ce cas le modèle est valide.

En ce qui concerne le poids de la variation de la variable effet est expliqué par la variation de la
variable cause, c’est -à-dire que R Square = 0,8610 de la variation de PNN est expliqué par la variable
indépendante/exogène ,x=le produit national brut.

Donc le modèle économétrique


^y i = y = -0,9206x + 22,939décrit la dépendance entre les deux
variables.

Si le produit national brut est égale à 9.3 ,les dettes publiques seront égaux à:
y/x=9.3 =y=-0,9206x9.3+ + 22,939= 14.37742 mil lei.

Pour estimer cette valeur avec une probabilité de réussite plus grande, on utilisera un intervalle
de confiance, pour α = 0,05 ou pour α = 0,01 – on obtient ainsi de la table Student, car n<30, un
tα = 2.086 et respectif 2.845 , compte tenu du fait que k = 1 et v = n- (k+1)= 20.
P { ^y X=10.3−Δ y≤y X=9.3≤^y X=9 .3 +Δ y }=1−α=p

√( )
2
2 1 ( xi −x ) ¿
Δ y =t α⋅s ^y =t α ¿ su 1+ + =¿ { ¿2.086*1.05954=2.2102;α=0,05 ¿ ¿¿¿
X=9.3 n ∑ ( x i−x )2

¿
Δ y =t 0 , 05 ; 20⋅s ^y =2 , 086⋅1 . 05954=2. 2102
X =9 .3
^y X=9 .3 − Δ y≤ y X =9. 3 ≤ ^y X=9 .3 +Δ y ⇔14,3768−2. 2102≤ y X =130 ≤14,3768+2. 2102
7,8808≤ y X =130≤20,8729
P [ y x =9. 3 ∈ ( 7,8808 ;20,8729 ) ] =0 , 955
Δ y =t 0 , 01 ;20⋅s ^y =2 . 845⋅1. 05954=3 . 0143
X=9 .3
y^ X=9 . 3− Δ y ¿ y X =9 .3 ¿ ^y X=9 . 3 +Δ y ⇔ 14,3768−3 . 0143≤ y X =130 ¿ 14,3768+3 .0143
5,5172≤ y X =9 .3 ¿ 23,2365

Vous aimerez peut-être aussi