Vous êtes sur la page 1sur 11

STAT

STAT.XLS : ROutils statistiques utiliss dans le cours de macroconomie (rgression et corrlation)


Y
M
1981
5
2
1982
5.5
2.5
1983
6
3.2
1984
7
3.6
1985
7.2
3.3
1986
7.7
4
1987
8.4
4.2
1988
9
4.6
1989
9.7
4.8
1990
10
5
Source:

Pyndyck et Rubinfeld
Econometric models and economic forecast
3e dition, p.17
Y revenu national
M masse montaire

Page 1

STAT.XLS : La rgression linaire simple Y_t = a+b*M_t + U_t t=81,...,90 Chapitre 1


Y
81
82
83
84
85
86
87
88
89
90

M
5
5.5
6
7
7.2
7.7
8.4
9
9.7
10

2
2.5
3.2
3.6
3.3
4
4.2
4.6
4.8
5

Y_FIT
4.58
5.435
6.632
7.316
6.803
8
8.342
9.026
9.368
9.71

U
0.42
0.065
-0.632
-0.316
0.397
-0.3
0.058
-0.026
0.332
0.29

11

11

Y en fonction
du temps

10
9

Y en fonction
de M

10
9

8
8
7
7
6
6
5
5
4
81

Y=a+b*M+U
a
1.16
b
1.71

82

83

84

85

86

87

88

89

90

4
2

1
0.8

R^2 0.9583
RSS 1.1259

0.6
0.4
0.2

Prvisions
M
91
6
92
6.5
93
7

U^2
0.1764
0.0042
0.3994
0.0999
0.1576
0.09
0.0034
0.0007
0.1102
0.0841

Y
11.42
12.3
13.1

R2

2
1.5
1
0.5
0
-0.5
-1
-1.5
-2

Rsidus

RAPPORT DETAILLE
Statistiques de la rgression
Coefficient de dtermination multiple 0.97909434
Coefficient de dtermination R^2
0.95862572
Coefficient de dtermination R^2
0.95345394
Ecart-type
0.37371654
Observations
10

2.5

3.5

4.5

Constante
Variable X 1

Coefficients Ecart-type StatistiqueLimite


t Probabilit
infrieure pour seuil de confiance = 95%
1.16814461 0.48341944 2.41642045 0.04208448 0.05337667
1.71555252 0.12600846 13.614582 8.149E-007 1.4249763

rieure
Limitepour
infrieure
seuil
Limite
de
pour
confiance
suprieure
seuil de =confiance
pour
95%seuil=de95.000%
confiance = 95.000%
2.28291255 0.05337667 2.28291255
2.00612874 1.4249763 2.00612874

CORR

Le coefficient de corrlation
Y
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
MOY
ECT

M
5
5.5
6
7
7.2
7.7
8.4
9
9.7
10

Y-MOY
2
2.5
3.2
3.6
3.3
4
4.2
4.6
4.8
5

M-MOY
-2.55
-2.05
-1.55
-0.55
-0.35
0.15
0.85
1.45
2.15
2.45

7.55
3.72
1.64331981 0.93786993

Y*M
-1.72
-1.22
-0.52
-0.12
-0.42
0.28
0.48
0.88
1.08
1.28

SOMME
CORRELATION
CALCUL
FORMULE

Y*M(-1)
4.386
2.501
0.806
0.066
0.147
0.042
0.408
1.276
2.322
3.136

3.526
1.891
0.286
0.042
-0.063
0.238
0.696
1.892
2.646

15.09

11.154

0.97909434 0.80412475 Voir note


0.97909434 0.98044729

5.5
5
4.5
4
3.5
3
2.5
2
5

10

11

Note : Attention, les calculs diffrent lgrement pour les retards. La cause, le calcul de la moyenne et des carts-type.
Y
M(-1)
Y-MOY
M-MOY
Y*M
1982
5.5
2 -2.33333333 -1.57777778 3.68148148
1983
6
2.5 -1.83333333 -1.07777778 1.97592593
1984
7
3.2 -0.83333333 -0.37777778 0.31481481
1985
7.2
3.6 -0.63333333 0.02222222 -0.01407407
1986
7.7
3.3 -0.13333333 -0.27777778 0.03703704
1987
8.4
4 0.56666667 0.42222222 0.23925926
1988
9
4.2 1.16666667 0.62222222 0.72592593
1989
9.7
4.6 1.86666667 1.02222222 1.90814815
1990
10
4.8 2.16666667 1.22222222 2.64814815

Page 6

CORR

MOY
ECT

7.83333333 3.57777778
1.4824904 0.8803759

SOMME
CORRELATION
CALCUL
FORMULE

Page 7

11.5166667

0.98044729
0.98044729

CORR

yenne et des carts-type.

Page 8

CORR

Page 9

THEORIE

La rgression linaire
Dans toute dmarche d'analyse, on cherche relier ou expliquer certaines variables
d'intrt (variables dpendantes) l'aide de variables explicatives ou indpendantes.
Par exemple, on peut penser que Y est reli de faon linaire X selon l'quation
(1) Y = a + b*X
o a est le coefficient d'ordonne l'origine et b est le coefficient de la pente de la
relation.
En pratique, on aimerait trouver les valeurs de a et b partir de donnes, souvent des
donnes chronologiques. Par exemple, le classeur STAT contient des donnes du PIB
(Y) et de la masse montaire (M) de 1981 1990).
Reformulons le modle (1) en terme de rgression.
(2) Y_t = a + b*X_t + U_t

t=1981,...,1990.

Le modle (2) suppose que chaque Y_t (de 1981 1990) est reli au X_t
correspondant mais cette relation n'est pas exacte car il y a un terme d'erreur U_t
associ chaque observation. Dans certains cas, Y_t est proche de a+b*X_t, dans
d'autres cas il est suprieur ou infrieur. Tout dpendra du terme d'erreur qui est est en
fait une variable alatoire de moyenne 0 et de variance sigma carr.
Comment trouver des valeurs pour a et b. Le classeur REG illustre la technique de la
rgression qui dtermine a et b de faon rendre la somme des erreurs au carr la plus
petite possible. Pourquoi ce crititre? On sait qu'une bonne relation doit gnrer de
petites erreurs U_t ; comme ces erreurs peuvent tre positives ou ngatives, il est
intressant de les mettre au carr.
En donnant diffrentes valeurs possibles pour a et b, on peut constater de faon
visuelle que les valeurs a=1,16 et b=1,76 :
1. donnent une somme des erreurs au carr la plus petite possible
2. donnent un R2 le plus grand possible
3. donnent un graphique o les rsidus U_t sont gnralement proches de zro
4. donnent un graphique o les valeurs prdites de Y sont proches des valeurs
observes
L'option Outils/Utilitaire d'analyse/Rgression linaire permet de trouver f

Page 10

THEORIE

Page 11