Vous êtes sur la page 1sur 70

Application de Box & Jenkins

1- Etude de la série PRIX :

Diagramme séquentiel de la série brute

60

PRIX 50

40

30

20

10

0 PRIX
JA JA J A J A JA JA JA JA JA J A J A JA JA JA J A J A J A J A J A
N N N N N N N N N N N N N N N N N N N
19 19 19 19 19 19 19 19 19 19 19 19 19 19 20 20 20 20 20
86 87 88 89 90 91 92 93 94 95 96 97 98 99 00 01 02 03 04

Date

Graphe de la moyenne et la variance de la série PRIX :

Graphe de la moyenne Graphe de la variance

45 50
40
35 40
30
25 30
PRIX PRIX
20
20
15
10 10
5
0 0
1 4 7 10 13 16 19 1 4 7 10 13 16 19

D’après les deux graphes, on remarque que la moyenne et la variance varient au cours
du temps. On peut donc appréhender la non stationnarité de la série.
La non stationnarité de la série implique la présence d’une saisonnalité, et/ ou d’une
tendance.
Pour vérifier ceci, on va appliquer des tests statistiques juste après la présentation des
corrélogrammes simple et partiel de la série brute.

63
Application de Box & Jenkins

Corrélogrammes simple et partiel de la série brute :


PRIX PRIX
1,0
1,0

,5
,5

0,0 0,0

-,5 -,5

ACF partiel
Limites de confiance Limites de confiance
ACF

-1,0 Coefficient -1,0 Coefficient


1 7 13 19 25 31 37 43 1 7 13 19 25 31 37 43
4 10 16 22 28 34 40 4 10 16 22 28 34 40

Numéro de décalage Numéro de décalage

Le corrélogramme simple présente une alternance entre une décroissance linéaire et une
stabilité, puis une légère élévation et enfin une stabilité.
Le corrélogramme partiel fait apparaître deux pics significatifs.

Test de la saisonnalité : (ANOVA)

Pour déceler la présence du facteur saisonnier, on utilise le test de Fisher qui repose
sur l’analyse de la variance.
Test d’influence du facteur ligne (mois) :
H0 : «absence du facteur saisonnier» contre H1 : « il existe un facteur saisonnier »

Test d’influence du facteur colonne (années) :


H 0  : «La série n’est pas affectée d’une tendance» / H1  : « La série est
tendancielle ».

Résultats du test :

Source des Somme des Degré de Moyenne F Probabilité Valeur critique


variations carrés liberté des carrés pour F
Lignes 177,095519 11 16,0995927 1,86533261 0,04587333 1,83726101
Colonnes 9252,90334 18 514,050185 59,558934 1,0519E-69 1,65617564
Erreur 1708,92811 198 8,63095007
Total 11138,927 227
Effet ligne :
Fcal > Ftab (1,86533261  1,83726101) au seuil   0,05, ceci implique que H0 est
rejetée, donc la série est légèrement affectée d’un facteur saisonnier.
Effet colonne :
Fcal > Ftab (59,558934 > 1,65617564) au seuil   0,05, ceci implique que H0 est rejetée,
Le test manifeste la présence d’une tendance.

Elimination du facteur saisonnier :

64
Application de Box & Jenkins

Pour extirper la saisonnalité, on applique l’opérateur de différence saisonnière


d’ordre 12 sur la série PRIX. La série ainsi obtenue est notée PRIXDS
(C’est-à-dire PRIXDSt  PRIXt –PRIXt-12)

Diagramme séquentiel de la série PRIXDS


30

Vér
20
ifica
tion
10 de

-10
PRIX

-20

Date
Transforme: Différence saisonnière (1, période 12)

l’élimination de la saisonnalité :

On applique le test de Fisher sur la série PRIXDS pour s’assurer que la saisonnalité
est complètement éliminée.

Résultats du test :

Source des Somme des Degré de Moyenne F Probabilité


Valeur
variations carrés liberté des carrés critique pour
F
Lignes 28,7925125 11 2,61750114 0,13405593 0,99961471 1,84014226
Colonnes 4718,91874 17 277,583455 14,2165017 1,783E-25 1,6776518
Erreur 3651,25735 187 19,5254404
Total 8398,9686 215

Effet ligne :
Fcal < Ftab (0,13405593 < 1,84014226) au seuil   0,05, ceci implique que H0 est
acceptée, donc la série PRIXDS n’est pas atteinte du facteur saisonnier.

Etude de la série PRIXDS :

65
Application de Box & Jenkins

Test de Dickey-Fuller :
Nous appliquons le test de Dickey-Fuller sur la série PRIXDS pour nous permettre de
détecter l’existence d’une racine unitaire et le type de la tendance.
H01 : « il existe une racine unitaire » H11 : « absence de racine unitaire »
2
H0  : « la constante est nulle » H12 : « la constante n’est pas nulle »
H03 : « le coefficient de la tendance est nul » H03: « le coefficient n’est pas nul »

Les résultats du test :

Le modèle (3) :

ADF Test Statistic -3.167765 1% Critical Value* -4.0037


5% Critical Value -3.4318
10% Critical Value -3.1393
Variable Coefficient Std. Error t-Statistic Prob.
PRIXDS(-1) -0.093011 0.029362 -3.167765 0.0018
C -0.067439 0.390992 -0.172483 0.8632
@TREND(1986:01) 0.002251 0.002941 0.765471 0.4448
R-squared 0.045324 Mean dependent var 0.071163
Adjusted R-squared 0.036318 S.D. dependent var 2.677532
S.E. of regression 2.628461 Akaike info criterion 4.78453
Sum squared resid 1464.668 Schwarz criterion 4.831562
Log likelihood -511.3369 F-statistic 5.032421
Durbin-Watson stat 1.34078 Prob(F-statistic) 0.007324

On accepte l’hypothèse nulle de non stationnarité (il existe une racine unitaire) car
la statistique de Student tˆ  0 =-3,16 > -3 ,43 au seuil 5%.
On accepte l’hypothèse nulle de la nullité du coefficient de la tendance
conditionnellement à la présence d’une racine unitaire du fait que
F3 =5,03 (Fisher) < Ftab = 6,34.

Le modèle (2) : 

ADF Test Statistic -3.081778 1% Critical Value* -3.4621


    5% Critical Value -2.875
    10% Critical Value -2.5739
Variable Coefficient Std. Error t-Statistic Prob.
PRIXDS(-1) -0.088789 0.028811 -3.081778 0.0023
C 0.196707 0.18366 1.071036 0.2854
R-squared 0.042685 Mean dependent var 0.071163
Adjusted R-squared 0.038191 S.D. dependent var 2.677532
S.E. of regression 2.625905 Akaike info criterion 4.777987
Sum squared resid 1468.716 Schwarz criterion 4.809342
Log likelihood -511.6336 F-statistic 9.497358
Durbin-Watson stat 1.342457 Prob(F-statistic) 0.002329

On rejette l’hypothèse nulle de non stationnarité (il n’existe pas une racine unitaire)
car la statistique de Student tˆ  0 =-3,08 < -2,87 au seuil 5%.

66
Application de Box & Jenkins

Le coefficient de la constante est significativement égal à zéro : tcˆ  0 =1,07 <1,96


au seuil 5%.

Le modèle (1) : 

ADF Test Statistic -0.91587 1% Critical Value* -2.5751


5% Critical Value -1.9412
10% Critical Value -1.6164

On accepte l’hypothèse nulle de non stationnarité (il existe une racine unitaire) car
la statistique de Student tˆ  0 =-0,91 > -1,94 au seuil 5%.
La série PRIXDS est donc non stationnaire de type de tendance DS sans dérive, il suffit
de la différencier au mois une fois pour la rendre stationnaire.
Le modèle s’écrit : xt   t
La série obtenue sera notée PRIXDSD.

Diagramme de la série PRIXDSD

20

10
DIF F (PRIX_1,1)

-10

Date

Test de Dickey-Fuller sur la série (PRIXDSD) :

Les résultats du test :

67
Application de Box & Jenkins

Le modèle (3) :

ADF Test Statistic -10.91106 1% Critical Value* -4.0039


5% Critical Value -3.4319
10% Critical Value -3.1394
Variable Coefficient Std. Error t-Statistic Prob.
PRISDSD(-1) -0.721466 0.066122 -10.91106 0
C -0.106 0.382484 -0.277135 0.7819
@TREND(1986:01) 0.000983 0.002826 0.347995 0.7282
R-squared 0.360706 Mean dependent var -0.060794
Adjusted R-squared 0.354646 S.D. dependent var 3.177282
S.E. of regression 2.552436 Akaike info criterion 4.725893
Sum squared resid 1374.65 Schwarz criterion 4.773079
Log likelihood -502.6705 F-statistic 59.52567
Durbin-Watson stat 1.885721 Prob(F-statistic) 0

On rejette l’hypothèse nulle de non stationnarité (il n’existe pas de racine unitaire)
car la statistique de Student tˆ  0 =-10,91 < -3 ,43 au seuil 5%.
Le coefficient de la tendance est significativement égal à zéro car t ̂  0,34 <1,96.

Le modèle (2) : 

ADF Test Statistic -10.92819 1% Critical Value* -3.4623


5% Critical Value -2.8751
10% Critical Value -2.5739
Variable Coefficient Std. Error t-Statistic Prob.
PRISDSD(-1) -0.720731 0.065952 -10.92819 0
C 0.012424 0.174248 0.0713 0.9432
R-squared 0.360339 Mean dependent var -0.060794
Adjusted R-squared 0.357321 S.D. dependent var 3.177282
S.E. of regression 2.54714 Akaike info criterion 4.717121
Sum squared resid 1375.439 Schwarz criterion 4.748579
Log likelihood -502.7319 F-statistic 119.4253
Durbin-Watson stat 1.885817 Prob(F-statistic) 0

On rejette l’hypothèse nulle de non stationnarité (il n’existe pas une racine unitaire)
car la statistique de Student tˆ  0 =-10,92 < -2,87 au seuil 5%.
Le coefficient de la constante est significativement égal à zéro : tcˆ  0 =0,07 <1,96
au seuil 5%.

Le modèle (1) :

ADF Test Statistic -10.95916 1% Critical Value* -2.5752


5% Critical Value -1.9412
10% Critical Value -1.6164

On rejette l’hypothèse nulle de non stationnarité (il n’existe pas une racine unitaire)
car la statistique de Student tˆ  0 =-10,95 < -1,94 au seuil 5%.
Le modèle s’écrit comme suit : xt     1 xt 1   t
La série est stationnaire, on passe à la modélisation par la méthode de Box & Jenkins.

68
Application de Box & Jenkins

Identification du modèle à priori :

Corrélogrammes de la série PRIXDSD :

PRIX PRIX
1.0 1.0

.5 .5

0.0 0.0

-.5 Limites de confiance -.5 Limites de confiance

ACF partiel
ACF

-1.0 Coefficient -1.0 Coefficient


1 7 13 19 25 31 37 43 1 7 13 19 25 31 37 43
4 10 16 22 28 34 40 4 10 16 22 28 34 40

Numéro de décalage Numéro de décalage


Transforme: différence (1), Différence saisonnière (1, période 12) Transforme: différence (1), Différence saisonnière (1, période 12)

Le modèle à priori est : SARIMA (2, 1, 2) (2, 1, 1).

Le choix du modèle optimal:

Le choix du modèle optimal se fera parmi tous les modèles proposés, ce choix est
basé sur les critères d’information AIC et BIC.

Modèle AIC BIC


SARIMA (1, 1,2) (3, 1,0) 945,99525 966,21908
SARIMA (1, 1,2) (0, 1,1) 930,40273 943,88528

Parmi ces modèles on choisit celui qui minimise les deux critères AIC et BIC, on opte
pour le modèle SARIMA (1, 1, 2) (0, 1, 1).

Estimation des paramètres du modèle optimal :

Les variables du modèle :

B SEB T-RATIO APPROX. PROB.

AR1 .87003168 .09773840 8.901637 .00000000


MA1 .64875818 .11281828 5.750470 .00000003
MA2 .28633824 .06436013 4.449000 .00001396
SMA1 .89822833 .08187823 10.970295 .00000000

Test sur les paramètres:

69
Application de Box & Jenkins

Les paramètres sont significativement différents de zéro, car les statistiques t


empiriques associés sont supérieures à la valeur de la statistique t théoriques 1,96 au
risque 5% et les probabilités sont toutes inférieures à 0,05.

Tests sur les résidus :

Error for PRIX from ARIMA, MOD_5 NOCON Error for PRIX from ARIMA, MOD_5 NOCON
1.0 1.0

.5 .5

0.0 0.0

-.5 -.5
Limites de confiance Limites de confiance
ACF partiel
ACF

-1.0 Coefficient -1.0 Coefficient


1 7 13 19 25 31 37 43 1 7 13 19 25 31 37 43
4 10 16 22 28 34 40 4 10 16 22 28 34 40

Numéro de décalage Numéro de décalage

On va s’assurer que les résidus du modèle SARIMA (1, 1, 2) (0, 1, 1) forment un bruit
blanc en utilisant les tests suivants :

a. Test de points de retournement :

 0  : « Les  i sont non corrélés »


H1 : « Il existe une corrélation entre les résidus ».
n 1
2( n  2) 16n  29
T=   i = 146 ;  T  = = 142 ; ar  T  = = 37,9.
i2 3 90

U = 0,65 < 1,96 donc on accepte H0 au seuil 5%.


Les résidus ne sont pas corrélés entre eux.
b. Test de Box-Ljung :

H0 : « 1=2=…=45=0 » contre H1 : «  j j := 1,…,45 tel que j  0 »


Pour k = 36, Q = 36,263  2 32 = 46,194, le pic n’est pas significatif.

Pour k = 43, Q = 48,462  2 39 = 54,572, le pic n’est pas significatif.

Pour k = 45, p = 1, q = 2, P = 0, Q = 1 :

70
Application de Box & Jenkins

La statistique Q = 48,462  2 41 = 56,942 donc on accepte l’hypothèse nulle : les


résidus forment un bruit blanc.

Auto- Stand.
Lag Corr. Err. -1 -.75 -.5 -.25 0 .25 .5 .75 1 Box-Ljung Prob.
+----+----+----+----+----+----+----+----+
1 -.004 .068 . * . .004 .948
2 -.048 .068 . *I . .503 .778
3 .063 .067 . I* . 1.368 .713
4 .054 .067 . I* . 2.010 .734
5 .012 .067 . * . 2.041 .843
6 -.083 .067 .**I . 3.581 .733
7 -.040 .067 . *I . 3.933 .788
8 .046 .067 . I* . 4.415 .818
9 .056 .066 . I* . 5.135 .822
10 -.102 .066 .**I . 7.518 .676
11 .078 .066 . I**. 8.909 .630
12 -.070 .066 . *I . 10.025 .614
13 -.037 .066 . *I . 10.347 .665
14 .059 .066 . I* . 11.165 .673
15 -.021 .065 . * . 11.270 .733
16 -.080 .065 .**I . 12.761 .690
17 -.048 .065 . *I . 13.308 .715
18 .015 .065 . * . 13.359 .770
19 -.078 .065 .**I . 14.825 .734
20 -.054 .065 . *I . 15.534 .745
21 -.004 .064 . * . 15.538 .795
22 .011 .064 . * . 15.570 .837
23 .023 .064 . * . 15.701 .868
24 -.126 .064 ***I . 19.552 .722
25 -.014 .064 . * . 19.597 .768
26 .022 .064 . * . 19.718 .805
27 -.146 .063 ***I . 25.035 .572
28 -.017 .063 . * . 25.110 .622
29 .051 .063 . I* . 25.774 .638
30 -.022 .063 . * . 25.895 .680
31 -.008 .063 . * . 25.912 .726
32 .025 .063 . * . 26.067 .761
33 .069 .062 . I*. 27.301 .746
34 -.019 .062 . * . 27.392 .782
35 -.023 .062 . * . 27.533 .812
36 -.183 .062 **.*I . 36.263 .456
37 .073 .062 . I*. 37.670 .438
38 .050 .062 . I*. 38.321 .455
39 -.046 .061 .*I . 38.891 .475
40 .026 .061 . I*. 39.071 .512
41 .035 .061 . I*. 39.404 .542
42 .109 .061 . I** 42.623 .444
43 .147 .061 . I*.* 48.462 .262
44 -.001 .061 . * . 48.462 .298
45 -.001 .060 . * . 48.462 .335

c. Test de la nullité des moyennes des résidus :


On teste l’hypothèse H0 : « m = 0 » contre H1 : « m  0 »

T = 1,354  1,96 alors on accepte la nullité des moyennes des résidus.

d. Test de Kolmogorov-Smirnov :

H0 : « les résidus sont gaussiens »


Les résultats sont : Dn - = - 0,049 Dn + = 0,067 Dn = sup -0,049 ; 0,067 =0,067
0,067 1,36/ (2151/2) = 0,092
n = 215. Les résidus sont donc gaussiens.

71
Application de Box & Jenkins

e. Test de Von Neuman :

Après avoir confirmé que les résidus sont gaussiens, ce test peut être effectué.
On teste l’hypothèse nulle :
H0 : « les résidus sont indépendants et identiquement distribués » contre l’hypothèse
H1 : « Au moins deux observations successives tendent à être corrélées »
Si la statistique calculée |VN |  1,96.
On accepte l’hypothèse que les résidus sont indépendants identiquement distribués.
Après calcul VN = 0,01179  1,96 on accepte l’hypothèse H0.

f. Test de Durbin Watson :

On teste: H0 : «  = 0 » contre H1 : «    0 ».


Si DW est proche de 2 alors on accepte H0.

Le logiciel SPSS donne le résultat DW= 2,001  2, dans ce cas les résidus ne sont pas
corrélés.

g. Test d’hétéroscédasticité : 

On teste H0 : « les résidus sont Homoscédastiques »


Contre H1 : « les résidus sont Hétéroscédastiques »
Corrélogrammes des résidus au carré :

ERRE2 ERRE2
1.0 1.0

.5 .5

0.0 0.0

-.5 -.5
Limites de confiance Limites de confiance
ACF partiel
ACF

-1.0 Coefficient -1.0 Coefficient


1 7 13 19 25 31 37 43 1 7 13 19 25 31 37 43
4 10 16 22 28 34 40 4 10 16 22 28 34 40

Numéro de décalage Numéro de décalage

72
Application de Box & Jenkins

Lag Corr. Err. -1 -.75 -.5 -.25 0 .25 .5 .75 1 Box-Ljung Prob.
+----+----+----+----+----+----+----+----+
1 -.052 .068 . *I . .578 .447
2 .042 .068 . I* . .960 .619
3 -.049 .067 . *I . 1.496 .683
4 .023 .067 . * . 1.612 .807
5 .022 .067 . * . 1.718 .887
6 .020 .067 . * . 1.804 .937
7 -.028 .067 . *I . 1.975 .961
8 -.149 .067 ***I . 6.959 .541
9 -.061 .066 . *I . 7.813 .553
10 .001 .066 . * . 7.813 .647
11 .072 .066 . I* . 9.005 .621
12 .024 .066 . * . 9.142 .691
13 .017 .066 . * . 9.210 .757
14 -.056 .066 . *I . 9.945 .766
15 -.042 .065 . *I . 10.356 .797
16 -.054 .065 . *I . 11.047 .807
17 .015 .065 . * . 11.099 .851
18 -.018 .065 . * . 11.175 .887
19 .052 .065 . I* . 11.820 .893
20 .033 .065 . I* . 12.080 .913
21 -.022 .064 . * . 12.198 .934
22 .082 .064 . I**. 13.834 .907
23 .016 .064 . * . 13.896 .930
24 .076 .064 . I**. 15.290 .912
25 .051 .064 . I* . 15.930 .917
26 .028 .064 . I* . 16.123 .933
27 .037 .063 . I* . 16.459 .944
28 .002 .063 . * . 16.460 .959
29 -.063 .063 . *I . 17.440 .955
30 .025 .063 . * . 17.593 .965
31 .027 .063 . I* . 17.776 .972
32 .101 .063 . I**. 20.401 .944
33 -.043 .062 .*I . 20.864 .950
34 -.043 .062 .*I . 21.344 .955
35 -.069 .062 .*I . 22.583 .948
36 .082 .062 . I** 24.335 .930
37 -.061 .062 .*I . 25.312 .927
38 -.060 .062 .*I . 26.262 .925
39 -.051 .061 .*I . 26.957 .928
40 -.089 .061 **I . 29.093 .899
41 -.025 .061 . * . 29.256 .915
42 .010 .061 . * . 29.282 .931
43 .044 .061 . I*. 29.816 .937
44 -.032 .061 .*I . 30.100 .945
45 -.025 .060 . * . 30.265 .955

La statistique Q =30,265  2 41 = 55,76 donc on accepte l’hypothèse nulle 


d’homoscédasticité des résidus.
Conclusion :

D’après la méthodologie de Box et Jenkins, les résidus du modèle optimal forment


un bruit blanc gaussien, donc le modèle choisit SARIMA (1, 1, 2) (0, 1, 1) est
valide, et la série prix peut être ajustée par le modèle suivant :
(1-0,87B) * (1-B12) * (1-B) * PRIXt = (1-0,64B-0,28B2) * (1-0,89B12) * t

RMSE = 3,4559

73
Application de Box & Jenkins

Prévisions :

Année et
mois Prévision Prév- Prév+
janv-05 46.12320 40.89404 51.35237
févr-05 47.44875 40.40418 54.49332
mars-05 47.96673 39.72634 56.20713
avr-05 49.24646 39.81138 58.68153
mai-05 47.91961 37.52370 58.31552
juin-05 49.09360 37.75333 60.43387
juil-05 47.98188 35.81373 60.15004
août-05 50.37786 37.40523 63.35049
sept-05 51.73786 38.02786 65.44786
oct-05 51.21414 36.79076 65.63752
nov-05 52.15910 37.06542 67.25279
déc-05 50.07396 34.33201 65.81592

Le graphe suivant représente la réalisation et les valeurs ajustées pour l’année 2005 :

60

50

40

30

20

PRIX
10
Fit for FIT_1 from A

0 RIMA, MOD_6 NOCON

Date

2- Analyse de la série IMP :

Diagramme séquentiel de la série brute

74
Application de Box & Jenkins

12000

10000

8000

6000

4000
IMP

2000 IMP

Date

Graphe de la moyenne et la variance de la série IMP :

Graphe de la moyenne Graphe de la variance

12000 600000

10000 500000

8000 400000

6000 IMP 300000 IMP

4000 200000

2000 100000

0 0
1 4 7 10 13 16 19 1 4 7 10 13 16 19

Nous remarquons, que la moyenne annuelle croit avec le temps et la variance annuelle
varie au cours du temps. On peut donc appréhender la non stationnarité de la série. La
non stationnarité de la série implique la présence d’une saisonnalité, et/ ou d’une
tendance.
Pour vérifier ceci, on va appliquer des tests statistiques juste après la présentation des
corrélogrammes simple et partiel de la série brute.
Corrélogrammes simple et partiel de la série brute :

75
Application de Box & Jenkins

IMP IMP
1,0 1,0

,5 ,5

0,0 0,0

-,5 -,5
Limites de confiance Limites de confiance

ACF partiel
ACF

-1,0 Coefficient -1,0 Coefficient


1 7 13 19 25 31 37 43 1 7 13 19 25 31 37 43
4 10 16 22 28 34 40 4 10 16 22 28 34 40

Numéro de décalage Numéro de décalage

On remarque que le corrélogramme simple présente une alternance entre une


décroissance linéaire et un état constant, et le corrélogramme partiel fait apparaître
un pic significatif au retard N°1.

Test de la saisonnalité : (ANOVA)

Pour détecter le facteur saisonnier, on applique le test de Fisher.


Test d’influence du facteur ligne (mois) :
H0 : «absence du facteur saisonnier» contre H1 : « il existe un facteur saisonnier »

Test d’influence du facteur colonne (années) :


H 0  : «La série n’est pas affectée d’une tendance» / H1  : « La série est
tendancielle ».

Résultats du test :

Source des Somme des Degré de Moyenne F Probabilité Valeur critique


variations carrés liberté des carrés pour F
Lignes 24154095,4 11 2195826,85 17,8774816 2,0802E-24 1,83726101
Colonnes 680225485 18 37790304,7 307,672474 4,562E-134 1,65617564
Erreur 24319628,7 198 122826,408
Total 728699209 227

Effet ligne :
Fcal  Ftab (17,8774816  1,83726101 ) au seuil α= 0,05, ceci implique que H0 est
rejetée, donc la série est affectée d’un facteur saisonnier.

Effet colonne :
Fcal > Ftab (307,672474 > 1,65617564) au seuil α= 0,05, ceci implique que H0 est
rejetée, donc la série est affectée d’une tendance.

Elimination du facteur saisonnier :

76
Application de Box & Jenkins

Pou ôter la saisonnalité, on applique l’opérateur de différence saisonnière d’ordre 12


sur la série IMP. La série ainsi obtenue est notée IMPDS.

Diagramme séquentiel de la série IMPDS


2000

1000

-1000
IMP

-2000

Date
Transforme: Différence saisonnière (1, période 12)

Vérification de l’élimination du facteur saisonnier :

On applique le test de Fisher sur la série IMPDS pour s’assurer que le facteur
saisonnier a disparu.

Résultats du test :

Valeur
Source des Somme Degré de Moyenne critique pour
variations des carrés liberté des carrés F Probabilité F
Lignes 299131.307 11 27193.7552 0.11839546 0.99979019 1.84014226
Colonnes 15188404.6 17 893435.567 3.88981646 1.6462E-06 1.6776518
Erreur 42951242.7 187 229685.79      
Total 58438778.7 215        

Effet ligne :
Fcal < Ftab (0,11839546 < 1,84014226) au seuil α= 0,05, ceci implique que H0 est
acceptée, donc la saisonnalité a complètement disparue.
Etude de la série IMPDS :

Test de Dickey-Fuller :

Nous appliquons le test de Dickey-Fuller sur la série IMPDS pour nous permettre de
détecter l’existence d’une racine unitaire et le type de la tendance.
H01 : « il existe une racine unitaire » H11 : « absence de racine unitaire »
2
H0  : « la constante est nulle » H12 : « la constante n’est pas nulle »

77
Application de Box & Jenkins

H03 : « le coefficient de la tendance est nul » H03: « le coefficient n’est pas nul »

Les résultats du test :


Le modèle (3) :

ADF Test Statistic -8.609687 1% Critical Value* -4.0037


    5% Critical Value -3.4318
    10% Critical Value -3.1393
Variable Coefficient Std. Error t-Statistic Prob.
IMPDS(-1) -0.520498 0.060455 -8.609687 0
C 193.8029 72.47192 2.674179 0.0081
@TREND(1986:01) -0.188456 0.505861 -0.372545 0.7099
R-squared 0.259342 Mean dependent var 0.414047
Adjusted R-squared 0.252354 S.D. dependent var 530.6687
S.E. of regression 458.8508 Akaike info criterion 15.10918
Sum squared resid 44635331 Schwarz criterion 15.15621
Log likelihood -1621.237 F-statistic 37.1159
Durbin-Watson stat 2.147278 Prob(F-statistic) 0

On rejette l’hypothèse nulle de non stationnarité (il n’existe pas une racine unitaire)
car la statistique de Student tˆ  0 =-8,60 < -3,43 au seuil 5%.
Le coefficient de la tendance est significativement égal à zéro : t ˆ  0 = 0,37 <1,96
au seuil 5%.
Le modèle (2) :

ADF Test Statistic -8.625184 1% Critical Value* -3.4621


    5% Critical Value -2.875
    10% Critical Value -2.5739
Variable Coefficient Std. Error t-Statistic Prob.
IMPDS(-1) -0.518678 0.060135 -8.625184 0
C 170.5911 36.94046 4.618 0
R-squared 0.258857 Mean dependent var 0.414047
Adjusted R-squared 0.255377 S.D. dependent var 530.6687
S.E. of regression 457.9222 Akaike info criterion 15.10053
Sum squared resid 44664552 Schwarz criterion 15.13189
Log likelihood -1621.307 F-statistic 74.3938
Durbin-Watson
stat 2.150065 Prob(F-statistic) 0

On rejette l’hypothèse nulle de non stationnarité (il n’existe pas une racine unitaire)
car la statistique de Student tˆ  0 =-8,62 < -2,87 au seuil 5%.
Le coefficient de la constante est significativement différent de zéro :
tcˆ  0 =4,61 >1,96 au seuil 5%.
La série est stationnaire, on passe à la modélisation par la méthode de Box et Jenkins.
Le modèle s’écrit comme suit :

xt    1 xt  1  c   t
Identification du modèle à priori :

Corrélogramme de la série IMPDS :

78
Application de Box & Jenkins

IMP
1,0

,5

0,0

-,5 Limites de confiance


ACF

-1,0 Coefficient
1 7 13 19 25 31 37 43
4 10 16 22 28 34 40

Numéro de décalage
Transforme: Différence saisonnière (1, période 12)

IMP
1,0

,5

0,0

-,5 Limites de confiance


ACF partiel

-1,0 Coefficient
1 7 13 19 25 31 37 43
4 10 16 22 28 34 40

Numéro de décalage
Transforme: Différence saisonnière (1, période 12)

Le modèle à priori est : SARIMA (3, 0,3) (2, 1,1)


Le choix du modèle optimal:
Le choix du modèle optimal se fera parmi tous les modèles proposés, ce choix est
basé sur les critères d’information AIC et BIC.

Modèle AIC BIC


SARIMA (3, 0,3) (2, 1,1) 3171,5693 3205,3221
SARIMA (1, 0,1) (0, 1,1) 3167,6048 3181,1059

Parmi ces modèles on choisit celui qui minimise les deux critères AIC et BIC, il s’agit
du modèle SARIMA (1, 0, 1) (0, 1, 1).

Estimation des paramètres du modèle optimal :

Les variables du modèle :

79
Application de Box & Jenkins

B SEB T-RATIO APPROX. PROB.

AR1 .86611 .055098 15.719361 .00000000


MA1 .49745 .091230 5.452747 .00000014
SMA1 .84080 .059452 14.142600 .00000000
CONSTANT 326.10720 20.282814 16.078006 .00000000

Test sur les paramètres:

Les paramètres sont significativement différents de zéro, car les statistiques t


empiriques associés sont supérieures à la valeur de la statistique t théorique 1,96 au
risque 5% et les probabilités sont toutes inférieures à 0,05.
On va s’assurer que les résidus du modèle SARIMA (1, 0, 1) (0, 1, 1) avec constante
forment un bruit blanc en utilisant les tests suivants :

Tests sur les résidus :

Error for IMP from ARIMA, MOD_3 CON Error for IMP from ARIMA, MOD_3 CON
1.0 1.0

.5 .5

0.0 0.0

-.5 -.5
Limites de confiance Limites de confiance
ACF partiel
ACF

-1.0 Coefficient -1.0 Coefficient


1 7 13 19 25 31 37 43 1 7 13 19 25 31 37 43
4 10 16 22 28 34 40 4 10 16 22 28 34 40

Numéro de décalage Numéro de décalage

a. Test de points de retournement :

 0  : « Les  i sont non corrélés »


H1 : « Il existe une corrélation entre les résidus ».

n 1
2( n  2) 16n  29
T=   i = 142 ;  T  = = 142,67 ; ar  T  = = 37,9.
i2 3 90

U = 0,108 < 1,96 donc on accepte H0.

b. Test de Box-Ljung :

On teste l’hypothèse nulle : les auto corrélations au pas K ne sont pas significatifs
C’est-à-dire :
H0 : « 1=2=…=45=0 » contre H1 : «  j j := 1,…,45 tq j  0 »

80
Application de Box & Jenkins

Pour k = 45, p = 1, q = 1, P = 0, Q = 1 :


Pour K=33 la statistique Q=31,029< 2 33-3 =43,77 donc le pic n’est pas significatif.
La statistique Q = 46,047  2 42 = 55,76 donc on accepte l’hypothèse nulle : les résidus

Forment un bruit blanc.

Lag Corr. Err. -1 -.75 -.5 -.25 0 .25 .5 .75 1 Box-Ljung Prob.
+----+----+----+----+----+----+----+----+
1 .038 .068 . I* . .317 .573
2 -.102 .067 .**I . 2.599 .273
3 .087 .067 . I**. 4.288 .232
4 .002 .067 . * . 4.289 .368
5 -.089 .067 .**I . 6.048 .302
6 .016 .067 . * . 6.103 .412
7 .005 .067 . * . 6.109 .527
8 -.043 .066 . *I . 6.520 .589
9 .063 .066 . I* . 7.430 .592
10 -.026 .066 . *I . 7.580 .670
11 .045 .066 . I* . 8.050 .709
12 .047 .066 . I* . 8.555 .740
13 .034 .066 . I* . 8.827 .786
14 .015 .065 . * . 8.879 .839
15 .028 .065 . I* . 9.068 .874
16 -.065 .065 . *I . 10.077 .863
17 .056 .065 . I* . 10.820 .866
18 -.012 .065 . * . 10.855 .900
19 -.077 .065 .**I . 12.277 .873
20 -.079 .065 .**I . 13.784 .841
21 -.060 .064 . *I . 14.649 .840
22 -.047 .064 . *I . 15.175 .855
23 .106 .064 . I**. 17.899 .763
24 -.045 .064 . *I . 18.404 .783
25 .036 .064 . I* . 18.719 .810
26 .087 .064 . I**. 20.613 .762
27 -.064 .063 . *I . 21.618 .757
28 -.012 .063 . * . 21.651 .797
29 .053 .063 . I* . 22.360 .805
30 -.070 .063 . *I . 23.603 .790
31 -.077 .063 .**I . 25.104 .763
32 .043 .063 . I* . 25.586 .782
33 -.145 .062 *.*I . 31.029 .566
34 -.010 .062 . * . 31.055 .613
35 .135 .062 . I*. 35.830 .429
36 -.051 .062 .*I . 36.507 .445
37 -.008 .062 . * . 36.522 .491
38 .085 .061 . I** 38.441 .450
39 -.002 .061 . * . 38.442 .495
40 -.010 .061 . * . 38.471 .539
41 -.052 .061 .*I . 39.196 .551
42 .028 .061 . I*. 39.404 .586
43 .032 .061 . I*. 39.679 .616
44 -.108 .060 **I . 42.857 .521
45 -.108 .060 **I . 46.047 .429

c. Test de la nullité des moyennes des résidus :

On teste l’hypothèse H0 : « m = 0 » contre H1 : « m  0 »


T = 0,347 1,96 alors on accepte la nullité des moyennes des résidus.

81
Application de Box & Jenkins

d. Test de Kolmogorov-Smirnov : (test de normalité)

H0 : « les résidus sont gaussiens »


Les résultats sont : Dn - = - 0,042 Dn + = 0,026 Dn = sup -0,042 ; 0,026 =0,042
0,042 1,36/ (2161/2) = 0,092 (n=216)
Les résidus sont donc gaussiens.

e. Test de Von Neuman :

Après avoir confirmé que les résidus sont gaussiens, ce test peut être effectué.
On teste l’hypothèse nulle :
H0 : « les résidus sont indépendants et identiquement distribués » contre l’hypothèse
H1 : « Au moins deux observations successives tendent à être corrélées »
Si la statistique calculée |VN |  1,96.
On accepte l’hypothèse que les résidus sont indépendants identiquement distribués.
Après calcul VN = 1,07  1,96 on accepte l’hypothèse H0.

f. Test de Durbin Watson :

On teste H0 : «  = 0» contre H1 : «   0 »


Le logiciel SPSS donne le résultat DW= 1,903  2, dans ce cas les résidus ne sont pas
corrélés.
g. Test d’hétéroscédasticité : 

On teste H0 : « les résidus sont Homoscédastiques »


Contre H1 : « les résidus sont Hétéroscédastiques »
Corrélogrammes des résidus au carré :

82
Application de Box & Jenkins

ERR2 ERR2
1.0 1.0

.5 .5

0.0 0.0

-.5 -.5
Limites de confiance Limites de confiance

ACF partiel
ACF

-1.0 Coefficient -1.0 Coefficient


1 7 13 19 25 31 37 43 1 7 13 19 25 31 37 43
4 10 16 22 28 34 40 4 10 16 22 28 34 40

Numéro de décalage Numéro de décalage

Autocorrelations: ERR2

Auto- Stand.
Lag Corr. Err. -1 -.75 -.5 -.25 0 .25 .5 .75 1 Box-Ljung Prob.
+----+----+----+----+----+----+----+----+
1 -.049 .068 . *I . .521 .471
2 .029 .067 . I* . .705 .703
3 -.004 .067 . * . .709 .871
4 -.045 .067 . *I . 1.162 .884
5 -.025 .067 . *I . 1.303 .935
6 .048 .067 . I* . 1.830 .935
7 -.023 .067 . * . 1.950 .963
8 -.053 .066 . *I . 2.592 .957
9 -.020 .066 . * . 2.682 .976
10 .008 .066 . * . 2.697 .988
11 -.067 .066 . *I . 3.739 .977
12 -.028 .066 . *I . 3.925 .985
13 -.084 .066 .**I . 5.546 .961
14 .018 .065 . * . 5.625 .975
15 -.050 .065 . *I . 6.203 .976
16 -.117 .065 .**I . 9.441 .894
17 .015 .065 . * . 9.491 .924
18 .052 .065 . I* . 10.146 .927
19 -.001 .065 . * . 10.147 .949
20 .042 .065 . I* . 10.567 .957
21 .100 .064 . I**. 13.003 .909
22 -.078 .064 .**I . 14.491 .883
23 .113 .064 . I**. 17.618 .778
24 -.011 .064 . * . 17.649 .820
25 .038 .064 . I* . 18.014 .842
26 -.077 .064 .**I . 19.489 .815
27 -.034 .063 . *I . 19.783 .840
28 -.060 .063 . *I . 20.695 .838
29 -.064 .063 . *I . 21.735 .831
30 .044 .063 . I* . 22.223 .846
31 .007 .063 . * . 22.235 .875
32 .049 .063 . I* . 22.841 .883
33 -.035 .062 .*I . 23.152 .899
34 -.084 .062 **I . 24.974 .870
35 .036 .062 . I*. 25.304 .886
36 .001 .062 . * . 25.304 .909
37 -.002 .062 . * . 25.305 .927
38 .118 .061 . I** 29.004 .853
39 .004 .061 . * . 29.009 .879
40 .047 .061 . I*. 29.596 .886

83
Application de Box & Jenkins

41 -.081 .061 **I . 31.362 .861


42 .026 .061 . I*. 31.545 .881
43 -.086 .061 **I . 33.577 .848
44 .015 .060 . * . 33.641 .871
45 .060 .060 . I*. 34.620 .869

La statistique Q =34,620 2 42 = 55,76 donc on accepte l’hypothèse nulle 


d’homoscédasticité des résidus.
Conclusion :

D’après la méthodologie de Box et Jenkins, les résidus du modèle optimal forment


un bruit blanc gaussien, donc le modèle choisi SARIMA (1, 0, 1) (0, 1, 1) avec
constante est valide, et la série IMP peut être ajustée par le modèle suivant :
(1-0,86B)*(1-B12)IMPt = (1-0,49B)*(1-0,84B12)t + 326,10

RMSE=404,158886.

Prévisions :

Année et
mois Prévision Prév- Prév+
janv-05 9800.44347 9428.67921 10172.2077
févr-05 9668.83521 9247.58517 10090.0852
mars-05 10163.16309 9706.01187 10620.3143
avr-05 10653.58109 10169.4626 11137.6996
mai-05 10799.77428 10294.959 11304.5895
juin-05 10804.36206 10283.4262 11325.2979
juil-05 10835.09323 10301.4632 11368.7232
août 2005 10835.25154 10291.5395 11378.9636
sept-05 10482.69285 9930.91681 11034.4689
oct-05 10496.5416 9938.27644 11054.8068
nov-05 10426.23132 9862.71622 10989.7464
déc-05 10159.2209 9591.43745 10727.0044

Le graphe suivant représente la réalisation et les valeurs ajustées pour l’année 2005 :

84
Application de Box & Jenkins

12000

10000

8000

6000

4000 IMP

Fit for FIT_1 from A

2000 RIMA, MOD_4 CON

Date

3- Analyse de la série brute PROD :

Diagramme séquentiel de la série brute

10000

9000

8000

7000

6000

5000
PROD

4000

Date

85
Application de Box & Jenkins

Graphe de la moyenne et la variance de la série PROD :

Graphe de la moyenne Grap he de la variance

10000 120000

8000 100000
80000
6000
PROD 60000 PROD
4000
40000
2000 20000
0 0
1 3 5 7 9 11 13 15 17 19 1 4 7 10 13 16 19

Nous remarquons, que la moyenne annuelle décroît avec le temps et la variance


annuelle varie au cours du temps. On peut donc appréhender la non stationnarité de la
série. La non stationnarité de la série implique la présence d’une saisonnalité, et/ ou
d’une tendance.
Pour vérifier ceci, on va appliquer des tests statistiques juste après la présentation des
corrélogrammes simple et partiel de la série brute.

Corrélogrammes simple et partiel de la série brute :

PROD PROD
1,0 1,0

,5 ,5

0,0 0,0

-,5 -,5
Limites de confiance Limites de confiance
ACF partiel
ACF

-1,0 Coefficient -1,0 Coefficient


1 7 13 19 25 31 37 43 1 7 13 19 25 31 37 43
4 10 16 22 28 34 40 4 10 16 22 28 34 40

Numéro de décalage Numéro de décalage

Le corrélogramme simple présente une décroissance linéaire qui peut être expliquée par
la présence d’une tendance.
Le corrélogramme partiel fait apparaître un pic significatif au retard N°1.

Test de la saisonnalité : (ANOVA)

86
Application de Box & Jenkins

Pour détecter le facteur saisonnier, on applique le test de Fisher.


Test d’influence du facteur ligne (mois) :
H0 : «absence du facteur saisonnier» contre H1 : « il existe un facteur saisonnier »

Test d’influence du facteur colonne (années) :


H 0  : «La série n’est pas affectée d’une tendance» / H1  : « La série est tendancielle ».

Résultats du test :

Valeur
Source des Somme Degré de Moyenne critique pour
variations des carrés liberté des carrés F Probabilité F
Lignes 223222,98 11 20295,725 17,0869928 1.7065E-23 1,83726101
Colonnes 203668312 18 11314906,2 952,563395 1,47E -181 1.65617564
Erreur 2351918,45 198 11878,376      
Total 208252853 227        

Effet ligne :
Fcal > Ftab (17,0869928  1,83726101) au seuil   0,05, ceci implique que H0 est
rejetée, donc la série est saisonnière.

Effet colonne :
Fcal > Ftab (952,563395 > 1,65617564) au seuil   0,05, ceci implique que H0 est
rejetée, donc la série est tendancielle.

Elimination du facteur saisonnier :

Pour éliminer la saisonnalité, on applique l’opérateur de différence saisonnière


d’ordre 12 sur la série PROD. La série ainsi obtenue est notée PRODDS
(C’est-à-dire PRODDSt  PRODt –PRODt-12)

Diagramme séquentiel de la série PRODDS

400

200

-200

-400

-600

-800
PROD

-1000

Date

87 (1, période 12)


Transforme: Différence saisonnière
Application de Box & Jenkins

Vérification de l’élimination du facteur saisonnier :

On applique le test de Fisher sur la série PRODDS pour voir si la saisonnalité a été
éliminée.

Résultats du test :

Valeur
Source des Somme Degré de Moyenne critique
variations des carrés liberté des carrés F Probabilité pour F
Lignes 10846.3786 11 986.034415 0.04472547 0.99999858 1.84014226
Colonnes 4743188.39 17 279011.082 12.6556439 4.7703E-23 1.6776518
Erreur 4122672.27 187 22046.3758      
Total 8876707.03 215        

Effet ligne :
Fcal < Ftab (0.04472547< 1,84014226) au seuil   0,05, ceci implique que H0 est
acceptée, donc la série PRODDS n’est pas atteinte du facteur saisonnier.
Etude de la série PRODDS :

Test de Dickey-Fuller :
Nous appliquons le test de Dickey-Fuller sur la série PRODDS pour nous permettre
de détecter l’existence d’une racine unitaire et le type de la tendance.
H01 : « il existe une racine unitaire » H11 : « absence de racine unitaire »
2
H0  : « la constante est nulle » H12 : « la constante n’est pas nulle »
H03 : « le coefficient de la tendance est nul » H03: « le coefficient n’est pas nul »

Les résultats du test :

Le modèle (3) :

ADF Test Statistic -5.383342 1% Critical Value* -4.0037


    5% Critical Value -3.4318
    10% Critical Value -3.1393
Variable Coefficient Std. Error t-Statistic Prob.
PRODDS(-1) -0.240274 0.044633 -5.383342 0
C -59.00909 23.01041 -2.564452 0.011
@TREND(1986:01) 0.134897 0.145515 0.927034 0.355
R-squared 0.122037 Mean dependent var 0.941488
Adjusted R-squared 0.113754 S.D. dependent var 134.3584
S.E. of regression 126.4858 Akaike info criterion 12.53199
Sum squared resid 3391714 Schwarz criterion 12.57902
Log likelihood -1344.189 F-statistic 14.73404
Durbin-Watson stat 2.32102 Prob(F-statistic) 0.000001

On rejette l’hypothèse nulle de non stationnarité (il n’existe pas une racine unitaire)
car la statistique de Student tˆ  0 =-5,38 < -3,43 au seuil 5%.
Le coefficient de la tendance est significativement égal à zéro : t ˆ  0 = 0,92 <1,96
au seuil 5%.
Le modèle (2) :

88
Application de Box & Jenkins

ADF Test Statistic -5.350475 1% Critical Value* -3.4621


    5% Critical Value -2.875
    10% Critical Value -2.5739
Variable Coefficient Std. Error t-Statistic Prob.
PRODDS(-1) -0.228022 0.042617 -5.350475 0
C -40.5899 11.60236 -3.498417 0.0006
R-squared 0.118478 Mean dependent var 0.941488
Adjusted R-squared 0.11434 S.D. dependent var 134.3584
S.E. of regression 126.444 Akaike info criterion 12.52674
Sum squared resid 3405463 Schwarz criterion 12.55809
Log likelihood -1344.624 F-statistic 28.62758
Durbin-Watson stat 2.341452 Prob(F-statistic) 0

On rejette l’hypothèse nulle de non stationnarité (il n’existe pas une racine unitaire)
car la statistique de Student tˆ  0 =-5,35 < -2,87 au seuil 5%.
Le coefficient de la constante est significativement différent de zéro :
tcˆ  0 =- 3,49 >1,96 au seuil 5%.

La série est stationnaire, on passe à la modélisation par la méthode de Box et Jenkins.


Le modèle s’écrit comme suit : xt    1 xt  1  c   t

Identification du modèle à priori :

Corrélogramme de la série PRODDS :

89
Application de Box & Jenkins

PROD
1,0

,5

0,0

-,5 Limites de confiance


ACF

-1,0 Coefficient
1 7 13 19 25 31 37 43
4 10 16 22 28 34 40

Numéro de décalage
Transforme: Différence saisonnière (1, période 12)

PROD
1,0

,5

0,0

-,5 Limites de confiance


ACF partiel

-1,0 Coefficient
1 7 13 19 25 31 37 43
4 10 16 22 28 34 40

Numéro de décalage
Transforme: Différence saisonnière (1, période 12)

Le modèle à priori est : SARIMA (2, 0,3) (1, 1,2)

Le choix du modèle optimal:

Le choix du modèle optimal se fera parmi tous les modèles proposés, ce choix est
basé sur les critères d’information AIC et BIC.

Modèle AIC BIC


SARIMA (3, 0,3) (0, 1,1) 2601,6725 2628,6747
SARIMA (2, 0,3) (1, 1,2) 2611,7812 2642,1588
SARIMA (3, 0, 3) (3, 1, 0) 2617,2553 2651,0081

Parmi ces modèles on choisit celui qui minimise les deux critères AIC et BIC, on
opte pour le modèle SARIMA (3, 0, 3) (0, 1, 1) avec constante.

Estimation des paramètres du modèle optimal :

90
Application de Box & Jenkins

Les variables du modèle :


B SEB T-RATIO APPROX. PROB.

AR1 -,20807 ,027366 -7,603097 ,00000000


AR2 ,19343 ,029444 6,569238 ,00000000
AR3 ,96063 ,025435 37,768213 ,00000000
MA1 -,90071 ,077096 -11,683003 ,00000000
MA2 -,57288 ,099091 -5,781348 ,00000003
MA3 ,33569 ,070595 4,755118 ,00000370
SMA1 ,89639 ,070558 12,704197 ,00000000
CONSTANT -201,26510 32,382335 -6,215274 ,00000000

Test sur les paramètres:

Les paramètres sont significativement différents de zéro, car les statistiques t


empiriques associés sont supérieures à la valeur de la statistique t théorique 1,96 au
risque 5% et les probabilités sont toutes inférieures à 0,05.
On va s’assurer que les résidus du modèle SARIMA (3, 0, 3) (0, 1, 1) avec constante
forment un bruit blanc en utilisant les tests suivants :

Tests sur les résidus :

91
Application de Box & Jenkins

Error for PROD from ARIMA, MOD_8 CON


1,0

,5

0,0

-,5
Limites de confiance
ACF

-1,0 Coefficient
1 7 13 19 25 31 37 43
4 10 16 22 28 34 40

Numéro de décalage

Error for PROD from ARIMA, MOD_8 CON


1,0

,5

0,0

-,5
Limites de confiance
ACF partiel

-1,0 Coefficient
1 7 13 19 25 31 37 43
4 10 16 22 28 34 40

Numéro de décalage

a. Test de points de retournement :

 0  : « Les  i ne sont pas corrélés »


H1 : « Il existe une corrélation entre les résidus ».

n 1
2( n  2) 16n  29
T=   i = 144 ;  T  = = 142,67 ; ar  T  = = 37,9.
i2 3 90

U = 0,035 < 1,96 donc on accepte H0.

b. Test de Box-Ljung :

On teste l’hypothèse nulle : les auto corrélations au pas K ne sont pas significatifs
C’est-à-dire :
H0 : « 1=2=…=45=0 » contre H1 : «  j j := 1,…,45 tq j  0 »

92
Application de Box & Jenkins

Pour k = 45, p = 3, q = 3, P = 0, Q = 1 :


La statistique Q = 33,266  2 38 = 53,38 donc on accepte l’hypothèse nulle : les résidus
Forment un bruit blanc.

Lag Corr. Err. -1 -.75 -.5 -.25 0 .25 .5 .75 1 Box-Ljung Prob.
+----+----+----+----+----+----+----+----+
1 ,020 ,068 . * . ,089 ,766
2 -,076 ,067 .**I . 1,364 ,506
3 -,034 ,067 . *I . 1,627 ,653
4 ,013 ,067 . * . 1,663 ,797
5 -,007 ,067 . * . 1,673 ,892
6 ,047 ,067 . I* . 2,158 ,905
7 -,029 ,067 . *I . 2,349 ,938
8 ,001 ,066 . * . 2,349 ,968
9 ,012 ,066 . * . 2,381 ,984
10 -,042 ,066 . *I . 2,778 ,986
11 ,051 ,066 . I* . 3,375 ,985
12 ,021 ,066 . * . 3,478 ,991
13 ,078 ,066 . I**. 4,883 ,978
14 ,000 ,065 . * . 4,883 ,987
15 -,044 ,065 . *I . 5,340 ,989
16 -,005 ,065 . * . 5,347 ,994
17 -,047 ,065 . *I . 5,868 ,994
18 -,027 ,065 . *I . 6,039 ,996
19 -,131 ,065 ***I . 10,115 ,950
20 -,006 ,065 . * . 10,124 ,966
21 ,042 ,064 . I* . 10,542 ,971
22 ,012 ,064 . * . 10,577 ,980
23 -,073 ,064 . *I . 11,869 ,972
24 ,037 ,064 . I* . 12,207 ,977
25 ,063 ,064 . I* . 13,198 ,974
26 ,095 ,064 . I**. 15,457 ,948
27 -,093 ,063 .**I . 17,606 ,915
28 -,086 ,063 .**I . 19,460 ,883
29 ,081 ,063 . I**. 21,124 ,855
30 -,065 ,063 . *I . 22,207 ,846
31 -,107 ,063 .**I . 25,146 ,761
32 ,029 ,063 . I* . 25,367 ,791
33 ,075 ,062 . I*. 26,803 ,768
34 ,016 ,062 . * . 26,871 ,803
35 ,040 ,062 . I*. 27,282 ,821
36 -,023 ,062 . * . 27,423 ,847
37 ,023 ,062 . * . 27,568 ,870
38 -,038 ,061 .*I . 27,942 ,884
39 ,028 ,061 . I*. 28,148 ,901
40 ,045 ,061 . I*. 28,689 ,909
41 -,034 ,061 .*I . 28,998 ,920
42 ,083 ,061 . I** 30,881 ,897
43 -,085 ,061 **I . 32,857 ,869
44 -,022 ,060 . * . 32,986 ,888
45 -,032 ,060 .*I . 33,266 ,902

c. Test de la nullité des moyennes des résidus :

On teste l’hypothèse H0 : « m = 0 » contre H1 : « m  0 »

T = -0,046 1,96 alors on accepte la nullité des moyennes des résidus.

d. Test de Kolmogorov-Smirnov : (test de normalité)

H0 : « les résidus sont gaussiens »


Les résultats sont : Dn - = - 0,080 Dn + = 0,051 Dn = sup -0,080 ; 0,051 =0,080

93
Application de Box & Jenkins

0,080 1,36/ (2161/2) = 0,092 (n=216)


Les résidus sont donc gaussiens.

e. Test de Von Neuman :

Après avoir confirmé que les résidus sont gaussiens, ce test peut être effectué.
On teste l’hypothèse nulle :
H0 : « les résidus sont indépendants et identiquement distribués » contre l’hypothèse
H1 : « Au moins deux observations successives tendent à être corrélées »
Si la statistique calculée |VN |  1,96.
On accepte l’hypothèse que les résidus sont indépendants identiquement distribués.

Après calcul VN = 1,00023  1,96 on accepte l’hypothèse H0.

f. Test de Durbin Watson :

On teste H0 : «  = 0» contre H1 : «   0 »


Le logiciel SPSS donne le résultat DW= 1,880  2, dans ce cas les résidus ne sont pas
corrélés.
g. Test d’hétéroscédasticité : 

On teste H0 : « les résidus sont Homoscédastiques »


Contre H1 : « les résidus sont Hétéroscédastiques »
Corrélogrammes des résidus au carré :

ERRE2 ERRE2
1.0 1.0

.5 .5

0.0 0.0

-.5 -.5
Limites de confiance Limites de confiance
ACF partiel
ACF

-1.0 Coefficient -1.0 Coefficient


1 7 13 19 25 31 37 43 1 7 13 19 25 31 37 43
4 10 16 22 28 34 40 4 10 16 22 28 34 40

Numéro de décalage Numéro de décalage

94
Application de Box & Jenkins

Lag Corr. Err. -1 -.75 -.5 -.25 0 .25 .5 .75 1 Box-Ljung Prob.
+----+----+----+----+----+----+----+----+
1 .020 .068 . I*** 5.076 .058
2 -.001 .067 . * . 5.076 .079
3 .044 .067 . I* . 5.499 .139
4 .022 .067 . * . 5.602 .231
5 .041 .067 . I* . 5.986 .308
6 -.010 .067 . * . 6.010 .422
7 .059 .067 . I* . 6.783 .452
8 -.001 .066 . * . 6.783 .560
9 -.038 .066 . *I . 7.104 .626
10 -.026 .066 . *I . 7.261 .701
11 -.025 .066 . * . 7.404 .765
12 .063 .066 . I* . 8.329 .759
13 -.002 .066 . * . 8.330 .821
14 -.023 .065 . * . 8.457 .864
15 -.051 .065 . *I . 9.074 .874
16 -.011 .065 . * . 9.102 .909
17 -.029 .065 . *I . 9.298 .930
18 .045 .065 . I* . 9.778 .939
19 .036 .065 . I* . 10.096 .951
20 .030 .065 . I* . 10.310 .962
21 -.041 .064 . *I . 10.725 .968
22 -.026 .064 . *I . 10.891 .976
23 .032 .064 . I* . 11.141 .982
24 .026 .064 . I* . 11.306 .987
25 .078 .064 . I**. 12.798 .979
26 .096 .064 . I**. 15.068 .956
27 .003 .063 . * . 15.071 .968
28 -.029 .063 . *I . 15.276 .975
29 -.037 .063 . *I . 15.614 .980
30 .015 .063 . * . 15.671 .985
31 -.009 .063 . * . 15.694 .990
32 -.011 .063 . * . 15.725 .993
33 .030 .062 . I*. 15.962 .995
34 .005 .062 . * . 15.968 .996
35 -.008 .062 . * . 15.983 .998
36 -.019 .062 . * . 16.076 .998
37 -.024 .062 . * . 16.225 .999
38 -.034 .061 .*I . 16.533 .999
39 -.019 .061 . * . 16.634 .999
40 -.011 .061 . * . 16.665 1.000
41 -.032 .061 .*I . 16.944 1.000
42 .025 .061 . I*. 17.115 1.000
43 -.008 .061 . * . 17.131 1.000
44 .005 .060 . * . 17.138 1.000
45 .102 .060 . I** 19.988 1.000

La statistique Q =19,988  2 38 = 53,38 donc on accepte l’hypothèse nulle 


d’homoscédasticité des résidus.

Conclusion :

D’après la méthodologie de Box et Jenkins, les résidus du modèle optimal forment


un bruit blanc gaussien, donc le modèle choisi SARIMA (3, 0, 3) (0, 1, 1) avec
constante est valide, et la série PROD peut être ajustée par le modèle suivant :

95
Application de Box & Jenkins

(1+0,20B-0,19B2-0,96B3) (1-B12) PRODt = (1+0,90B+0,57B2-0,33B3)*(1-0,89B12)


*t -201,2

RMSE=126,8781

Prévisions :

Année et mois Prévision Prév- Prév+


janv-05 5161.99696 4999.76817 5324.22575
févr-05 5203.80292 5004.46453 5403.14131
mars-05 5174.00177 4943.33505 5404.66848
avr-05 5161.25356 4900.64869 5421.85842
mai-05 5141.93392 4861.70862 5422.15922
juin-05 5113.15235 4812.69498 5413.60972
juil-05 5024.4408 4704.85386 5344.02773
août-05 5023.69347 4691.00715 5356.3798
sept-05 4987.58208 4639.76923 5335.39493
oct-05 4999.1735 4638.0885 5360.2585
nov-05 4984.68387 4613.95625 5355.41149
déc-05 4970.12741 4587.47014 5352.78469

Le graphe suivant représente la réalisation et les valeurs ajustées pour l’année 2005 :

96
Application de Box & Jenkins

10000

9000

8000

7000

6000

PRO
5000
Fit for FIT_1 from A

4000 RIMA, MOD_4 CON

Date

4-Analyse de la série EXP :

Diagramme séquentiel de la série brute


300

200

100
EXP

Date

Graphe de la moyenne et la variance de la série EXP :

97
Application de Box & Jenkins

Graphe de la moyenne Graphe de la variance

160 1400
140 1200
120 1000
100
800
80 EXP ExP
600
60
40 400
20 200
0 0
1 3 5 7 9 11 13 1 3 5 7 9 11 13

D’après les deux graphes, on remarque que la moyenne annuelle et la variance annuelle
varient au cours du temps.
Ceci nous laisse supposer la non stationnarité de la série, qui se traduit par la présence
d’un facteur saisonnier, et/ ou d’une tendance.
Nous confirmons ceci, en faisant appel à des tests statistiques et les corrélogrammes
simple et partiel de la série brute.

Corrélogrammes simple et partiel de la série brute :


EXP EXP
1,0 1,0

,5 ,5

0,0 0,0

-,5 -,5
Limites de confiance Limites de confiance
ACF partiel
ACF

-1,0 Coefficient -1,0 Coefficient


1 7 13 19 25 31 37 1 7 13 19 25 31 37
4 10 16 22 28 34 40 4 10 16 22 28 34 40

Numéro de décalage Numéro de décalage

En examinant les corrélogrammes simple et partiel on a remarqué :

Le corrélogramme simple décroît d’une manière linéaire


Le corrélogramme partiel fait apparaître un pic au retard N°1 et au retard N°2

D’après les résultats précédents, on peut conclure que la série est affectée d’une
tendance, et/ ou d’une saisonnalité.

98
Application de Box & Jenkins

Pour détecter la présence de la saisonnalité, on fait appel au test de Fisher.

Test de la saisonnalité : (ANOVA)

Pour détecter le facteur saisonnier, on applique le test de Fisher.


Test d’influence du facteur ligne (mois) :
H0 : «absence du facteur saisonnier» contre H1 : « il existe un facteur saisonnier »

Test d’influence du facteur colonne (années) :


H 0  : «La série n’est pas affectée d’une tendance» / H1  : « La série est
tendancielle ».

Résultats du test :

Valeur
Source des Somme Degré de Moyenne critique
variations des carrés liberté des carrés F Probabilité pour F
Lignes 3009,20833 11 273,56394 0,86542523 0,5760886 1.8561721
Colonnes 274248,196 13 21096,0151 66,737528 5,8291E-54 1.78916792
Erreur 45202,875 143 316,104021      
Total 322460,28 167        

Effet ligne :
Fcal < Ftab (0,86542523 < 1,8561721 ) au seuil α= 0,05, ceci implique que H0 est
acceptée, donc la série n’est pas affectée d’un facteur saisonnier.
Effet colonne :
Fcal > Ftab (66,737528 > 1,78916792) au seuil α= 0,05, ceci implique que H0 est
acceptée, donc la série est tendancielle.

Test de Dickey-Fuller :

Nous appliquons le test de Dickey-Fuller sur la série EXP pour nous permettre de
détecter l’existence d’une racine unitaire et le type de la tendance.

H01 : « il existe une racine unitaire » H11 : « absence de racine unitaire »


H02 : « la constante est nulle » H12 : « la constante n’est pas nulle »
H03 : « le coefficient de la tendance est nul » H03: « le coefficient n’est pas nul »

Les résultats du test :

Le modèle (3) :

ADF Test Statistic -3.804277 1% Critical Value* -4.0155


5% Critical Value -3.4374
10% Critical Value -3.1427
Variable Coefficient Std. Error t-Statistic Prob.
P(-1) -0.162706 0.042769 -3.804277 0.0002
C 23.03944 6.755457 3.410494 0.0008
@TREND(1991:01) -0.110758 0.038597 -2.869641 0.0047
R-squared 0.081095 Mean dependent var -0.934132

99
Application de Box & Jenkins

Adjusted R-squared 0.069889 S.D. dependent var 16.50927


S.E. of regression 15.92191 Akaike info criterion 8.39107
Sum squared resid 41575.18 Schwarz criterion 8.447082
Log likelihood -697.6543 F-statistic 7.236668
Durbin-Watson stat 2.505097 Prob(F-statistic) 0.000973

On rejette l’hypothèse nulle de non stationnarité (il n’existe pas une racine unitaire)
car la statistique de Student tˆ  0 =-3,80 < -3,43 au seuil 5%.
Le coefficient de la tendance est significativement différent de zéro : t ˆ  0 =  -2,86
> 1,96 au seuil 5%.

La série EXPt est de type TS ; on fait une régression.

Les résultats des coefficients de détermination sont présentés dans le tableau suivant :

Rsq
LIN 0,004
LOG 0,007
INV 0,008
QUA 0,007
CUB 0,008
POW 0,002
EXP 0,003
LGS 0,003
Etant donné que les coefficients de détermination sont faibles, on a opté pour la
transformation logarithmique.
La série transformée sera notée EXPL.

Diagramme de la série EXPL

3
EXP

Date

100
Application de Box & Jenkins

Corrélogrammes simple et partiel de la série EXPL:

EXPL EXPL
1.0 1.0

.5 .5

0.0 0.0

-.5 -.5
Limites de confiance Limites de confiance

ACF partiel
ACF

-1.0 Coefficient -1.0 Coefficient


1 7 13 19 25 31 37 1 7 13 19 25 31 37
4 10 16 22 28 34 40 4 10 16 22 28 34 40

Numéro de décalage Numéro de décalage

Le corrélogramme simple décroît d’une manière linéaire


Le corrélogramme partiel fait apparaître un pic au retard N°1.

Pour détecter la présence de la saisonnalité, on fait appel au test de Fisher.

Test de la saisonnalité : (ANOVA)

Pour détecter le facteur saisonnier, on applique le test de Fisher.


Test d’influence du facteur ligne (mois) :
H0 : «absence du facteur saisonnier» contre H1 : « il existe un facteur saisonnier »
Test d’influence du facteur colonne (années) :
H 0  : «La série n’est pas affectée d’une tendance» / H1  : « La série est tendancielle ».

Résultats du test :

Valeur
Source des Somme Degré de Moyenne critique
variations des carrés liberté des carrés F Probabilité pour F
Lignes 0.5563875 11 0.05058068 1.19457177 0.29588472 1.8561721
Colonnes 123.225743 13 9.47890334 223.864723 4.7673E-88 1.78916792
Erreur 6.05492083 143 0.0423421
Total 129.837052 167

Effet ligne :
Fcal < Ftab (1,194557177 < 1,8561721 ) au seuil α= 0,05, ceci implique que H0 est
acceptée, donc la série n’est pas affectée d’un facteur saisonnier.
Effet colonne :
Fcal > Ftab (223,864723 > 1,78916792) au seuil α= 0,05, ceci implique que H0 est
acceptée, donc la série est tendancielle.

Test de Dickey-Fuller :

101
Application de Box & Jenkins

Nous appliquons le test de Dickey-Fuller sur la série EXP pour nous permettre de
détecter l’existence d’une racine unitaire et le type de la tendance.

H01 : « il existe une racine unitaire » H11 : « absence de racine unitaire »


H02 : « la constante est nulle » H12 : « la constante n’est pas nulle »
H03 : « le coefficient de la tendance est nul » H03: « le coefficient n’est pas nul »

Les résultats du test :

Le modèle (3) :

ADF Test Statistic -1.538549 1% Critical Value* -4.0155


5% Critical Value -3.4374
10% Critical Value -3.1427
Variable Coefficient Std. Error t-Statistic Prob.
EXPL(-1) -0.033019 0.021461 -1.538549 0.1258
C 0.180336 0.118139 1.526474 0.1288
@TREND(1991:01) -0.000675 0.000387 -1.745787 0.0827
R-squared 0.019 Mean dependent var -0.016826
Adjusted R-squared 0.007037 S.D. dependent var 0.16154
S.E. of regression 0.160971 Akaike info criterion -0.797384
Sum squared resid 4.249514 Schwarz criterion -0.741372
Log likelihood 69.58157 F-statistic 1.588171
Durbin-Watson stat 2.356702 Prob(F-statistic) 0.207425
On accepte l’hypothèse nulle de non stationnarité (il existe une racine unitaire) car
la statistique de Student tˆ  0 =-1,53 > -3 ,43 au seuil 5%.

On accepte l’hypothèse nulle de la nullité du coefficient de la tendance


conditionnellement à la présence d’une racine unitaire du fait que
F3 =1,58 (Fisher) < Ftab = 6,49

Le modèle (2) :

ADF Test Statistic -0.356362 1% Critical Value* -3.4706


5% Critical Value -2.8788
10% Critical Value -2.5759
Variable Coefficient Std. Error t-Statistic Prob.
EXPL(-1) -0.005141 0.014427 -0.356362 0.722
C 0.005042 0.062632 0.0805 0.9359
R-squared 0.000769 Mean dependent var -0.016826
Adjusted R-
squared -0.005287 S.D. dependent var 0.16154
S.E. of regression 0.161967 Akaike info criterion -0.790947
Sum squared resid 4.328486 Schwarz criterion -0.753606
Log likelihood 68.04406 F-statistic 0.126994
Durbin-Watson
stat 2.379182 Prob(F-statistic) 0.722024

On accepte l’hypothèse nulle de non stationnarité (il existe une racine unitaire) car
la statistique de Student tˆ  0 =-0,35 > -2,87 au seuil 5%.

102
Application de Box & Jenkins

On accepte l’hypothèse nulle de la nullité du coefficient de la tendance


conditionnellement à la présence d’une racine unitaire du fait que
F2 =0,12 (Fisher) < Ftab = 4,71.

Le modèle (1) :

ADF Test Statistic -1.390849 1% Critical Value* -2.5779


5% Critical Value -1.9417
10% Critical Value -1.6167

On accepte l’hypothèse nulle de non stationnarité (il existe une racine unitaire) car
la statistique de Student tˆ  0 =-1,39< -1,94 au seuil 5%.
La série EXPLD est donc non stationnaire de type de tendance DS sans dérive.

Le modèle s’écrit comme suit : xt   t


Pour ôter la tendance, il suffit de différencier la série EXPL au moins une fois.
La série ainsi obtenue sera notée EXPLD.

Diagramme séquentiel de la série EXPLD


1.0

.5

0.0

-.5
EXPL

-1.0

Date
Transforme: différence (1)

Test de Dickey-Fuller sur la série différenciée (EXPLD) :

Le modèle (3) :

ADF Test Statistic -15.62005 1% Critical Value* -4.0158


    5% Critical Value -3.4376
    10% Critical Value -3.1427

103
Application de Box & Jenkins

Variable Coefficient Std. Error t-Statistic Prob.


EXPLD(-1) -1.201306 0.076908 -15.62005 0
C 0.001509 0.024999 0.06036 0.9519
@TREND(1991:01) -0.00026 0.000258 -1.007152 0.3154
R-squared 0.599503 Mean dependent var -0.001325
Adjusted R-squared 0.594589 S.D. dependent var 0.249539
S.E. of regression 0.158886 Akaike info criterion -0.823349
Sum squared resid 4.114912 Schwarz criterion -0.767108
Log likelihood 71.33795 F-statistic 121.9971
Durbin-Watson stat 2.003071 Prob(F-statistic) 0

On rejette l’hypothèse nulle de non stationnarité (il n’existe pas une racine unitaire)
car la statistique de Student tˆ  0 =-15,62 < -3,43 au seuil 5%.
Le coefficient de la tendance est significativement égal à zéro : t ˆ  0 = 1,007 <1,96
au seuil 5%.

Le modèle (2) :

ADF Test Statistic -15.58713 1% Critical Value* -3.4708


5% Critical Value -2.8789
10% Critical Value -2.5759
Variable Coefficient Std. Error t-Statistic Prob.
EXPLD(-1) -1.196759 0.076779 -15.58713 0
C -0.020358 0.012393 -1.642735 0.1024
R-squared 0.59701 Mean dependent var -0.001325
Adjusted R-squared 0.594553 S.D. dependent var 0.249539
S.E. of regression 0.158893 Akaike info criterion -0.829193
Sum squared resid 4.140519 Schwarz criterion -0.791699
Log likelihood 70.82304 F-statistic 242.9585
Durbin-Watson stat 1.999481 Prob(F-statistic) 0

On rejette l’hypothèse nulle de non stationnarité (il n’existe pas une racine unitaire)
car la statistique de Student tˆ  0 =-15,58 < -2,87 au seuil 5%.
Le coefficient de la constante est significativement égal à zéro : tcˆ  0 = -1,64
<1,96 au seuil 5%.

Le modèle (1) :

ADF Test Statistic -15.42152 1% Critical Value* -2.578


    5% Critical Value -1.9417
    10% Critical Value -1.6167

104
Application de Box & Jenkins

On rejette l’hypothèse nulle de non stationnarité (la racine unitaire n’existe pas) car
la statistique de Student tˆ  0 =-15,42 < -1,94 au seuil 5%.
La série est stationnaire, on passe à la modélisation par la méthode de Box & Jenkins.

Identification du modèle à priori :

Corrélogrammes de la série différenciée (EXPLD) :


EXPL
EXPL
1.0
1.0

.5
.5

0.0
0.0

-.5 -.5 Limites de confiance


Limites de confiance
ACF partiel
ACF

-1.0 Coefficient -1.0 Coefficient


1 7 13 19 25 31 37 1 7 13 19 25 31 37
4 10 16 22 28 34 40 4 10 16 22 28 34 40

Numéro de décalage Numéro de décalage


Transforme: différence (1) Transforme: différence (1)

Le modèle à priori est ARIMA (2, 1, 1).

Le choix du modèle optimal :

Modèle AIC BIC


ARIMA (1, 1,0) -138,49879 -135,3808
ARIMA (0, 1,1) -138,45117 -135,33317

Parmi ces modèles on choisit celui qui minimise les deux critères AIC et BIC, on opte
pour le modèle ARIMA (0,1, 1).

Estimation des paramètres du modèle optimal :

B SEB T-RATIO APPROX. PROB.

MA1 .18194803 .07695155 2.3644490 .01921274

Test sur les paramètres:

Les paramètres sont significativement différents de zéro, car les statistiques t


empiriques associés sont supérieures à la valeur de la statistique t théorique 1,96 au
risque 5% et les probabilités sont toutes inférieures à 0,05.
On va s’assurer que les résidus du modèle choisi forment un bruit blanc en utilisant les
tests suivants :

Tests sur les résidus :

105
Application de Box & Jenkins

Error for EXPL from ARIMA, MOD_15 NOCON Error for EXPL from ARIMA, MOD_15 NOCON
1.0 1.0

.5 .5

0.0 0.0

-.5 -.5
Limites de confiance Limites de confiance

ACF partiel
ACF

-1.0 Coefficient -1.0 Coefficient


1 7 13 19 25 31 37 1 7 13 19 25 31 37
4 10 16 22 28 34 40 4 10 16 22 28 34 40

Numéro de décalage Numéro de décalage

a. Test de points de retournement :

 0  : « Les  i ne sont pas corrélés » / H1 : « Il existe une corrélation entre les
résidus ».
n 1
2( n  2) 16n  29
T=   i = 114;  T  = = 110 ; ar  T  = = 29,36.
i2 3 90
U = 0,73 < 1,96 donc on accepte H0 au seuil 5%.

Les résidus ne sont pas corrélés.

b. Test de Box-Ljung :

H0 : « 1=2=…=42=0 » contre H1 : «  j j := 1,…,42 tq j  0 »

Pour K =12 la statistique Q =18,602  2 12-1= 19,675 donc le pic n’est pas
significatif.
Pour k = 42, p = 0, q = 1 :
La statistique Q = 31,099  2 41 = 56,942 donc on accepte l’hypothèse nulle : les
résidus forment un bruit blanc.
Lag Corr. Err. -1 -.75 -.5 -.25 0 .25 .5 .75 1 Box-Ljung Prob.
+----+----+----+----+----+----+----+----+
1 -.022 .077 . * . .083 .773
2 .006 .076 . * . .090 .956
3 .047 .076 . I* . .466 .926
4 -.101 .076 .**I . 2.224 .695
5 .023 .076 . * . 2.319 .803
6 .063 .076 . I* . 3.023 .806
7 -.116 .075 .**I . 5.384 .613
8 .084 .075 . I**. 6.626 .578
9 -.090 .075 .**I . 8.082 .526
10 -.036 .075 . *I . 8.319 .598
11 .147 .074 . I*** 12.247 .345
12 .187 .074 . I**.* 18.602 .099

106
Application de Box & Jenkins

13 .012 .074 . * . 18.630 .135


14 .109 .074 . I**. 20.813 .107
15 -.037 .073 . *I . 21.061 .135
16 -.043 .073 . *I . 21.403 .164
17 -.064 .073 . *I . 22.164 .178
18 -.050 .073 . *I . 22.636 .205
19 .022 .072 . * . 22.725 .250
20 -.016 .072 . * . 22.775 .300
21 -.091 .072 .**I . 24.372 .275
22 .075 .072 . I**. 25.476 .275
23 -.055 .071 . *I . 26.062 .298
24 .000 .071 . * . 26.062 .350
25 .056 .071 . I* . 26.685 .372
26 .004 .071 . * . 26.687 .426
27 -.014 .070 . * . 26.726 .479
28 -.036 .070 . *I . 26.994 .519
29 -.033 .070 . *I . 27.219 .560
30 -.030 .070 . *I . 27.404 .602
31 .009 .069 . * . 27.419 .651
32 -.041 .069 . *I . 27.769 .681
33 -.023 .069 . * . 27.882 .720
34 .024 .069 . * . 28.005 .756
35 -.081 .068 .**I . 29.394 .735
36 .028 .068 . I* . 29.567 .767
37 .066 .068 . I* . 30.500 .766
38 .020 .068 . * . 30.590 .798
39 -.029 .067 . *I . 30.770 .824
40 -.030 .067 . *I . 30.969 .846
41 .000 .067 . * . 30.969 .873
42 -.024 .067 . * . 31.099 .892

c. Test de la nullité des moyennes des résidus :

On teste l’hypothèse H0 : « m = 0 » contre H1 : « m  0 »

T = -1,6560 1,96 alors on accepte la nullité des moyennes des résidus.

d. Test de Kolmogorov-Smirnov : (test de normalité)

H0 : « les résidus sont gaussiens »


Les résultats sont : Dn - = - 0,254 Dn + = 0,238 Dn = sup -0,254 ; 0,238 =0,254
1/2
0,254 > 1,36/ ( 167 ) = 0,105.
n = 167
Les résidus ne sont pas gaussiens.

e. Test de Durbin Watson :

On teste H0 : «  = 0» contre H1 : «   0 »

Le logiciel SPSS donne le résultat DW= 1,980  2, dans ce cas les résidus ne sont pas
corrélés.

f. Test d’hétéroscédasticité :

On teste H0 : « les résidus sont Homoscédastiques »


Contre H1 : « les résidus sont Hétéroscédastiques »
Corrélogrammes des résidus au carré :

107
Application de Box & Jenkins

ERR2 ERR2
1.0 1.0

.5 .5

0.0 0.0

-.5 -.5
Limites de confiance Limites de confiance

ACF partiel
ACF

-1.0 Coefficient -1.0 Coefficient


1 7 13 19 25 31 37 1 7 13 19 25 31 37
4 10 16 22 28 34 40 4 10 16 22 28 34 40

Numéro de décalage Numéro de décalage

Lag Corr. Err. -1 -.75 -.5 -.25 0 .25 .5 .75 1 Box-Ljung Prob.
+----+----+----+----+----+----+----+----+
1 .128 .077 . I*** 2.797 .094
2 -.032 .076 . *I . 2.972 .226
3 -.022 .076 . * . 3.055 .383
4 .007 .076 . * . 3.064 .547
5 -.037 .076 . *I . 3.302 .653
6 -.029 .076 . *I . 3.445 .751
7 .004 .075 . * . 3.447 .841
8 -.008 .075 . * . 3.460 .902
9 .055 .075 . I* . 4.002 .911
10 .011 .075 . * . 4.022 .946
11 .050 .074 . I* . 4.475 .954
12 .247 .074 . I**.** 15.552 .213
13 -.012 .074 . * . 15.577 .273
14 -.021 .074 . * . 15.658 .335
15 -.040 .073 . *I . 15.952 .385
16 -.046 .073 . *I . 16.353 .429
17 -.046 .073 . *I . 16.749 .471
18 -.045 .073 . *I . 17.139 .514
19 -.036 .072 . *I . 17.380 .564
20 -.038 .072 . *I . 17.650 .610
21 .033 .072 . I* . 17.865 .658
22 .019 .072 . * . 17.934 .710
23 .040 .071 . I* . 18.244 .744
24 -.006 .071 . * . 18.252 .791
25 -.028 .071 . *I . 18.413 .824
26 -.040 .071 . *I . 18.731 .848
27 -.042 .070 . *I . 19.088 .867
28 -.041 .070 . *I . 19.432 .884
29 -.038 .070 . *I . 19.730 .901
30 -.037 .070 . *I . 20.013 .916
31 -.030 .069 . *I . 20.205 .931
32 -.032 .069 . *I . 20.425 .943
33 -.043 .069 . *I . 20.815 .951
34 -.029 .069 . *I . 20.991 .961
35 .079 .068 . I**. 22.340 .952
36 -.007 .068 . * . 22.353 .963
37 -.015 .068 . * . 22.398 .972
38 -.032 .068 . *I . 22.625 .977
39 -.031 .067 . *I . 22.841 .982
40 -.034 .067 . *I . 23.096 .985
41 -.035 .067 . *I . 23.363 .988

108
Application de Box & Jenkins

42 -.035 .067 . *I . 23.635 .990

Pour K=12, Q=15,552 < 2 12-1 =19.675, le pic n’est pas significatif
La statistique de Box-ljung Q= 23,635 <  41 = 56,942 : on accepte l’hypothèse
2

d’homoscédasticité des résidus.

Conclusion :

D’après la méthodologie de Box et Jenkins, les résidus du modèle optimal forment


un bruit blanc non gaussien, donc le modèle choisi ARIMA (0, 1, 1) est valide, et la
série EXPL peut être ajustée par le modèle suivant :

(1-B) EXPLt = (1-0,18B)  t

RMSE=0,20456716.

Prévisions :

Les prévisions de la série EXP seront calculées après la transformation


exponentielle :

Année et mois Prévisions


janv-05 14.18861
févr-05 10.73681
mars-05 10.95995
avr-05 11.71913
mai-05 11.32981
juin-05 10.89427
juil-05 11.67006
août-05 11.24347
sept-05 11.10500
oct-05 11.49689
nov-05 11.27125
déc-05 11.18646

Le graphe suivant représente la réalisation et les valeurs ajustées pour l’année 2005 :

109
Application de Box & Jenkins

300

200

100

EXP

Fit for FIT_1 from A


0 RIMA, MOD_37 NOCON

Date

5. Analyse de la série brute CONS :

Diagramme de la série brute

500000

400000

300000

200000
CONS

100000

Date

110
Application de Box & Jenkins

Graphe de la moyenne et la variance de la série CONS :

Graphe de la m oye nne Graphe de la variance

450000
1400000000
400000
350000 1200000000
300000 1000000000
250000 800000000
CONS CONS
200000 600000000
150000
400000000
100000
50000 200000000
0 0
1 4 7 10 13 16 19 1 5 9 13 17

On remarque que la moyenne et la variance varient au cours du temps ; chose qu’on


peut expliquer par la non stationnarité de la série.
On fait appel aux tests statistiques pour vérifier cela, juste avant on présente les
corrélogrammes simple et partiel de la série brute.

Corrélogrammes simples et partiel de la série brute :

CONS CONS
1.0 1.0

.5 .5

0.0 0.0

-.5 -.5
Limites de confiance Limites de confiance
ACF partiel
ACF

-1.0 Coefficient -1.0 Coefficient


1 7 13 19 25 31 37 43 1 7 13 19 25 31 37 43
4 10 16 22 28 34 40 4 10 16 22 28 34 40

Numéro de décalage Numéro de décalage

Le corrélogramme simple présente une décroissance linéaire, ensuite une croissance


linéaire.
Le corrélogramme partiel fait apparaître un pi significatif au retard N01.

Test de la saisonnalité : (ANOVA)

Pour détecter le facteur saisonnier, on applique le test de Fisher.

111
Application de Box & Jenkins

Test d’influence du facteur ligne (mois) :


H0 : «absence du facteur saisonnier» contre H1 : « il existe un facteur saisonnier »

Test d’influence du facteur colonne (années) :


H 0  : «La série n’est pas affectée d’une tendance» / H1  : « La série est tendancielle ».

Résultats du test :

Valeur
Source des Somme Degré de Moyenne critique
variations des carrés liberté des carrés F Probabilité pour F
Lignes 1.4768E+10 11 1342540705 8.71625668 1.5433E-12 1.83726101
Colonnes 4.6453E+11 18 2.5807E+10 167.549583 2.939E-109 1.65617564
Erreur 3.0497E+10 198 154027211
Total 5.0979E+11 227

Effet ligne
Fcal > Ftab (8,71625668 > 1,83726101) au seuil α= 0,05, ceci implique que H0 est
rejetée, la série est donc saisonnière.
Effet colonne :
Fcal > Ftab (167,54 > 1,65) au seuil α= 0,05, on rejette H0, la série est tendancielle.

Elimination du facteur saisonnier :

Pour éliminer la saisonnalité, on applique l’opérateur de différence saisonnière


d’ordre 12 sur la série CONS. La série ainsi obtenue est notée CONSDS
(C’est-à-dire CONSDSt CONSt –CONSt-12)

Diagramme séquentiel de la série CONSDS


200000

100000

0
CONS

-100000

Date
Transforme: Différence saisonnière (1, période 12)

112
Application de Box & Jenkins

Vérification de l’élimination du facteur saisonnier :

On applique le test de Fisher sur la série CONSDS pour s’assurer que la saisonnalité
est complètement éliminée.

Résultats du test :

Valeur
Source des Somme Degré de Moyenne critique
variations des carrés liberté des carrés F Probabilité pour F
Lignes 89724417 11 8156765.18 0.0230247 0.99999996 1.84014226
Colonnes 1.2364E+11 17 7272889679 20.529724 4.3551E-34 1.6776518
Erreur 6.6247E+10 187 354261444      
Total 1.8998E+11 215        

Effet ligne :
Fcal < Ftab (0,023 < 1,84), la saisonnalité a totalement disparue.

Etude de la série CONSDS :

Test de Dickey-Fuller :
Nous appliquons le test de Dickey-Fuller sur la série CONSDS pour nous permettre
de détecter l’existence d’une racine unitaire et le type de la tendance.

H01 : « il existe une racine unitaire » H11 : « absence de racine unitaire »


H02 : « la constante est nulle » H12 : « la constante n’est pas nulle »
H03 : « le coefficient de la tendance est nul » H03: « le coefficient n’est pas nul »

Les résultats du test :

Le modèle (3) :

ADF Test Statistic -3.025044 1% Critical Value* -4.0037


5% Critical Value -3.4318
10% Critical Value -3.1393
Variable Coefficient Std. Error t-Statistic Prob.
CONSDS(-1) -0.08226 0.027193 -3.025044 0.0028
C 63.32622 1749.292 0.036201 0.9712
@TREND(1986:01) 7.419554 13.0193 0.569889 0.5694
R-squared 0.041547 Mean dependent var 16.70186
Adjusted R-squared 0.032505 S.D. dependent var 11953.06
S.E. of regression 11757.19 Akaike info criterion 21.59617
Sum squared resid 2.93E+10 Schwarz criterion 21.64321
Log likelihood -2318.589 F-statistic 4.594912
Durbin-Watson stat 1.945013 Prob(F-statistic) 0.01113

On accepte l’hypothèse nulle de non stationnarité (il existe une racine unitaire) car
la statistique de Student tˆ  0 =-3,02 > -3 ,43 au seuil 5%.

113
Application de Box & Jenkins

On accepte l’hypothèse nulle de la nullité du coefficient de la tendance


conditionnellement à la présence d’une racine unitaire du fait que
F3 =4,59 (Fisher) < Ftab = 6,34.
Le modèle (2) :

ADF Test Statistic -2.982154 1% Critical Value* -3.4621


5% Critical Value -2.875
10% Critical Value -2.5739
Variable Coefficient Std. Error t-Statistic Prob.
CONSDS(-1) -0.080343 0.026941 -2.982154 0.0032
C 931.8439 857.3623 1.086873 0.2783
R-squared 0.040079 Mean dependent var 16.70186
Adjusted R-squared 0.035572 S.D. dependent var 11953.06
S.E. of regression 11738.54 Akaike info criterion 21.5884
Sum squared resid 2.93E+10 Schwarz criterion 21.61976
Log likelihood -2318.753 F-statistic 8.893242
Durbin-Watson stat 1.945751 Prob(F-statistic) 0.003196

On rejette l’hypothèse nulle de non stationnarité (il n’existe pas une racine unitaire)
car la statistique de Student tˆ  0 =-2,98 < -2,87 au seuil 5%.
Le coefficient de la constante est significativement égal à zéro : tcˆ  0 =1,08 <1,96
au seuil 5%.
Le modèle (1) :

ADF Test Statistic -0.775943 1% Critical Value* -2.5751


    5% Critical Value -1.9412
    10% Critical Value -1.6164

On accepte l’hypothèse nulle de non stationnarité (il existe une racine unitaire) car
la statistique de Student tˆ  0 =-0,77 > -1,94 au seuil 5%.
La série CONSDS est donc non stationnaire de type de tendance DS sans dérive.
Le modèle s’écrit comme suit : xt   t
Pour ôter la tendance, il suffit de différencier la série CONSDS au moins une fois.
La série ainsi obtenue sera notée CONSDSD.

Diagramme séquentiel de la série CONSDSD

114
Application de Box & Jenkins

60000

40000

20000

-20000

-40000
CONS

-60000

Date
Transforme: différence (1), Différence saisonnière (1, période 12)

Test de Dickey-Fuller sur la série différentiée (CONSDSD) :

Les résultats du test :

Le modèle (3) :

ADF Test Statistic -12.67348 1% Critical Value* -4.02


5% Critical Value -3.4396
10% Critical Value -3.1439
Variable Coefficient Std. Error t-Statistic Prob.
CONSDSD(-1) -1.0309 0.081343 -12.67348 0
C -930.6342 2034.384 -0.457453 0.648
@TREND(1991:01) 11.28151 20.18381 0.558938 0.577
R-squared 0.515431 Mean dependent var -24.86234
Adjusted R-squared 0.509013 S.D. dependent var 15875.3
S.E. of regression 11123.89 Akaike info criterion 21.49087
Sum squared resid 1.87E+10 Schwarz criterion 21.55003
Log likelihood -1651.797 F-statistic 80.30859
Durbin-Watson stat 1.997751 Prob(F-statistic) 0

On rejette l’hypothèse nulle de non stationnarité (la racine unitaire n’existe pas) car
la statistique de Student tˆ  0 =-12,67 < -3 ,43 au seuil 5%.

115
Application de Box & Jenkins

Le coefficient de la tendance est significativement égal à zéro car t ̂  0,55<1,96.


Le modèle (2) :

ADF Test Statistic -12.68989 1% Critical Value* -3.4738


5% Critical Value -2.8802
10% Critical Value -2.5766
Variable Coefficient Std. Error t-Statistic Prob.
CONSDSD(-1) -1.028883 0.081079 -12.68989 0
C 90.11671 894.4051 0.100756 0.9199
R-squared 0.514429 Mean dependent var -24.86234
Adjusted R-squared 0.511234 S.D. dependent var 15875.3
S.E. of regression 11098.71 Akaike info criterion 21.47995
Sum squared resid 1.87E+10 Schwarz criterion 21.51939
Log likelihood -1651.956 F-statistic 161.0332
Durbin-Watson stat 1.997529 Prob(F-statistic) 0

On rejette l’hypothèse nulle de non stationnarité (il n’existe pas une racine unitaire)
car la statistique de Student tˆ  0 =-12,68 < -2,88 au seuil 5%.
Le coefficient de la constante est significativement égal à zéro : tcˆ  0 = 0,10 <1,96
au seuil 5%.
Le modèle (1) :

ADF Test Statistic -12.73077 1% Critical Value* -2.579


5% Critical Value -1.9419
10% Critical Value -1.6168

On rejette l’hypothèse nulle de non stationnarité (la racine unitaire n’existe pas)
car la statistique de Student tˆ  0 =-12,73 < -1,94 au seuil 5%.
Le modèle s’écrit comme suit : xt     1 xt 1   t
La série est stationnaire, on passe à la modélisation par la méthode de Box & Jenkins.
Identification du modèle à priori :

Corrélogrammes de la série CONSDSD :

CONS CONS
1.0 1.0

.5 .5

0.0 0.0

-.5 Limites de confiance -.5 Limites de confiance


ACF partiel
ACF

-1.0 Coefficient -1.0 Coefficient


1 7 13 19 25 31 37 43 1 7 13 19 25 31 37 43
4 10 16 22 28 34 40 4 10 16 22 28 34 40

Numéro de décalage Numéro de décalage


Transforme: différence (1), Différence saisonnière (1, période 12) Transforme: différence (1), Différence saisonnière (1, période 12)

116
Application de Box & Jenkins

Le modèle à priori est SARIMA (0, 1, 0) (3, 1, 1)

Le choix du modèle optimal :

Modèle AIC BIC


SARIMA (0, 1, 0) (2, 1,0) 4565,2137 4571,955
SARIMA (0,1, 0) (3, 1, 0) 4557,1498 4567,2617

Parmi ces modèles on choisit celui qui minimise les deux critères AIC et BIC, on opte
pour le modèle SARIMA (0,1, 0) (3, 1, 0).

Estimation des paramètres du modèle optimal :

B SEB T-RATIO APPROX. PROB.

SAR1 -.76354578 .06886267 -11.087950 .00000000


SAR2 -.45590873 .08218098 -5.547618 .00000009
SAR3 -.23816630 .07425649 -3.207347 .00154706

Test sur les paramètres :

Les paramètres sont significativement différents de zéro, car les statistiques t


empiriques associés sont supérieures à la valeur de la statistique t théorique 1,96 au
risque 5%, et les probabilités sont toutes inférieures à 0,05.

Tests sur les résidus :

Error for CONS from ARIMA, MOD_4 NOCON Error for CONS from ARIMA, MOD_4 NOCON
1.0 1.0

.5 .5

0.0 0.0

-.5 -.5
Limites de confiance Limites de confiance
ACF partiel
ACF

-1.0 Coefficient -1.0 Coefficient


1 7 13 19 25 31 37 43 1 7 13 19 25 31 37 43
4 10 16 22 28 34 40 4 10 16 22 28 34 40

Numéro de décalage Numéro de décalage

a. Test de points de retournement :

117
Application de Box & Jenkins

 0  : « Les  i ne sont pas corrélés entre eux »

H1 : « Il existe une corrélation entre les résidus ».


n 1
2( n  2) 16n  29
T=   i = 146 ;  T  = = 142 ; ar  T  = = 37,9.
i2 3 90

U = 0,64 < 1,96 donc on accepte H0 au seuil 5%.


Les résidus ne sont pas corrélés entre eux.
b. Test de Box-Ljung :

H0 : « 1=2=…=45=0 » contre H1 : «  j j := 1,…,45 tq j  0 »

Pour K =42, p = 0, q = 0, P = 3, Q = 0 : la statistique Q =34,352  2 42-3 = 54,572


donc le pic n’est pas significatif
Pour K =43, la statistique Q =41,705  2 43-3 = 55,758 donc le pic n’est pas
significatif.
Pour k = 45, la statistique Q = 41,776  2 42 = 55,76 donc on accepte l’hypothèse
nulle : les résidus Forment un bruit blanc.

Lag Corr. Err. -1 -.75 -.5 -.25 0 .25 .5 .75 1 Box-Ljung Prob.
+----+----+----+----+----+----+----+----+
1 .021 .068 . * . .093 .761
2 -.056 .068 . *I . .771 .680
3 .044 .067 . I* . 1.205 .752
4 .035 .067 . I* . 1.478 .831
5 -.007 .067 . * . 1.489 .914
6 -.090 .067 .**I . 3.306 .770
7 -.040 .067 . *I . 3.668 .817
8 .030 .067 . I* . 3.869 .869
9 .061 .066 . I* . 4.719 .858
10 -.072 .066 . *I . 5.905 .823
11 .056 .066 . I* . 6.628 .828
12 -.047 .066 . *I . 7.139 .848
13 -.030 .066 . *I . 7.353 .883
14 .072 .066 . I* . 8.559 .858
15 -.016 .065 . * . 8.617 .897
16 -.081 .065 .**I . 10.170 .858
17 -.064 .065 . *I . 11.150 .849
18 .025 .065 . I* . 11.304 .881
19 -.080 .065 .**I . 12.827 .847
20 -.052 .065 . *I . 13.482 .856
21 .036 .064 . I* . 13.792 .878
22 .015 .064 . * . 13.849 .907
23 .047 .064 . I* . 14.392 .915
24 -.067 .064 . *I . 15.493 .906
25 -.015 .064 . * . 15.547 .928
26 .007 .064 . * . 15.560 .946
27 -.148 .063 ***I . 21.027 .785
28 -.003 .063 . * . 21.030 .824
29 .064 .063 . I* . 22.055 .818

118
Application de Box & Jenkins

30 -.040 .063 . *I . 22.450 .837


31 .008 .063 . * . 22.466 .868
32 .037 .063 . I* . 22.810 .884
33 .060 .062 . I*. 23.741 .882
34 -.044 .062 .*I . 24.245 .892
35 -.019 .062 . * . 24.336 .912
36 -.123 .062 **I . 28.264 .818
37 .042 .062 . I*. 28.719 .833
38 .064 .062 . I*. 29.814 .826
39 -.024 .061 . * . 29.966 .850
40 .012 .061 . * . 30.006 .875
41 .010 .061 . * . 30.033 .897
42 .127 .061 . I*.* 34.352 .793
43 .165 .061 . I*.* 41.705 .527
44 -.016 .061 . * . 41.771 .568
45 -.004 .060 . * . 41.776 .609

c. Test de la nullité des moyennes des résidus :

On teste l’hypothèse H0 : « m = 0 » contre H1 : « m  0 »

T = 0,332 1,96 alors on accepte la nullité des moyennes des résidus.

d. Test de Kolmogorov-Smirnov : (test de normalité)

H0 : « les résidus sont gaussiens »


Les résultats sont : Dn - = - 0,047 Dn + = 0,029 Dn = sup -0,047 ; 0,029=0,047
0,047 1,36/ (2151/2) = 0,092 n=215
Les résidus sont donc gaussiens.

e. Test de Von Neuman :

Après avoir confirmé que les résidus sont gaussiens, ce test peut être effectué.
On teste l’hypothèse nulle :
H0 : « les résidus sont indépendants et identiquement distribués » contre l’hypothèse
H1 : « Au moins deux observations successives tendent à être corrélées »
Si la statistique calculée |VN |  1,96.
On accepte l’hypothèse que les résidus sont indépendants identiquement distribués.

Après calcul VN = 0,01223  1,96 on accepte l’hypothèse H0.

f. Test de Durbin Watson :

On teste H0 : «  = 0» contre H1 : «   0 »


Le logiciel SPSS donne le résultat DW= 2,018  2, dans ce cas les résidus ne sont pas
corrélés.
g. Test d’hétéroscédasticité : 

119
Application de Box & Jenkins

On teste H0 : « les résidus sont Homoscédastiques »


Contre H1 : « les résidus sont Hétéroscédastiques »
Corrélogrammes des résidus au carré :

ERRE2 ERRE2
1.0 1.0

.5 .5

0.0 0.0

-.5 -.5
Limites de confiance Limites de confiance

ACF partiel
ACF

-1.0 Coefficient -1.0 Coefficient


1 7 13 19 25 31 37 43 1 7 13 19 25 31 37 43
4 10 16 22 28 34 40 4 10 16 22 28 34 40

Numéro de décalage Numéro de décalage

Auto- Stand.
Lag Corr. Err. -1 -.75 -.5 -.25 0 .25 .5 .75 1 Box-Ljung Prob.
+----+----+----+----+----+----+----+----+
1 -.061 .068 . *I . .821 .365
2 .083 .068 . I**. 2.344 .310
3 -.063 .067 . *I . 3.214 .360
4 .034 .067 . I* . 3.472 .482
5 .025 .067 . I* . 3.613 .606
6 .027 .067 . I* . 3.771 .708
7 -.030 .067 . *I . 3.967 .784
8 -.128 .067 ***I . 7.676 .466
9 -.063 .066 . *I . 8.583 .477
10 -.022 .066 . * . 8.695 .561
11 .053 .066 . I* . 9.346 .590
12 .040 .066 . I* . 9.710 .641
13 .031 .066 . I* . 9.931 .700
14 -.068 .066 . *I . 11.020 .684
15 -.041 .065 . *I . 11.408 .723
16 -.019 .065 . * . 11.495 .778
17 .042 .065 . I* . 11.912 .805
18 -.043 .065 . *I . 12.354 .828
19 .029 .065 . I* . 12.558 .860
20 .015 .065 . * . 12.610 .894
21 -.010 .064 . * . 12.633 .921
22 .053 .064 . I* . 13.313 .924
23 .005 .064 . * . 13.319 .945
24 .018 .064 . * . 13.400 .959
25 .034 .064 . I* . 13.691 .967
26 .026 .064 . I* . 13.854 .975
27 .055 .063 . I* . 14.610 .975
28 .003 .063 . * . 14.611 .982
29 -.046 .063 . *I . 15.141 .984

120
Application de Box & Jenkins

30 .057 .063 . I* . 15.954 .983


31 .020 .063 . * . 16.052 .988
32 .109 .063 . I**. 19.101 .965
33 -.062 .062 .*I . 20.080 .962
34 -.002 .062 . * . 20.082 .972
35 -.053 .062 .*I . 20.811 .972
36 .043 .062 . I*. 21.283 .976
37 -.077 .062 **I . 22.829 .967
38 -.051 .062 .*I . 23.507 .968
39 -.062 .061 .*I . 24.522 .966
40 -.088 .061 **I . 26.600 .949
41 -.053 .061 .*I . 27.354 .950
42 .029 .061 . I*. 27.587 .958
43 .067 .061 . I*. 28.803 .952
44 -.025 .061 .*I . 28.979 .961
45 -.018 .060 . * . 29.071 .969

La statistique de Box-ljung Q= 29,071 <  42 2 = 58,124 : on accepte l’hypothèse


d’homoscédasticité des résidus.

Conclusion :

D’après la méthodologie de Box et Jenkins, les résidus du modèle optimal forment


un bruit blanc gaussien, donc le modèle choisi SARIMA (0,1, 0) (3, 1, 0) est valide, et
la série CONS peut être ajustée par le modèle suivant :

(1-B12)*(1-B)*(1+0,76B12+0,45(B2)12+0,23(B3)12) * CONSt = t

RMSE =15272,3795

Prévisions :

Année et mois Prévision Prév- Prév+


janv-05 385536.4647 365871.3612 405201.5683
févr-05 384861.7689 357175.3438 412548.1940
mars-05 378050.1675 344290.5205 411809.8144
avr-05 372220.6290 333408.8051 411032.4529
mai-05 370437.7829 327233.8207 413641.7450
juin-05 376771.9760 329649.8125 423894.1395
juil-05 378746.8371 328069.2869 429424.3873
août-05 386890.1167 332947.2171 440833.0163
sept-05 395096.3423 338127.3149 452065.3697
oct-05 388806.7630 329013.6359 448599.8902
nov-05 382316.7490 319873.3227 444760.1753
déc-05 394994.0465 330052.0741 459936.0189

Le graphe suivant représente la réalisation et les valeurs ajustées pour l’année 2005 :

121
Application de Box & Jenkins

500000

400000

300000

200000
CONS

Fit for FIT_1 from A

100000 RIMA, MOD_87 NOCON

Date

6- Etude de la série STOCK :

Diagramme séquentiel de la série brute

122
Application de Box & Jenkins

400000

380000

360000

340000

320000

300000
STOCK

280000

260000

Date

Graphe de la moyenne et de la variance de la série STOCK :

Graphe de la m oye nne Graphe de la variance

400000 500000000
350000
400000000
300000
250000 300000000
200000 STOCK STOCK
150000 200000000
100000
100000000
50000
0 0
1 4 7 10 13 16 19 1 5 9 13 17

D’après les deux graphes, on remarque que la moyenne et la variance varient au cours
du temps. On peut donc appréhender la non stationnarité de la série.
La non stationnarité de la série implique la présence d’une saisonnalité, et/ ou d’une
tendance.
Pour vérifier ceci, on va appliquer des tests statistiques juste après la présentation des
corrélogrammes simple et partiel de la série brute.
Corrélogrammes simple et partiel de la série brute :

123
Application de Box & Jenkins

STOCK STOCK
1.0 1.0

.5 .5

0.0 0.0

-.5 -.5
Limites de confiance Limites de confiance

ACF partiel
ACF

-1.0 Coefficient -1.0 Coefficient


1 7 13 19 25 31 37 43 1 7 13 19 25 31 37 43
4 10 16 22 28 34 40 4 10 16 22 28 34 40

Numéro de décalage Numéro de décalage

Test de la saisonnalité : (ANOVA)

Pour détecter le facteur saisonnier, on applique le test de Fisher.


Test d’influence du facteur ligne (mois) :
H0 : «absence du facteur saisonnier» contre H1 : « il existe un facteur saisonnier »

Test d’influence du facteur colonne (années) :


H 0  : «La série n’est pas affectée d’une tendance» / H1  : « La série est tendancielle ».

Résultats du test :

Valeur
Source des Somme des Degré de Moyenne critique
variations carrés liberté des carrés F Probabilité pour F
Lignes 9508378633 11 864398058 7.82411765 3.2278E-11 1.83726101
Colonnes 9.926E+10 18 5514420604 49.913897 1.7372E-63 1.65617564
Erreur 2.1875E+10 198 110478663
Total 1.3064E+11 227

Effet ligne :
Fcal > Ftab (7,82411765 > 1,83726201) au seuil α= 0,05, ceci implique que H0 est
rejetée, la série est saisonnière.

Effet colonne :
Fcal > Ftab (49,913897 > 1,65617564) au seuil α= 0,05, ceci implique que H0 est rejetée,
La série est tendancielle.

Elimination du facteur saisonnier :

Pour extirper la saisonnalité, on applique l’opérateur de différence saisonnière


d’ordre 12 sur la série STOCK. La série ainsi obtenue sera notée STOCKDS.

Diagramme séquentiel de la série STOCKDS

124
Application de Box & Jenkins

60000

40000

20000

-20000

-40000
STO C K

-60000

-80000

Date
Transforme: Différence saisonnière (1, période 12)

Vérification de l’élimination du facteur saisonnier :

On applique le test de Fisher sur la série STOCKDS.

Résultats du test :

Valeur
Source des Somme Degré de Moyenne critique
variations des carrés liberté des carrés F Probabilité pour F
Lignes 111350592 11 10122781.1 0.03615118 0.99999954 1.84014226
Colonnes 5.0412E+10 17 2965399040 10.5902393 1.2935E-19 1.6776518
Erreur 5.2362E+10 187 280012467
Total 1.0289E+11 215

Effet ligne :
Fcal < Ftab (0,03615118 < 1,84014226) au seuil α=0,05, ceci implique que H0 est
acceptée, le facteur saisonnier a disparu.

Etude de la série STOCKDS :

Test de Dickey-Fuller :

Nous appliquons le test de Dickey-Fuller sur la série CONSDS pour nous permettre
de détecter l’existence d’une racine unitaire et le type de la tendance.

H01 : « il existe une racine unitaire » H11 : « absence de racine unitaire »


H02 : « la constante est nulle » H12 : « la constante n’est pas nulle »
H03 : « le coefficient de la tendance est nul » H03: « le coefficient n’est pas nul »

Les résultats du test :

125
Application de Box & Jenkins

Le modèle (3) :

ADF Test Statistic -3.992219 1% Critical Value* -4.0037


5% Critical Value -3.4318
10% Critical Value -3.1393
Variable Coefficient Std. Error t-Statistic Prob.
STOCKDS(-1) -0.141882 0.03554 -3.992219 0.0001
C 2.231635 1681.247 0.001327 0.9989
@TREND(1986:01) -2.797315 12.50993 -0.223607 0.8233
R-squared 0.07011 Mean dependent var 57.68372
Adjusted R-squared 0.061337 S.D. dependent var 11680.07
S.E. of regression 11316.19 Akaike info criterion 21.51971
Sum squared resid 2.71E+10 Schwarz criterion 21.56674
Log likelihood -2310.369 F-statistic 7.991941
Durbin-Watson stat 1.973558 Prob(F-statistic) 0.000451

On rejette l’hypothèse nulle de non stationnarité (il n’existe pas une racine unitaire)
car la statistique de Student tˆ  0 =-3,99 < -3 ,43 au seuil 5%.
Le coefficient de la tendance est significativement égal à zéro : t ˆ  0 =- 0,22
<1,96 au seuil 5%.

Le modèle (2) : 

ADF Test Statistic -4.000658 1% Critical Value* -3.4621


    5% Critical Value -2.875
    10% Critical Value -2.5739
Variable Coefficient Std. Error t-Statistic Prob.
STOCKDS(-1) -0.141012 0.035247 -4.000658 0.0001
C -331.0483 776.1412 -0.426531 0.6702
R-squared 0.06989 Mean dependent var 57.68372
Adjusted R-
squared 0.065524 S.D. dependent var 11680.07
S.E. of regression 11290.93 Akaike info criterion 21.51065
Sum squared resid 2.72E+10 Schwarz criterion 21.542
Log likelihood -2310.394 F-statistic 16.00527
Durbin-Watson stat 1.974803 Prob(F-statistic) 0.000087

On rejette l’hypothèse nulle de non stationnarité (il n’existe pas une racine unitaire)
car la statistique de Student tˆ  0 =-4,00 < -2,87 au seuil 5%.
Le coefficient de la constante est significativement égal à zéro : tcˆ  0 =-
0,42<1,96 au seuil 5%.
Le modèle (1) :

ADF Test Statistic -3.45381 1% Critical Value* -2.5789


5% Critical Value -1.9419
10% Critical Value -1.6168

On rejette l’hypothèse nulle de non stationnarité (la racine unitaire n’existe pas)
car la statistique de Student tˆ  0 =-3,45 < -1,94 au seuil 5%.

Le modèle s’écrit comme suit : xt     1 xt 1   t

126
Application de Box & Jenkins

La série est stationnaire, on passe à la modélisation par la méthode de Box & Jenkins.

Identification du modèle à priori :

Corrélogrammes simple et partiel de la série STOCKDS :

STOCK STOCK
1.0 1.0

.5 .5

0.0 0.0

-.5 Limites de confiance -.5 Limites de confiance

ACF partiel
ACF

-1.0 Coefficient -1.0 Coefficient


1 7 13 19 25 31 37 43 1 7 13 19 25 31 37 43
4 10 16 22 28 34 40 4 10 16 22 28 34 40

Numéro de décalage Numéro de décalage


Transforme: Différence saisonnière (1, période 12) Transforme: Différence saisonnière (1, période 12)

Le modèle à priori est SARIMA (1, 0, 3) (3, 1, 3)

Le choix du modèle optimal :

Le choix du modèle optimal se fera parmi tous les modèles proposés, ce choix est
basé sur les critères d’information AIC et BIC.

Modèle AIC BIC


SARIMA (1, 0,0) (3, 1,0) 4542,1734 4555,6745
SARIMA (1, 0,0) (2, 1,0) 4554,9475 4565,0733

Parmi ces modèles on choisi celui qui minimise les deux critères AIC et BIC, on opte
pour le modèle SARIMA (1,0, 0) (3, 1, 0).

Estimation des paramètres du modèle optimal :

Les variables du modèle :


B SEB T-RATIO APPROX. PROB.

127
Application de Box & Jenkins

AR1 .88384711 .03179291 27.800136 .00000000


SAR1 -.81145127 .06707133 -12.098333 .00000000
SAR2 -.54258591 .08010867 -6.773123 .00000000
SAR3 -.28409216 .07161645 -3.966856 .00009963

Test sur les paramètres:

Les paramètres sont significativement différents de zéro, car les statistiques t


empiriques associés sont supérieures à la valeur de la statistique t théorique 1,96 au
risque 5%, et les probabilités sont toutes inférieures à 0,05.

Tests sur les résidus :

Error for STOCK from ARIMA, MOD_11 NOCON Error for STOCK from ARIMA, MOD_11 NOCON
1.0 1.0

.5 .5

0.0 0.0

-.5 -.5
Limites de confiance Limites de confiance
ACF partiel
ACF

-1.0 Coefficient -1.0 Coefficient


1 7 13 19 25 31 37 43 1 7 13 19 25 31 37 43
4 10 16 22 28 34 40 4 10 16 22 28 34 40

Numéro de décalage Numéro de décalage

On va s’assurer que les résidus du modèle SARIMA (1, 0, 0) (3, 1, 0) forment un


bruit blanc en utilisant les tests suivants :

a. Test de points de retournement :

 0  : « Les  i ne sont pas corrélés entre eux »


H1 : « Il existe une corrélation entre les résidus ».

n 1
2( n  2) 16n  29
T=   i = 145 ;  T  = = 142; ar  T  = = 37,9.
i2 3 90

U = 0,64 < 1,96 donc on accepte H0.

b. Test de Box-Ljung :

On teste l’hypothèse nulle : les auto corrélations au pas K ne sont pas significatifs
C’est-à-dire :

128
Application de Box & Jenkins

H0 : « 1=2=…=45=0 » contre H1 : «  j j := 1,…,45 tq j  0 »

Pour K =43 la statistique Q =46,155  2 43-4= 54,572 donc le pic n’est pas
significatif.
Pour k = 45, p = 1, q = 0, P = 3, Q = 0 :
La statistique Q = 46,559  2 41 = 56,942 donc on accepte l’hypothèse nulle : les
résidus

Forment un bruit blanc.


Lag Corr. Err. -1 -.75 -.5 -.25 0 .25 .5 .75 1 Box-Ljung Prob.
+----+----+----+----+----+----+----+----+
1 -.004 .068 . * . .003 .956
2 -.007 .067 . * . .014 .993
3 .065 .067 . I* . .962 .810
4 -.026 .067 . *I . 1.111 .892
5 -.056 .067 . *I . 1.816 .874
6 -.040 .067 . *I . 2.174 .903
7 -.027 .067 . *I . 2.334 .939
8 .033 .066 . I* . 2.581 .958
9 .091 .066 . I**. 4.463 .878
10 -.103 .066 .**I . 6.881 .737
11 .062 .066 . I* . 7.752 .735
12 -.055 .066 . *I . 8.454 .749
13 -.091 .066 .**I . 10.376 .663
14 .090 .065 . I**. 12.248 .586
15 -.006 .065 . * . 12.257 .659
16 -.133 .065 ***I . 16.405 .425
17 -.025 .065 . *I . 16.553 .485
18 .003 .065 . * . 16.554 .554
19 -.096 .065 .**I . 18.749 .473
20 -.023 .065 . * . 18.878 .530
21 .063 .064 . I* . 19.841 .531
22 -.004 .064 . * . 19.846 .593
23 .050 .064 . I* . 20.463 .614
24 -.074 .064 . *I . 21.814 .590
25 -.015 .064 . * . 21.867 .643
26 .044 .064 . I* . 22.353 .669
27 -.156 .063 ***I . 28.441 .388
28 -.012 .063 . * . 28.479 .439
29 .095 .063 . I**. 30.728 .378
30 .018 .063 . * . 30.807 .425
31 .014 .063 . * . 30.858 .473
32 .003 .063 . * . 30.860 .524
33 .032 .062 . I*. 31.120 .561
34 -.067 .062 .*I . 32.279 .552
35 .057 .062 . I*. 33.111 .560
36 -.120 .062 **I . 36.870 .429
37 .034 .062 . I*. 37.178 .461
38 .095 .061 . I** 39.576 .400
39 -.036 .061 .*I . 39.920 .429
40 .049 .061 . I*. 40.564 .445
41 -.010 .061 . * . 40.589 .489
42 .048 .061 . I*. 41.208 .506
43 .135 .061 . I*.* 46.155 .343
44 .029 .060 . I*. 46.378 .375
45 -.026 .060 .*I . 46.559 .408

c. Test de la nullité des moyennes des résidus :

On teste l’hypothèse H0 : « m = 0 » contre H1 : « m  0 »


T = -1,241 1,96 alors on accepte la nullité des moyennes des résidus.
d. Test de Kolmogorov-Smirnov : (test de normalité)

129
Application de Box & Jenkins

H0 : « les résidus sont gaussiens »


Les résultats sont : Dn - = - 0,034 Dn + = 0,041 Dn = sup -0,034 ; 0,041 =0,041
0,042 1,36/ (2161/2) = 0,092 (n=216)
Les résidus sont donc gaussiens.

e. Test de Von Neuman :

Après avoir confirmé que les résidus sont gaussiens, ce test peut être effectué.
On teste l’hypothèse nulle :
H0 : « les résidus sont indépendants et identiquement distribués » contre l’hypothèse
H1 : « Au moins deux observations successives tendent à être corrélées »
Si la statistique calculée |VN |  1,96.
On accepte l’hypothèse que les résidus sont indépendants identiquement distribués.
Après calcul VN = 0,98  1,96 on accepte l’hypothèse H0.

f. Test de Durbin Watson :

On teste H0 : «  = 0» contre H1 : «   0 »


Le logiciel SPSS donne le résultat DW= 1,98  2, dans ce cas les résidus ne sont pas
corrélés.
g. Test d’hétéroscédasticité : 

On teste H0 : « les résidus sont Homoscédastiques »


Contre H1 : « les résidus sont Hétéroscédastiques »
Corrélogrammes des résidus au carré :

ERRE2 ERRE2
1.0 1.0

.5 .5

0.0 0.0

-.5 -.5
ACF partiel

Limites de confiance Limites de confiance


ACF

-1.0 Coefficient -1.0 Coefficient


1 7 13 19 25 31 37 43 1 7 13 19 25 31 37 43
4 10 16 22 28 34 40 4 10 16 22 28 34 40

Numéro de décalage Numéro de décalage

Auto- Stand.
Lag Corr. Err. -1 -.75 -.5 -.25 0 .25 .5 .75 1 Box-Ljung Prob.
+----+----+----+----+----+----+----+----+
1 -.117 .068 .**I . 2.980 .084
2 .087 .067 . I**. 4.632 .099
3 -.005 .067 . * . 4.637 .200
4 .078 .067 . I**. 5.993 .200
5 -.055 .067 . *I . 6.672 .246

130
Application de Box & Jenkins

6 .112 .067 . I**. 9.474 .149


7 -.085 .067 .**I . 11.103 .134
8 -.065 .066 . *I . 12.053 .149
9 .039 .066 . I* . 12.406 .191
10 -.035 .066 . *I . 12.684 .242
11 .009 .066 . * . 12.704 .313
12 -.042 .066 . *I . 13.113 .361
13 .003 .066 . * . 13.115 .439
14 -.038 .065 . *I . 13.458 .491
15 -.073 .065 . *I . 14.712 .472
16 -.059 .065 . *I . 15.523 .487
17 -.017 .065 . * . 15.592 .553
18 .013 .065 . * . 15.634 .618
19 .044 .065 . I* . 16.102 .650
20 -.013 .065 . * . 16.145 .708
21 .045 .064 . I* . 16.643 .733
22 .086 .064 . I**. 18.456 .679
23 -.004 .064 . * . 18.461 .732
24 -.006 .064 . * . 18.468 .780
25 -.024 .064 . * . 18.614 .815
26 .026 .064 . I* . 18.776 .846
27 .012 .063 . * . 18.811 .877
28 .076 .063 . I**. 20.244 .855
29 -.077 .063 .**I . 21.723 .831
30 -.023 .063 . * . 21.858 .859
31 .037 .063 . I* . 22.198 .877
32 .099 .063 . I**. 24.732 .817
33 -.040 .062 .*I . 25.141 .835
34 -.009 .062 . * . 25.162 .864
35 -.007 .062 . * . 25.174 .890
36 -.031 .062 .*I . 25.429 .905
37 -.089 .062 **I . 27.505 .872
38 .011 .061 . * . 27.535 .895
39 -.007 .061 . * . 27.548 .915
40 -.083 .061 **I . 29.378 .892
41 -.034 .061 .*I . 29.688 .905
42 -.039 .061 .*I . 30.102 .915
43 -.007 .061 . * . 30.114 .931
44 -.059 .060 .*I . 31.069 .929
45 -.010 .060 . * . 31.098 .943

La statistique de Box-ljung Q= 31,098 <  421 = 56,942 : on accepte l’hypothèse


d’homoscédasticité des résidus.

Conclusion :

D’après la méthodologie de Box et Jenkins, les résidus du modèle optimal forment


un bruit blanc gaussien, donc le modèle choisi SARIMA (1, 0, 0) (3, 1, 0) est valide, et
la série STOCK peut être ajustée par le modèle suivant :

(1-0,88B)* (1+0,81 B(12)+0,54(B2)12+0,28(B3)12)*(1-B12)*STOCKt =t

RMSE=13093,4606

Année et mois Prévision Prév- Prév+


Prévisions : janv-05 289246.648 269559.728 308933.568
févr-05 285741.83 260289.779 311193.882
mars-05 301806.391 273126.496 330486.286
avr-05 308308.257 277651.183 338965.331
mai-05 306263.593 274347.624 338179.562
juin-05 297823.981 265089.9 330558.063
juil-05 300370.644 267098.537 333642.75
août-05 293010.716 259382.189 326639.243
sept-05 279500.683131245634.947 313366.419
oct-05 290036.026 256011.947 324060.104
nov-05 290491.249 256361.265 324621.233
déc-05 283980.042 249779.134 318180.95
Application de Box & Jenkins

Le graphe suivant représente la réalisation et les valeurs ajustées pour l’année 2005 :

400000

380000

360000

340000

320000

300000
STOCK
280000
Fit for FIT_1 from A

260000 RIMA, MOD_101 NOCON

Date

132

Vous aimerez peut-être aussi