Vous êtes sur la page 1sur 9

LES MODELES SARIMA : IDENTIFICATION

ESTIMATION ET PREVISION
Elyse Aristide HOUNDETOUNGAN
courriel : ariel92and@gmail.com

Janvier 2016

Table des matires


Introduction

1 Gnralit : limites des mthodes de dsaisonnalisation


1.1 Notations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Limites des mthodes de dsaisonnalisation . . . . . . . . . . . . . . . . . .

2
2
3

2 La thorie des modles SARIMA


2.1 Rappel sur le test de Dickey Fuller . . . . . . . . . . . . . . . . . . . . . .
2.2 Dtermination de D . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3 Corrlogramme des processus SARIMA, dtermination de P et de Q . . . .

6
6
7
9

LES MODELES SARIMA

Introduction
Lconomtrie consiste en gnral modliser une variable laide dautres facteurs
appels explicatifs. On peut sintresser lvolution du taux de croissance, de linvestissement, de la consommation . . . ou mme lvolution du chiffre daffaires dune entreprise,
pour dgager limpact que pourraient avoir un certain nombre de variables sur leur volution. Sous un autre angle, lapproche conomtrique peut sintresser la prvision, du
chiffre daffaires par exemple. Dans ce cas prcis, les valeurs antrieures de la variables
dintrt sont gnralement utilises. Autrement dit, on modlise la variable uniquement
par ses valeurs passes sans faire recours dautres facteurs exognes. Ces modles sont
dits autorgressifs.
Il existe un paradigme de modles autorgressifs. Dans ce document nous allons parler
des modles Seasonal AutoRegressive Integrated Moving Average (SARIMA). Ces modles
sont une extension des modles ARIMA avec la prise en compte de la saisonnalit. Il est
assez frquent de se rendre compte que beaucoup dconomtres maitrisent les modles
ARIMA sans pour autant manipuler les SARIMA. En principe lapproche des SARIMA
est la mme que celle des ARIMA et devrait tre perue facilement.
Nous allons mettre laccent sur trois aspects. La premire des choses sera de lever cette
illusion qui fait croire quon peut toujours dsaisonnaliser une srie saisonnire pour lui
appliquer un modle ARIMA. En fait, a ne va pas toujours marcher et nous allons le
dcouvrir avec des exemples concrets. Une deuxime partie vas plutt se focaliser sur la
thorie des modles SARIMA. On aura dterminer leur fonction dautocorrlation et
autocorrlation partielle. La dernire partie sera la mise en uvre sous certains logiciels.
NB : Ce cours suppose que vous maitrisez les modles ARIMA. Abstenez vous
de le lire si ce nest pas le cas.

Gnralit : limites des mthodes de dsaisonnalisation

1.1

Notations

Soit (Xt )tZ un processus stochastique qui suit un ARIM A(p, d, q). Alors on a :
(1 B)d (B)Xt = (B)t avec t

BB(0, 2 )

Le polynme (.) est de degr p et (.) de degr q. Notons que le processus (1 B)d Xt
est stationnaire, ainsi les racines de (.) ne sont pas sur le cercle unit. Pour identifier un
ARIMA, il sagit donc de dterminer le p, le d et le q.
Le problme est un peu plus complexe pour les SARIMA. le nombre de paramtre augmente. Ainsi, on dit quun processus (Xt )tZ suit un SARIM A(p, d, q)(P, D, Q)s lorsque :
(1 B)d (1 B s )D (B s )(B)Xt = (B s )(B)t avec t

BB(0, 2 )

les polynmes (.), (.), (.) et (.) sont respectivement de degrs P , p, Q et q. Dans ce
cas aussi le processus (1 B)d (1 B s )D Xt est stationnaire. Les polynmes (.) et (.)
ont donc des racines qui ne sont pas sur le cercle unit.
De faon gnrale, le paramtre s reflte la frquence de la mesure de la variable dans
un cycle. Par exemple, si on observe la temprature moyenne dune rgion donne, le cycle
Aristide E.
HOUNDETOUNGAN

Page 2

LES MODELES SARIMA


sera lanne et la frquence 12. Si on observe le prix trimestriel dun actif saisonnier, le
cycle sera lanne et la frquence 4. Trs souvent le cycle de saisonnalit est 1 an (sauf
pour les variables dont la saisonnalit est semestrielle, mais qui sont vraiment rares) et la
frquence le nombre de fois quon observe le phnomne sur un cycle.

1.2

Limites des mthodes de dsaisonnalisation

Pour traiter les sries saisonnires, lapproche la plus frquente est de la dsaisonnaliser.
On obtient donc une srie non saisonnires qui peut rpondre aux critres des modles
ARIMA. Cette approche nest pas trop conseille. En effet, dune part on traite les toutes
les sries saisonnires de la mme faon dans distinction de D = 0 ou D = 1 ou autre (on
ne se soucie pas mal des paramtres P , D et Q). Dautre part la mthode applique pour
la dsaisonnalisation peut ne pas tre adquate.
La saisonnalit dun processus va bien au del de ce que lon pense. Voici un exemple de
ce que nous percevons souvent comme une saisonnalit.
Exemple 1 :
Supposons un produit A dont le prix Xt mesur chaque trimestre prend de fortes valeurs
pour le premier trimestre (en moyenne 140), une valeur moyenne pour les deuxime et
troisimes trimestres (en moyenne 100 et 80 respectivement), et une forte valeur pour le
quatrime trimestre (en moyenne 162). Ainsi, pour chaque trimestre, le prix va fluctuer
autour de la valeur correspondante. De faon concrte le processus peut tre de la forme
suivante :
(1 B 4 )Xt = t = Xt = Xt4 + t soit Xt

SARIM A(0, 0, 0)(0, 1, 0)4

Pour se conformer lexemple, posons X1 = 140, X2 = 100, X3 = 80, et X4 = 162.


A laide de la formule de rcurrence, essayons de simuler les valeurs de Xt jusqu lordre
20 (pour 5 ans). A partir de X5 on aura besoin des valeurs de t . Si vous travaillez sous
des logiciels vous pouvez simuler des nombres qui suivent une loi normale centre. Dans
le cas contraire, il est fourni est lannexe 1, une srie de nombre alatoire suivant une loi
normale centre rduite. La simulation du prix nous permet dobtenir les valeurs ci-aprs.
Tableau 1 Evolution du prix du produit A

Anne
Anne
Anne
Anne
Anne

1
2
3
4
5

Trimestre 1

Trimestre 2

Trimestre 3

Trimestre 4

140,00
139,29
140,70
141,65
142,81

100,00
98,85
97,54
97,11
95,58

80,00
80,34
79,85
80,55
79,99

162,00
165,02
164,86
165,93
167,98

A coup sr, les tests de saisonnalits vont aboutir des meilleurs rsultats. Juste
parce que la saisonnalit est de type dterministe et plus rapidement, lon peut obtenir
les coefficients saisonniers (il suffit de faire ici une moyenne pour chaque trimestre). On
peut donc dsaisonnaliser la srie.

Aristide E.
HOUNDETOUNGAN

Page 3

LES MODELES SARIMA

n1

-T
r
n1 i1
-T
A ri2
n1
-T
A ri3
n1
-T
A ri4
n2
-T
A ri1
n2
-T
A ri2
n2
-T
A ri3
n2
-T
A ri4
n3
-T
A ri1
n3
-T
A ri 2
n3
-T
A ri3
n3
-T
A ri4
n4
-T
A ri1
n4
-T
A ri2
n4
-T
A ri 3
n4
-T
A ri4
n5
-T
A ri1
n5
-T
A ri2
n5
-T
A ri3
n5
-T
ri4

Figure 1 Evolution du prix du produit A

Le test de Fisher confirme la saisonnalit qui souponne au sein de la srie. Ce test


marche seulement cause de la forme du modle. Pour en tre sr, considrons un taux
saisonniers, respectant le modle suivant.
Exemple 2 :
(1 + 0.9B 4 )Xt = t = Xt = 0.9Xt4 + t soit Xt

SARIM A(0, 0, 0)(1, 0, 0)4

On suppose que X1 = 0, 15, X2 = 0, 65, X3 = 0, 40, et X4 = 0, 1. La simulation


permet dobtenir ce qui suit.
Tableau 2 Evolution du taux

1
2
3
4
5

Trimestre 2

Trimestre 3

Trimestre 4

0,15
-0,21
0,33
-0,20
0,30

0,65
-0,70
0,50
-0,49
0,29

0,40
-0,33
0,25
-0,15
0,08

-0,10
0,39
-0,37
0,44
-0,19

n1

-T
A ri1
n1
-T
A ri2
n1
-T
A ri3
n1
-T
A ri4
n2
-T
A ri 1
n2
-T
A ri2
n2
-T
A ri3
n2
-T
A ri4
n3
-T
A ri1
n3
-T
A ri2
n3
-T
A ri3
n3
-T
A ri4
n4
-T
A ri1
n4
-T
A ri2
n4
-T
A ri3
n4
-T
A ri4
n5
-T
A ri1
n5
-T
A ri2
n5
-T
A ri3
n5
-T
ri 4

Anne
Anne
Anne
Anne
Anne

Trimestre 1

Lallure de la courbe ne rvle pas que la srie est saisonnire. Mieux, les tests infirment
la saisonnalit, pourtant nous venons de simuler un SARIMA. Il est vrai que dans une
certaine mesure, on pourrait considrer la srie comme un ARIMA creux. Mais en rendant
Aristide E.
HOUNDETOUNGAN

Page 4

LES MODELES SARIMA


le problme plus compliqu, soit par exemple P = 3, on ne pourra plus parler de ARIMA
creux au risque davoir des retards de lordre de 12. Ainsi il convient de noter simplement
que lorsque D est nul, les tests de saisonnalit peuvent savrer inefficace.
Ces deux exemples montrent que lapproche qui consiste dsaisonnaliser une srie
avant la modlisation ne garantit pas toujours de meilleurs rsultats. Cest dailleurs
la raison pour laquelle les modles SARIMA sont de nos jours disponibles sous certains
logiciels (R, SAS . . .). Cependant les exemples prcdents ont linconvnient dtre relatifs
des sries trs courtes. Lorsquon sintresse des sries chronologiques, et surtout pour
faire la prvision, il est recommander davoir une srie trs longue. Ainsi, pour un troisime
exemple, nous allons essayer de simuler une srie un peu plus longue.
Exemple 3 :
Pour cet exemple, le logiciel R est utilis.
Nous allons simuler un SARIM A(1, 0, 0)(2, 0, 1)4 . Soit :
(1 0.8B)(1 + 0.5B 4 + 0.4B 8 )Xt = (1 0.9B 4 )t
Autrement dit :
d = 0,
(B) = (1 0.8B) est de degr 1,
(B) = 1 est de degr 0,
2
D = 0,
(B) = (1 + 0.5B + 0.4B ) est de degr 2 et (B) = (1 0.9B) est de degr 1.
Ce modle peut scrire encore sous la forme :
(1 0.8B + 0.5B 4 0.4B 5 + 0.4B 8 0.32B 9 )Xt = (1 0.9B 4 )t
En effet, cest cette forme qui va nous permettre la simulation sous R. On utilise donc
la commande suivante.
arima.sim(n = 500, list(ar = c(0.8, 0, 0, 0.5, 0.4, 0, 0, 0.4, 0.32), ma = c(0, 0, 0, 0.9)))

n1
-

Tr
n1 i1
-T
A ri2
n1
-T
A ri3
n1
-T
A ri4
n2
-T
A ri 1
n2
-T
A ri2
n2
-T
A ri3
n2
-T
A ri4
n3
-T
A ri1
n3
-T
A ri2
n3
-T
A ri3
n3
-T
A ri4
n4
-T
A ri1
n4
-T
A ri2
n4
-T
A ri3
n4
-T
A ri4
n5
-T
A ri1
n5
-T
A ri2
n5
-T
A ri3
n5
-T
ri4

n = 500 signifie quon a simul une srie de taille 500. Les paramtres de la variable
ar et ma ne sont rien dautre que les paramtres du polynme autorgressif et ceux du
polynme moving average. Le graphique suivant prsente lvolution de la srie (juste
pour les cinq premires annes).

Aristide E.
HOUNDETOUNGAN

Page 5

LES MODELES SARIMA


Lallure de la srie ne prsente toujours pas de saisonnalit. La boite moustache
ci-dessous indique presque une galit des moyennes entre les trimestres. Ce rsultat est
confirm par le test de Fisher (pvalue = 0.97).

Avec un peu de manque de vigilance, on peut conclure que cette srie nest pas saisonnire, donc jamais elle ne peut tre modlise avec un SARIMA. Ce sera un dbut de
tous les problmes, car lidentification dun ARIMA simple va toujours chouer. Pour en
tre certain, analysons juste les fonctions dautocorrlations simples et partielles.

Rien quavec ces graphiques on pourrait affirmer que la srie suit un SARIMA cause
des pic rguliers significatifs. Il sera impossible didentifier un ARIMA simple de cette
srie et esprer avoir un bruit blanc comme rsidu.

2
2.1

La thorie des modles SARIMA


Rappel sur le test de Dickey Fuller

Dickey Fuller (1981) a construit un test pour vrifier la prsence de racine unitaire
dans la partie AR des modles ARIMA. Soit un processus stochastique qui vrifie
Aristide E.
HOUNDETOUNGAN

Page 6

LES MODELES SARIMA

(B)Xt = (B)t ,

avec t

BB(0, 2 )

(1)

Le test de Dickey Fuller (DF) est bas sur le modle gnral suivant :
(1 B)(Xt at b) = t

(2)

La srie considre est (Xt at b) afin dliminer la prsence dune tendance linaire
ventuelle. Le principe du test est de rechercher la valeur de . Si = 1, alors le polynme
(.) de lquation 1 est factorisable par (1 B). Dans le cas, contraire phi(.) nest pas
factorisable par (1 B) et le processus (Xt at b) serait stationnaire. Daprs 2, on a :
Xt at b Xt1 + a(t 1) + b = t
Xt = Xt1 + a(1 )t + b(1 ) + t
Xt = ( 1)Xt1 + a(1 )t + b(1 ) + t
Lhypothse nulle du test est = 1. Autrement dit le polynme (.) de la partie AR a au
moins une racine unitaire (d > 1). La srie nest pas donc stationnaire (Lorsquon parle
de la srie, il sagit de (Xt at b), afin dannuler ventuellement la prsence tendance
linaire). Si 6= 1, alors d = 0.
Attention !
Avec le modle 2, si on ne prend pas en compte les autocorrtations de Xt , il pourrait
avoir un biais dans le rsultat. Soit un ARIM A(1, 1, 0) tel que :
(1 B)(1 + 0.6B)Xt = t
(1 0.4B 0.6B 2 )Xt = t
Xt = 0.4Xt1 + 0.6Xt2 + t
Xt = (0.4 1)Xt1 + 0.6Xt2 + t
Le test aura donc tendance rejeter = 1. On risque de dire que la srie est stationnaire.
Do le test de Dickey Fuller Augment (DFA) est plus pertinent que celui de DF simple.
Le modle 2 prend en compte une tendance linaire et une drive. Cependant, cette
spcification doit tre teste. Au cas o elle sera rejete (si la tendance nest pas significative par exemple donc la srie nest pas TS), il faut passer un modle sans constante mais
avec constante seule qui fera aussi lobjet de vrification. Si cette dernire spcification
est aussi rejete, on fait recours un modle sans constante ni tendance. Cette mthode
est celle la plus utilise pour dterminer d. Si on rehette = 1, alors d > 1 (et non d = 1).
Il faut reprendre le test sur la diffrence premire pour sassurer quelle est stationnaire
(sinon on peut avoir d = 2, surtout en finance).

2.2

Dtermination de D

Thoriquement d, D N. Mais dans la pratique D = 0 ou D = 1. De plus d + D 6 2.


En effet, les modles SARIMA ncessitent plus de donnes. Si D > 2 et s = 12, on perdra
au moins les 24 premires observations de la srie. Si de plus, d = 1, on perdra au moins
48 observations. Ainsi, il ne faut pas appliquer un modle SARIMA sur une srie de taille
30, 40, non !
Aristide E.
HOUNDETOUNGAN

Page 7

LES MODELES SARIMA


Considrons le modle 1 : (B)Xt = (B)t ,
avec t
BB(0, 2 )
Si le polynme (.) nest pas factorisable par (1 B s ), alors D = 0. Dans le cas contraire
D = 1 (on suppose un cas pratique o D = 0 ou D = 1). Or le test de DFA permet de
tester si (.) est factorisable par (1 B). Ainsi, on peut construire un test bas sur celui
de DFA. Rappelons ici le modle sans constante ni tendance de DFA.
Xt = ( 1)Xt1 +

p
X

ar Xtr + t ,

avec t

BB(0, 2 )

(3)

r=1

Rappelons aussi que la valeur de p considrer correspond celle significative sur la


fonction dautocorrlation partielle de la diffrence premire. Lorsquon voudra faire le test
sur la diffrence premire, il faut dterminer p sur la fonction dautocorrlation partielle
de la diffrence seconde.
Pour tester si le polynme AR est factorisable par (1 B s ), on peut estimer :
0

s Xt = ( 1)Xts +

p
X

ar s Xtrs + t ,

avec t

BB(0, 2 )

(4)

r=1

s est la diffrence avec le retard dordre s : s Xt = Xt Xts .


Ce modle sinspire du modle 3. Il est bas sur le schma de factorisation de (.) par
(1 B), quon a essay dadapter (1 B s ).
Soit un SARIM A(0, 0, 0)(2, 1, 0)s tel que :
(1 B s )(1 1 B s 2 B 2s )Xt = t
= Xt = 1 Xts (1 2 )Xt2s 2 Xt3s + t
s Xt = Xt Xts = (1 1)Xts (1 2 )Xt2s 2 Xt3s + t
s Xt = (1 1)(Xts Xt2s ) + (2 1)(Xt2s Xt3s ) Xt3s + t
s Xt = (1 1)s Xts + (2 1)s Xt2s Xt3s + t
Ainsi, on peut constater sur la fonction dautocorralation partielle un pic dordre s et un
autre pic dordre 2s. Donc il faut prendre
P 0 en compte dans le modle 4, les autocorrlations
dordre s, 2s, 3s, . . . Do le thme pr=1 ar s Xtrs dans le modle 4.
Si = 1 nest pas rejet, alors le polynme (.) est factorisable par (1 B s ). Do D = 1.
Dans le cas contraire, D = 0.
Remarques
1 - Dans les modles de dtermination de d et D, on pose 1 = . Tester = 1 revient
tester = 0.
2 - Il ne faut pas utiliser la table de Student pour tester = 0. Il faut plutt comparer
la statistique de Student celle lue sur une table de Dickey Fuller. Lorsque la statistique
est infrieure la valeur lue, on rejette = 0. Ce test est un peu diffrent. Gnralement,
on rejette H0 lorsque la statistique calcule est suprieur celle thorique, mais dans ce
cas prcis, la statistique thorique est ngative, ce qui change la le sens de lingalit.
3- Il est prfrable de dterminer D avant de dterminer d. Supposons par exemple que
D = 1 et d = 0. Si en pratique on essaie de didentifier d premirement, on aboutira
la conclusion selon laquelle d 6= 0. En effet, un polynme factorisable par (1 B s ) est
aussi factorisable par (1 B). Dans ce cas, le reste de la division de (.) par (1 B) sera
difficile traiter. Le problme est quil fallait diviser par (1 B s ).
4- Le modle 4 suppose que la srie nest pas TS. Il faudra enlever dabord la tendance
lorsque la srie est tche dune tendance.
Aristide E.
HOUNDETOUNGAN

Page 8

LES MODELES SARIMA

2.3

Corrlogramme des processus SARIMA, dtermination de P


et de Q

Annexe 1 Simulation de 50 nombres alatoires


-0,71205352
-1,14975417
0,33602607
3,01731561
1,41445074
-1,30614846
-0,48543323
-0,15370551
0,94357193
-0,43090839

Aristide E.
HOUNDETOUNGAN

0,69658169
1,06211448
1,15937296
-1,53522099
-0,55518051
2,05715341
0,14758854
-1,50661166
0,17227184
0,16103259

1,6488265
-0,38222083
-0,25956979
-0,28648892
1,0782304
0,48651561
1,52813926
-0,69413836
0,16355957
0,25596819

N (0, 1)
-0,10604278
1,96504775
-1,14510414
0,2015445
0,75772279
-0,88440313
-0,75830872
-1,40912993
0,30978152
1,04732852

-0,13882289
-2,05711755
-0,07440587
-0,93593927
-1,29334061
0,2733151
-0,3793212
0,160586
0,12435981
0,12076081

Page 9