Vous êtes sur la page 1sur 19

Sries temporelles Modles ARIMA.

Didier Delignires
Sminaire EA "Sport Performance Sant"
Mars 2000

Il existe deux catgories de modles pour rendre compte d'une srie temporelle. Les premiers
considrent que les donnes sont une fonction du temps (y = f(t)). Cette catgorie de modle
peut tre ajuste par la mthode des moindres carrs, ou d'autres mthodes itratives.
L'analyse des modles par transforme de Fourier est une version sophistique de ce type de
modle.

Une seconde catgorie de modles cherche dterminer chaque valeur de la srie en fonction
des valeurs qui la prcde (yt = f(yt-1, yt-2, )). C'est le cas des modles ARIMA ("Auto-
Regressive Integrated Moving Average"). Cette catgorie de modles a t popularise et
formalise par Box et Jenkins (1976).

A noter que le choix de l'un ou l'autre type de modle est surtout thorique: est-il raisonnable
de penser que dans un phnomne donn, les points sont fondamentalement fonction des
points prcdents et de leurs erreurs, plutt qu'un signal, priodique ou non, entach de bruit.
On peu noter cependant que souvent, on a recours l'analyse de variance pour traiter les
sries temporelles. Or une des assomptions majeures de l'ANOVA est que les rsidus des
diffrentes mesures ne sont pas auto-corrls. Ce n'est videmment pas le cas si la
performance l'essai t est lie la performance ralise l'essai t-1.

Les processus autorgressifs supposent que chaque point peut tre prdit par la somme
pondre d'un ensemble de points prcdents, plus un terme alatoire d'erreur.

Le processus d'intgration suppose que chaque point prsente une diffrence constante avec le
point prcdent.

Les processus de moyenne mobile supposent que chaque point est fonction des erreurs
entachant les points prcdant, plus sa propre erreur.

Un modle ARIMA est tiquet comme modle ARIMA (p,d,q), dans lequel:
p est le nombre de termes auto-rgressifs
d est le nombre de diffrences
q est le nombre de moyennes mobiles.

1. Diffrenciation.

L'estimation des modles ARIMA suppose que l'on travaille sur une srie stationnaire. Ceci
signifie que la moyenne de la srie est constante dans le temps, ainsi que la variance. La
meilleure mthode pour liminer toute tendance est de diffrencier, c'est--dire de remplacer
la srie originale par la srie des diffrences adjacentes. Une srie temporelle qui a besoin
d'tre diffrencie pour atteindre la stationnarit est considre comme une version intgre
d'une srie stationnaire (d'o le terme Integrated).

1
La correction d'une non-stationnarit en termes de variance peut tre ralise par des
transformation de type logarithmique (si la variance crot avec le temps) ou l'inverse
exponentielle. Ces transformations doivent tre ralises avant la diffrenciation.

Une diffrenciation d'ordre 1 suppose que la diffrence entre deux valeurs successives de y est
constante.

yt yt-1 = + t

est la constante du modle, et reprsente la diffrence moyenne en y. Un tel modle est un


ARIMA(0,1,0). Il peut tre reprsent comme un accroissement linaire en fonction du temps.
Si est gal 0, la srie est stationnaire.

Les modles d'ordre 2 travaillent non plus sur les diffrences brutes, mais sur les diffrences
de diffrence. La seconde diffrence de y au moment t est gale (yt -yt-1 ) - (yt-1 - yt-2), c'est--
dire yt 2yt-1 + yt-2.

Un modle ARIMA(0,2,0) obira lquation de prdiction suivante :

yt 2yt-1 + yt-2 = + t

ou encore:

yt = + 2yt-1 - yt-2 + t

2. Auto-rgression

Les modles auto-rgressifs supposent que yt est une fonction linaire des valeurs
prcdentes.

y t = + 1y(t-1) + 2y(t-2) + 3y(t-3).+ t

Littrairement, chaque observation est constitue d'une composante alatoire (choc alatoire,
) et d'une combinaison linaire des observations prcdentes. 1, 2 et 3 dans cette quation
sont les coefficients d'auto-rgression

A noter que cette quation porte soit sur les donnes brutes, soit sur les donnes diffrencies
si une diffrenciation a t ncessaire. Pour un modle ARIMA(1,1,0) on aura :

yt yt-1 = + (yt-1 yt-2) + t

Ce qui peut galement tre crit:

yt = + yt-1 + (yt-1 yt-2) + t

Notez qu'un processus auto-rgressif ne sera stable que si les paramtres sont compris dans un
certain intervalle ; par exemple, s'il n'y a qu'un paramtre auto-rgressif, il doit se trouver dans
l'intervalle -1<1<+1. Dans les autres cas, les effets passs s'accumuleraient et les valeurs

2
successives des xt se dplaceraient infiniment vers l'avant, ce qui signifie que la srie ne serait
pas stationnaire. S'il y a plus d'un paramtre auto-rgressif, des restrictions similaires
(gnrales) sur les valeurs des paramtres peuvent tre poses (par exemple, voir Box et
Jenkins, 1976 ; Montgomery, 1990).

3. Moyenne mobile

Les modles moyenne mobile suggrent que la srie prsente des fluctuations autour d'une
valeur moyenne. On considre alors que la meilleure estimation est reprsente par la
moyenne pondre d'un certain nombre de valeurs antrieures (ce qui est le principe des
procdures de moyennes mobiles utilises pour le lissage des donnes). Ceci revient en fait
considrer que lestimation est gal la moyenne vraie, auquel on ajoute une somme
pondre des erreurs ayant entach les valeurs prcdentes :

y t = -1(t-1) -2(t-2) -3(t-3). + t.

Littrairement, chaque observation est compose d'une composante d'erreur alatoire (choc
alatoire, ) et d'une combinaison linaire des erreurs alatoires passes. 1, 2 et 3 sont les
coefficients de moyenne mobile du modle.

Comme prcdemment cette quation porte soit sur les donnes brutes, soit sur les donnes
diffrencies si une diffrenciation a t ncessaire. Pour un modle ARIMA(0,1,1) on aura :

yt yt-1 = - t-1 + t

Ce qui peut galement tre crit:

yt = + yt-1 - t-1 + t

Un modle de moyenne mobile correspond des sries exhibant des fluctuations


alatoires autour d'une moyenne variant lentement. Plutt que de prendre comme
prcdemment la valeur prcdente comme prdicteur, on utilise une moyenne de quelques
observations prcdentes, de manire liminer le bruit, et estimer plus prcisment la
moyenne locale.

Cette logique corresponds au lissage exponentiel simple, qui considre chaque


observation comme la rsultante d'une constante (b) et d'un terme d'erreur , soit :

yt = b + t

. La constante b est relativement stable sur chaque segment de la srie, mais peut se
modifier lentement au cours du temps. Si ce modle est appropri, l'une des manires d'isoler
la relle valeur de b, et donc la partie systmatique ou prvisible de la srie, consiste
calculer une sorte de moyenne mobile, ou les observations courantes et immdiatement
prcdentes ("les plus rcentes") ont une pondration plus forte que les observations plus
anciennes. C'est exactement ce que fait un lissage exponentiel simple, o les pondrations les

3
plus faibles sont affectes exponentiellement aux observations les plus anciennes. La formule
spcifique de lissage exponentiel simple est :

yt = t (1-) yt-1

Lorsqu'on l'applique de faon rcurrente chaque observation successive de la srie,


chaque nouvelle valeur prdite est calcule comme la moyenne pondre de l'observation
courante et de l'observation prcdente prdite ; la prcdente observation prdite tait elle-
mme calcule partir de la valeur (prcdente) observe et de la valeur prdite avant cette
valeur (prcdente), et ainsi de suite. Par consquent, chaque valeur prdite est une moyenne
pondre des observations prcdentes, o les poids dcroissent exponentiellement selon la
valeur des paramtres . Si est gal 1 les observations prcdentes sont compltement
ignores ; si est gal 0, l'observation courante est totalement ignore, et la valeur prdite
ne porte que sur les valeurs prdites prcdentes (qui est calcule partir de l'observation
lisse qui lui prcde, et ainsi de suite ; c'est pourquoi toutes les valeurs prdites auront la
mme valeur que la valeur initiale 0). Les valeurs intermdiaires de produiront des rsultats
intermdiaires (noter que la valeur 1- correspond au des quations prcdentes).

On peut galement envisager des modles mixtes: par exemple un modle ARIMA(1,1,1)
aura l'quation de prdiction suivante:

yt = + yt-1 + (yt-1 yt-2) - 1t-1 + t

Nanmoins on prfre gnralement utiliser de manire exclusive les termes AR ou MA.

4. Signification des paramtres des modles ARIMA

L'objectif essentiel des modles ARIMA est de permettre une prdiction de l'volution future
d'un phnomne. Son dveloppement dans le domaine de l'conomtrie est bas sur ce
principe. On en verra plus loin une illustration.

Un autre intrt, peut-tre plus essentiel en ce qui concerne la recherche scientifique, est de
comprendre la signification thorique de ces diffrents processus. Il est clair cependant que
cette interprtation dpend de la nature du phnomne tudi, et des modles dont le
chercheur dispose pour en rendre compte.

- Un processus non diffrenci bruit blanc (ARIMA(0,0,0) suggre des fluctuations


alatoires autour d'une valeur de rfrence. Cette valeur de rfrence peut tre considre
comme une caractristique stable du systme tudi (trait de personnalit, mmoire, capacit
stabilise, etc..)

- Un processus de moyenne mobile suggre que la valeur de rfrence volue d'une mesure
l'autre. Plus prcisment, la valeur de rfrence est fonction de la valeur de rfrence
prcdente et de l'erreur ayant entach la mesure prcdente.

- Un processus auto-rgressif suggre que le phnomne tudi n'est pas dtermin par une
valeur de rfrence. C'est la performance prcdente (ou les performances prcdentes) qui
dterminent entirement la performance prsente.

4
Par exemple, Spray et Newell (1986) analysent des donnes tires d'une exprimentation
portant sur le rle de la connaissance des rsultats dans l'apprentissage. Les sujets ralisent 77
essais dans une tche manuelle. Le protocole comprenait plusieurs groupes, diffrencis par
des combinaisons spcifiques d'essais avec ou sans connaissance des rsultats. Notamment,
certains sujets disposaient de connaissance des rsultats tout au long des 77 essais, pour
d'autre la CR tait supprime au-del de 17, 32 ou 52 essais. Un groupe n'avait pas de CR du
tout.

Les rsultats de la modlisation montrent que les sries avec CR (ou les portions de sries
avec CR) peuvent tre reprsente par des processus bruit blanc du type:

yt = + t

C'est--dire un modle ARIMA (0,0,0). Cette quation suggre donc que les performances
successives oscillent de manire alatoire autour d'une valeur moyenne, sorte de rfrence
interne construite par la connaissance des rsultats.

Les sries sans CR (ou les portions de srie sans CR) sont quant elles modlises selon un
ARIMA(0,1,1) selon la formule:

y t = -1(t-1) + t
ou

y t = rt + t

rt reprsentant la valeur de rfrence, qui cette fois change chaque essai. On peut driver du
modle que

5
rt = rt-1 -1(t-1)

C'est--dire que la rfrence est une combinaison de la rfrence prcdente et de l'erreur


ayant entach l'essai prcdent. Ce modle indique clairement que l'essai en cours est
influenc par l'essai prcdent, ce qui n'tait pas le cas dans les essais avec CR.

Ce modle peut galement tre crit sous la forme d'une interpolation pondre entre la
performance au temps t et la rfrence au temps t-1:

rt = -1yt + (1+1)rt-1

L'analyse des donnes de Diggles (1977) suggre que la rfrence prcdente est plus
importante que la performance actuelle.

On peut noter que pour les sujets ayant bnfici de la CR durant 52 essais sur 77, la srie
demeure stationnaire et bruit blanc jusqu' la fin de l'exprimentation.

5. Dtermination de l'ordre de diffrenciation.

Une srie stationnaire fluctue autour d'une valeur moyenne et sa fonction d'autocorrlation
dcline rapidement vers zro.

Si une srie prsente des auto-corrlations positives pour un grand nombre de dcalages (par
exemple 10 ou plus), alors elle ncessite d'tre diffrencie.

La diffrenciation tend introduire des auto-corrlations ngatives.

Si l'auto-corrlation de dcalage 1 est gale 0 ou ngative, la srie n'a pas besoin d'tre
diffrencie. Si l'auto-corrlation de dcalage 1 est infrieure 0.5, la srie est sur-
diffrencie.

L'ordre optimal de diffrenciation est souvent celui pour lequel l'cart-type est minimal. Un
accroissement de l'cart-type doit donc tre considr comme un symptme de sur-
diffrenciation.

Un troisime symptme de sur-diffrenciation est un changement systmatique de signe d'une


observation l'autre.

Par exemple, la figure suivante reprsente une srie temporelle originale (il s'agit de
l'volution temporelle d'units de vente.

6
Le graphique de la fonction d'auto-corrlation prsente une rgression lente et linaire,
typique des sries non stationnaires:

Enfin l'cart-type de la srie est important: 17.56. Cette srie ncessite de toute vidence d'tre
diffrencie. Une premire difrenciation (c'est--dire l'application d'un ajustement ARIMA
(0,1,0) avec constante donne les rsidus suivants:

7
La srie semble a peu prs stationnaire, sans tendance marque long terme: la srie semble
toujours revenir sa valeur moyenne, bien que cette tendance reste pour le moins
"paresseuse". La fonction d'auto-corrlation confirme la persistance d'auto-corrlation
positive:

L'cart-type a cependant t rduit de manire importante, de 17.56 1.54. Si l'on essaie une
seconde diffrenciation (c'est--dire l'application d'un modle ARIMA(0,2,0) avec constante,
on obtient les rsultats suivants:

Cette srie montre de clairs signes de sur-diffrenciation. Les valeurs passe de manire quasi-
systmatique du signe positif au signe ngatif. La fonction d'auto-corrlation montre un pic
ngatif au premier dcalage; proche de .5.

8
Enfin, l'cart-type a augment de 1.54 1.81. Ceci semble indiquer que l'ordre optimal de
diffrenciation, pour cette srie, est de 1. Le modle devra cependant tre optimis (pour faire
disparatre tout trace d'auto-corrlation dans les rsidus), par l'ajout de termes AR ou MA.

La diffrenciation dont on a parl est dite non-saisonnire, dans le sens o elle porte sur des
donnes adjacentes. On verra plus loin qu'une diffrenciation saisonnire peut tre ncessaire
pour rendre compte de variations systmatiques, circadiennes, hebdomadaires, mensuelles ou
annuelles.

Un modle sans diffrenciation suppose que la srie originale est stationnaire. Un modle
avec une diffrenciation d'ordre 1 suppose que la srie originale prsente une tendance
constante. Un modle avec une diffrenciation d'ordre 2 suppose que la srie originale
prsente une tendance variant dans le temps.

Les modles ARIMA peuvent inclure une constante ou non (sans constante signifie que la
constante est gale 0). L'interprtation d'une constante (significativit statistique) dpend du
modle.

- Un modle sans diffrenciation possde gnralement une constante (qui reprsente


dans ce cas la moyenne de la srie).

- Si la srie est diffrencie, la constante reprsente la moyenne ou l'ordonne


l'origine de la srie diffrencie ; par exemple, si la srie est diffrencie une fois, et qu'il n'y a
pas de paramtre auto-rgressif dans le modle, la constante reprsentera la moyenne de la
srie diffrencie, et donc la pente du trend linaire de la srie non diffrencie..

- Dans le cas des modles avec un ordre de diffrenciation de 2, la constante


reprsente la tendance moyenne de la tendance. Dans la mesure o en gnral on ne suppose
pas l'existence de telles tendances, la constante est gnralement omise.

- S'il n'y a pas de paramtre auto-rgressif dans le modle, l'esprance mathmatique


de la constante est m, la moyenne de la srie ;

- S'il y a des paramtres auto-rgressifs dans la srie, la constante reprsente


l'ordonne l'origine.

9
A noter que la moyenne, dans les modles ARIMA, renvoie la moyenne des sries
diffrencies, alors que la constante est un facteur qui apparat dans la partie droite des
quations de prdiction. Moyenne et constante sont lies par l'quation suivante:

= moyenne x (1 - AR(p))

La constante est gale la moyenne, multiplie par 1 moins la somme des coefficients des
termes auto-rgressifs.

6. Identification des termes AR.

Aprs que la srie ait t stationnarise, l'tape suivante consiste identifier les termes AR et
MA ncessaires pour corriger les auto- corrlations rsiduelles. Cette analyse est base sur
l'examen des fonctions d'auto-corrlation et d'auto-corrlation partielle. Rappelons que l'auto-
corrlation est la corrlation d'une srie avec elle-mme, selon un dcalage (lag) dfini.
L'auto-corrlation de dcalage 0 est par dfinition gale 1. La fonction d'auto-corrlation fait
correspondre chaque dcalage l'auto-corrlation correspondante.

D'une manire gnrale, un corrlation partielle entre deux variables est la quantit de
corrlations qui n'est pas explique par les relations de ces variables avec un ensemble
spcifi d'autres variables. Supposons par exemple que l'on ralise la rgression de Y sur trois
variables X1, X2 et X3. La corrlation partielle entre Y et X3 contrlant X1 et X2 est la
quantit de corrlation entre Y et X3 qui n'est pas expliqu par leurs relations communes avec
X1et X2. Elle peut tre calcule comme la racine carre du gain de variance explique obtenu
en ajoutant X3 la rgression de Y sur X1 et X2.

Dans le cas des sries temporelles, la corrlation partielle de dcalage k est la corrlation entre
yt et yt-k, contrlant l'influence des k-1 valeurs interposes.

L'autocorrlation de dcalage 1 est la corrlation entre yt et yt-1 . On suppose que c'est


galement la corrlation entre yt-1 et yt-2 Si yt et yt-1 sont corrls, et que yt-1 et yt-2 le sont
galement, on peut supposer qu'une corrlation sera prsente entre y et yt-2. C'est--dire que la
corrlation de dcalage 1 se propage au dcalage 2 et sans doute aux dcalages d'ordre
suprieurs. Plus prcisment, la corrlation attendue au dcalage 2 est la carr de la
corrlation observe au dcalage 1. L'auto-corrlation partielle de dcalage 2 est donc la
diffrence entre l'auto-corrlation de dcalage 2 et la corrlation attendue due la propagation
de la corrlation de dcalage 1.

Si l'on revient la fonction d'auto-corrlation de l'exemple prcdent (avant diffrenciation),


on peut supposer que la prsence d'auto-corrlations fortes pour un grand nombre de
dcalages successifs est li ce phnomne de propagation. Ceci est confirm par l'examen de
la fonction d'auto-corrlation partielle, qui n'a qu'un valeur significative au dcalage 1 (notons
que l'auto-corrlation partielle de dcalage 1 est gale l'auto-corrlation correspondante,
aucune valeur n'tant intercale).

10
Ceci indique clairement que les auto-corrlations de dcalage suprieur 1 ne sont dues qu'
la propagation de l'auto-corrlation de dcalage 1.

Une extinction brutale de l'auto-corrlation partielle associe un dclin plus progressif de


l'auto-corrlation constitue la signature caractristique d'un processus auto-rgressif. Plus
particulirement, l'auto-corrlation partielle de dcalage k est gale au coefficient AR(k)
estim dans un modle contenant k termes AR. On pourrait d'ailleurs dterminer les
coefficients AR par rgression multiple, en prdisant (yt-yt-1) partir de k chantillons
reprsentant les k dcalages.

Le dcalage auquel l'auto-corrlation partielle disparat indique le nombre de termes auto-


rgressifs inclure.

Gnralement, ce pattern est associ une auto-corrlation de dcalage 1 positive, signe que
la srie demeure sous-diffrencie. Une lgre sous-diffrenciation peut donc tre compense
par l'ajout d'un terme auto-rgressif.

Si l'on reprend la srie temporelle qui a prcdemment servi d'exemple, on trouvait donc avec
un ordre de diffrence (ajustement par ARIMA(0,1,0) les fonctions d'auto-corrlation et
d'auto-corrlation partielle suivantes:

11
On peut noter que l'auto-corrlation de dcalage 1 est significative et positive, et que l'auto-
corrlation partielle prsente une extinction plus brutale que l'auto-corrlation. . L'auto-
corrlation partielle ne prsente en fait que deux pics significatifs, alors que l'auto-corrlation
en prsente quatre. La srie diffrencie prsente donc une signature de processus auto-
rgressif d'ordre 2.

L'ajustement de la srie avec un modle ARIMA(2,1,0) donne les fonctions ACF et PACF
suivantes:

12
Les auto-corrlations aux dcalages 1 et 2 ont t supprimes, et aucune auto-corrlation
n'apparat aux dcalages suprieurs. L'analyse montre que les coefficients AR sont
significativement diffrentes de 0, et l'cart-type des rsidus a t rduit de 10% (de 1.54
1.42 par l'ajout des termes AR L'quation de prdiction a la forme suivante:

yt = + yt-1 + 1(yt-1 yt-2) + 2(yt-2 yt-3)

Dans ce cas, = 0.258178


1 = 0.2524
2 = 0.195572

Cette quation permet la prdiction des donnes ultrieures la priode dite de validation du
modle. Le graphique suivant rend compte de cette prdiction:

7. Identification des termes MA.

La fonction d'auto-corrlation joue pour les processus de moyenne mobile le mme rle que la
fonction d'auto-corrlation partielle pour les processus auto-rgressifs. Si l'auto-corrlation est
significative au dcalage k mais plus au dcalage k+1, ceci indique que k termes de moyenne
mobile doivent tre ajouts au modle.

A noter que si les coefficients AR peuvent tre estims par une analyse en rgression
multiple, une telle dmarche est impossible pour les coefficients MA. D'une part, parce que
l'quation de prdiction est non-linaire, et d'autre part les erreurs ne peuvent tre spcifies
en tant que variable indpendantes. Les erreurs doivent tre calcules pas pas en fonction
des estimations courantes des paramtres.

Une signature MA est gnralement associe une auto-corrlation ngative au dcalage 1,


signe que la srie est sur-diffrencie. Une lgre sur-diffrenciation peut donc tre
compense par l'ajout d'un terme de moyenne mobile.

On a vu qu'avec un ordre de diffrenciation de 1, la srie qui nous a servi d'exemple demeurait


sous-diffrencie. Si l'on travaille sur des diffrences d'ordre 2 (par ajustement d'un modle
ARIMA(0,2,0) on obtient les fonction ACF et PACF suivantes:

13
Ces fonctions sont typiques de la signature des processus de moyenne mobile. Le pic unique
et ngatif pour la fonction d'auto-corrlation indique un processus MA(1). Le modle
pertinent serait donc un ARIMA(0,2,1). L'quation de prdiction serait la suivante:

yt = 2yt-1 - yt-2 - 1et-1

Ces deux modles peuvent ajuster de manire alternative la srie de dpart. Sachant que les
termes AR peuvent compenser une lgre sous diffrenciation, et les termes MA une lgre
sous-diffrenciation, il est courant que deux modles alternatifs soient possibles: un premier
avec 0 ou 1 ordre de diffrenciation combin avec des termes AR, et un autre avec le niveau
de diffrenciation suprieur, combin des termes MA. Le choix d'un ou l'autre modle peut
reposer sur des prsuppos thoriques lis au phnomne observ.

Les outils principaux utiliss lors de la phase d'identification sont donc les tracs de la srie,
les corrlogrammes d'autocorrlation (FAC), et d'autocorrlation partielle (FACP). La
dcision n'est pas simple et les cas les plus atypiques requirent, outre l'exprience, de
nombreuses exprimentations avec des modles diffrents (avec divers paramtres ARIMA).
Toutefois, les composantes des sries chronologiques empiriques peuvent souvent tre assez
bien approches en utilisant l'un des 5 modles de base suivants, identifiables par la forme de
l'autocorrlogramme (FAC) et de l'autocorrlogramme partiel (FACP). Puisque le nombre de
paramtres ( estimer) de chaque type dpasse rarement 2, il est souvent judicieux d'essayer
des modles alternatifs sur les mmes donnes.

14
(1) Un paramtre autorgressif (p) : FAC - dcomposition exponentielle ; FACP - pic la
priode 1, pas de corrlation pour les autres priodes.

(2) Deux paramtres autorgressifs (p) : FAC - une composante de forme sinusodale ou un
ensemble de dcompositions exponentielles ; FACP - pics aux priodes 1 et 2, aucune
corrlation pour les autres priodes.

(3) Un paramtre de moyenne mobile (q) : FAC - pic la priode 1, aucune corrlation
pour les autres priodes ; FACP - exponentielle amortie.

(4) Deux paramtres de moyenne mobile (q) : FAC - pics aux priodes 1 et 2, aucune
corrlation pour les autres priodes ; FACP - une composante de forme sinusodale ou un
ensemble de dcompositions exponentielles.

(5) Un paramtre autorgressif (p) et un de moyenne mobile (q) : FAC - dcomposition


exponentielle commenant la priode 1 ; FACP - dcomposition exponentielle commenant
la priode 1.

8. Racines unitaires

Si une srie est largement sur- ou sous-diffrencie (c'est--dire qu'un ordre complet de
diffrenciation doit tre t ou ajout), on obtient gnralement une racine unitaire (unit root)
au niveau des coefficients AR ou MA.

Dans le cas d'un modle ARIMA(1,k,0), AR(1) est gal 1. Dans le cas plus gnral d'un
modle ARIMA(p,k,0), la somme des coefficients AR est gale 1 (c'est--dire non
significativement diffrente de 1). On peut considrer qu'alors les termes AR simulent une
diffrence (on a vu dans l'exemple prcdent que le premier terme auto-rgressif pouvait tre
substitu la premire diffrence). Le nombre de termes AR doit tre rduit d'une unit et on
doit accrotre d'une unit l'ordre de diffrenciation.

Le mme raisonnement peut tre tenu pour les coefficients MA. Dans le cas d'un modle
ARIMA(0,k,1), MA(1) est gal 1, et d'une manire gnrale la somme des coefficients MA
est gale 1. Les termes MA dans ce cas tendent annuler exactement une diffrence. Le
nombre de termes MA doit tre rduit d'une unit et on doit rduire d'une unit l'ordre de
diffrenciation.

9. Evaluation des modles

L'objectif de la modlisation est de dterminer combien de paramtres auto-rgressifs (p) et


de moyennes mobiles (q) sont ncessaires pour obtenir un modle effectif et parcimonieux du
processus (parcimonieux signifie qu'il s'agit, parmi tous les modles possibles, du modle
possdant le moins de paramtres et le plus grand nombre de degrs de libert pour ajuster les
donnes). En pratique, le nombre de paramtres p ou q dpasse trs rarement 2.

Estimation des Paramtres: l'analyse produit les valeurs approches de t, calcules partir des
erreurs-types des paramtres. Si cette valeur de t n'est pas significative, le paramtre respectif

15
peut tre limin du modle, sans affecter dans la plupart des cas l'ajustement global du
modle.

Un autre indicateur simple et courant pour mesurer la fiabilit du modle est de comparer la
prcision des estimations bases sur des donnes partielles, afin que les prvisions puissent
tre compares avec les dernires observations connues de la srie (initiale).

Toutefois, un bon modle ne doit pas seulement produire des prvisions suffisamment
prcises, il doit galement tre parcimonieux et produire des rsidus statistiquement
indpendants, ne contenant que du bruit, sans aucune composante rgulire (par exemple, le
corrlogramme des rsidus ne doit pas rvler d'autocorrlations). Un bon test du modle
consiste (a) tracer les rsidus et les examiner pour voir s'il existe des tendances
systmatiques, et (b) tudier l'autocorrlogramme des rsidus (il ne doit pas y avoir
d'autocorrlations entre les rsidus).

Ce que l'on cherche savoir ici, c'est si les rsidus ne sont pas distribus de faon
systmatique dans la srie (par exemple, systmatiquement ngatifs dans une premire partie
de la srie puis proches de zro dans une seconde) ou s'ils ne sont pas autocorrls ce qui
tendrait montrer que le modle ARIMA est inadquat. L'analyse des rsidus de l'ARIMA
constitue un test important du modle. La procdure d'estimation postule que les rsidus ne
sont pas (auto-) corrls et qu'ils sont distribus normalement.

La mthode ARIMA n'est approprie que lorsque la srie chronologique est stationnaire
(c'est--dire que les moyennes, variances, et autocorrlations doivent tre sensiblement
constantes au cours du temps). Il est galement recommand d'avoir au moins 50 observations
dans le fichier de donnes. Les paramtres estims sont considrs constants dans toute la
srie.

10. Modles saisonniers

L'ARIMA saisonnire multiplicative est une gnralisation et une extension de la mthode


prsente aux paragraphes prcdents, pour des sries o le mme phnomne se rpte au
cours du temps, chaque saison. Outre les paramtres non saisonniers, des paramtres
saisonniers pour un dcalage spcifi (repr lors de la phase d'identification) doivent tre
estims. Comme pour les paramtres de l'ARIMA simple, ce sont : les paramtres auto-
rgressifs saisonniers (ps), de diffrenciation saisonnire (ds), et de moyenne mobile
saisonnire (qs). Par exemple, le modle (0,1,2)(0,1,1) dcrit un modle sans paramtre auto-
rgressif, avec 2 paramtres de moyenne mobile normaux et 1 paramtre de moyenne mobile
saisonnier. Le calcul de ces paramtres intervient aprs diffrenciation une fois de 1 priode,
et une fois saisonnirement. Le dcalage saisonnier utilis pour les paramtres saisonniers est
souvent dtermin lors de la phase d'identification et doit tre explicitement spcifi.

Les recommandations gnrales concernant la slection des paramtres estimer (bass sur
les FAC et FACP) s'appliquent galement aux modles saisonniers (pour une illustration d'une
ARIMA saisonnire, voir l'Exemple dans la section ARIMA du chapitre). La principale
diffrence est que dans les sries saisonnires, les FAC et FACP auront des coefficients assez
importants pour de nombreuses priodes saisonnires (en plus de leur composante globale
refltant la composante non saisonnire de la srie).

16
Trac de la var: VAR1
700 700

600 600

500 500

400 400
VAR1

300 300

200 200

100 100

0 0
-10 0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150
Numros Obs.

11. ARIMA pour Sries Chronologiques Interrompues

Une question qui se pose frquemment dans les analyses de sries chronologiques est de
savoir si un vnement extrieur (exogne) a perturb les observations ultrieures. Par
exemple, la mise en uvre d'une nouvelle politique conomique a-t-elle permis d'amliorer
les performances conomiques ; une nouvelle loi anti-crime a-t-elle permis d'inflchir les taux
d'agression suivants ; et ainsi de suite. En gnral, nous souhaiterions pouvoir valuer l'impact
d'un ou plusieurs vnements discrets sur les valeurs de la srie chronologique. Ce type
d'analyse de srie chronologique interrompue est dcrit en dtail par McDowall, McCleary,
Meidinger, et Hay (1980). McDowall distingue entre trois grands types d'impact possibles :
(1) soudain et permanent, (2) permanent et graduel, et (3) soudain et temporaire.

Impact Soudain et Permanent


Efficacit relative
1.1 1.1

1.0 1.0

0.9 0.9

0.8 0.8
EFFICACE

0.7 0.7

0.6 0.6

0.5 0.5

0.4 0.4
0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32
Numros Obs.

Un impact soudain et permanent implique simplement que la moyenne globale de la srie


chronologique se trouve modifie aprs l'intervention ; le dplacement global est not .

17
Impact Graduel et Permanent

La structure d'impact graduel et permanent implique que l'augmentation ou la diminution due


l'intervention soit progressive, et que l'impact permanent final ne devienne vident qu'aprs
un certain temps :

Impactt = *Impactt-1 +

(pour tout t priode d'impact, sinon = 0).

Cette structure d'impact est dfinie par deux paramtres (delta) et (omga). Si est proche
de 0 (zro), l'impact permanent final deviendra vident aprs quelques observations
supplmentaires ; si est proche de 1, l'impact permanent final de l'impact deviendra vident
aprs de nombreuses observations supplmentaires. Tant que le paramtre demeure
suprieur 0 et infrieur 1 (les limites de stabilit du systme), l'impact sera graduel et
produira une modification (dplacement) asymptotique de la moyenne globale par la
quantit :

/(1-)

Les programmes danalyse calculent automatiquement la modification asymptotique des


impacts graduels et permanents. Notez que lors de l'valuation d'un modle, il est important
que les deux paramtres soient statistiquement significatifs ; sinon, on pourrait aboutir des
conclusions paradoxales. Par exemple, supposons que le paramtre ne soit pas
significativement diffrent de 0 (zro) mais que le paramtre le soit ; cela voudrait dire
qu'une intervention aurait caus une modification graduelle significative, sans que le rsultat
ne soit significativement diffrent de zro.

Impact Soudain et Temporaire

Un impact soudain et temporaire implique que l'augmentation ou la diminution initiale


soudaine due l'intervention s'estompe lentement, sans modification permanente de la
moyenne de la srie. Ce type d'intervention peut tre synthtis par les expressions :

Avant l'intervention : Impactt = 0


Pendant l'intervention : Impactt =
Aprs l'intervention : Impactt = *Impactt-1

Notez que cette structure d'impact est nouveau dfinie par les deux paramtres (delta) et
(omga). Tant que le paramtre demeurera suprieur 0 et infrieur 1 (les limites de
stabilit du systme), l'impact initial soudain se dcomposera graduellement. Si est proche
de 0 (zro) la dcomposition sera trs rapide, et l'impact aura compltement disparu aprs
quelques observations seulement. Si est proche de 1 la dcomposition sera lente, et
l'intervention continuera affecter la srie sur de nombreuses observations. Notez que lors de
l'valuation d'un modle, il est encore une fois important que les deux paramtres soient
statistiquement significatifs ; sinon on pourrait aboutir des conclusions paradoxales. Par
exemple, supposons que le paramtre ne soit pas significativement diffrent de 0 (zro)

18
mais que le paramtre le soit ; cela voudrait dire qu'une intervention n'aurait pas caus de
modification initiale soudaine, tout en montrant une dcomposition significative.

Rfrences essentielles :

Box, G.E.P. & Jenkins, G.M. (1976). Time series analysis : Forecasting and control. Oakland,
CA : Holden-Day.
Spray, J.A. & Newell, K.M. (1986). Time series analysis of motor learning : KR versus no-
KR. Human Movement Science, 5, 59-74.

Sites Internet :

http://www.autobox.com/t1a13a.html
http://www.duke.edu/~rnau/arimest.htm

Logiciels :
Systat (menu Time series)
Statistica (menu Sries chronologiques)
Minitab (menu Time series)

19