Vous êtes sur la page 1sur 21

Méthodes de prévision (STT-3220)

Section 5
Modélisation de séries chronologiques
avec la méthodologie de Box-Jenkins

Version: 11 décembre 2008


Identification des modèles ARIMA
 On désire ajuster un modèle ARMA(p,q):
  B  Z t   0    B  at , t.
 Un autre type de modèles est le modèle
ARIMA(p,d,q):

  B 1  B  Z t   0    B  at , t.
d

 Un modèle ARIMA est simplement un modèle


dont la dième différence est ARMA.

2 STT-3220; Méthodes de prévision


Méthode de Box et Jenkins
 Box et Jenkins ont popularisé l’utilisation des
modèles ARMA, en insistant sur les étapes
nécessaires à la modélisation d’une série
chronologique quelconque:
 Les trois étapes sont:
– Identification des modèles (choix des ordres p, d et q).
– Estimation des paramètres; moindres carrés
conditionnels, inconditionnels, maximum de
vraisemblance.
– Validation du modèle (statistiques portmanteau;
prévisions).
3 STT-3220; Méthodes de prévision
Étape 1: Identification
 1. Est-ce que la variance semble constante?
– On veut s’assurer que le terme de variance dans le
modèle est constant, par exemple comme fonction du
temps.
– Transformations populaires:
 Transformation racine, transformation inverse, transformation
logarithmique.
 Préférablement (mais de manière optionnelle dans le cours),
méthodologie de Box-Cox pour trouver la transformation.
– On veut stabiliser la variance, et en plus, se
rapprocher de la normalité des erreurs.
4 STT-3220; Méthodes de prévision
Transformation de Box-Cox
 La transformation a la forme:
 y 1
  ,   0,
y  
 log y  ,   0.
 Le choix de se fait souvent en effectuant un
graphique de la vraisemblance en fonction de


5 STT-3220; Méthodes de prévision


Identification (suite)

 2. Choix du niveau de différentiation. Ici on


veut une série stationnaire. En particulier la
moyenne ne doit pas dépendre du temps.
 Si la série est stationnaire: Si  Z t  est
ARMA(p,q), alors les autocorrélations (k)
sont en nombre infini et décroissent vers 0
plutôt rapidement.
 Un estimateur de (k) est donné par r(k).

6 STT-3220; Méthodes de prévision


Identification (suite)
 De plus, on devrait avoir que:
P
r k     k 
 Cependant, la série  Z t  est non-stationnaire,
que se passe-t-il? On sait que cov(Zt,Zt-k) va
dépendre de k, mais aussi de t. Ainsi les
autocorrélations (k) ne sont pas définies.
Mais que sera la comportement des
statistiques r(k)?
7 STT-3220; Méthodes de prévision
Théorème

 Soit une série chronologique Z1 , Z 2 ,  , Z n


générée d’un processus ARIMA(p,d,q), où d  1 ;
on présume que le terme d’erreur  at  est un
bruit blanc Gaussien.
 Alors pour chaque délai k fixé, on a que:
P
r  k  1, 1  k  K  n

8 STT-3220; Méthodes de prévision


Cas stationnaire versus cas non-
stationnaire, comportement des r(k), k
fixé, comme fonction de n.

 Cas stationnaire:
P
r k     k 

 Cas non-stationnaire:
P
r  k  1, 1  k  K  n

9 STT-3220; Méthodes de prévision


Autres éléments d’information
 Cas stationnaire: Les r(k) comme fonction de k
décroissent à 0 de façon exponentielle (décroissance
vers 0 très rapide).
 Cas non-saisonnier: à partir de k = 20, toutes les
autocorrélations devraient être très près de 0.
 Cas non-stationnaire: Décroissance des r(k) de
manière linéaire vers 0? Décroissante très lente? Les
r(k) sont toutes de même signes? Ce sont tous des
indices d’un problème de stationnarité.

10 STT-3220; Méthodes de prévision


Identification: choix de p et de q
 Ayant identifié d, on a maintenant comme

modèle W   d Z
t t
. 
 Important éléments d’information:
– Pour un autorégressif, toutes les autocorrélations
partielles s’annulent après un certain délai.
– Pour un moyenne-mobile, toutes les
autocorrélations s’annulent après un certain délai.
 Que fait-on si les (k) et les kk semblent tous
les deux en nombre infini?

11 STT-3220; Méthodes de prévision


Modélisation des résidus

 Supposons que le processus est:


  B 1  B  Z t    B  bt , t.
d

 Cependant, le processus  bt  n’est pas un


bruit blanc mais un ARMA  ~
p , ~
q  . Donc:
~ ~
  B  bt    B  at , t.
~ 1 ~
bt    B   B  at

12 STT-3220; Méthodes de prévision


Modélisation des résidus (suite)

 Quelques manipulations donnent:


  B 1  B  Z t    B  bt , t.
d

~ 1 ~
  B 1  B  Z t    B   B   B  at ,
d

~ ~
  B   B 1  B  Z t    B   B  at
d

  B 1  B  Z t   *  B  at ,
* d

 Ce modèle n’est rien d’autre qu’un ARIMA  p , d , q  * *

13 STT-3220; Méthodes de prévision


Modélisation des résidus: exemple
 Supposons que vos disposez d’une série. Vous la
différenciez une fois pour la rendre stationnaire. Vous
disposez à ce stade d’un ARIMA(p,1,q).
 Vous trouvez que r(1) suggère une composante MA.
Vous modéliser un ARIMA(0,1,1).
 Un examen des résidus suggère une composante
AR(1). Vous tentez finalement un ARIMA(1,1,1) qui
devrait faire l’affaire.
 En résumé: ce sont les résidus qui permettent de
construire des modèles ARMA en pratique.
14 STT-3220; Méthodes de prévision
Étape 2: Estimation
 Dans le modèle:
  B 1  B  Z t   0    B  at , t.
d

 On doit procéder à l’estimation de:


– Paramètres autorégressifs: 1 ,  ,  p
– Paramètres moyenne-mobiles: 1 ,  ,  q
– Paramètre  0
– Paramètre  2
a

15 STT-3220; Méthodes de prévision


Estimation de  0

Dans  B 1  B Z t   0    B  at , t.
   d

  B Wt   0    B  at ,
Wt   1 1 0   1  B   B  at
 H :
Donc: 0 0  0  H 0 : W  0
'

E Wt   W   1 1 0
 W2  u
vu W  N  W ,  ,   n u  n1 1  n  W  u 
n 1
 Or on a 2
W
2
W
 
 On rejette H0 si T  W  1.96  2.0
ˆW
16 STT-3220; Méthodes de prévision
Estimation des paramètres
autorégressifs et moyenne-mobiles

 Plusieurs techniques sont possibles:


– Méthode du maximum de vraisemblance,
– Méthode par moindres carrés conditionnels,
– Méthode par moindres carrés inconditionels,
 Ces techniques sont discutées dans Abraham
& Ledolter (pp. 250-258).

17 STT-3220; Méthodes de prévision


Étape 3: Validation du modèle
 Quand on cherche à valider un modèle de
régression, une étape consiste habituellement à
analyser les résidus.
 La situation est similaire en séries chronologiques.
Considérons le modèle:   B 1  B  Z t   0    B  at
d

 Les résidus sont: aˆt  Z t  Zˆ t
 Les Ẑ t sont obtenus en estimant les divers
paramètres.

18 STT-3220; Méthodes de prévision


Test approximatif: test de bruit
blanc sur les résidus

 On se rappelle que si  at  est un bruit blanc,


alors les ra  k  sont asymptotiquement
indépendants, admettant pour un k donné une
loi normale:  1
ra  k   N  0, 
 n
 Un test de l’hypothèse H0 : (k) = 0 peut
reposer sur le test: n r  k  et la règle de
12

décision consiste à rejeter la nulle si:


n1 2 r  k   2
19 STT-3220; Méthodes de prévision
Introduction aux tests de type
portemanteau
 Puisque les n1 2 r  k  sont
approximativement de lois N(0,1), et utilisant
l’indépendance, lorsque  at  est bruit blanc
fort, on trouve que:
K L
Q K   n r  k    a
2 2
K
k 1
 Pour l’hypothèse nulle d’adéquation, on rejette
pour de grandes valeurs, i.e. 2
Q K    K ,1

20 STT-3220; Méthodes de prévision


Test de Box-Pierce et de Ljung-Box
 En suivant un raisonnement similaire au test de bruit blanc,
mais tenant compte du fait que l’on construit une statistique
de test basée sur des résidus, Box et Pierce, ainsi que Ljung
et Box ont montré que pour tester l’adéquation d’un modèle
ARMA(p,q): K L
QBP  K   n raˆ2  k    K2  p  q
k 1
K
 n  2 L 2
QLB  K    n  2    raˆ  k    K  p  q
k 1  n  k 
 La logique des tests est la même: on rejette pour de grandes
valeurs. Ex: avec Ljung-Box, on rejette l’adéquation si
21 STT-3220; Méthodes de prévision
QLB  K    K2  p  q ,1

Vous aimerez peut-être aussi