Académique Documents
Professionnel Documents
Culture Documents
SRIES CHRONOLOGIQUES
O. ROUSTANT
Novembre 2008
Table des matires
TABLE DES MATIERES ..................................................................................................................................... 1
INTRODUCTION .................................................................................................................................................. 3
Une srie chronologique, ou srie temporelle, est une srie d'observations ordonnes
chronologiquement1. Elles se rencontrent naturellement dans une grande varit de domaines.
On peut citer : l'conomie (taux de chmage, PNB ), la finance (cours d'action, taux
d'intrt, ), l'cologie (pollution l'ozone, au CO, ), le transport (avec l'exemple clbre
du trafic arien international), la dmographie
Les objectifs d'tude sont multiples. La prvision est sans doute le but le plus frquent. Il
s'agit de prvoir les valeurs futures d'une variable grce aux valeurs observes dans le prsent
et le pass de cette mme variable ; la problmatique n'est donc pas la mme qu'en rgression
o l'on cherche prvoir le niveau d'une variable (la rponse) en fonction du niveau d'autres
variables (les prdicteurs). Parmi les autres objectifs avous de l'tude des sries temporelles,
figure le problme de l'estimation d'une tendance ; par exemple on peut se demander si une
variation observe du chmage est le fait d'une fluctuation saisonnire, ou bien est le reflet
d'une tendance. Cela ncessite donc le filtrage des variations saisonnires. En finance, c'est en
gnral tout simplement (!) la dynamique2 de la srie qui est au centre des tudes ; la
modlisation d'un cours d'action est quasiment sans intrt sur la prvision mais est essentielle
pour l'valuation (le "pricing") des produits financiers complexes construits sur l'action (on
parle de "produits drivs"). Un autre problme consiste valuer l'impact d'un vnement sur
une variable : comment quantifier l'influence de la ceinture de scurit sur le nombre de tus
sur la route? du changement d'horaire sur la consommation d'nergie ?
L'tude systmatique des sries temporelles remonte la fin du 2me conflit mondial et n'a
cess de s'intensifier depuis (la rvolution informatique a mme donn un srieux coup
d'acclrateur pour tout ce qui relve des applications pratiques3 !). Le nombre de techniques
d'tudes et de modles est maintenant colossal. Ce cours est une modeste introduction
quelques techniques de base reconnues par le monde scientifique et employes par les
praticiens. Il se limite aux sries temporelles univaries (une seule variable) et discrtes (par
opposition au temps continu) ; quelques complments (notamment l'aspect "frquence") et
extensions sont voqus dans le tout dernier chapitre.
1
Par la suite, il s'agira d'une suite de variables alatoires.
2
C'est--dire la faon dont influent les valeurs passes sur le prsent.
3
mais aussi du dveloppement thorique : la croissance fulgurante de la puissance de calcul a ainsi ouvert la
voie l'estimation non paramtrique.
Nous allons illustrer quelques techniques descriptives utiles en sries chronologiques sur
quelques exemples. Commenons par la clbre srie du trafic arien international, que nous
dnommerons dsormais 'airline' (source : http://go.to/forecasting/ ).
1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960
Janvier 112 115 145 171 196 204 242 284 315 340 360 417
Fvrier 118 126 150 180 196 188 233 277 301 318 342 391
Mars 132 141 178 193 236 235 267 317 356 362 406 419
Avril 129 135 163 181 235 227 269 313 348 348 396 461
Mai 121 125 172 183 229 234 270 318 355 363 420 472
Juin 135 149 178 218 243 264 315 374 422 435 472 535
Juillet 148 170 199 230 264 302 364 413 465 491 548 622
Aot 148 170 199 242 272 293 347 405 467 505 559 606
Septembre 136 158 184 209 237 259 312 355 404 404 463 508
Octobre 119 133 162 191 211 229 274 306 347 359 407 461
Novembre 104 114 146 172 180 203 237 271 305 310 362 390
Dcembre 118 140 166 194 201 229 278 306 336 337 405 432
La premire tape consiste tracer les donnes, ce qui est fait sur la figure ci-aprs. On peut
dj faire quelques remarques prliminaires :
Augmentation rgulire du trafic ;
Fluctuation saisonnire : augmentation de novembre juillet-aot, avec un creux vers le
mois d'avril, puis diminution jusqu'en novembre.
Les donnes sont de plus en plus disperses.
Pour faire vite, disons que les deux premires questions reviennent tudier la partie
dterministe de la srie que l'on visualise aisment ; la dernire vise analyser la structure
alatoire - "le bruit" - qui reste une fois que l'on a extrait la partie dterministe. Dans ce
chapitre on tudiera essentiellement la partie dterministe en prparant le terrain pour la partie
alatoire.
xt +1
Interprtation: Notons yt = log( xt ) . Alors pour de petites variations de xt , yt +1 yt
.
xt
Autrement dit, l'accroissement sur la courbe transforme est approximativement le
pourcentage d'accroissement sur la courbe initiale.
Dfinition : un filtre moyenne mobile (ou MA pour Moving Average) est une application de la
M
forme xt
i .xt +i .
i = m
L'appellation (2h+1) MA fait rfrence la largeur de la fentre utilise pour lisser ; il en est
de mme de l'appellation 2h MA mme si la largeur de la fentre est 2h+1 car ce filtre
s'obtient comme la moyenne des deux filtres "naturels" de taille 2h.
La largeur de la fentre doit tre choisie en fonction de l'objectif souhait. S'agissant de filtrer
la saisonnalit, il est recommand de choisir la taille de la fentre gale la priodicit. Dans
notre cas, on utilisera le filtre 12 MA. Le rsultat est donn sur la figure ci-dessous, ainsi que
la srie rsiduelle xt / M t .
On constate comme suppos que les indices saisonniers de juillet-aot - mais aussi juin ont
tendance augmenter ; d'autre part, ceux de fvrier et mars ont tendance diminuer.
B
Dfinition: L'oprateur retard, not B (pour backward), est yt yt 1 .
Diffrentiant une premire fois, on obtient le rsultat ci-dessous. Comme prvue, la tendance
a t en bonne partie limine ; il reste peut-tre un terme constant. D'autre part, la
transformation n'a pas limin la saisonnalit : on voit de faon vidente des cycles de
longueur 12. On pourrait ensuite diffrencier une 2me fois mais cela n'est pas ncessaire car le
filtrage de la saisonnalit aura la mme consquence.
On a donc s = I B s , avec B s =
B B ... B .
s fois
Jan. Fev. Mars Avril Mai Juin Juil. Aot Sep. Oct. Nov. Dec.
1961 375 384 383 326 344 375 419 424 429 399 376 288
1962 360 376 360 381 354 301 333 339 316 352 378 360
1963 388 398 377 383 449 415 429 369 414 462 447 403
1964 409 390 380 438 431 426 348 394 396 451 384 491
1965 466 454 442 475 401 406 385 380 422 397 430 433
1966 421 374 401 451 465 456 469 466 412 427 414 384
1967 328 395 381 360 383 383 403 425 422 414 382 390
1968 320 412 437 421 450 442 450 412 422 372 375 392
1969 356 392 426 442 426 406 392 426 445 464 379 409
1970 497 459 513 549 447 445 432 514 565 557 601 582
1971 587 560 590 556 582 527 585 556 574 556 582 583
1972 644 620 618 623 546 568 595 605 598 592 558 595
1973 549 637 568 605 594 567 545 545 592 576 593 603
1974 631 614 617 546 632 673 732 593 693 730 731 733
1975 802 755 805 751 855 769 800 825 799 802 765 827
1976 760 781 769 766 752 751 761 873 750 758 772 791
1977 813 781 797 802 782 838 756 764 796 781 780 679
1978 748 759 749 756 802 754 792 772 769 731 746 741
1979 712 723 698 746 754 735 722 737 728 773 723 741
1980 738 765 748 707 808 746 773 751 721 731 735 701
1981 762 783 796 803 806 765 781 768 812 854 858 818
1982 856 897 817 872 895 825 922 915 902 908 911 919
1983 861 827 855 867 836 916 828 835 792 771 757 756
1984 712 733 746 728 707 666 636 676 696 654 613 677
1985 705 680 699 650 687 638 670 555 631 676 659 689
Le graphe de la srie est reprsent ci-aprs. Il est bien difficile de dceler une tendance ou un
phnomne cyclique. Nanmoins, on ne peut esprer tudier cette srie sans effectuer de
transformation car il y a un manque de stabilit au niveau des valeurs elle-mme. En
revanche, le problme disparat lorsqu'on s'intresse la srie des variations du nombre de
jeunes femmes sans emploi obtenue par diffrentiation. La diffrentiation a pour but de se
ramener une srie "stationnaire" (la dfinition rigoureuse est donne au chapitre 3).
Etant donne une srie d'observations x1 , x2 ,..., xN , on s'intresse aux prvisions qu'on peut
donner la date N pour les dates futures. De faon gnrale, la prvision faite une date t
pour l'horizon h, c'est--dire pour la date t+h, sera note x (t , h) .
La mthode de lissage exponentiel simple procde par filtrage de la srie de donnes avec les
particularits suivantes:
le filtre utilis fait intervenir tout le pass (il est donc dcentr gauche, contrairement
ceux employs au chapitre prcdent).
les poids attribus aux observations dcroissent de faon exponentielle en fonction de
l'anciennet de ces observations.
Le lissage exponentiel simple ne s'applique qu'aux sries sans tendance ni saisonnalit. Les
extensions de la mthode - mthodes de Holt et de Holt-Winters permettent de tenir compte
de la prsence d'une tendance et/ou d'une saisonnalit.
Description
La prvision l'horizon 1 est donne ici par la moyenne des observations passes, avec des
poids dcroissant avec l'anciennet de faon gomtrique:
x ( N ,1) = c0 xN + c1 xN 1 + ...
avec ct +1 = (1 ).ct , 0 < < 1 . Avec la contrainte que la somme des poids fasse 1, on en
dduit la forme des poids comme une fonction exponentielle de l'anciennet:
ct = (1 )t , t = 0,1,...
La prvision l'horizon h est, par dfinition, la mme qu' l'horizon 1:
x ( N , h) = x ( N ,1), h = 1, 2,...
Algorithme itratif
Sous la forme prcdente, l'valuation des prvisions comme une moyenne de toutes les
observations passes peut-tre trs coteuse en temps de calcul. Heureusement on a la
relation:
x ( N ,1) = xN + (1 ) x ( N 1,1)
ce qui permet de calculer les prvisions la date N de proche en proche. Pour initialiser
l'algorithme, on adopte gnralement le choix x (1,1) = x1 .
La formule ci-dessus donne en outre une autre interprtation de la mthode: la prvision la
date N "corrige" la prvision antrieure avec l'observation prsente. Le paramtre rgit
l'importance du prsent dans cette correction; par exemple, pour =0 la prvision est la valeur
la plus ancienne tandis que pour =1, la prvision est donne par l'observation prsente.
Cadre d'application
Le lissage exponentiel simple n'est rien d'autre qu'un filtrage local de la srie de donne; rien
n'est prvu pour prendre en compte un terme tendanciel ou un phnomne cyclique, et les
rsultats sont en effet trs dcevants dans ces cas. On se bornera donc l'utiliser lorsque
aucune tendance ou saisonnalit n'est visible.
Exemple
Reprenons la srie 'unemp'. Supposons que l'on ignore les donnes des 6 derniers mois de
l'anne 1985 et que l'on souhaite prvoir au 30 juin 1985 les chiffres du chmage relatif la
catgorie sociale considre pour les 6 derniers mois de l'anne. Ici la srie ne prsente pas de
tendance vidente ni de saisonnalit; on peut donc employer la technique de lissage
exponentiel simple. Ci-dessous, on donne les rsultats obtenus pour 3 valeurs du paramtre .
Prvisions l'horizon 1
Mois Index Valeurs =0.1 =0.5 =0.9
observes
Janvier 1961 1 375
Fvrier 2 384 375.0 375.0 375.0
Mars 3 383 375.9 379.5 383.1
Avril 4 326 376.6 381.3 383.0
.. .. .. .. .. ..
Avril 1985 292 650 712.6 690.0 697.3
Mai 293 687 706.3 670.0 654.7
Juin 294 638 704.4 678.5 683.8
Juillet 295 (670)* 697.8 658.2 642.6
Aot 296 (555)* 697.8 658.2 642.6
Septembre 297 (631)* 697.8 658.2 642.6
Octobre 298 (676)* 697.8 658.2 642.6
Novembre 299 (659)* 697.8 658.2 642.6
Dcembre 300 (689)* 697.8 658.2 642.6
4
Dans un cadre probabiliste le critre serait choisi, de prfrence, de faon maximiser la vraisemblance.
2. Mthode de Holt
Il s'agit d'une adaptation du lissage exponentiel simple aux sries prsentant une tendance
mais sans saisonnalit vidente. Elle opre au plan local le lissage simultan du "niveau" de la
srie Lt et de la pente bt de la tendance, au moyen des quations rcursives:
Lt = xt + (1 )( Lt 1 + bt 1 )
bt = ( Lt Lt 1 ) + (1 )bt 1
x (t , h) = Lt + hbt
On retrouve le lissage exponentiel simple pour =0, et b1=0. Dans ce cas on a tout simplement
Lt = x (t ,1) .
Initialisation
Le plus simple consiste prendre L1 = x1 et b1 = x2 x1 , mais d'autres techniques peuvent tre
envisages, par exemple une rgression linaire sur les premires valeurs pour donner une
estimation locale de la tendance initiale.
3. Mthodes de Holt-Winters
Ce sont les mthodes privilgier parmi les techniques de lissage exponentiel dans le cas de
sries d'observations prsentant la fois un terme de tendance et une saisonnalit. Elles
oprent le lissage simultan de 3 termes correspondant respectivement des estimations
locales du niveau de la srie dsaisonnalise Lt , de la pente de la tendance bt et de la
saisonnalit St . On peut citer au moins deux mthodes dont l'une est adapte aux sries
admettant une dcomposition multiplicative et l'autre correspondant aux dcompositions
additives.
x (t , h) = ( Lt + hbt ) St s + h
Initialisation
L'initialisation de l'algorithme requiert cette fois 3s valeurs: L1 ,..., Ls , b1 ,..., bs , S1 ,..., S s . Il est
naturel de choisir pour t=1,,s :
x + ... + xs
Lt = 1
s
1x x x x
bt = 1+ s 1 + ... + 2 s s
s s s
x
St = t
Lt
mais d'autres choix restent possibles.
Lt = ( xt St s ) + (1 )( Lt 1 + bt 1 )
bt = ( Lt Lt 1 ) + (1 )bt 1
St = ( xt Lt ) + (1 ) St s
x (t , h) = Lt + hbt + St s + h
Le choix des valeurs initiales et des paramtres se fait de faon tout fait analogue au cas
multiplicatif.
3.3. Exemple
Reprenons la srie 'airline'. Plaons-nous au 31 dcembre 1959 et supposons que l'on ait
prvoir le trafic pour l'anne suivante. D'aprs l'tude descriptive ralise au chapitre 1, c'est
la mthode de Holt-Winters multiplicative qui parat la plus adapte
Les inconvnients les plus flagrants sont de deux ordres. Tout d'abord, rien ne garantit
l'optimalit de la mthode sur une srie de donne : les mthodes de lissage exponentiel sont
parfois loin d'tre les mieux adaptes (encore faut-il s'en apercevoir). D'autre part, elles sont
incapables de fournir des intervalles de prvision, c'est--dire un intervalle contenant la
prvision avec une probabilit donne. Et pour cause, aucun cadre probabiliste n'a t dfini
pour le moment.
Pour pallier ces insuffisances, on est amen raliser des prvisions au moyen de modles
probabilistes. Il est noter que les mthodes de lissage exponentiel correspondent (
l'exception de la version multiplicative de Holt-Winters) des modles probabilistes
particuliers. On peut donc voir les mthodes probabilistes comme des techniques plus
gnrales permettant de justifier l'emploi des mthodes lmentaires et d'en largir le champ
d'application.
__________
Jusqu' prsent, nous avons regard les donnes sans aucune ambition de modlisation. Si l'on
prend l'image d'un projectile propuls par un canon, notre dmarche se serait limite
observer une forme parabolique de la trajectoire. On aimerait maintenant aller plus loin et
proposer un modle capable de reproduire le "comportement" des donnes de faon analogue
que le modle Newtonien explique la forme de la chute du boulet de canon. Ici cependant la
tache est bien diffrente puisque les donnes ne sont pas dterministes. La dmarche consiste
supposer que les donnes observes x1 ,..., xn forment un extrait d'une trajectoire d'un
processus stochastique ( X t ( ))tZ , donc qu'il existe tel que ( x1 ,..., xn ) = ( X 1 ( ),..., X n ( )) .
L'ambition est alors de proposer, lorsque cela est possible, un modle "plausible" pour le
processus ( X t ) . En fait on ne sait vraiment faire quelque chose que lorsqu'il est possible de
supposer que le processus est stationnaire. Dans ce cas on peut associer deux caractristiques
essentielles au processus, la fonction d'autocorrlation et la fonction d'autocorrlation
partielle. La ncessaire comparaison des autocorrlations estimes partir des donnes avec
celles calcules pour des modles connus sera parfois mme suffisante pour avoir une bonne
ide d'un modle adquat. Cela suppose naturellement d'avoir une connaissance solide des
modles probabilistes les plus courants. Dans ce cours, on se restreint des modles linaires
de type "SARIMA"; leur prsentation fait l'objet de la deuxime partie du chapitre.
1. Notions gnrales.
1.1. Stationnarit.
La connaissance d'un processus quivaut connatre la loi de tout vecteur ( X t +1 ,..., X t + h ) , h
entier. La notion de stationnarit au sens strict, analogue celle de rgime permanent en
physique, est donne par la
Cette notion est parfois trop restrictive et l'on prfre alors la stationnarit au second ordre :
Notons que ces dfinitions sont quivalentes lorsque ( X t ) est un processus gaussien (c'est--
dire lorsque la loi de tout vecteur ( X t +1 ,..., X t + h ) est gaussienne).
Proprits.
(0) = 1
( h) 1 (d'aprs l'ingalit de Cauchy-Schwartz)
( h) = ( h) est une fonction paire.
Interprtation gomtrique.
(h) est le cosinus de l'angle entre X t et X t + h .
Signalons une difficult d'ordre thorique : deux processus stationnaires distincts peuvent
avoir la mme fonction d'autocorrlation. Considrons par exemple :
1
X t = Z t + Z t 1 et Yt = Z t + Z t 1
o est un rel non nul fix, et les v.a. Z t sont i.i.d. Il est facile de voir que les fonctions
d'autocorrlations X et Y sont gales.
D'autre part, sur un plan pratique cette fois, il serait miraculeux de pouvoir identifier un
processus la seule vue de la fonction d'autocorrlation (estime). Heureusement, nous avons
un deuxime outil notre disposition.
Le coefficient (h) jouit des mmes proprits qu'un coefficient de corrlation ordinaire et
on a :
Interprtation gomtrique.
(h) est le cosinus de l'angle entre X t et X t + h , les projections sur l'orthogonal de l'espace
vectoriel engendr par X t +1 ,..., X t + h 1 .
Xt+1
Exemple pour h = 2. Xt
Xt+2
cos( ) = (2)
cos( ) = (2)
X t +1
Proposition.
Considrons la projection de X t + h sur l'espace vectoriel engendr par X t , X t +1 ,..., X t + h 1 :
EL ( X t + h | X t , X t +1 ,..., X t + h 1 ) = h ,1 X t + h 1 + ... + h ,h 1 X t +1 + h ,h X t
Alors (h) = h ,h .
Le calcul pratique des coefficients (h) est bas sur ce rsultat et utilise astucieusement le
fait que lorsque h augmente la projection sur l'espace augment de la nouvelle variable se
dduit de la projection prcdente. C'est l'algorithme de Durbin-Levinson (voir (Brockwell,
Davis) 5.2.).
Dfinitions.
1. ( X t ) est un bruit blanc fort ssi les v.a. Xt sont identiquement distribues et indpendantes.
On note ( X t ) IID (0, 2 ) o 2 est la variance de Xt .
2. (X t ) est un bruit blanc (faible) ssi les v.a. Xt sont identiquement distribues et non
linairement corrles : cov( X t ; X t + h ) = 0 . On note ( X t ) WN (0, 2 ).
Dans le cas de processus gaussiens, les deux notions concident. On parle alors de bruit blanc
gaussien.
Il s'agit donc d'un processus dont les accroissements sont un bruit blanc. Lorsque ( X t ) est
gaussien, c'est la version discrte du clbre mouvement brownien.
Stationnarit.
Une marche au hasard n'est pas stationnaire car var( X t ) = var( X 0 ) + t var( X 1 X 0 ) .
Par sa forme le modle AR(p) voque le modle de rgression linaire. La diffrence majeure
est que les prdicteurs sont eux-mmes alatoires et (souvent) corrls entre eux. Pour tudier
ses proprits, il est commode de commencer par le cas p = 1.
Cas p=1.
Le processus AR(1) est donc dfini par
X t = X t 1 + Z t (*)
avec (Z t ) WN (0, 2
).
Cette dernire solution n'est toutefois pas envisageable dans la pratique car la valeur du
processus en un instant fait intervenir tous les instants futurs. On dit que le processus n'est pas
causal.
Dfinition. ( X t ) est dit causal par rapport au bruit blanc (Z t ) si on peut l'crire sous la forme
+
X t = j Z t j
j =0
En rsum le processus AR(1) que nous considrerons sera causal, ce qui implique < 1 et
l'criture MA() : X t = ( B) Z t , avec ( z ) = 1 + z + 2 z 2 + ... .
Cas gnral.
Le modle AR(p) peut s'crire sous la forme synthtique
( B) X t = Zt
avec ( z ) = 1 1 z ... p z p .
On a les rsultats suivants :
Le terme "MA" vient du fait que que Xt est exprim comme une moyenne mobile de (Z t )
avec les poids 1,1 ,..., q .
Cas q=1.
Stationnarit. Inversibilit.
Le modle MA(1) : X t = Z t + Z t 1 est toujours stationnaire. Cependant il est indispensable
de pouvoir exprimer Zt en fonction de X t , X t 1 ,... ne serait-ce que pour pouvoir calculer
Z1 , Z 2 ,..., Z n en fonction des donnes X 1 , X 2 ,..., X n . Or si < 1 , on peut crire
Z t = X t X t 1 + 2 X t 2 ...
tandis que pour > 1 ,
1 1
Zt =
X t +1 2 X t + 2 + ...
Ce dernier cas est peu recommandable et correspond une situation de non-inversibilit.
Dfinition. ( X t ) est dit inversible par rapport au bruit blanc (Z t ) si on peut crire Zt sous la
forme
+
Zt = j X t j
j =0
Remarque.
On n'aura pas manqu d'observer la "dualit" entre un modle autorgressif et un modle
moyenne mobile, entre causalit et inversibilit, proprits de (resp. ) pour le modle AR
et les celles de (resp. ) pour le modle MA. Cependant on ne peut pas parler de symtrie
car dans les deux cas la proprit de bruit blanc est porte par (Z t ) .
Cas gnral.
Ecrivons le modle MA(q) sous la forme
X t = ( B ) Z t
q
avec ( z ) = 1 + 1 z + ... + q z .
On a les rsultats suivants:
Thorme.
Stationnarit, inversibilit.
( X t ) est toujours stationnaire, et inversible si et seulement si a toutes ses racines
l'extrieur du cercle unit.
Autocorrlations.
On a (h) = 0 si h > q. En outre, la rciproque est vraie : si ( X t ) est un processus
stationnaire avec les coefficients d'autocorrlations nuls au-del de l'ordre q (et non nul en q),
alors ( X t ) suit le modle MA(q).
Autocorrlations partielles.
Il n'y a pas de rsultat particulier.
Dfinition.
1. ( X t ) suit le modle ARIMA(p,d,q) lorsque la srie diffrencie Yt = ( I B) d X t suit le
modle ARMA(p,q). On a donc formellement
( I B ) d ( B ) X t = ( B ) Z t
o et sont deux polynmes unitaires de degr respectif p et q, et (Z t ) WN (0, 2 ).
Les proprits du modle gnral SARIMA se dduisent de celles du processus ARMA. Il est
bien sr non stationnaire sauf (peut-tre) si d = D = 0.
__________
Etant donne une srie d'observations, une question essentielle dans l'approche probabiliste
est le choix d'un modle le mieux adapt. Box et Jenkins ont propos au cours des annes
1970 une dmarche systmatique permettant d'aboutir, si c'est possible, au choix d'un modle
de type (S)ARIMA.
Elle repose sur plusieurs tapes qui sont dtailles sur la srie 'unemp'. La srie du trafic
arien est tudie ensuite.
5
Notons que les techniques de dcompositions ne font pas partie, stricto sensu, de la dmarche de Box et
Jenkins. En fait lorsqu'une dcomposition a t ralise, il est souvent possible d'obtenir un rsultat analogue par
le biais de transformations et de diffrentiations (comme dans le cas du trafic arien).
(Y Y )(Y
t t +h Y )
(k ) = t =1
n
2
(Y Y )
t =1
t
Ci-dessous figurent ACF et PACF pour la srie "unemp", avec les bandes7 de confiance
1.96n 1/ 2 .
6
Les lecteurs intresss pourront regarder (Brockwell, Davis), thormes 7.2.2. et 8.1.2.
7
Le terme est trompeur car l'interprtation se fait coefficient par coefficient.
Le pige
Il est crucial d'avoir une srie stationnaire pour pouvoir tirer des enseignements des
graphiques prcdents. Considrons par exemple le modle form d'une composante
saisonnire bruite:
X t = sin(2 t / 30) + 0.5Z t (*)
o Zt est un bruit blanc N(0,1). Il est clair que les autocorrlations thoriques sont nulles
partir du rang 1 car le processus (*) ne diffre d'un bruit blanc qu'au travers d'une partie
dterministe. Pourtant voici ce que donne ACF et PACF pour une srie de 500 valeurs
simules partir de (*) :
Il ne faut surtout pas conclure qu'il y a de fortes corrlations ! En fait l'estimation des
autocorrlations est brouille par la composante dterministe. Le graphique ci-dessus
nous montre la prsence d'une saisonnalit mais est inutilisable pour examiner les
corrlations au sens probabiliste. En gnral le fait que les corrlations ne tendent pas
rapidement vers zro est un signe de non-stationnarit8.
8
Mais la srie correspondante peut trs bien tre associe un modle ARMA
3. Estimation
Nous considrons ici le cas d'un ARMA(p,q) , ( B)Yt = ( B) Z t avec Z t N (0, 2 ), mais
des rsultats analogues existent pour les modles du type SARIMA.
Notons = (1 ,..., p ,1 ,..., q ) le vecteur des paramtres. L'estimation de est un problme
assez dlicat, mais qui est trait par les logiciels de statistique usuels. Parmi les techniques
employes, citons la plus sduisante pour l'esprit qui est celle du maximum de vraisemblance.
On estime par la valeur la plus vraisemblable, c'est--dire celle qui donne la plus grande
densit de probabilit :
= Arg max L( y1 ,..., yn ; )
o L(Y1 ,..., Yn ; ) est la densit de probabilit du vecteur alatoire (Y1 ,..., Yn ) . Les proprits
asymptotiques9 sont donnes dans le :
Thorme.
Soit ( B)Yt = ( B) Z t un modle ARMA(p,q) causal et inversible, tel que et n'ont pas de
zros communs. Alors si (Zt) est un bruit blanc gaussien N (0, 2 ) ,
(i) n N (0, V ( ) )
( ) n +
9
Les proprits asymptotiques sont identiques pour l'estimateur des moindres carrs.
n vii
Bien que ACF et PACF ne le suggrent pas, on pourrait tre tenter d'essayer un modle plus
riche de type MA(2) : Yt = Z t + 1Z t 1 + 2 Z t 2 . On obtient alors :
La valeur estime pour 1 n'a quasiment pas chang (ce qui est rassurant!) et toujours trs
significative; en revanche, l'estimation obtenue pour 2 est entache d'une erreur plus de 5
fois suprieure et n'est donc pas significative. On n'a donc pas intrt rajouter un deuxime
paramtre.
Enfin l'estimation ne serait pas complte sans l'estimation de la variance du bruit. On obtient
Z =37.45.
4. Validation.
Tous les rsultats d'estimation obtenus prcdemment, toutes les prvisions que l'on pourra
faire, etc. dpendent de faon cruciale du fait que les rsidus forment un bruit blanc gaussien.
Il est donc capital d'accorder un soin particulier la vrification de cette hypothse.
Les vrifications vont porter non pas sur les rsidus thoriques mais sur les rsidus estims ce
qui peut modifier les conclusions parfois de faon importante. D'autre part, l'indicateur usuel
Rsidus
Les rsultats sont plutt encourageants. toutefois, il faut savoir que travaillant avec des
rsidus estims les bandes de confiance pour les coefficients de corrlation des rsidus
10
Il est clair en effet que si les rsidus sont indpendants, leurs carrs le sont galement.
Avant de passer des tests plus rigoureux, on peut galement contrler visuellement la
normalit des rsidus en traant la droite de Henri. On constate ici que les quantiles
exprimentaux sont parfaitement aligns12.
Tests de Portmanteau.
Notons ( Z (h) ) la fonction d'autocorrlation empirique des rsidus estims Zt .
Le trac de l'ACF des rsidus vise vrifier que chaque coefficient Z (h) est, de faon
individuelle, l'intrieur de la bande de confiance. Les tests de Portmanteau sont bass sur
une statistique faisant intervenir collectivement les premires autocorrlations. L'hypothse
H0 est : " Z1 ,..., Z n sont indpendantes et identiquement distribues". On se contentera de
prsenter le test de Ljung-Box, dont la statistique est :
2
n
( j )
QZ = n(n + 2) Z
j =1 n j
Intuitivement une valeur leve de QZ signifie qu'il y a parmi les h premires autocorrlations
des valeurs significatives et va pousser au rejet de H0. Pour les carrs des rsidus on considre
de faon analogue la statistique :
11
Voir (Brocwell, Davis) 9.4.
12
Un tel alignement est plutt exceptionnel!
13
Donnes issues de v.a. indpendantes.
(Z )(Z )
2 2
t Z2 t +h Z2
2
ZZ (h) = t =1
n 2
(Z )
2
t Z2
t =1
n
1
Zt . On a alors le rsultat suivant, relatif un modle ARMA(p,q) sous des
2
avec Z 2 =
n t =1
hypothses que l'on supposera vrifies.
Thorme.
Si les variables alatoires Z1 ,..., Z n sont i.i.d., alors
(i) QZ est approximativement de loi 2 (h ( p + q ))
(ii) QZZ est approximativement de loi 2 (h)
Test de Kendall
Il est bon d'effectuer un test d'indpendance qui ne fasse pas intervenir le coefficient de
corrlation linaire. Le test de Kendall en est un. L'hypothse H0 est inchange (cependant on
applique le test aux rsidus estims). La statistique T du test est le nombre de
"retournements", ou changements de pente, de la srie de donnes z1 ,..., zn . Un retournement
dsigne une configuration de trois nombres a, b, c avec a<b et b>c ou a>b et b<c. On a alors :
Thorme.
Si les variables alatoires Z1 ,..., Z n sont i.i.d., alors T est asymptotiquement normale
(
N T , T
2
) avec T
2
= 2(n 2) / 3 et T = (16n 29) / 90 .
La rgle de dcision est cette fois bilatrale. Un trop grand nombre de retournements indique
des variations trop frquentes pour un bruit blanc (corrlation ngative); l'inverse trop peu
de changements de pente indique une rgularit suspecte (corrlation positive).
Test de Kolmogorov
On renvoie le lecteur au cours de 1re anne o ce test est prsent en dtail.
Les p-valeurs pour les tests d'indpendance sont satisfaisantes. La statistique de Kolmogorov
Dn est fournie. Au niveau 5%, on rejette l'hypothse de normalit si ( n + 0.85 / n 0.01) Dn
est suprieur 0.895. Le membre de gauche est valu 0.64 ce qui est acceptable.
En conclusion, on valide le modle MA(1) pour la srie diffrencie. Pour la srie initiale du
nombre de jeunes femmes sans emploi aux Etats-Unis, on peut donc proposer le modle
ARIMA(0,1,1) :
On remarque tout d'abord que parmi les premires autocorrlations, seule la premire est
Corrlogrammes de Vt
__________
Dans le cadre probabiliste fix au chapitre 3, les donnes x1 , x2 ,..., xN sont vues comme une
ralisation particulire d'un processus alatoire ( X t )t . A l'issue des chapitres 3 et 4 on
suppose qu'on connat la loi du processus, donc la loi de tout vecteur ( X t +1 ,..., X t + h ) . Dans ce
contexte, quoi correspond la notion de prvision ? Comment la calcule-t-on ?
Dfinition.
La prvision en t l'horizon h, note X (t , h) , est
X (t , h) = E ( X t +h | t )
14
L'erreur de prvision correspondante, note e(t , h) , est dfinie par
e(t , h) = var ( X t + h | t ) = E ((X t +h X (t , h) ) )
2
t
Dfinition.
Un intervalle de prvision est un intervalle contenant la prvision avec une probabilit
donne. Ainsi I (t , h) est un intervalle de prvision au niveau de X (t , h) ssi :
P X (t , h) I (t , h) | t =
( )
Il ne s'agit donc pas d'un intervalle de confiance
14
Il s'agit d'un abus de langage. L'erreur de prvision dsigne, proprement parler, l'cart entre la valeur
inconnue X t + h et la prvision X (t , h ) . Il faudrait parler d'erreur quadratique moyenne de prvision.
15
pour un processus centr.
(
avec (Z t ) WN (0, 2 ). Alors, X t + h | t N X t + Z t ; 2 (1 + (h 1)(1 + 2 ) ) .)
La valeur de Z t s'obtient de proche en proche partir de (*) et une condition d'initialisation,
par exemple Z 0 = 0 . En fait, les prvisions un pas16 sont simplement donnes par la
mthode de lissage exponentiel. En effet, on a
X (t ,1) = X t + Z t
= X t + ( X t ( X t 1 + Z t 1 ))
= (1 + ) X X (t 1,1)
t
ce qui correspond la mthode SES avec = 1 + lorsque ] 1;0[ . On vrifie que les
prvisions un horizon quelconque concident galement.
Autrement dit, les prvisions obtenues par le modle ARIMA sont les mmes que celles
obtenues par lissage exponentiel. On peut donc dans ce cas donner des intervalles de prvision
pour les prvisions obtenues par SES. Soulignons que si le modle ARIMA(0,1,1) n'avait pas
t valid pour la srie de donnes, la notion mme d'intervalle de prvision n'aurait pas de
sens dans le cadre SES.
Reprenons le problme de prvision consistant prdire le chmage pour les 6 derniers mois
de l'anne 1985 au 30 juin 1985. La procdure de Box et Jenkins dcrite au chapitre 4 doit
tre reconduite en enlevant les 6 dernires valeurs de la srie. Le modle ARIMA(0,1,1) est
encore valide; on obtient = 0.5005 et = 37.06 . On remarque que 1 + = 0.4995 est
diffrent du paramtre estim dans SES, = 0.4931 . Cela vient du fait que la procdure
d'estimation de n'est pas un calcul de moindres carrs simples. La diffrence est cependant
minime (ne pas oublier l'ordre de grandeur de l'erreur d'estimation de ). Bien que et
soient estims, on se contente de faire comme s'il s'agissait des "vrais" paramtres. La loi de
prvision est celle indique dans la proposition ci-dessus. Finalement, on a :
Intervalle de prvision
Mois Index Valeur Valeur Erreur de Borne Borne
observe prdite prvision infrieure suprieure
Juillet 295 (670)* 658.3 37.1 585.6 730.9
Aot 296 (555)* 658.3 41.4 577.1 739.5
Septembre 297 (631)* 658.3 45.4 569.3 747.2
Octobre 298 (676)* 658.3 49.0 562.2 754.3
Novembre 299 (659)* 658.3 52.4 555.6 760.9
Dcembre 300 (689)* 658.3 55.6 549.4 767.2
16
c'est--dire l'horizon 1.
2.2. Simulation
La loi de prvision peut tre approche au moyen de simulations.
D'un point de vue thorique, les simulations permettent d'obtenir des ralisations
indpendantes X tr+ h , r = 1,..., R , de la loi conditionnelle X t + h | t . D'aprs la loi des grands
nombres, on dispose d'approximations de la prvision et de l'erreur de prvision, valables pour
R "grand"
1 R 1 R
E ( X t + h | t ) X R X tr+ h , var ( X t + h | t ) ( X tr+ h X R ) 2
R r =1 R r =1
mais aussi de la loi de prvision elle-mme :
1 R
P ( X t + h x | t ) 1 r
R r =1 {X t +h x}
Yt + k = Yt + k 1 + Yt + k 12 Yt + k 13 + U t + k 1U t + k 1 12U t + k 12 + 112U t + k 13
Les valeurs x1 , x2 ,..., xt tant donnes, on dduit y1 , y2 ,..., yt puis z1 , z2 ,..., zt (avec la
condition xi = 0, i 0 ). Conditionnellement ces valeurs, on obtient en simulant U t +1 selon
la loi N (0; 2 ) des ralisations indpendantes de Yt +1 . Puis de proche en proche de
Yt + 2 ,..., Yt + h . Le processus tant gaussien, on dispose d'intervalles de prvisions relatifs (Yt ) .
Il faut ensuite revenir (X t ) .
Intervalle de prvision
Mois Index Valeur Valeur Borne Borne
observe prdite infrieure suprieure
Janvier 133 (417) * 419.6 390.3 451.0
Fvrier 134 (391) * 398.7 365.9 434.4
Mars 135 (419) * 466.6 423.1 514.6
Avril 136 (461) * 454.3 407.5 506.5
Mai 137 (472) * 473.8 421.1 533.1
Juin 138 (535) * 547.4 482.0 621.6
Juillet 139 (622) * 623.2 544.3 713.5
Aot 140 (606) * 631.8 547.7 728.9
Septembre 141 (508) * 527.1 453.4 612.7
Octobre 142 (461) * 462.7 395.3 541.6
Novembre 143 (390) * 407.1 345.4 479.7
Dcembre 144 (432) * 452.6 381.6 536.7
Dans les situations o la fois l'indpendance et la normalit sont douteuses, il est prfrable
d'envisager un autre modle.
17
Voir le cours de 1re anne, paragraphe "simulation d'une loi discrte".
t0 t1 t2
On compare alors les prvisions avec les donnes postrieures celles utilises pour la
modlisation. On parle de donnes post-sample et d'valuation post-sample des erreurs.
Pour valuer la qualit des prvisions l'horizon h, on calcule les erreurs relles
er (t , h) = x (t , h) xt , t1 < t t2
et on peut mesurer leur importance au moyen d'indicateurs classiques tels que
l'erreur moyenne absolue (MAE)
t2 h
1
MAE (h) = | er (t , h) |
t2 t1 + 1 t =t1 +1
l'erreur quadratique moyenne (MSE)
t2 h
1
MSE (h) = er (t , h) 2
t2 t1 + 1 t =t1 +1
__________
Le domaine des sries chronologiques est en pleine expansion et les notions prsentes ici,
quoique largement utilises, ne constituent qu'une petite part des connaissances actuelles sur
le sujet. De faon rapide, on peut distinguer : temps discret et temps continu, stationnarit et
non stationnarit, scalaire et vectoriel, linaire et non linaire, domaine temporel et domaine
des frquences, paramtrique et non paramtrique. Alors ce cours correspond peu prs au
choix : "temps discret, scalaire, linaire, domaine temporel, paramtrique" !. Bien entendu il
est hors de question de prsenter tous les choix restants. On se contentera de prsenter certains
des aspects ci-dessus non traits ici en renvoyant des ouvrages choisis.
Les modles GARCH sont trs employs en finance. En effet, on observe pour les cours
d'action par exemple que de fortes hausses (baisses) se rpercutent souvent les jours suivants,
traduisant un "emballement" du march. On ne peut donc pas en gnral admettre que la
variance conditionnelle des rendements19 soit constante comme dans le cas du modle
ARMA. Pour en savoir plus, on pourra consulter les articles fondateurs de Engle et Bollerslev,
ou les ouvrages de Gouriroux (1997) ou Campbell, Lo, MacKinlay (1997) (chapitre 12).
18
R. Engle a obtenu pour cette dcouverte le prix Nobel dconomie 2003, ex aequo avec
C.W.G. Granger, lui aussi conomtre.
19
En finance, on parle plus volontiers de volatilit qui dsigne l'cart-type du rendement.
En guise de conclusion, citons simplement quelques notions importantes non abordes ici
relatives aux sries temporelles : les modles d'tat, le filtrage de Kalman, (voir par exemple
(Chatfield) ou (Brockwell, Davis)), les rseaux de neurones (une courte introduction et
quelques rfrences se trouvent dans (Campbell, lo, MacKinlay)), les ondelettes.
__________
P.J. Brockwell, R.A. Davis. (1987). Time Series: Theory and Methods. Second edition.
Springer-Verlag.
J.Y.Cambell, A.W. Lo, A.C. MacKinlay. (1997). The Econometrics of Financial Markets.
Princeton.
C. Chatfield. (1989). The Analysis of Time Series, an Introduction. Fourth edition. Chapman
& Hall.
C.W.J. Granger, P. Newbold. (1986). Forecasting Economic Time Series. Second edition.
Academic Press.
C.M. Hafner. (1998). Non Linear Time Series Analysis with Applications to Foreign
Exchange Rate Volatility. Physica Verlag.