Vous êtes sur la page 1sur 26

Statistique applique la gestion et au marketing

http://foucart.thierry.free.fr/StatPC

Chapitre 8

ANALYSE DES SRIES CHRONOLOGIQUES


Nous abordons dans ce chapitre lanalyse de donnes statistiques particulires en ce sens que les observations sont rgulirement chelonnes dans le temps. Ce genre de donnes est bien connu en conomie : la quasi-totalit des indices de prix, de production etc. sont calculs rgulirement par lINSEE ou dautres tablissements et constituent ce que lon appelle des sries chronologiques. Elles sont frquentes aussi en gestion : surveillance du niveau des stocks, suivi des ratios dune entreprise etc. Leur particularit vient de lintroduction du temps dans lanalyse de ces donnes : on tudie une suite de couples de la forme (t, xt), o xt est lobservation de la variable linstant t.

1. DESCRIPTION D'UNE SRIE CHRONOLOGIQUE.


On distingue en gnral trois effets constitutifs dune srie chronologique : Un effet long terme, appele tendance (on ajoute parfois long terme), composante tendancielle ou trend ;

Chapitre 8

page 2

Analyse des sries chronologiques

Un effet dit saisonnier, qui rapparat intervalles rguliers ; cet effet se traduit par une composante de la srie appele composante saisonnire. Un effet inexpliqu : cet effet, que l'on suppose en gnral d au hasard, se manifeste par des variations accidentelles.

Dans les sries conomiques longues, on cite souvent un effet supplmentaire : c'est ce que l'on appelle le cycle de Kondratiev, qui rsulte du fait que, suivant la thorie de Kondratiev, une priode de prosprit conomique succde mcaniquement une priode de dpression.

1.1 Description de la tendance.


La description initiale de la tendance repose sur l'interprtation de la reprsentation graphique de la srie.

Dfinition : on appelle tendance (ou variation long terme ou trend) de la srie xt la srie ct rsultant de la totalit des effets permanents auxquels est soumise la srie xt. Exemple : Nous donnons ci-dessous les cours (en ) du titre Alcatel de code sicovam 13000 du 4 janvier (n1) au 5 mars 1999 (n45). L'unit de temps est le jour boursier, et le cours est dtermin par loffre et la demande elles-mmes dtermines par lvolution conomique. Les donnes figurent sur le site (paramtres Alcatel.par) : 1 2 3 4 5 6 7 8 9 109.500 113.200 119.700 122.350 122.900 118.250 113.550 107.700 107.400 10 11 12 13 14 15 16 17 18 103.750 105.400 101.175 101.100 100.150 96.050 96.950 101.000 103.000 19 20 21 22 23 24 25 26 27 100.100 101.800 102.450 100.600 99.200 99.200 94.375 96.350 97.250 28 29 30 31 32 33 34 35 36 94.000 94.600 96.425 94.025 95.350 94.175 96.600 97.250 98.500 37 38 39 40 41 42 43 44 45 99.950 103.150 101.250 98.450 97.550 100.000 107.050 112.900 117.400

Tableau 1.8 : Cours du titre Alcatel du 4 janvier 1999 au 5 mars 1999 La tendance peut tre dcompose en trois phases (figure 1.8) : Le cours baisse du dbut des observations (7 janvier ) jusqu' l'observation n15

(c'est--dire le 22 janvier) ;

Chapitre 8

page 3

Analyse des sries chronologiques

De l'observation n16 (25 janvier) l'observation n41 (1er mars), le cours dimi-

nue lgrement ; Il augmente rapidement partir du 2 mars.

On ne distingue pas sur la figure 1.8 de variations apparaissant intervalles rguliers : la srie n'est soumis aucun effet saisonnier visible. La composante accidentelle est visualise par les petites variations de cours d'un jour l'autre. Par exemple le cours n11 est suprieur au cours n10 : cela ne remet pas en cause la baisse de la tendance compte tenu des cours du 7 au 22 janvier.

Figure 1.8 : cours journalier du titre Alcatel (du 4 janvier 1999 au 5 mars 1999) Pour faire apparatre plus clairement la tendance, il faut attnuer la composante accidentelle. On utilise pour cela les moyennes mobiles dfinies de la faon suivante :

Dfinitions : on appelle moyenne mobile centre de longueur impaire li = 2 k +1 linstant t la mmt = (xt-k + + xt-1 + xt + xt+1 + + xt+k) / li on appelle moyenne mobile centre de longueur paire lp = 2 k linstant t la va-

valeur moyenne mmt des observations xt-k, xt-k+1, , xt, xt+1, , xt+k :

leur moyenne mmt des observations xt-k, xt-k+1, xt-k+2, xt, xt+1, , xt+k , la premire et la dernire tant pondres par 0.5 : mmt = (0.5 xt-k + xt-k+1 + + xt-1 + xt + xt+1 + + xt+k-1+ 0.5 xt+k) / lp

Chapitre 8

page 4

Analyse des sries chronologiques

Dans la premire formule, le nombre de termes de la somme est gal 2 k + 1 : il s'agit bien d'une moyenne. Dans la seconde, la somme des coefficients est gale 2 k, puisque le premier et le dernier sont gaux 0.5 : il s'agit d'une moyenne pondre. Dans les deux cas, le nombre d'observations prise en compte avant linstant t est gal au nombre d'observations prises en compte aprs linstant t : cest pour cela que les moyennes sont dites centres. La premire valeur dune moyenne mobile de longueur 4 ( = 2 x 2) ou 5 (= 2 x 2 + 1) que lon peut calculer, est linstant t = 3, puisque la premire observation connue est x1 : mm3 = (0.5 x1 + x2 + x3 + x4 + 0.5 x5) / 4 mm3 = (x1 + x2 + x3 + x4 + x5) / 5 (l = 4) (l = 5)

De faon gnrale, ne peut calculer de moyenne mobile en t = 1, t = 2, , t = k puisque les formules ne peuvent tre appliques que si l'on connat xt-k. De mme, si T est le nombre total d'observations, on ne peut calculer mmT, mmT-k+1 puisqu'il faut connatre xt+k. Lavantage des moyennes mobiles est d'attnuer la composante accidentelle tout en conservant les tendances linaires : la srie est dite lisse , et est d'autant plus lisse que la longueur de la moyenne mobile est leve comme on peut le constater sur la figure 3.8 sur laquelle nous avons reprsent les moyennes mobiles de longueur 14.

Exemple : nous donnons dans le tableau 2.8 un extrait des moyennes mobiles de longueur 5 et les reprsentations graphiques sur les figures 2.8 et 3.8 des cours du titre Alcatel et des moyennes mobiles de longueur 5 et 14. Instant 1 2 3 4 cours () 109.50000 113.20000 119.70000 122.35000 moyenne mobile Instant 42 43 44 45 cours () 100.00000 107.05000 112.90000 117.40000 moyenne mobile 103.19000 106.98000

117.53000 119.28000

Tableau 2.8 : cours du titre Alcatel du 4 janvier (n1) au 5 mars 1999 (n45) moyennes mobiles de longueur 5 (extrait) On notera que, dans les journaux financiers, les moyennes mobiles ne sont pas centres : on utilise les moyennes des 50 ou 100 dernires observations avant linstant t pour dfinir la tendance linstant t. L'inconvnient des moyennes mobiles de longueur 14 est quelles ne sont dfinies qu' partir de la 8e observation et jusqu la 38e. On ne dispose d'aucune information sur la tendance ni au dbut ni la fin de la priode d'observation. Il faut donc choisir la longueur des

Chapitre 8

page 5

Analyse des sries chronologiques

moyennes mobiles suivant le nombre d'observations et l'objectif de l'analyse. Nous verrons que la longueur de ces m.m. dpend aussi de la priode des variations saisonnires pour faire apparatre la tendance.

Figure 2.8 : cours du titre Alcatel du 4 janvier au 5 mars 1999 Moyennes mobiles de longueur 5.

Figure 3.8 : cours du titre Alcatel du 4 janvier au 5 mars 1999 Moyennes mobiles de longueur 4.

Chapitre 8

page 6

Analyse des sries chronologiques

Thorme : si la tendance dune srie chronologique xt est linaire et a pour quation ct = t + , les moyennes mobiles centres ont pour tendance la mme droite et en sont dautant plus proches que la longueur des moyennes mobiles est leve.

Ce thorme est dmontr dans un complment pdagogique. Il peut tre complt par ltude de tendance de la forme ct = 2t2 + 1t + propose en application pdagogique.

1.2 Description simultane des variations saisonnires et de la tendance.


Une variation saisonnire est caractrise par le fait qu'elle se produit intervalles de temps rguliers, d'o d'ailleurs le terme saisonnier.

Dfinition : on appelle variation saisonnire d'une srie chronologique linstant t une variation due un effet momentan se reproduisant rgulirement dans le temps.

Exemple : nous tudions la srie chronologique suivante observe trimestriellement pendant 6 ans (tableau 3.8). 1er trimestre 89.658 96.205 99.602 103.272 105.637 111.118 2e trimestre 97.593 99.399 105.192 109.644 113.428 117.215 3e trimestre 108.906 112.763 116.556 121.208 125.641 129.776 4e trimestre 114.157 119.185 121.911 126.508 131.147 133.000

Anne 1 Anne 2 Anne3 Anne 4 Anne 5 Anne 6

Tableau 3.8 : srie chronologique 1 (priode p = 4) Lobservation de chaque trimestre est soumis un effet particulier qui revient tous les ans ; il y a donc 4 variations saisonnires correspondant chacune un trimestre.

Chapitre 8

page 7

Analyse des sries chronologiques

Figure 4.8 : reprsentation graphique de la srie 1 (donnes observes trimestriellement pendant 6 ans) Dfinition : la priode note p des variations saisonnires est la longueur exprime en units de temps sparant deux variations saisonnires dues un mme phnomne.

Remarque : nous supposerons dans la suite que la srie est soumise des variations saisonnires de mme priode p. La priode est alors le nombre de variations saisonnires. Cette hypothse nest pas toujours ralise au dpart : les ventes par tranches horaires dun hypermarch sont soumises par exemple une premire variation saisonnire due lheure et une seconde due la journe. Ce cas est trait thoriquement en considrant une priode gale au plus petit commun multiple des deux priodes : deux variations saisonnires de priodes 4 et 6 donnent une variation saisonnire de priode 12 (= 3 x 4 = 2 x 6).

Il n'est pas toujours facile de distinguer la tendance lorsque la srie chronologique est soumise des variations saisonnires. La mthode mathmatique consiste calculer les moyennes mobiles en choisissant comme longueur la priode des variations saisonnires, de faon les faire disparatre. Si la moyenne mobile choisie est de longueur diffrente, les variations saisonnires ne sont pas toujours limines (cf. figures 5.8 et 6.8). Ces moyennes mobiles ont en outre l'avantage d'attnuer les variations accidentelles comme nous l'avons vu prcdemment, mais l'inconvnient de n'tre dfinies ni au dbut ni la fin de la priode observe.

Chapitre 8

page 8

Analyse des sries chronologiques

Exemple : on pourra comparer sur les figures 5.8 et 6.8 ci-dessous les moyennes mobiles de longueur 4 (dont les valeurs numriques sont donnes dans le tableau 4.8) et de longueur 5.

Figure 5.8 : reprsentation simultane de la srie 1 et des moyennes mobiles de longueur 4

Figure 6.8 : reprsentation simultane de la srie 1 et des moyennes mobiles de longueur 4 Contrairement aux m.m. de longueur 4, les m.m. de longueur 5 nliminent pas les variations saisonnires.

Thorme : les moyennes mobiles dune srie soumise des variations saisonnires de priode p ne sont pas soumises ces variations saisonnires si leur longueur l est gale la priode p, et plus gnralement si leur longueur est un multiple de la priode.

Chapitre 8

page 9

Analyse des sries chronologiques

Ce thorme est dmontr dans un complment pdagogique.

Conclusion : les moyennes mobiles dune srie chronologique dont la tendance est linaire et les variations saisonnires sont de priode p font apparatre la tendance et disparatre les variations saisonnires si leur longueur l est gale la priode p.

2. MODLISATION ET DSAISONNALISATION.
Un modle de srie chronologique est une quation prcisant la faon dont les composantes sarticulent les unes par rapport aux autres pour constituer la srie chronologique. Il existe de trs nombreux modles, et parmi eux deux modles classiques simples : le modle additif et le modle multiplicatif, auxquels nous nous limiterons. Dans les deux modles prsents, la longueur des moyennes mobiles doit tre imprativement gale la priode des variations saisonnires. Nous avons prsent dans le tableau 3.8 les donnes sous une forme particulire : en lignes, ce sont les annes, et en colonnes les trimestres : le terme xt correspondant la te observation est alors not xi,j, i donnant l'anne (la ligne) et j le trimestre (la colonne). La relation entre les indices i et j dune part et linstant t dautre part est la suivante : t = (i-1) p + j Exemple : j=1 j=2 i=1 t=1 t=2 i=2 t=5 t=6 j=3 t=3 t=7 j=4 t=4 t=8

i = 3 t = 9 t = 1 t = 11 t = 12 Exemple pour n = 3 et p = 4 Nous utiliserons cette notation trs souvent dans la suite du texte.

2.1 Modle additif de srie chronologique.


La srie chronologique xt se dcompose en une tendance note ct, des variations saisonnires st de priode p (gales s1, s2, s3, , sp) et d'une composante accidentelle et.

Chapitre 8

page 10

Analyse des sries chronologiques

Le modle le plus simple est le modle additif, dans lequel la variation saisonnire s'ajoute simplement la tendance : pour tout t = 1, , T xt = ct + st + et

Le modle additif s'exprime donc en gnral de la faon suivante : pour tout i = 1, , n pour tout j = 1, , p xi,j = ci,j + sj + ei,j

Le terme sj caractrise la variation saisonnire linstant j de chaque priode i : du trimestre j dans le cas particulier des sries 1 et 2 (p = 4), du mois j dans des donnes mensuelles (p = 12) etc. Les moyennes mobiles seront aussi notes mmi,j. Dfinition : les termes sj du modle additif exprim sous la forme prcdente sont appels coefficients saisonniers du modle additif.

On peut calculer la diffrence entre l'observation et la tendance : pour tout i = 1, , n pour tout j = 1, , p xi,j ci,j = sj + ei,j

Pour un mme trimestre, la diffrence entre l'observation et la tendance est donc peu prs constant et gale sj (on suppose que la composante accidentelle est relativement faible). Nous avons vu prcdemment que les moyennes mobiles de longueur l gale la priode des variations saisonnires sont des approximations de la tendance. On peut donc considrer que la diffrence entre une observation xi,j et la moyenne mobile mmi,j correspondante est peu prs constante pour j fix : pour tout i = 1, , n pour tout j = 1, , p xi,j mmi,j sj

Cette proprit est recherche sur la reprsentation graphique de la srie xt pour dterminer si cette srie suit un modle additif ou non. Elle peut tre observe sur la figure 5.8 dans laquelle la tendance est caractrise par les moyennes mobiles de longueur 4 : les diffrences entre x3 et mm3, entre x7 et mm7, entre x11 et c11 sont peu prs constantes, de mme les diffrences entre x4 et mm4, x8 et mm8, x12 et mm12 etc. On peut en dduire les diffrences xi,j mmi,j. Les moyennes mobiles donnant une premire approximation de la tendance ci,j, les colonnes du tableau des diffrences contiennent des approximations des coefficients sj.

Chapitre 8

page 11

Analyse des sries chronologiques

Exemple : Les moyennes mobiles et par suite diffrences xi,j mmi,j ne sont pas dfinies aux premier et deuxime trimestres de la premire anne, ni aux troisime et quatrime trimestres de la dernire (tableaux 4.8 et 5.8). 1er trimestre Anne 1 Anne 2 Anne3 Anne 4 Anne 5 Anne 6 105.14860 109.65950 113.42748 117.24943 121.79719 2e trimestre 106.25917 110.47448 114.58360 118.38337 122.54573 3e trimestre 4e trimestre 103.39678 104.44080 107.31233 108.46116 111.27404 112.28937 115.45379 116.22236 119.64839 120.80691

Tableau 4.8 : moyennes mobiles de longueur 4 de la srie 1 1er trimestre Anne 1 Anne 2 Anne3 Anne 4 Anne 5 Anne 6 -8.94393 -10.05746 -10.15538 -11.61263 -10.67929 2e trimestre -6.86050 -5.28258 -4.93910 -4.95497 -5.33023 3e trimestre 4e trimestre 5.50932 9.71580 5.45047 10.72334 5.28226 9.62153 5.75471 10.28534 5.99271 10.33979

Tableau 5.8 : diffrences entre les observations et les moyennes mobiles de la srie 1 Les diffrences apparaissant dans une mme colonne sont proches les uns des autres et caractrisent le modle additif.

Les diffrences xi,j mmi,j sont donc des approximations des coefficients sj. Leur moyenne (ou leur mdiane) , pour chaque colonne j, donne une premire estimation sj': 1 n sj' = (xi,j mmi,j) n i=1 On obtiendra enfin les estimations dfinitives sj en centrant ces termes sj: on calcule la moyenne des sj: 1 ms' = (s1' + s2' + + sp') p

Chapitre 8

page 12

Analyse des sries chronologiques

on centre en posant : pour tout j =1, , p sj = sj' ms'

Exemple : le tableau 5.8 donne les diffrences entre les observations et les moyennes mobiles. On en dduit les moyennes suivantes : s1' = -10.2897 s2' = -5.4735 s3' = 5.5979 s4' = 10.1371

On calcule la moyenne des sj' : ms' = -0.007039938 Les valeurs dfinitives sont obtenues en posant sj = sj' ms': s1 = -10.2827 s2 = -5.4664 s3 = 5.6049 s4 = 10.1442

rgle de calcul des estimations des coefficients saisonniers du modle additif on calcule les diffrences entre les observations et les moyennes mobiles ; on calcule la moyenne ou la mdiane sj des diffrences de chaque colonne du tableau ; on calcule la moyenne ms' de ces valeurs sj' ; on obtient les estimations sj en centrant les valeurs sj : sj = sj' ms'.

2.2 Modle multiplicatif de srie chronologique.


Le second modle que nous tudions ici est le modle multiplicatif suivant : pour tout t = 1, , T xt = ct (1 + st) + et

En prsentant les donnes comme dans le paragraphe prcdent, le modle multiplicatif s'exprime de la faon suivante : pour tout i = 1, , n pour tout j = 1, , p xi,j = ci,j ( 1 + sj ) + ei,j

Le terme sj caractrise la variation saisonnire du trimestre j dans le cas particulier des sries 1 et 2, du mois j dans des donnes mensuelles etc. On peut calculer la diffrence entre l'observation et la tendance : pour tout i = 1, , n pour tout j = 1, , p
er

xi,j ci,j = ci,j sj + ei,j

Considrons le cas particulier j = 1 (1 trimestre de lanne i). pour tout i = 1, , n xi,1 ci,1 = ci,1 s1 + ei,1

Chapitre 8

page 13

Analyse des sries chronologiques

La diffrence xi,1 ci,1 entre l'observation et la tendance est proportionnelle la tendance ci,1 : lorsque cette tendance est croissante, la diffrence augmente, lorsqu'elle est dcroissante, il diminue. Le mme raisonnement peut videmment tre tenu pour j fix quelconque. Les diffrences permettent ainsi de dterminer si la srie chronologique tudie suit un modle multiplicatif. Exemple : on considre la srie chronologique ci-dessous : 1er trimestre 2e trimestre 3e trimestre 4e trimestre 224.3705 253.2811 201.2421 248.9411 274.3802 300.1641 248.9038 298.4386 331.9657 371.4032 303.4313 365.9029 406.6326 437.9967 361.5774 444.8447 488.4166 536.5268 435.5698 549.3614 598.0016 659.2896 533.2156 669.2675 Tableau 6.8 : srie chronologique 2 (modle multiplicatif , priode p = 4)

Anne 1 Anne 2 Anne 3 Anne 4 Anne 5 Anne 6

Figure 7.8 : srie 2 et moyennes mobiles de longueur 4 Cette srie est soumise des variations saisonnires de priode 4 ; la tendance, caractrise par les moyennes mobiles de longueur 4, est croissante, et la diffrence entre une observation xt et la moyenne mobile mmt a tendance augmenter pour une mme variation saisonnire : l Les diffrences entre x3 et mm3, entre x7 et mm7, entre x11 et c11 augmentent visiblement, de mme que les diffrences entre x4 et mm4, x8 et mm8, x12 et mm12 etc. (figure 7.8).

Chapitre 8

page 14

Analyse des sries chronologiques

Pour quantifier les variations saisonnires, on considre les rapports xi,j / ci,j : pour tout i = 1, , n pour tout j = 1, , p xi,j / ci,j = 1 + sj + ei,j / ci,j En considrant que les variations accidentelles ei,j sont faibles par rapport la tendance ci,j et en utilisant l'approximation de la tendance par les moyennes mobiles, on constate donc que les rapports x3 / mm3, x7 / mm7, x11/mm11, sont peu prs constants et donnent une approximation de 1 + s3, de mme les rapports x4 / mm4, x8 / mm8, x12 / mm12 etc. donnent une approximation de 1 + s4 : xi,j pour tout j = 1, , p

= 1 + sj = S j

mmi,j Exemple : les tableaux 7.8 et 8.8 ci-dessous contiennent les moyennes mobiles de la srie et les rapports xi, j / mmi,j. 1er trimestre 2e trimestre Anne 1 Anne 2 Anne3 Anne 4 Anne 5 Anne 6 262.140 319.494 385.759 467.090 572.761 274.284 334.743 402.895 489.404 599.955 3e trimestre 238.210 287.670 352.509 422.986 516.167 4e trimestre 250.322 303.773 370.167 445.525 545.210

Tableau 7.8 : moyennes mobiles de longueur 4 de la srie 2 1er trimestre Anne 1 Anne 2 Anne3 Anne 4 Anne 5 Anne 6 1.04670 1.03904 1.05411 1.04566 1.04407 2e trimestre 1.09435 1.10952 1.08712 1.09629 1.09890 3e trimestre 0.84481 0.86524 0.86078 0.85482 0.84385 4e trimestre 0.99449 0.98244 0.98848 0.99847 1.00761

Tableau 8.8 : rapports des observations aux moyennes mobiles de la srie 2 Les rapports dans chaque colonne du tableau 8.8 sont peu prs constants.

Les rapports xi,j / mmi,j sont donc des approximations des termes 1 + sj que l'on appelle coefficients saisonniers dans le cas du modle multiplicatif.

Dfinition : les termes Sj = 1 + sj du modle multiplicatif exprim sous la forme prcdente sont appels coefficients saisonniers du modle multiplicatif.

Chapitre 8

page 15

Analyse des sries chronologiques

On obtient des premires estimations Sj' des coefficients saisonniers en calculant la moyenne (ou la mdiane) des rapports figurant dans chaque colonne. Par analogie avec les coefficients saisonniers sj du modle additif, dont la moyenne est gale 0, on cherche des estimations dfinitives Sj de moyenne 1 : on calcule la moyenne : 1 mS' = (S1' + S2' + + Sp') p on pose : pour tout j =1, , p Sj = Sj' / mS'

Les coefficients saisonniers estims Sj sont ainsi de somme p : 1 S1 + S2 + + Sp = ( S1 + S2 + + Sp ) mS = p ce qui quivaut une moyenne des sj gale 0 puisque l'on a Sj = 1 + sj. Exemple : le tableau 8.8 donne les rapports des observations aux moyennes mobiles. on en dduit les moyennes suivantes : S1' = 1.045913 S2' = 1.097236 S3' = 0.8539006 S4' = 0.9942986

on calcule la moyennes des Sj' : mS' = .9978371 les valeurs dfinitives sont obtenues de faon que les Sj' soient de moyenne 1 : S1 = 1.04818 S2 = 1.099614 S3 = 0.8557515 S4 = 0.9964539

rgle de calcul des estimations des coefficients saisonniers du modle multiplicatif on calcule les rapports des observations aux moyennes mobiles ; on calcule la moyenne ou la mdiane des rapports Sj de chaque colonne du tableau ; on calcule la moyenne mS de ces valeurs ; on obtient les estimations Sj en posant Sj=Sj / mS.

Chapitre 8

page 16

Analyse des sries chronologiques

2.3 Dsaisonnalisation.
Les coefficients saisonniers permettent d'liminer d'une observation les effets de la variation saisonnire correspondante. On obtient ainsi les valeurs corriges des variations saisonnires, ou encore les valeurs dsaisonnalises. L'avantage de cette dsaisonnalisation est de permettre la comparaison de deux observations soumises des variations saisonnires diffrentes.

dfinition : on appelle observation corrige des variations saisonnires la valeur xi,j' obtenue en liminant l'effet saisonnier sur la valeur xi,j. modle additif : modle multiplicatif : xi,j' = xi,j sj xi,j' = xi,j / Sj

Les valeurs corriges des variations saisonnires (expression souvent abrge par c.v.s.) caractrisent la fois la tendance et la variation accidentelle.

Exemple : on donne ci-dessous les quatre dernires observations de la srie 2 (anne 6) et les valeurs corriges des variations saisonnires : 1er trimestre observations : 598.00160 valeur c.v.s. : 570.51396 2e trimestre 659.28960 599.56452 3e trimestre 533.21560 623.09629 4e trimestre 669.26750 671.64924

L'observation du deuxime trimestre est largement suprieure celle du troisime, mais c'est l'inverse pour les valeurs c.v.s. : la tendance est reste croissante au troisime trimestre. Supposons que l'observation du premier trimestre de l'anne 7 soit gale 720.15. Pour savoir si la tendance est reste la hausse, on calcule la valeur dsaisonnalise : x7,1' = 720.15/1.04818 = 687.04771 et on la compare la valeur dsaisonnalise du quatrime trimestre de l'anne prcdente : x6,4' = 671.649 La valeur c.v.s. x7,1' est suprieur x6,4'. La tendance est reste la hausse si la diffrence est suprieure la variation accidentelle . Il faudrait donc comparer cette diffrence

Chapitre 8

page 17

Analyse des sries chronologiques

lcart type des variations accidentelles, calcul sur les donnes antrieures. Il semble que dans la pratique, cette comparaison ne soit gure effectue.

3. FILTRE DE BUYS-BALLOT.
Le filtre de Buys-Ballot concerne les sries chronologiques suivant un modle additif et dont la tendance est linaire. Il consiste estimer les paramtres de ce modle suivant le critre des moindres carrs, et permet ensuite, dans la mesure o les hypothses sont respectes, d'effectuer des prvisions. Il sagit en fait dune rgression linaire multiple particulire. Lorsque la srie suit le modle multiplicatif et que la tendance est exponentielle, les logarithmes des observations vrifient les conditions prcdentes. On peut alors appliquer le filtre de Buys-Ballot.

3.1 Filtre de Buys-Ballot.


Nous supposons donc que la srie tudie suit le modle additif et que la tendance est linaire : ct = t + Pour exprimer la tendance en fonction de la ligne i et de la colonne j du tableau, nous utilsons la relation et les variables t, i et j donnes prcdemment : t = (i-1) p + j dans laquelle i varie de 1 n, j de 1 p. Le nombre total T d'observations est gal n p. Le modle complet est le suivant : pour tout i = 1, , n pour tout j = 1, , p xi,j = [(i-1) p + j ] + + j + i,j Les coefficients en caractres grecs sont des coefficients thoriques quil sagit destimer : on retrouve ici la notation employe dans le chapitre prcdent. Les observations de la variable explique sont notes ici xi,j, et les variables explicatives sont le temps t et p variables particulires qui napparaissent pas directement dans la formule et dont les coefficients de rgression sont les variations saisonnires j.

Chapitre 8

page 18

Analyse des sries chronologiques

Le critre des moindres carrs consiste dterminer les paramtres b, a, s1, s2, , sp de faon minimiser la somme des carrs des diffrences ei,j = xi,j [( b (i-1) p + j + a + sj ] entre la valeur observe xi,j et la valeur estime par le modle b [(i-1) p + j ] + a + sj. Les valeurs obtenues sont des estimations des paramtres thoriques , , j. Le coefficient de corrlation du modle est le coefficient de corrlation entre les valeurs observes xi,j et les valeurs estimes xi,j. On calculera les estimations des paramtres laide des formules suivantes : 2 b =
_______________

p ( n2 1)

n n ( n + 1) ____________ [ i mi . m] i=1 2

a sj

= =

m b ( n p + 1)/2 m.j m b [ j ( p + 1 )/2 ]

avec les notations suivantes : m : moyenne de la totalit des observations mi. : moyenne des observations de la ligne i m.j : moyenne des observations de la colonne j dfinition : les termes ei,j = xi,j [ [ b (i-1) p + j ] + a + sj ] sont appels rsidus. Comme en rgression, la variance des rsidus s2 dpend du coefficient de corrlation r et de la variance x2 des observations xi,j de la variable explique : s2 = x2 ( 1 r2) Linterprtation du coefficient de corrlation est dlicate dans le cas des sries chronologiques. Il est souvent trs lev (une valeur de 0.98 nest pas rare) sans que lon puisse en dduire directement que lajustement obtenu est satisfaisant. Cette particularit est due au fait que la variable temps est ordonne. Ds lors, il suffit que la tendance soit croissante ou dcroissante pour que le coefficient de corrlation soit leve. Mais il ne donne aucun renseignement sur la nature de la tendance, qui peut tre exponentielle ou linaire etc.

Chapitre 8

page 19

Analyse des sries chronologiques

Exemple : le modle additif et l'hypothse de linarit de la tendance de la srie 1 sont confirms par la reprsentation graphique (figure 8.8).

Figure 8.8 : reprsentation simultane de la srie 1, de la tendance et des valeurs estimes par le modle Nous donnons les rsultats partiels suivants : annes 1 2 3 4 5 6 moyennes annuelles mi. 102.57846 106.88766 110.81528 115.15820 118.96325 122.77737 produits i mi. 102.57846 213.77531 332.44585 460.63280 594.81625 736.66425

On en dduit le modle estim par le filtre de Buys-Ballot : b = 1.011173 s1 = -10.43134 s3 = 5.77288 r = 0.99791 a = 100.2237 s2 = -5.27912 s4 = 9.93759 s = 0.5641465

Tableau 9.8 : paramtres du modle linaire additif estims par le filtre de Buys-Ballot sur la srie 1 L'ajustement peut tre considr comme trs prcis puisque le coefficient de corrlation entre les observations xi,j et les estimations xi,j' est gal 0.99791. La srie 1 n'est pas une srie relle : elle a t obtenue par simulation du modle linaire additif avec comme paramtres thoriques : xt = t + + t + t

= 1, = 100, t N(0,1), 1 = -10, 2 = -5, 3 = 5, 4 = 10.

Chapitre 8

page 20

Analyse des sries chronologiques

Les valeurs estimes sont visiblement trs proches des valeurs thoriques. La mthode statistique permet donc de retrouver partir des observations les valeurs des paramtres utiliss pour gnrer les donnes. Cest le moins quon pouvait en attendre.

3.2 Validation du modle linaire et prvision.


Pour effectuer la prvision xi,jp de la srie chronologique linstant t = (i-1) p + j, on remplace dans le modle thorique les paramtres par leurs estimations : xi,jp = b [(i-1) p + j ] + a + sj Ces prvisions ponctuelles peuvent tre compltes par des prvisions par intervalle de confiance, comme en rgression, mais nous ne donnerons pas les formules trop complexes pour tre utilises facilement.

Exemple : Les valeurs estimes par le modle sont donnes par la formule : xi,j = 1.011173 [ (i-1) 4 + j ] + 100.2237 + sj avec : s1 = -10.43134 s2 = -5.27912 s3 = 5.77288 s4 = 9.93759

Les prvisions concernant l'anne 7 sont les suivantes : x7,1p = 115.07169 x7,2p = 121.23509 x7,3p = 133.29826 x7,4p = 138.47414

Les prvisions que l'on peut effectuer aprs l'estimation des paramtres ne sont justifies que dans la mesure o les hypothses du modles sont respectes. Une hypothse fondamentale pour la prvision et souvent nglige est que les conditions dans lesquelles la srie chronologique volue sont les mmes la date de la prvision que dans le pass. Il faut noter que cette condition nest pas toujours vrifie, par leffet de la prvision elle-mme : par exemple, un hypermarch qui prvoit une baisse de son chiffre daffaires va prendre des mesures de rduction de cot, augmenter sa publicit etc., de faon augmenter ses ventes : les dcisions vont donc lencontre de la prvision. Il est indispensable en outre de contrler statistiquement le modle. Pour cela, on tudie les rsidus ei,j. Ces rsidus possdent les proprits mathmatiques habituelles en rgres-

Chapitre 8

page 21

Analyse des sries chronologiques

sion : ils sont centrs, indpendants de la variable explicative (ici le temps). Les rsidus de chaque trimestre sont en outre de moyenne nulle. Pour que le modle soit valide, leur rpartition doit tre proche de la loi normale. Ils ne doivent prsenter pas d'volution particulire dans le temps, ce que lon peut vrifier par une reprsentation graphique ou par des tests (tests de Durbin et Watson, sur le coefficient dautocorrlation de rang 1). Rappelons enfin que la prvision xi,jp est la prvision de la moyenne des observations pour t fix : lintervalle de confiance donn par certains logiciels est celui de cette moyenne, et non de la valeur individuelle linstant t.

4. LISSAGE EXPONENTIEL.

4.1 Gnralits sur le lissage exponentiel.


Le lissage exponentiel est une classe de mthodes de lissage de sries chronologiques dont l'objectif est la prvision court terme. Ces mthodes sont fondes sur une hypothse fondamentale : chaque observation linstant t dpend des observations prcdentes et d'une variation accidentelle, et cette dpendance est plus ou moins stable dans le temps. L'estimation xtp de la srie linstant t connaissant xt-1 est donc obtenue par une formule de la forme : xtp = t-1 x0 + t-2x1 + t-3 x2 + . + 0 xt-1 On peut gnraliser cette formule au cas o seule l'observation xt-h est connue : xtp = t-h x0 + t-h-1 x1 + t-h-2 x2 + . + 0 xt-h Dans le premier cas, on peut prvoir lhorizon 1 : sachant xt, on prvoit xt+1, l'observation suivante, et dans le cas gnral, on peut prvoir l'horizon h : sachant xt, on prvoit xt+h. On peut penser que plus l'horizon h est faible, meilleure est la prvision. Les mthodes de lissage exponentiel consistent choisir les coefficients j en fonction de la srie tudie. Dans le cas o la srie est stationnaire (on ne distingue pas de tendance la hausse j = j / (1 ) ni la baisse), on utilise le lissage exponentiel simple. Les coefficients j sont de la forme :

Chapitre 8

page 22

Analyse des sries chronologiques

o est la constante de lissage choisie de faon empirique entre 0 et 1. La valeur 1/ est parfois appele ge moyen du lissage. Lorsque la srie prsente une tendance linaire par morceaux (la tendance peut tre

considre comme linaire sur une suite de quelques observations), et n'est soumise aucune variation saisonnire, on effectue les prvisions l'aide du double lissage exponentiel. En effet, en appliquant deux fois le lissage exponentiel simple, on dtermine une suite de droites de tendance qui ajustent les observations. Dans le cas dune srie soumise des variations saisonnires, on utilise souvent le

modle de Holt et Winters, que nous expliquons rapidement dans le paragraphe 4.2.

Dans les lissages exponentiels simple et double, il y a donc une seule constante fixer. Le choix peut tre empirique, cest--dire effectu par lutilisateur en fonction de la connaissance quil a de la srie. Lorsque la valeur xt ne dpend gure que des 3 ou 4 dernires observations, on peut choisir la constante proche de 1. Inversement, si les observations antrieures gardent longtemps une influence sur la valeur xt, on choisira proche de 0. On peut aussi dterminer la constante de faon minimiser la somme des carrs des erreurs commises pour lhorizon h fix. Certains programmes proposent cette option.

Exemple : la figure 9.8 ci-dessous montre l'ajustement obtenu l'horizon 1 du cours de laction Alcatel par un double lissage exponentiel.

Figure 9.8 : cours du titre Alcatel et prvision lhorizon 1 par double lissage exponentiel ( = 0.65)

Chapitre 8

page 23

Analyse des sries chronologiques

La constante de lissage a t dtermine de faon minimiser la somme des carrs des erreurs ( = 0.65). La valeur prvue suit la srie avec retard. Le cours prvu linstant t = 46 (8 mars 1999) est gal 122.22 ; le cours moyen observ de la sance est de 118 : la prvision nest pas trs satisfaisante. Les mthodes de prvision ne donnent pas de bons rsultats sur les cours en Bourse (sinon, cela se saurait !).

4.2 Modle de Holt et Winters.


La mthode de Holt et Winters permet en effet d'effectuer des prvisions sur des sries chronologiques assez irrgulires et soumises ou non des variations saisonnires suivant un modle additif ou multiplicatif. Elle consiste en trois lissages exponentiels simultans. On dfinit donc trois paramtres, nots , et . A chaque instant t, elle donne une estimation : de la tendance du coefficient saisonnier correspondant de la valeur observe.

On peut choisir les coefficients arbitrairement : faibles si l'on considre que la valeur linstant t dpend d'un grand nombre d'observations antrieures, levs dans le cas contraire. On peut aussi en calculer les valeurs optimales, en minimisant la somme des carrs des diffrences entre les valeurs observes et estimes. On procde ensuite aux prvisions, en considrant que la tendance suit un modle linaire additif ou multiplicatif trs court terme.

Exemple : on tudie ici la srie constitue du nombre trimestriel de naissances dans la rgion Centre. La figure 10.8 montre une tendance assez irrgulire, avec des variations saisonnires de priode 4. Le filtre de Buys-Ballot n'est visiblement pas adapt dans ce cas particulier, et nous appliquons ici le modle de Holt et Winters. Nous choisissons comme modle un modle dont la tendance court terme est linaire (ici, on se limite examiner une succession de quelques points), et les variations de priode 4 additives. Nous fixons l'horizon 4 pour disposer des prvisions de toute l'anne 1986.

Chapitre 8

page 24

Analyse des sries chronologiques

Figure 10.8 : nombre de naissances dans la rgion Centre de 1972 1985 Moyennes mobiles de longueur 4. Les paramtres optimaux que l'on obtient en minimisant la somme des carrs de la totalit des rsidus sont : = 0.9, = 0.9, = 0.1.

Figure 11.8 : nombre de naissances dans la rgion Centre de 1972 1985 Estimations par le modle de Holt et Winters et prvision pour 1986 Le tableau 10.8 permet de comparer prvisions et observations de l'anne 1986 : les naissances aux deux premiers trimestres ne sont pas trs bien estimes, contrairement aux deux dernires. 1er trimestre observations 7018 prvisions 6824 2e trimestre 7720 7410 3e trimestre 7415 7405 4e trimestre 6986 6984

Tableau 10.8 : nombre de naissances dans la rgion Centre observs et prvus en 1986

Chapitre 8

page 25

Analyse des sries chronologiques

CONCLUSION
L'analyse des sries chronologiques est un des objectifs fondamentaux de la statistique. Nous insistons sur le fait, que quelle que soit la mthode utilise, il faut tre vigilant sur les prvisions effectues qui peuvent tre dans certains cas totalement aberrantes (cf. Bensaber et Bleuse-Trillon, p. 123, propos du modle de Holt et Winters). Nous conseillons fortement aux praticiens de se limiter aux mthodes quils connaissent lorsquils effectuent leurs prvisions. Le logiciel quils utilisent doit tre sr, contrl : il nous est arriv dobtenir des rsultats diffrents sur les mmes donnes et par la mme mthode en employant deux logiciels diffrents, ou daboutir des prvisions manifestement fausses puisque diffrentes des valeurs donnes dans les ouvrages de rfrence.

Chapitre 8

page 26

Analyse des sries chronologiques

TABLE DES MATIERES 1. DESCRIPTION D'UNE SRIE CHRONOLOGIQUE. ............................................ 1 1.1 Description de la tendance.................................................................................... 2 1.2 Description simultane des variations saisonnires et de la tendance.................. 6 2. MODLISATION ET DSAISONNALISATION. .................................................. 9 2.1 Modle additif de srie chronologique. ................................................................ 9 2.2 Modle multiplicatif de srie chronologique...................................................... 12 2.3 Dsaisonnalisation.............................................................................................. 16 3. FILTRE DE BUYS-BALLOT. ................................................................................ 17 3.1 Filtre de Buys-Ballot. ......................................................................................... 17 3.2 Validation du modle linaire et prvision......................................................... 20 4. LISSAGE EXPONENTIEL. .................................................................................... 21 4.1 Gnralits sur le lissage exponentiel................................................................. 21 4.2 Modle de Holt et Winters. ................................................................................ 23 CONCLUSION ............................................................................................................ 25

Vous aimerez peut-être aussi