Vous êtes sur la page 1sur 68

Retrouver ce titre sur Numilog.

com
Retrouver ce titre sur Numilog.com

Dans la même série

ANTONIADIS A., BERRUYER J, et CARMONA R., R é g r e s s i o n non


linéaire et applications.
ARTUS P., DELEAU M. et MALGRANGE P., M o d é l i s a t i o n m a c r o -
économique.
BOSQD, et LECOUTRE J.-P , Théorie de l'estimation fonctionnelle.
B R I L L E T J.-L. M o d é l i s a t i o n économétrique - Principes et
techniques.
FRACHOT A. et GOURIEROUX C., Titrisation et r e m b o u r s e m e n t s
anticipés.
GOURIEROUX C., Econométrie des variables qualitatives (2e éd,).
GOURIEROUX C., Modèles Arch et a p p l i c a t i o n s financières.
GOURIEROUX C., Théorie des sondages
GOURIEROUX C. et MONFORT A,, Séries temporelles et modèles
dynamiques (2e éd.).
Statistique et modèles économétriques.
— Vol. 1 : Notions générales, estimation, prévision,
algorithmes.
— Vol. 2 : Tests, r é g i o n s de c o n f i a n c e , choix de modèles,
théorie asymptotique.
GRANDMONT J.-M., Monnaie et valeur.
HENRIET D. et ROCHET J.-C., Microéconomie de l'assurance.

LAFFONT J, J , Cours de théorie microéconomique.


— Vol. 1 : F o n d e m e n t s de l ' é c o n o m i e p u b l i q u e . C o u r s de
théorie microéconomique.
— Vol. 2 : Economie de l'incertain et de l'information.
LESOURNE J., Economie de l'ordre et du désordre.
LOLLIVIER S., Exercices de microéconomie.
MICHEL G., L'économie française,
Retrouver ce titre sur Numilog.com

MONFORT A., Cours de probabilités (2e éd.).


MONFORT A., Cours de statistique mathématique (2e éd.).
MUET P.-A., Théories et modèles de la macroéconomie - Tome 1 :
L'équilibre de courte période (4e éd.).
PATAT J.-P., Monnaie, institutions financières et politique
monétaire (5e éd.).
PISANI-FERRY J., STERDYNIAK H. et VILLA P., Problèmes de
macroéconomie.
SALANIÉ B., Théorie des contrats.
TIROLE J., Théorie de l'organisation industrielle - Tome 1 et
Tome 2.
VOLLE M., Analyse des données (3e éd.).
Retrouver ce titre sur Numilog.com

COLLECTION « ÉCONOMIE ET STATISTIQUES AVANCÉES »


Série : Ecole Nationale de la Statistique et de l'Administration Economique
et Centre d'Etudes des Programmes Economiques

Christian Alain
GOURIEROUX MONFORT
Professeurs à l'ENSAE

SERIES
TEMPORELLES
ET M O D E L E S
DYNAMIQUES
2e édition

ECONOMICA
49, rue Héricart, 75015 Paris '
Retrouver ce titre sur Numilog.com

@ Ed. ECONOMICA, 1995


Tous droits de reproduction,-de traduction, d'adaptation et d'exécution
résèrvés-po^r tous les pays.
Retrouver ce titre sur Numilog.com

Avant-propos

L'étude de l'évolution temporelle d'une ou plusieurs variables a, depuis


longtemps, intéressé des spécialistes de domaines très variés. Les probabi-
listes ont construit une importante théorie mathématique, la théorie des
processus stochastiques, qui permet d'analyser avec un très grand degré
de finesse les propriétés d'un ensemble de variables aléatoires indicées par
le temps. Les théoriciens de la statistique ont proposé diverses approches
des problèmes d'estimation, de tests, de prévision et de filtrage pour les
processus stochastiques. Des praticiens appartenant à des domaines très
variés (physique, automatique, économie,...) ont développé des techniques
adaptées à leurs problèmes spécifiques et ont ainsi créé une grande gamme
d'outils d'analyse qui n'est pas toujours reliée très clairement à la littéra-
ture théorique.
Devant cet ensemble vaste et hétéroclite, l'étudiant intéressé par l'ana-
lyse des séries économiques peut se trouver quelque peu désemparé, et
l'objectif de ce livre est de l'aider le plus possible dans son apprentissage.
Pour que cette aide soit efficace, il nous a semblé qu'il fallait éviter deux
écueils : une abstraction trop grande et, à l'opposé, un empirisme sans
aucun support théorique. Nous avons donc essayé de progresser au mieux
entre ces écueils en n'hésitant pas à prendre quelque liberté avec la rigueur
mathématique quand son coût devenait trop élevé ou risquait de nuire à
l'intuition et, à l'inverse, en mettant en lumière les éventuelles faiblesses
théoriques de techniques d'usage courant.
Par ailleurs, nous avons tenté de présenter de manière synthétique des
problèmes d'origines diverses : des problèmes d'origine statistique comme
la désaisonnalisation et la prévision, des problèmes d'origine économétrique
comme la causalité, l'exogénéité, la cointégration, les anticipations et des
problèmes issus de l'automatique comme le filtrage et le lissage de Kal-
man. Nous pensons en effet que ces diverses approches sont utiles à la
modélisation des séries économiques et qu'elles permettent d'apporter des
éclairages complémentaires à de nombreuses questions.
Retrouver ce titre sur Numilog.com

Le livre est organisé de la façon suivante. Le premier chapitre est


consacré à une présentation générale des problèmes et des méthodes de
traitement. Le deuxième chapitre montre, de façon détaillée, comment la
régression linéaire peut être appliquée aux problèmes liés à la saisonnalité
et à la prévision. Les méthodes de désaisonnalisation par des moyennes mo-
biles sont décrites dans le chapitre 3. Le chapitre 4 présente l'application
des méthodes de lissage exponentiel au problème de la prévision. Le cha-
pitre 5 fournit les outils probabilistes nécessaires à l'étude des méthodes
de prévision récentes proposées par Box et Jenkins ; ces méthodes sont
décrites dans le chapitre 6. Le chapitre 7 introduit la notion de séries tem-
porelles multivariées et le chapitre 8 étudie leurs diverses représentations.
Le chapitre 9 s'intéresse aux problèmes statistiques (estimations et tests)
posés par les séries stationnaires. Le chapitre 10 utilise les techniques de
séries temporelles pour étudier des notions économétriques de causalité,
d'exogénéité et de multiplicateurs. Le chapitre I l aborde les problèmes
de modélisation économétrique spécifiques aux séries non stationnaires. Le
chapitre 12 traite des anticipations. Les chapitres 13 et 14 regroupent les
problèmes statistiques liés aux modèles économétriques stationnaires ou
non stationnaires. Le chapitre 15 présente les modèles espace d'états et le
filtrage de Kalman, tandis que le chapitre 16 présente des applications de
ces techniques à l'économétrie. La deuxième édition intègre les développe-
ments récents de l'économétrie des processus non stationnaires.
Retrouver ce titre sur Numilog.com

CHAPITRE 1

Généralités

1.1 Définition d'une série temporelle


La mise en évidence de mécanismes économiques et la prise de déci-
sions supposent que l'on dispose de plusieurs observations des variables
importantes afin d'étudier les liaisons qui existent entre elles. L'impossi-
bilité d'expériences contrôlées dans la plupart des domaines économiques
fait que ces observations sont souvent obtenues au moyen d'enquêtes ou
par exploitation de divers fichiers et sont disponibles, par exemple, une fois
par an ou une fois pa trimestre. Il s'agit donc d'observations répétées, cor-
respondant à des dates différentes. La suite des observations d'une variable
(Yf, t e T) est appelée série temporelle ou série chronologique.
Les dates d'observations sont en général équidistantes les unes des
autres : c'est le cas de séries mensuelles, trimestrielles... L'année contient
alors un nombre entier s d'intervalles séparant deux dates d'observations
successives : s = 12 pour une série mensuelle, s = 4 pour une série trimes-
trielle... Les dates équidistantes sont dans la suite indexées par des entiers :
t = 1,..., T où T désigne le nombre d'observations.
Signalons que dans des domaines autres qu'économiques, certains ca-
ractères (température, hygrométrie,...) sont observés de façon continue
dans le temps au moyen d'appareils physiques. L'indice t est alors à valeur
dans un intervalle de M. Ce cas est très différent du précédent, puisqu'une
infinité d'observations est disponible ; il ne sera pas étudié dans la suite.
Les observations peuvent correspondre à des flux ou à des niveaux.
La consommation mensuelle de pétrole est un flux ; chaque observation
correspond à une période. Pour que ces observations soient directement
comparables, il faudrait que les longueurs des périodes soient les mêmes.
Dans le cas des consommations mensuelles, cette longueur est de 28, 29,
30 ou 31 jours et il peut être nécessaire de corriger la série brute. Une
façon simple d'y parvenir consiste à calculer la consommation journalière
moyenne pour chacun des mois. Dans le cas d'un niveau, les observations
Retrouver ce titre sur Numilog.com

correspondent à des dates précises. La valeur journalière du dollar en francs


à l'ouverture du marché boursier est un exemple de niveau. Notons qu'un
flux peut toujours être considéré comme la différence de deux niveaux.

1.2 Exemples de séries temporelles


Donnons deux exemples de séries chronologiques qui seront utilisés
dans la suite p o u r illustrer les diverses méthodes étudiées.

A. I n d i c e m e n s u e l des p r i x à la c o n s o m m a t i o n

Tableau 1.1

Source : INSEE.

B. Trafic voyageur
Les données concernent le trafic voyageur de la SNCF en deuxième
classe. Elles sont exprimées en millions de voyageurs kilomètres. Les ob-
servations mensuelles portent sur la période 1963-1980.
Retrouver ce titre sur Numilog.com

Tableau 1.2

1.3 Représentation graphique


Les séries sont habituellement présentées dans un repère orthornormé
comportant en ordonnée les valeurs des observations et en abscisse les dates
correspondantes. L'évolution de l'indice mensuel des prix à la consomma-
tion entre les mois de janvier 1970 et de décembre 1978 (tableau 1.1) est
par exemple donnée par la figure 1.3.
L'échelle des temps choisie (unité petite) permet de mettre en évidence
l'évolution à moyen terme de la série. Celle-ci semble présenter une rupture
à la fin de l'année 1973, associée à la première augmentation brutale des
prix du pétrole.
Définissons le taux d'accroissement de l'indice entre les dates t - 1 et
t par :

où It est la valeur de l'indice pour le mois t.


Les valeurs numériques de cet accroissement se déduisent des valeurs
figurant dans le tableau 1.1
Retrouver ce titre sur Numilog.com

F i g u r e 1.3

Tableau 1.4 Accroissement relatif mensuel de l'indice des prix à la consom-


mation entre les mois de février 1970 et décembre 1978 (en pourcentage)

Cette nouvelle série présente évidemment plus de changements de va-


riation que la série initiale It ; un accroissement brusque de l'indice est
souvent compensé par un accroissement plus faible un ou deux mois après,
d'où les nombreux "pics et creux" de la figure 1.5.
Une fois éliminés ces "pics et creux" à très court terme, on voit ap-
paraître une évolution à moyen terme comprenant quatre phases princi-
pales : la première, jusqu'au mois d'octobre 1973 correspond à un taux
d'accroissement à peu près fixe voisin de 0,4 % par mois ; cet accroisse-
ment a alors augmenté brusquement jusqu'au milieu de l'année 1974, puis
Retrouver ce titre sur Numilog.com

après une décroissance s'est stabilisé à partir de 1976 à un niveau proche


de 0,7 %, supérieur à celui du début de la période.

F i g u r e 1.5

F i g u r e 1.6
Evolution à moyen t e r m e de l'accroissement relatif de l'indice des prix

La quasi-stabilité de bIt sur la période 1970-1972 peut également être


mise en évidence en présentant la série It dans un repère semi-logarith-
mique (ordonnée Log It ; abscisse t). En effet, la série vérifie la relation
-
approchée : où <5o est une constante et satisfait donc ap-
t 1
Retrouver ce titre sur Numilog.com

proximativement : I = I1 ( 1 + δ 0 ) P r e n a n t le logarithme de cette égalité,


nous voyons que dans un repère semi-logarithmique l'évolution à moyen
terme sera sur la période 1970-1972 approximativement linéaire.
La série précédente présente d'autres régularités : ainsi l'accroissement
relatif de l'indice au mois d'août est, de 1971 à 1978, toujours inférieur
à ceux de juillet et de septembre. Cette particularité s'explique évidem-
ment par le "sommeil" de l'économie au moment des vacances. Cet effet
du mois sur la valeur de l'indice (phénomène saisonnier) est cependant
moins m a r q u é sur la série d'indice des prix que sur d'autres séries (voir
par exemple la série de la figure 1.8).
Si nous voulons m e t t r e en évidence graphiquement ce phénomène
périodique, il nous faut pouvoir compare facilement les données d'un même
mois correspondant à des années différentes. Ceci peut être fait en présen-
t a n t dans un même repère, comportant en abscisse les mois, les données
de chacune des années.

F i g u r e 1.7
Evolution de l'accroissement de l'indice des prix

de janvier 1972 à décembre 1974

Cette représentation graphique fait mieux apparaître les similitudes


de forme au cours de l'année. Ainsi entre mai et décembre les trois années
présentent des sommets pour les mêmes mois.
Des remarques similaires peuvent être faites pour l'autre série. Le
graphe des données relatives au trafic SNCF (figure 1.8) fait ainsi ap-
paraître une évolution à moyen terme approximativement constante et une
périodicité de 12 nettement plus marquée que dans la série précédente.
Retrouver ce titre sur Numilog.com

F i g u r e 1.8
Evolution du trafic voyageur entre janvier 1963 et décembre 1966

1.4 Quelques problèmes posés par les séries tempo-


relles
A. La prévision
Le problème de la prévision consiste à évaluer les valeurs futures
YT+h, h > 1 d'une variable à partir de l'observation de ses valeurs passées
Yi, ... YT. La prévision, notée Yr(h) ou TYT+h, déduite de ces observations
sera généralement différente de la valeur que prendra la variable à l'ins-
t a n t T + h ; pour cette raison on préfère souvent proposer un intervalle
de prévision [ ] susceptible de contenir la valeur inconnue
YT+h.
La qualité de la prévision dépend de la façon dont évolue la série. Plus
la série est fonction "régulière" du temps, plus il sera facile de prévoir. Les
prévisions seront par exemple bonnes pour beaucoup de variables écono-
miques en période de croissance, lorsque l'allure générale de la série est
linéaire ou exponentielle. E n revanche, les diverses méthodes de prévision
ne p e r m e t t e n t pas de prévoir un changement d'évolution dû à une modi-
fication des structures économiques, que rien dans le passé ne p e r m e t t a i t
de supposer.
La qualité de la prévision dépend de l'horizon h et est généralement
meilleure, lorsque h est petit.
Les méthodes servant à la prévision peuvent également être utilisées
pour évaluer une valeur passée de la variable. On emploie alors le terme de
Retrouver ce titre sur Numilog.com

valeur ajustée au lieu de prévision. Ceci peut par exemple être utile dans le
cas de données manquantes et peut donc permettre de compléter une série
temporelle. Ces valeurs ajustées peuvent aussi servir pour mesurer l'effet
d ' u n phénomène accidentel (grève, phénomène climatique exceptionnel) ; la
valeur ajustée donne une idée de la valeur qu'aurait dû prendre la variable,
si ce phénomène n'avait pas eu lieu.

B. E n l e v e r la t e n d a n c e

Dans une période de croissance, beaucoup de variables économiques


ont des évolutions à moyen terme (ou tendance, ou trend) analogues. Ces
variables sont donc toutes fortement corrélées entre elles, sans que ceci
exprime une quelconque liaison à caractère explicatif entre ces variables.
Pour voir si de telles liaisons existent, il peut être utile d'enlever cette
tendance.

C. C o r r e c t i o n des v a r i a t i o n s s a i s o n n i è r e s

Nous avons observé sur la sértie du trafic SNCF que les valeurs prises
pour un mois donné étaient généralement du même côté de la moyenne
annuelle ; par exemple les valeurs associées au mois d'août sont au-dessus
de celle-ci. On appelle série corrigée des variations saisonnières ou série
désaisonnalisée notée Y c v s , la série obtenue en retranchant de la série
initiale cet effet saisonnier.

Cette série corrigée des variations saisonnières est d ' u n grand intérêt
pour l'interprétation des séries temporelles. Supposons, par exemple,
qu'une mesure économique ait été prise au mois de juillet afin de réduire
l'augmentation des prix. L'observation d'un taux d'accroissement des prix
plus faible en août qu'en juillet permet-il d'en déduire un effet de cette
mesure ? Il faut se garder de conclure trop rapidement ; l'observation des
valeurs prises par la série corrigée des variations saisonnières, où l'effet de
la saison est éliminé, permet directement de répondre à cette question.
Signalons d ' a u t r e part que pour une raison similaire à celle décrite en B,
il peut être nécessaire de désaisonnaliser les séries avant de chercher les
liaisons explicatives pouvant exister entre variables.

D. D é t e c t i o n de r u p t u r e

Suite à des changements de politique économique ou à des modifica-


tions profondes des relations structurelles entre variables, les séries peuvent
dans certains cas présenter des ruptures soit de niveau, soit de pente. Nous
donnons ci-dessous deux séries. La première relative au taux d'accroisse-
ment du P N B espagnol montre une baisse brusque du niveau correspondant
aux "crises pétrolières" successives.
Retrouver ce titre sur Numilog.com

F i g u r e 1.9
PNB espagnol (accroissement)

La seconde fournit les évolutions de taux de change de la livre par


rapport au dollar. On y observe diverses ruptures de pente.

F i g u r e 1.10
T a u x de change livre/dollar
Retrouver ce titre sur Numilog.com

Il e s t é v i d e m m e n t i m p o r t a n t d ' e s s a y e r de p r é v o i r ces d a t e s d e r u p t u r e
o u , si ceci se r é v è l e i m p o s s i b l e , d e r e p é r e r l e u r e x i s t e n c e le p l u s r a p i d e m e n t
possible.

E. Causalité - Décalage temporel


L ' o b s e r v a t i o n s i m u l t a n é e d a n s le t e m p s de plusieurs variables p e u t
p e r m e t t r e d e r é p o n d r e à d e s q u e s t i o n s liées à la c a u s a l i t é . S u r la p é r i o d e
1 9 7 5 - 1 9 7 9 , la f o r m a t i o n d e s p r i x d u p é t r o l e b r u t est-elle u n e c o n s é q u e n c e
d e s p r i x o b s e r v é s d e l ' o r ? E s t - c e i n v e r s e m e n t ces p r i x , qui s u i v e n t c e u x d u
p é t r o l e ? U n e fois d é t e r m i n é , si c e l a e s t p o s s i b l e , le s e n s d e la c a u s a l i t é , il
faut savoir avec quel délai et p e n d a n t combien de t e m p s ( d é t e r m i n a t i o n du
d é c a l a g e t e m p o r e l ) l a v a r i a b l e e x p l i c a t i v e influe s u r l a v a r i a b l e e x p l i q u é e .

F. S é p a r a t i o n court et long t e r m e
Les influences e n t r e variables p r e n n e n t plus ou moins de t e m p s , sont
p l u s o u m o i n s p e r s i s t a n t e s . L ' u n des p r o b l è m e s i m p o r t a n t s d e la m a c r o é c o -
n o m é t r i e e s t d e s é p a r e r ces r e l a t i o n s p e r s i s t a n t e s ( d i t e s d e long t e r m e ) d e
celles q u i n e le s o n t p a s . C e s d e r n i è r e s s ' i n t e r p r è t e n t s o u v e n t e n t e r m e
d'ajustement.

G. E t u d e des anticipations des agents


L ' a n a l y s e d e s séries t e m p o r e l l e s p e r m e t a u s s i d ' é t u d i e r c o m m e n t les
agents réagissent vis-à-vis d u temps. Ainsi on dispose souvent de données
j o i n t e s s u r les v a l e u r s p r i s e s p a r c e r t a i n e s v a r i a b l e s é c o n o m i q u e s e t s u r les
p r é v i s i o n s d e ces v a l e u r s f a i t e s t r o i s m o i s a v a n t p a r les chefs d ' e n t r e p r i s e .

F i g u r e 1.11

On peut alors se demander s'ils anticipent bien le niveau de la variable,


son évolution ; on peut essayer de comprendre comment ils calculent im-
plicitement leurs anticipations...
Retrouver ce titre sur Numilog.com

1.5 Spécificité des méthodes de traitement


Diverses méthodes ont été mises au point pour résoudre les problèmes
précédents.
Le caractère optimal de chacune de ces méthodes dépend du problème
considéré : désaisonnalisation ou prévision par exemple, et également de la
série dont on dispose. Pour illustrer ce fait, nous pouvons considérer trois
critères proposés par Lovell (1963) que devrait raisonnablement satisfaire
une méthode de correction des variations saisonnières :

(I)
(II)
(III)
La première de ces propriétés serait très importante en pratique, puis-
qu'elle p e r m e t t r a i t d'obtenir la série agrégée corrigée de variations sai-
sonnières à partir des séries de base désaisonnalisées. Elle permettrait éga-
lement d'obtenir la série désaisonnalisée d ' u n niveau à partir de la série
désaisonnalisée du flux associé et inversement.
La seconde propriété exprime l'indépendance de la méthode de désai-
sonnalisation vis-à-vis des changements d'unités : désaisonnaliser une série
de consommation de pétrole exprimée en m3 ou exprimée en barils conduira
au même résultat.
La troisième propriété permettrait par exemple d'obtenir le taux de
chômage désaisonnalisé en faisant le r a p p o r t du nombre ce chômeurs désai-
sonnalisé par le nombre d'actifs désaisonnalisé. Ces trois propriétés, qui a
priori semblent naturelles, conduisent cependant à des méthodes inutili-
sables en pratique.
Les deux premières conditions impliquent la linéarité du procédé
d ' a j u s t e m e n t saisonnier ; il existe donc des réels atT tels que :
.
T
Si nous écrivons maintenant la condition (III) :

nous en déduisons qu'il existe une valeur t0 telle que :

∀ ≠ t0, a =0,

et
atto = 0 ou 1.
La valeur désaisonnalisée serait égale soit à une valeur décalée, soit à
zéro, ce qui est peu intéressant.
Retrouver ce titre sur Numilog.com

Bien que chaque méthode ne puisse posséder de bonnes propriétés


pour toutes les séries existantes, il sera toujours possible de trouver des
méthodes satisfaisantes pour chaque série étudiée. Généralement, les
méthodes usuelles sont déduites d ' u n modèle décrivant la série chronolo-
gique ; elles posséderont certaines propriétés d' "optimalité" pour les séries
compatibles avec le modèle. Plus la série s'écartera du modèle supposé,
plus la méthode correspondante sera mauvaise et les résultats entachés de
distorsions graves.

1.6 Modélisation d'une série temporelle


La résolution des divers problèmes que nous avons évoqués s'appuie
sur des modèles décrivant la façon dont la série évolue. Il est commode de
distinguer trois types de modèles : les modèles d'ajustement, les modèles
autoprojectifs et les modèles explicatifs. Nous allons présenter brièvement
ces trois types de modèles et nous indiquerons au passage comment ils
seront utilisés dans la suite du livre.

A. Modèles d ' a j u s t e m e n t
1. Le principe
L'observation de données réelles fait généralement apparaître diverses
régularités ; si nous considérons par exemple la série du trafic voyageur
entre janvier 1963 et décembre 1966 (figure 1.8), nous constatons que le
mouvement à moyen terme (tendance) est approximativement constant ;
si nous retranchons cette tendance de la série initiale nous obtenons une
courbe approximativement périodique et nulle en moyenne. On peut donc
penser faire l'hypothèse que la série a été générée par un modèle du type :
Yt — a + St + Ut,

où a est une constante inconnue représentant la tendance et St est une


fonction périodique du temps (par exemple sinusoïdale) de période 12,
nulle en moyenne, qu'on appellera mouvement saisonnier ; ut, appelé partie
irrégulière, aura le s t a t u t de variable aléatoire centrée. Notons que cette
1 partie irrégulière est souvent petite par rapport aux deux autres, ce qui ne
signifie pas qu'elle est négligeable ; au contraire, c'est souvent dans cette
partie que l'on trouvera les fluctuations les plus intéressantes sur le plan
économique.
La décomposition précédente est classique ; on y ajoute quelquefois
une quatrième partie, appelée le cycle, représentant des mouvements pério-
diques à moyen terme.
D'une manière plus générale, on peut proposer un modèle du type :
Vt = f (t, ut),

où f est une fonction indexée par un nombre fini de paramètres inconnus


et où u est une variable aléatoire centrée sur laquelle diverses hypothèses
Retrouver ce titre sur Numilog.com

additionnelles peuvent être faites ; un tel modèle est appelé modèle d'ajus-
tement.

2. Ajustement global et a j u s t e m e n t local


Les hypothèses faites sur les variables aléatoires ut induisent des
méthodes d'estimation de la fonction f , ayant de bonnes propriétés d'op-
timalité.
Ainsi, dans le chapitre II on propose une méthode d'estimation op-
timale dans le cas où les ut ont mêmes variances et sont non corrélées :
c'est la méthode des moindres carrés ordinaires. On propose également
une méthode dans le cas où les Ut ont même variance et sont corrélés. Ces
méthodes font jouer un rôle équivalent à toutes les observations et on peut
dire qu'elles conduisent à des ajustement globaux. Les résultats des esti-
mations obtenues peuvent être utilisés de diverses façons et, en particulier,
pour la désaisonnalisation et la prévision.
Dans certains cas on peut vouloir fonder les modèles et les méthodes
d'estimation sur des critères p e r m e t t a n t de faire jouer des rôles différents
aux diverses observations. Ainsi dans le chapitre 3 sur les moyennes mo-
biles, on définit des séries qui sont "localement" assimilables à des po-
lynômes de bas degrés, c'est-à-dire qui sont invariantes par un ajustement
polynomial local faisant intervenir un petit nombre d'observations. Cette
définition permet d'introduire une classe importante de méthodes de désai-
sonnalisation.
Dans le chapitre 4 consacré aux méthodes de prévision par lissage on
verra également que ces méthodes peuvent être justifiées par un ajuste-
ment local de diverses fonctions (polynômes, fonctions périodiques, expo-
nentielles...) autour de la valeur présente ; dans ces ajustements les ob-
servations jouent un rôle exponentiellement décroissant quand on remonte
dans le passé, d'où le nom de lissage exponentiel donné à ces méthodes.

3. Ajustement additif ou multiplicatif


La fonction d ' a j u s t e m e n t f ( t , ut) est souvent additive, c'est-à-dire
qu'elle se décompose en :

f ( t , ut) = g(t) + ut,

on dit que le modèle est un modèle d ' a j u s t e m e n t additif.


Si la fonction / ( t , Ut) s'écrit :

f ( t , ut) = g(t) - ut,

on dit que le modèle est un modèle d'ajustement multiplicatif.


Notons que, lorsque les diverses variables sont positives, on passe d'un
modèle multiplicatif à un modèle additif à l'aide de la fonction logarithme.
Retrouver ce titre sur Numilog.com

4. Ajustement déterministe et ajustement aléatoire


On a vu qu'un modèle d'ajustement additif s'écrit :

Yt = g(t) + ut,

où g(t) est une fonction du temps inobservable, mais déterministe.


Il est également possible de supposer que g(t), t ∈ ℤ, est un processus
aléatoire indépendant du processus ut, t c Z. Une classe particulière de
modèles de ce type, appelés modèles à composantes non observables, est
étudiée dans le chapitre 15.

B. M o d è l e s a u t o p r o j e c t i f s
Dans un modèle autoprojectif, on suppose que Y est une fonction de
ses valeurs passées et d'une perturbation aléatoire ut :

Y = ƒ ( Y 1, Y-2, ..., u ) .

Une classe de tels modèles, particulièrement utiles pour la prévision,


sont les modèles ARIMA étudiés à partir du chapitre V, d'abord dans le
cas univarié, puis dans le cas multivarié. Comme on le verra, cette classe
permet d'atteindre une gamme de modèles très variés à l'aide d'un nombre
de paramètres relativement limité. En outre, il est possible de proposer des
méthodes, dites méthodes d'identification, permettant de choisir dans cet
ensemble de modèles celui qui semble le mieux adapté aux données dont
on dispose. Une fois ce modèle choisi, on peut en estimer les paramètres
et déterminer les prévisions optimales.
Parmi les méthodes de prévision ainsi mises en évidence on trouve,
en particulier, les méthodes de lissage exponentiel. L'avantage essentiel de
la méthode identification - estimation - prévision fondée sur les modèles
ARIMA, appelée quelquefois méthode de Box et Jenkins, est qu'elle permet
de sélectionner la méthode de prévision optimale dans un vaste ensemble
de possibilités, tandis que les méthodes classiques (ajustement global ou
lissage) comportent une plus grande part d'arbitraire dans le choix de la
fonction utilisée pour l'ajustement.
De plus, on verra que dans le cas multivarié ces modèles permettent de
donner des réponses aux problèmes liés à la causalité, à la séparation court
et long terme, aux comportements d'anticipation des agents (chapitres 10
à 13).

C. M o d è l e s explicatifs
Dans cette dernière catégorie de modèles la variable Yt est exprimée
en fonction d'un vecteur de variables observables, dites exogènes, Xt et
d'une perturbation aléatoire ut :

Yt = ƒ ( X , u ) ,
Retrouver ce titre sur Numilog.com

Xt est soit déterministe, soit aléatoire ; dans ce dernier cas, les processus
{ X } et { u } ont certaines propriétés d'indépendance ou de non corrélation.
Ces modèles sont les modèles de base de l'économétrie et nous les
considérerons essentiellement pour faire le lien entre eux et les modèles
autoprojectifs.

1. Modèle explicatif statique


Dans un modèle explicatif statique les variables Xt ne contiennent
pas de valeurs passées de Yt et les ut sont indépendants entre eux. Par
exemple, un modèle de ce type sera :

YT = a bXt + UT, t = 1,..., T,

où les Xt sont indépendants de tous les ut et où les ut sont centrés et


indépendants entre eux.

2. Modèle explicatif dynamique


Un modèle explicatif peut être dynamique soit parce que les ut sont
autocorrélés, soit parce que Xt contient des valeurs passées de Yt, c'est-à-
dire des variables dites "endogènes retardées".
- Perturbations autocorrélées
Une façon commode de prendre en compte l'autocorrélation des ut
est de supposer que la série des ut satisfait un modèle autoprojectif. L'ap-
proche autoprojective permet donc de proposer une classe de modèles pour
les perturbations, c'est-à-dire pour la composante représentant notre igno-
rance, et apparaît complémentaire de la formalisation reliant Y et X qui,
elle, est souvent fondée sur la connaissance des mécanismes économiques.

- Variables endogènes retardées


La théorie économique fournit souvent des indications sur l'identité
des variables à faire intervenir dans un modèle ; en revanche elle donne ra-
rement des précisions sur les décalages temporels pertinents. Dans l'étude
de ce problème difficile et crucial l'approche autoprojective peut aussi,
comme on le verra dans le chapitre 10, être utile.
Ces modèles explicatifs dynamiques seront étudiés en détail dans la
suite du livre. On distinguera en particulier les modèles stationnaires et
non stationnaires (chapitres 11, 13, 14), on s'intéressera aux modèles dy-
namiques fondés sur la théorie des anticipations (chapitre 12) et on fera
le lien entre les modèles dynamiques et la théorie du filtrage de Kalman
(chapitres 15 et 16).
Retrouver ce titre sur Numilog.com
Retrouver ce titre sur Numilog.com

CHAPITRE 2

Désaisonnalisation
par la méthode
de la régression linéaire

2.1 Ecriture d'un modèle linéaire


On suppose que la série b r u t e est la somme des deux composantes
déterministes (la tendance Zt et la saisonnalité St) et d'une composante
aléatoire (la perturbation ut) :
Xt — Zt + St + Ut.
Pour compléter la description du modèle, il reste à expliciter les formes
fonctionnelles des composantes déterministes et à faire des hypothèses sur
la loi des perturbations ut, t = 1,... T. Chacune des composantes déter-
ministes est écrite comme combinaison linéaire de fonctions connues du
temps :

b1 ... b, c1 ...c sont des constantes inconnues qu'il faudra estimer à partir
des observations. Les perturbations ut sont choisies de moyennes nulles
E = 0 ∀ , de même variance : Vut = cr2 Vt, et non corrélées Cov(ut, UT)
= 0, Vt ^ T.
Finalement, le modèle est :

(2.1)
Retrouver ce titre sur Numilog.com

La partie déterministe apparaît comme une fonction linéaire des k + 1


paramètres b et c, d'où le nom de modèle linéaire donné à la formule (2.1).
Ce modèle peut être écrit en terme de vecteurs. Appelons X, ZI, ...,
Z , SI, ..., S1, u les vecteurs de R T, dont les composants sont respective-
ment .
Le système d'équations (2.1) signifie que le vecteur aléatoire X admet
la décomposition :

k
La tendance Zlbl est un élément du sous-espace vectoriel Z en-

gendré par les vecteurs Z Z . Lorsque ces k vecteurs sont indépen-


1
dants, ce sous-espace est de dimension k. De même, la saisonnalité
j=1
est un élément du sous-espace S engendré par SI, ..., S1. Ce sous-espace
est de dimension l dès que les vecteurs SI, ..., Si constituent un système
libre. Ces conditions sur les dimensions de Z et S sont supposées satisfaites
dans la suite.
Les fonctions Zi et SJ dépendent de la façon dont le caractère X varie
avec le temps. Considérons, par exemple la série trimestrielle d'un indice
de production industrielle (voir annexe 2).

F i g u r e 2.2
Retrouver ce titre sur Numilog.com

Sur la période considérée la croissance à moyen t e r m e est approxi-


m a t i v e m e n t l i n é a i r e ; il e s t a l o r s n a t u r e l d ' a p p r o c h e r la t e n d a n c e p a r u n e
d r o i t e : Zt = b1 + b2t. L e s o u s - e s p a c e Z d e d i m e n s i o n 2 e s t e n g e n d r é p a r les
séries Z \ = 1 e t Z ; = t. U n e fois r e t r a n c h é d e l a série b r u t e le m o u v e m e n t
à m o y e n t e r m e , l a c o u r b e o b t e n u e (figure 2.3) p r é s e n t e d e s pics e t d e s c r e u x
d ' a m p l i t u d e s c o m p a r a b l e s à i n t e r v a l l e r é g u l i e r . C e t i n t e r v a l l e d e q u a t r e ob-
s e r v a t i o n s c o r r e s p o n d ici à l ' a n n é e . L a c o m p o s a n t e s a i s o n n i è r e S t p o u r r a
être choisie sous la forme d ' u n e fonction p é r i o d i q u e d e période q u a t r e . Elle
p r e n d r a q u a t r e v a l e u r s ( o u coefficients s a i s o n n i e r s ) c1, C2, C3, C4 a s s o c i é e s
à c h a c u n d e s t r i m e s t r e s : S t = Cj, si la d a t e t c o r r e s p o n d a u t r i m e s t r e j .
O n p e u t alors écrire : où , fonction
i n d i c a t r i c e d u t r i m e s t r e j , p r e n d la v a l e u r 1 si l a d a t e t c o r r e s p o n d à ce
t r i m e s t r e , la v a l e u r 0 s i n o n .

F i g u r e 2.3

En résumé on peut, pour décrire cette série particulière, proposer en


première approximation un modèle du type :

(2.4)

Généralement, on choisit pour la tendance une fonction de forme lisse,


présentant peu de changements de variations ; souvent ce sera un po-
lynôme de degré faible. La modélisation la plus simple de la saisonnalité
consiste, comme dans l'exemple précédent, à prendre un effet fixe de la
saison. D'autres formes peuvent être proposées : une variation lente de
chacun des coefficients saisonniers est décrite en prenant ceux-ci fonctions
polynomiales du temps ; les coefficients des polynômes sont alors supposés
différents pour chaque saison (voir exercice 2.6).
Retrouver ce titre sur Numilog.com

La décomposition de la saisonnalité peut d'autre part inclure des va-


riables prenant des valeurs non nulles pour plus d'une saison. Par exemple,
l'une de ces variables pourrait être le nombre de jours de travail dans la
saison considérée. L'effet des vacances, des grèves, des week-ends pourrait
également être représenté de cette façon.

2.2 Unicité de la décomposition


Les formes retenues pour les composantes déterministes doivent
conduire à une décomposition unique de la série initiale en tendance et
saisonnalité. Il ne doit pas exister deux couples distincts [Z, S] et [Z*, S*]
tels que :

Seule la fonction nulle peut donc s'interpréter simultanément comme


une tendance et une saisonnalité ; autrement dit, on doit avoir : Z n
S — {0}. Pour que cette condition soit réalisée, il faut que le système
Z Z, S S constitue un système libre. Reprenons dans cette op-
tique le modèle (2.4). Le sous-espace Z est engendré par Z l = [1, 1,..., 1]'
et Z2 = [1, 2,..., T]' ; le sous-espace des saisonnalités est engendré par :

S = [1, 0, 0, 0, 1, 0, 0, 0, 1, 0...]'

S2 = [ 0 , 1 , 0 , 0 , 0 , 1 , 0 , 0 , 0 , 1 . . . ] '

S3 = [ 0 , 0 , 1 , 0 , 0 , 0 , 1 , 0 , 0 , 0 . . . ] '

S4 = [ 0 , 0 , 0 , 1 , 0 , 0 , 0 , 1 , 0 , 0 . . . ] '

L'unicité de la décomposition n'est pas satisfaite. Les six vecteurs


Z I , Z2, S I , S2, S3, S4 sont en effet liés entre eux par la relation :
Z1 = SI + S2 + S3 + S4.
Pour rétablir l'unicité de la décomposition, il semble naturel d'imposer
aux effets saisonniers de se compenser sur une année, ce qui conduit à
introduire la contrainte :

(2.5)

Le sous-espace des saisonnalités S* contient alors les fonctions S telles


que :
Retrouver ce titre sur Numilog.com

Le sous-espace S*, de dimension 3, est engendré par :

81* = 81 - 84, 82* = 82 - s 4 , s3* = s 3 - s4.

Le modèle composé de (2.4) - (2.5) est appelé modèle trimestriel de


Buys-Ballot.

2.3 Transformations de la série brute


L'intérêt principal d'une description linéaire de la série réside dans
la simplicité du modèle ; ceci permettra d'en faire une étude mathéma-
tique approfondie. Choisir une telle écriture peut sembler restrictif, ce-
pendant l'hypothèse de linéarité est moins forte qu'il n'y paraît. De nom-
breux modèles peuvent être rendus linéaires après transformation de la
série brute. Ces modèles transformés s'écrivent :

(2.6)

Ils sont du type (2.1) à condition de choisir comme nouvelle variable


expliquée la variable X* définie par :

Exemple : Modèle multiplicatif


Le modèle trimestriel :

où est la fonction indicatrice du trimestre et où les coefficients saison-


niers satisfont CI + C2 + C3 + C4 = 0 est du type (2.6). La série transformée
de la série b r u t e est X* = Log Xt. Il s'agit d ' u n modèle multiplicatif
et chacune des composantes expliquant la série initiale X peut être mise
en évidence en appliquant à l'équation la fonction exponentielle. On a :
avec :

L ' é v o l u t i o n à m o y e n t e r m e a u n e f o r m e e x p o n e n t i e l l e c r o i s s a n t e , si
h2 > 0, d é c r o i s s a n t e s i n o n ; si h2 > 0, les effets s a i s o n n i e r s c r o i s s e n t en
v a l e u r a b s o l u e a v e c t (voir figure 2.7V
Retrouver ce titre sur Numilog.com

F i g u r e 2.7
Modèle multiplicatif (62 > 0)

Exemple : Modèle logistique


Considérons le modèle donné par :

Pour que ce modèle ait un sens, il faut que Xt soit compris entre 0 et
1, quel que soit t.
La variable Xt s'écrit :

et son évolution a approximativement la forme indiquée dans la figure 2.8,


lorsque b2 est négatif.
Ce modèle, dit logistique, est adapté à l'étude de la consommation
. de certains biens durables. Xt représente alors la proportion de ménages
possédant ce bien à l'instant t.

2.4 Estimateur des moindres carrés ordinaires (m.c.o.)


Considérons le modèle linéaire (2.1)
Retrouver ce titre sur Numilog.com

F i g u r e 2.8
Modèle logistique

La méthode des m.c.o. consiste à choisir comme estimations êj des


paramètres bi, c3, les valeurs qui rendent minimal le carré de la distance
entre la série et sa partie déterministe :

Notons les estimations des vecteurs


des paramètres et Z, S les matrices de tailles (T, k) et (T, l) dont les
colonnes sont respectivement ZI,... Zk et S S . Les solutions b et
c du problème de minimisation satisfont le système des k + l équations
normales :

(le symbole ' désigne la transposition des matrices).


Ce système peut encore s'écrire :

Lorsque les vecteurs Z Z S S sont linéairement indépen-


dants, la matrice du premier membre est inversible ; le système admet alors
la solution unique :

(2.9)
Retrouver ce titre sur Numilog.com

On peut déduire du système des équations normales les expressions


de b et c. On a :

Remplaçons dans les k premières équations normales :

___
(2.10)
De même on a :

(2 1)11)
R e m a r q u e 2.12 :
E n l'absence de saisonnalité (1 = 0), il faut supprimer dans le système
des équations normales les blocs relatifs à S et ê ; l'équation (2.9) se réduit
alors à : b = ( Z ' Z ) - I Z ' X .
Remarque 2.13 :
La méthode que nous venons de décrire suppose que les vecteurs
Z \ . . . , Zk, SI, ..., Si constituent un système libre ; elle ne s'applique donc
pas directement au modèle de Buys-Ballot et nous verrons au paragraphe
2.5b comment l'adapter à ce modèle.

2.5 Applications
a) Considérons le modèle multiplicatif sans saisonnalité défini par :

Log Xt = bl + b2t + Ut, t = 1,..., T.

La matrice Z a deux colonnes respectivement égales à Z = [1,.., l]'


1 et Z2 = [1,2,..., T]'. Les estimateurs bi et b2 sont donnés par :
Retrouver ce titre sur Numilog.com

D'où en développant :

b) Dans le modèle trimestriel de Buys-Ballot :


, t = 1, ..., T,
et les coefficients saisonniers vérifient CI + C2 + C3 + C4 = 0. La méthode
des m.c.o. doit alors être appliquée en tenant compte de cette égalité.
Les estimateurs bl, b2, êl, ê2, ê3, ê4 sont obtenus comme solutions du
problème de minimisation sous contrainte :

Comme j=J t = 1 Vt, ce problème s'écrit aussi :

Ce dernier programme montre que les estimateurs 61, 62, êj j =


1, ...,4 peuvent être calculés en utilisant une démarche en deux étapes. On
commence d ' a b o r d par chercher 62, 6j j = 1 , 4 en minimisant :

c'est-à-dire en régressant par les m.c.o. sans contrainte Xt sur


. On obtient ensuite hl et êj en utilisant les égalités :

(2.14)
Retrouver ce titre sur Numilog.com

Dans un premier temps, nous allons déterminer b2, 6j. Afin de simpli-
fier les calculs, nous supposons que le nombre T d'observations correspond
à un nombre entier N d'années : T = 4N. L'observation du je trimestre
de la ne année est indexée par t = 4(n — 1) + j n = 1,..., N, j = 1,..., 4.
Nous désignerons par :
xn = la moyenne des observations de X sur les quatre trimestres de
l'année n,
= la moyenne des observations de X relatives au j trimestre,
x = la moyenne de toutes les observations de X.
1 N 1 4
Remarquons que : .
n=l j=l
Les estimateurs des divers paramètres sont : (voir exercice 2.9)

(2.15)

(2.16)

Les estimateurs bi et êj s'obtiennent ensuite à partir des formules


(2.14) et (2.15).

Remarquons que les estimateurs bi et b2 des paramètres de la ten-


dance peuvent être obtenus en effectuant la régression simple des moyennes
annuelles xn sur l'indice du milieu de l'année exprimé en trimestres :
5
(voir exercice 2.1).

2.6 Propriétés statistiques des estimateurs


Les estimateurs des paramètres obtenus en 2.4 sont des variables aléa-
toires approchant les vraies valeurs inconnues b et c. Il faut alors étudier
leurs propriétés statistiques, en particulier avoir une idée de l'erreur com-
mise en effectuant ces approximations.
Retrouver ce titre sur Numilog.com

A. M o m e n t s d ' o r d r e 1
Sous l'hypothèse E u t = 0, les estimateurs des m.c.o. sont sans biais,
c'est-à-dire égaux en moyenne aux valeurs à estimer : Vbi, Cj :

Il n'y a donc en moyenne, ni surestimation, ni sous-estimation des


valeurs inconnues.
E n particulier :

estiment sans biais les valeurs inconnues de la tendance et de la saisonnalité


à l'instant t.

B. M o m e n t d ' o r d r e 2
k 1
Une fonction linéaire des paramètres , où les Pi
i=1 j=1
et γ sont des nombres connus est donc estimée sans biais par

L'erreur commise en approchant d par d peut être mesurée par l'erreur


quadratique moyenne E ( d — d)2. Comme d = Ed, cette erreur est égale à
la variance de d, notée Vd. Explicitons cette variance :

Le calcul de cette variance suppose connues les variances des esti-


mateurs et leurs covariances respectives. Ces quantités sont généralement
présentées sous forme matricielle dans la matrice de variance covariance :
b
V . Cette matrice carrée, symétrique, de taille k + 1 est composée de
c
quatre blocs :
Retrouver ce titre sur Numilog.com

Vb matrice carrée de taille k, a pour terme général d'ordre (i, i') :


Cov (bi, bi/) ; en particulier les termes de la diagonale ne sont autres que
les variances Vbi. Les autres blocs Cov (6, c) et Vê de taille (k, l) et (1, l),
ont pour termes Cov (bi, êj) et Cov (êj, êj').
Si nous notons β = [β1, ..., β]' et γ = γ 1 , . . . , γ ] ' , Vd s'écrit :

(2.18)

Lorsque les perturbations ut sont de moyenne nulle, de même variance


a'2 et sont non corrélées, on peut facilement montrer que la matrice de
variance-covariance de ^ est donnée par :
cJ

(2.19)

Rappelons également que la principale justification de la méthode des


moindres carrés ordinaires est le théorème de Gauss-Markov qui indique
que d est l'estimateur de d de variance minimale parmi les estimateurs
sans biais, fonctions linéaires des observations Xt.

Exemple 2.20 :
Reprenons le modèle de Buys-Ballot étudié en 2.5.b), on a :

en particulier, l'expression

permet de calculer les variances et covariances des coefficients saisonniers


estimés c.

C. E s t i m a t i o n d e la v a r i a n c e des p e r t u r b a t i o n s
La matrice obtenue en (2.19) ne peut être calculée numériquement,
puisque son expression dépend du paramètre inconnu σ Celui-ci peut être
estimé sans biais de la manière suivante.
Soit ût le résidu d'estimation à l'instant t : Ût = Xt - Zt —St ; ût est
une approximation aléatoire de la perturbation Ut■
Retrouver ce titre sur Numilog.com

La quantité :

(2.21)

est un estimateur sans biais de σ La matrice de variance-covariance est


alors estimée par :

(2.22)

et de même la variance d'une fonction linéaire des estimateurs :

est estimée par :

D. Intervalle de confiance
Au lieu de proposer pour d une valeur approchée d, il est souvent
préférable d'en fournir un encadrement : d, < d < d2. L'intervalle de
confiance [ ] est aléatoire et ne contient d qu'avec une certaine pro-
babilité. Lorsque les perturbations sont supposées indépendantes, suivant
une même loi normale N(0, σ un tel intervalle encadrant la valeur d
avec la probabilité 0.95 est donné par :

(2.23)

où Φ est le nombre ayant la probabilité 5 % d'être dépassé en module dans


une loi de Student à T - k - l degrés de liberté. Si T est grand, Φ vaut
approximativement 2.

2.7 Utilisations de la méthode de régression


A. R e c h e r c h e d e v a l e u r s a b e r r a n t e s
Certaines observations peuvent ne pas paraître compatibles avec le
reste des données. Savoir si ces observations sont vraiment "aberrantes",
Retrouver ce titre sur Numilog.com

c'est-à-dire si elles n'ont pas été engendrées de la même façon que les autres
données est un point important. Traiter comme les autres observations des
données aberrantes risque, en effet, d'affecter sensiblement l'analyse.
Ces valeurs atypiques peuvent apparaître pour plusieurs raisons :
- elles peuvent être dues à des erreurs de mesure, de saisie ou de calcul.
On peut dans un tel cas espérer les corriger en examinant la façon,
dont les données ont été recueillies et traitées ;
- elles peuvent refléter des phénomènes accidentels (une grève par
exemple). Les dates auxquelles se sont produits de tels événements
peuvent facilement être retrouvées. Ainsi des valeurs atypiques ap-
paraissent souvent dans les séries économiques françaises en 1963
(grève des mineurs), en 1968 (grève générale), en 1974 (première crise
pétrolière)... Ces phénomènes étrangers à l'évolution habituelle de la
série sont généralement éliminés.
On peut éventuellement considérer comme valeurs aberrantes des
données engendrées de la même façon que les autres données, mais tirées
dans la queue de la distribution. Ainsi dans un échantillon d'individus re-
nouvelé chaque année pourrait à une certaine date figurer un milliardaire.
Le traitement d'un tel cas n'est pas clair ; souvent on élimine ces valeurs
et on effectue l'analyse sur les données obtenues après l'élimination.
Il y a diverses manières de détecter les valeurs aberrantes.
1) Jusqu'à maintenant nous avons considéré une décomposition de Xt
de la forme :
(2.24)

dans laquelle ne figurent pas de valeurs aberrantes. Supposons que le


modèle (2.24) décrive bien la série X. Sous l'hypothèse de normalité des
perturbations, ut est dans 95 % des cas compris entre - 2 σ et +2or. Appro-
chant toutes ces quantités, nous voyons que ût devrait généralement être
compris entre —2s et +2s. Les dates où ces résidus se trouvent à l'extérieur
de cet intervalle peuvent correspondre à des valeurs aberrantes.

F i g u r e 2.25
Valeurs a b e r r a n t e s
Retrouver ce titre sur Numilog.com

Cette approche peut facilement être améliorée pour tenir compte de


la loi des résidus ; désignons par A la matrice :

les résidus sont de moyennes nulles et ont pour matrice de variance-cova-


riance : Vû = σ A . Le résidu "studentisé" est donné par , où att et
le te élément de la diagonale de A.
Asymptotiquement. s'il n'y a pas de valeurs aberrantes, le résidu stu-
dentisé suit une loi normale centrée réduite et est, dans approximativement
95 % des cas, inférieur à 2 en module ; on peut donc accepter l'hypothèse
d'existence d'une valeur atypique à la date t si : et la rejeter
dans le cas contraire.
2) Une autre approche consiste à utiliser un modèle intégrant l'éven-
tualité d'une valeur aberrante à l'instant ta. Pour cela on introduit habi-
tuellement une variable indicatrice de cette date :

(2.26)

où vaut 0 si t ≠ t0, 1 sinon.


L'absence de valeur aberrante se t r a d u i t par : H0(α = 0). Nous pou-
vons tester cette hypothèse par un test de Student classique.
Sous l'hypothèse générale, l'estimateur des m.c.o. de a n'est autre que
la valeur Xto - Zto - Sta. On voit donc que la somme des carrés des résidus
sous l'hypothèse générale n'est autre que celle obtenue en appliquant les
m.c.o. au modèle (2.24) pour les données Xt, t ≠ to ; nous la noterons
. Sous l'hypothèse nulle la somme des carrés des résidus S C R 2
est obtenue en appliquant les m.c.o. à (2.24) pour les données complètes.
Le module de la statistique de Student est donc égal à :

Une valeur de cette statistique supérieure à la valeur critique à 95 %


de la loi de Student à (T — k — l — 1) degrés de liberté conduit à accepter
l'existence d ' u n e valeur aberrante à la date to.

B. D é s a i s o n n a l i s a t i o n
La série corrigée des variations saisonnières peut
être estimée par :
Retrouver ce titre sur Numilog.com

L'erreur quadratique moyenne et due à l'approximation de X f v s par


est estimée par :

C. P r é v i s i o n
Les estimateurs 6i, êj peuvent servir à prévoir une valeur de X non
encore observée : XT+h h > 1.
Si on suppose que le modèle est encore vrai à l'instant T + h, on a :

avec E = 0, V = σ COV(UT+h, Ut) = 0, t = 1,..., T , et la


valeur X T + h peut être approchée par :
i 1

(2.27)
' i

On peut montrer que X T ( h ) est, au sens de l'erreur quadratique


moyenne, la meilleure prévision fonction linéaire des valeurs observées
X 1 , . . . , X de la variable et satisfaisant la condition de sans biais :

E (XT(h) - XT+h) = 0.

L'estimation de la variance de l'erreur commise en effectuant cette


approximation est :

k i

où d est l'estimateur de .
i= 1 j=1
Retrouver ce titre sur Numilog.com

L o r s q u e les p e r t u r b a t i o n s s u i v e n t d e s lois n o r m a l e s , on obtient un


i n t e r v a l l e d e p r é v i s i o n à 95 % p o u r X T + h e n p r e n a n t :

où Φ est défini c o m m e en (2.23).

2.8 Autocorrélation des erreurs


Dans les graphes précédents nous avons supposé que les perturbations
étaient non corrélées. Il est cependant possible que les valeurs prises par
une série temporelle à des instants successifs soient liées entre elles. Une
telle liaison peut être prise en compte par l'intermédiaire des perturbations.

A. A u t o c o r r é l a t i o n d ' o r d r e 1
Supposons par exemple que les perturbations satisfassent :

(2.28)

où les variables Et sont indépendantes de même loi N(O, (2) et où p est


un réel compris entre —1 et 1. Nous supposerons pour simplifier que la
relation (2.28) est valable pour t 6 Z, c'est-à-dire vraie aussi pour des
valeurs non observées correspondant aux indices non compris entre 1 et
T. La perturbation peut alors s'écrire (voir aussi le chapitre V pour une
étude complète des modèles généraux incluant 2.28)

On déduit de cette écriture les moments de Ut :

et pour tout h > 0 :


Retrouver ce titre sur Numilog.com

(La justification des interversions des signes E et E est donnée dans le


chapitre 5, annexe 5.A).
La matrice de variance-covariance des perturbations est dans ce cas
non scalaire ; elle est donnée par :

(2.29)

Considérons de nouveau le modèle linéaire :

(2.30)

où les vecteurs Zl et S3 sont linéairement indépendants et où les pertur-


bations satisfont (2.28) ; la méthode des moindres carrés ordinaires décrite
à la section précédente fournit des estimateurs sans biais des coefficients,
mais ces estimateurs ne sont pas les plus précis possible. La précision peut
être améliorée en employant l'estimateur des moindres carrés généralisés
défini par :

La matrice Q peut facilement être inversée ; on a :

Cet estimateur des moindres carrés généralisés est identique à l'esti-


mateur des moindres carrés ordinaires appliqué au modèle :

où H est une matrice vérifiant HΩH' = Id ou H ' H = Q -1. On obtient


une telle matrice H en prenant :
Retrouver ce titre sur Numilog.com

Soit H* la matrice obtenue en enlevant la première ligne de H. L'es-


timateur des moindres carrés généralisés est peu différent de l'estimateur
des moindres carrés ordinaires appliqué à :

c'est-à-dire à l'estimateur obtenu en régressant :

pour t — 2,... T. Cette méthode approchée a été recommandée par Cochran


O r c u t t [1949].
Les deux méthodes d'estimation précédentes, méthode des moindres
carrés généralisés et méthode de Cochran-Orcutt, ne peuvent être directe-
ment appliquées, car elles supposent le paramètre p connu ; en général p
est inconnu et il est nécessaire d'employer une méthode en deux étapes.
Dans une première étape, on estime le paramètre p. Ce paramètre p
s'interprète comme la corrélation entre ut et u - 1 et il est généralement
estimé par la corrélation empirique entre les résidus ût et û - 1 déduits de
la méthode des moindres carrés ordinaires :

Dans un deuxième temps on emploie la méthode des moindres carrés


généralisés ou la méthode de Cochran-Orcutt après avoir remplacé le pa-
ramètre p inconnu par son estimation p.

B. Y a-t-il a u t o c o r r é l a t i o n d ' o r d r e 1 ?
Avant de décrire la série chronologique par un modèle avec auto-
corrélation des erreurs, il faut savoir si l'emploi d'un tel modèle, est néces-
saire. Pour cela il faut pouvoir tester l'hypothèse p = 0 (absence de corréla-
tion et donc emploi de la méthode des moindres carrés ordinaires) contre
l'hypothèse contraire (corrélation et emploi de la méthode des moindres
carrés généralisés).
Ce test est habituellement effectué selon la méthode proposée par
Durbin et Watson [Durbin-Watson (1950) (1951)] par :
Retrouver ce titre sur Numilog.com

où ût est le résidu d'estimation déduit de la méthode des moindres carrés


ordinaires.
Si le nombre d'observations est grand, on a :

La loi de cette statistique, lorsque p — 0, dépend des valeurs des


variables Z ' et SJ. Il est cependant possible d'encadrer D W par deux
statistiques dont les lois ne dépendent pas de ces variables. Ceci conduit
à des tests faisant intervenir deux seuils critiques di < du, fonctions du
nombre d'observations T et du nombre de variables explicatives k' non
compris la constante (voir la table statistique jointe). Ainsi dans le modèle
(2.30), k' — k + 1 — 1. Lorsqu'on veut tester l'absence de corrélation contre
l'hypothèse de corrélation positive, on rejette l'hypothèse de non-corréla-
tion si D W < dl, on accepte cette hypothèse si D W > du ; dans le cas
dl < D W < du, on ne peut pas conclure.
La procédure précédente peut être adaptée pour tester l'hypothèse de
non-corrélation contre l'hypothèse d'une corrélation négative ; il suffit de
remplacer D W par 4 — D W . Si 4 — D W < dl on rejette l'hypothèse de
non-corrélation ; si 4 — D W > du on accepte cette hypothèse ; on ne peut
conclure si dl < 4 — D W < du.
Un inconvénient de ce test est évidemment qu'il ne permet pas tou-
jours de choisir entre les deux hypothèses.
Une autre méthode pour tester l'hypothèse (p = 0) contre l'alternative
(ρ ≠ 0) pourrait être fondée sur la comparaison des signes des résidus ût
et Ût-l t = 2, 4, 6... Les diverses combinaisons de signes et le nombre de
fois où elles apparaissent sont données dans la table ci-après. La somme
T u + T12 + T21 + T22 est égale à la partie entière de T / 2 .
L'hypothèse de non-corrélation pourrait alors être testée en appli-
quant un test du khi-deux à cette table de contingence 2 x 2. Lorsque l'hy-
pothèse d'indépendance des signes est acceptée, on applique la méthode
des moindres carrés ordinaires ; si cette hypothèse est rejetée on utilise la
méthode des moindres carrés généralisés ou la méthode de Cochran-Orcutt.
Retrouver ce titre sur Numilog.com

Valeurs critiques à 5 % du test de Durbin-Watson


Retrouver ce titre sur Numilog.com

C. P r é v i s i o n
Lorsque les perturbations sont autocorrélées les formules de prévi-
sion (2.27) doivent être modifiées pour tenir compte des liaisons entre les
observations de deux dates différentes. Supposons par exemple que nous
disposions des observations Xl, ..., XT et que nous souhaitions prévoir la
variable correspondant à la date T + 1 :

avec u + 1 = ρ + ε + 1 , OÙ ET+I est indépendant de ε1, ..., ET et suit


une loi N(O, a2).
On a :

et la prévision optimale de XT+I (lorsque les paramètres sont connus) est


égale à la partie prédéterminée :

Lorsque les paramètres sont inconnus, une prévision de XT+l sera :

(2.31)
Retrouver ce titre sur Numilog.com

D. A u t o c o r r é l a t i o n d ' o r d r e s u p é r i e u r
Dans le modèle linéaire, la perturbation représente notamment les
effets des variables omises. Si ces variables présentent elles-mêmes une
saisonnalité, celle-ci va apparaître dans l'autocorrélation.
Considérons par exemple une série trimestrielle (période 4) ; il peut
alors sembler préférable d'introduire l'autocorrélation entre les perturba-
tions par :
Ut = PUt-4 + Et, ~~1 < p < 1.

La démarche décrite dans le cas de l'autocorrélation d'ordre 1 peut


facilement être généralisée.
Supposons que nous disposions de 4T observations. La matrice de
variance-covariance de u est :

Vu = σ ⊗ Id,

où est la matrice définie par (2.29), Id est la matrice identité d'ordre 4 et


⊗ est le produit de Kronecker des matrices 1. Donc a
et l'estimateur des moindres carrés généralisés est donné par :

Cet estimateur peut être approché par l'estimateur des moindres car-
rés ordinaires obtenu en régressant Xt —PXt-4 sur Z —ρ Z - 4 , S - ρ S - 4
pour t = 5,..., T.

1 Si A est u n e m a t r i c e (p x q) d'éléments a i j , si B est une matrice (g x h), le


p r o d u i t de Kronecker de A p a r B , écrit A ⊗ B , est la m a t r i c e (pg x qh) a d m e t t a n t
la décomposition par blocs :

Lorsque A et B sont carrés et inversibles, A 0 B est carrée inversible et

(A⊗B) = A ⊗ B
Retrouver ce titre sur Numilog.com

Ces méthodes d'estimation supposent connue la corrélation p et il


sera nécessaire d'estimer celle-ci dans une première étape. On pourra par
exemple l'estimer par :

Finalement nous pouvons remarquer que le test de l'hypothèse p = 0


fondé sur les signes se généralise immédiatement à condition de comparer
signes de ût et Ût-4 et que la technique de prévision est identique à
condition de considérer XT+1 — p X T - 3 '

2.9 Deux inconvénients de la méthode des m.c.o.


A. Mise à j o u r
Les estimateurs 6, ê dépendent du nombre d'observations effectuées ;
dans cette section nous notons bT, cT leurs expressions relatives à la
période 1,..., T. Lorsqu'on dispose d'une observation supplémentaire
X + 1, ces estimateurs sont transformés en . Cependant, il n ' y a

pas de relation très simple (exercice 2.7) entre ( ) et ( )


(voir cependant le chapitre 16 pour la définition des moindres carrés récur-
sifs).

B. C h a n g e m e n t d e r é g i m e s
Les bonnes propriétés statistiques de la méthode des m.c.o. supposent
que le modèle linéaire :

fournisse une description correcte de la série brute. Il arrive cependant que


la forme fonctionnelle liant Z , S et X change au cours de la période et
qu'un modèle préférable soit par exemple :

(2.32)
Retrouver ce titre sur Numilog.com

Dans ce cas une désaisonnalisation effectuée en utilisant le modèle


(2.28) conduit à de mauvais résultats. Il est donc nécessaire de déceler les
changements de régime en observant la façon dont évolue Xt.
Les changements de régime, s'ils sont décelés [voir Monfort (1982,
p. 263] doivent être pris en compte dans l'estimation. Considérons par
exemple, le modèle (2.32) correspondant à un changement de régime ;
notons At la variable valant 1, si t < to et 0, sinon. On a :

(2.32) définit donc un modèle linéaire dans lequel les nouvelles variables
explicatives sont Z A, Z - A), S A, S 1 - A) et les paramètres
peuvent être estimés par la méthode des m.c.o. ou des m.c.g. appliquée à
ce nouveau modèle.

2.10 Application au "trafic voyageur"


A titre d'exemple, nous utilisons pour décrire cette série mensuelle la
formulation la plus classique comportant une tendance linéaire : b2t + bl,
et une saisonnalité de période 12 :

où est la fonction indicatrice du mois j.


Les paramètres &i et b2 de la tendance et les 12 coefficients saisonniers
Cj ont été estimés par les moindres carrés ordinaires, calculés à partir des
observations de la période 1963-1979. Les 12 dernières observations rela-
tives à l'année 1980 ont été retirées de cette estimation de manière à pou-
voir comparer sur cette année les réalisations avec les prévisions déduites
du modèle estimé.
Dans un premier temps, on a calculé les estimateurs non contraints
de b2 et des δ = b1 + Cj, j = 1,..., 12. Les estimations sont les suivantes :

L'estimation de 61 s'en déduit en prenant la moyenne des douze der-


niers chiffres : b1 = 1864.
Retrouver ce titre sur Numilog.com

Les coefficients saisonniers estimés êi sont :

La somme de ces coefficients est évidemment égale à 0. Comme on pou-


vait s'y attendre, les coefficients saisonniers correspondant aux vacances
(avril, juin, juillet, août, décembre) sont positifs, ce qui traduit l'augmen-
tation du trafic durant ces périodes.
La qualité de l'ajustement peut être étudiée en reportant sur un même
graphique les valeurs observées de la série Xt et les valeurs ajustées Xt (voir
figure 2.33) ou en examinant l'évolution des résidus d'estimation (figure
2.34). Cette dernière montre que l'allure générale des résidus ne correspond
pas exactement à une suite de variables aléatoires centrées non corrélées
de même variance et donc que la forme retenue n'est pas parfaitement
adaptée. En particulier, la figure 2.34 donnant l'évolution des résidus de
1963 à 1979 semble indiquer une convexité de la tendance ; celle-ci pour-
rait être prise en compte en employant un modèle additif, où la tendance
serait modélisée par un polynôme de degré deux ou en utilisant une version
mensuelle du modèle multiplicatif décrit plus haut. On peut aussi remar-
quer que l'hypothèse de stabilité des coefficients saisonniers pourrait être
remise en cause au vu de la figure 2.34.

F i g u r e 2.33
C o m p a r a i s o n sur la période 1963-1970 des séries réelle et ajustée
Retrouver ce titre sur Numilog.com

F i g u r e 2.34
Evolution des résidus d'estimation

F i g u r e 2.35
Série corrigée des variations saisonnières sur la période 1972-1979

La série désaisonnalisée s'obtient en retranchant de la série initiale les


estimations des coefficients saisonniers. Elle est représentée dans la figure
2.35 avec la série brute. On voit que la désaisonnalisation a pour effet
d'amortir les pics et les creux de la série initiale.
L'écart relatif moyen entre la prévision et la réalisation pour les douze
mois de l'année 1980 est de 6,9 %.
Retrouver ce titre sur Numilog.com

2.11 Exercices
E x e r c i c e 2.1 :
Rappeler les expression des estimateurs des moindres carrés ordinaires
de bi et b2 dans le modèle :

5
Calculer ces estimateurs lorsque tn = 4(n — 1) + - et les comparer
avec les estimateurs b2 et bi obtenus en (2.16) et (2.17).
Exercice 2.2 :
On considère le modèle : Xt = Zt + S + α 1 = l o + ut introduit en (2.26).
On régresse Xt sur les Z; et les S{ de façon à obtenir des estimateurs des
biet Cj. Vérifier que ces estimateurs sont biaisés (si a ≠ 0).
Exercice 2.3 :
Afin de mieux estimer la saisonnalité, on peut penser dans un premier
temps éliminer la tendance. Considérons par exemple le modèle trimestriel
de Buys-Ballot. Calculer X* = Xt - 2Xt-1 + Xt-2 t —3, - - •, T. Vérifier
que la partie déterministe de X ; est une fonction linéaire des Cj' Comment
estimerait-on les Cj ?
Exercice 2.4 :
On considère le modèle de Buys-Ballot ; étudier révolution de l'erreur
quadratique moyenne de prévision eh en fonction de l'horizon h. Conclu-
sion ?

Exercice 2.5 :
On considère deux séries trimestrielles satisfaisant :

où e s t l'indicatrice du je trimestre et où les perturbations sont temporel-


lement indépendantes, mais peuvent être contemporainement corrélées :

Montrer qu'il revient au même de traiter les séries , séparément


ou simultanément.
Retrouver ce titre sur Numilog.com

E x e r c i c e 2.6 :
On considère un modèle trimestriel où les coefficients saisonniers se-
raient des fonctions linéaires du temps :

Vérifier qu'il existe deux relations indépendantes entre les variables


explicatives. Montrer que les coefficients saisonniers ne peuvent être nuls en
moyenne sur quatre trimestres consécutifs que si dj = 0, j = 1, • ■- , 4. Que
devient ce résultat lorsqu'on impose à la moyenne de ces coefficients pour
quatre trimestres d'une même année d'être nuls ?
Exercice 2.7 :
(Voir 2.9 pour les notations)
Vérifier que :

où A est une matrice que l'on déterminera.


Exercice 2.8 :
On considère l'exemple du trafic voyageur (paragraphe 2.10). La va-
riance estimée de la perturbation est : 82 = (200.6)2et la matrice de
variance-covariance estimée de â, 6jj = 1, • • - , 12 est donnée par :

(Seule la moitié inférieure de la matrice est donnée ; celle-ci est évi-


demment prolongeable p a r symétrie).
1) Déterminer les variances des coefficients saisonniers estimés êj j =
1,..., 12.
Retrouver ce titre sur Numilog.com

2) Calculer en fonction de l'horizon la longueur de l'intervalle de prévi-


sion à 95 %.
Exercice 2.9 :
On considère le modèle de Buys- Ballot décrit en 2.5
T T T T
a) Déterminer , e t exprimer y ^ tXt et en
fonction de , x, Xj'
b) Utilisant les formules :

avec Z2 = (1,2, ..., T)', en déduire les formules (2.15) et (2.16).


Retrouver ce titre sur Numilog.com

Annexe 2 : Indice de la production industrielle :


secteur bâtiment et travaux publics

Source : INSEE.
Retrouver ce titre sur Numilog.com
Retrouver ce titre sur Numilog.com

CHAPITRE 3

Désaisonnalisation
par la méthode
des moyennes mobiles

3.1 Principe de la méthode


Considérons une série X = [Xt] admettant une décomposition addi-
tive :
Xt = Zt + St + Ut, t = 1, ..., T.

Une façon simple de déterminer l'une des composantes de cette série,


par exemple la tendance Zt, consiste à appliquer à la série une transforma-
tion linéaire f, qui conserve la tendance et annule les autres composantes.
Plus précisément, notons X;, , , les tiemes composantes des trans-
formées par f des séries X, Z, S, u ; comme f est linéaire, nous avons
Zf — ZI + St + ul ; d'autre part, f annule la saisonnalité : S* = 0, la
perturbation : u; = 0 et conserve la tendance : ZI = Zt. La série X*
transformée de la série initiale est alors confondue avec la tendance.
Toute la difficulté d'une telle méthode est évidemment dans le choix
de la transformation f. Les définitions des diverses composantes étant
assez "floues", on ne peut raisonnablement espérer construire une trans-
formation conservant exactement les tendances et annulant exactement
toutes les saisonnalités et toutes les perturbations. On peut tout au plus
essayer d'avoir ces propriétés approximativement, , , ul #0, et
exactement pour certaines formes particulières des composantes. Le choix
d'une fonction f n'est donc pas automatique et devrait être fondé sur un
examen préalable de la série et sur une modélisation de ses diverses com-
posantes. Le choix de cette fonction doit aussi permettre d'éviter certains
inconvénients de la méthode de la régression autrement dit :
- les calculs doivent être simples,
Retrouver ce titre sur Numilog.com

- la mise à jour facile, lorsque T augmente,


- la méthode doit bien réagir aux changements de régime
Les transformations généralement utilisées sont les moyennes mobiles.
X* est alors, par définition, une somme pondérée des valeurs de X corres-
pondant à des dates entourant t :

(3.1)

où m i , m2 £ N et θ - 1 , . . . , θ 2 e JR.
Le nombre de points m1 + m 2 + 1 intervenant dans la transformation
est appelé ordre de la moyenne mobile.
Le calcul précédent n ' a évidemment de sens que lorsque :

m1 + 1 < t < T —m2

Il faudra donc trouver d'autres écritures pour exprimer les valeurs


extrêmes et , X £ en fonction des valeurs de
la série initiale. Dans un premier temps il est préférable de ne pas tenir
compte de cette difficulté. Pour cela nous pouvons supposer que la série
observée est indexée par Z ; t varie alors de —oo à +00 et il n'y a pas de
valeurs extrêmes.
Si nous notons L l'opérateur "retard", qui à la série (Xt, t G Z) fait
correspondre la série ( X t - l ; t G Z), la série transformée par la moyenne
mobile s'écrit : r n

On en déduit la définition suivante d'une moyenne mobile.


Définition 3.2 :
U n e moyenne mobile est u n e application s'écrivant comme
combinaison linéaire finie de puissances positives et négatives
de l ' o p é r a t e u r r e t a r d :

Les moyennes mobiles sont souvent choisies centrées, c'est-à-dire telles


que : m l = m2 = m. L'opérateur M peut alors s'écrire :

M = Lm [ θ - + θ - + 1 L-1 + ... + θ L .

Notons F l'opérateur avance défini par F = L - 1 et 0 le polynôme tel


que :
8 ( x ) = B-m + θ - + 1 x + ... = θ x
Retrouver ce titre sur Numilog.com

on a :
M = Lme(F).

La donnée du polynôme 0 caractérise la moyenne centrée M . On


connaît en effet l'ordre de cette moyenne, puisque 2m + 1 = d°Θ + 1 et
évidemment ses coefficients, égaux à ceux du polynôme 0 .
Les procédures fondées sur les moyennes mobiles sont principalement
utilisées pour la désaisonnalisation. Habituellement la série est désaison-
nalisée en utilisant une démarche itérative : on commence par appliquer
une moyenne mobile visant à conserver la tendance et à annuler les deux
autres composantes. On obtient ainsi une première estimation de la ten-
dance et donc, par différence avec la série initiale, de la somme S + u. La
saisonnalité est alors estimée à partir de S + u (ce qui est plus facile q u ' à
partir de Z + S + u) en appliquant une moyenne mobile visant à conserver
S et à annuler u.
R e t r a n c h a n t l'estimation de S de la série initiale X , on obtient une
valeur approchée de Z + u à partir de laquelle la tendance devrait être
estimée avec plus de précision que la première fois et ainsi de suite. Cette
approche itérative permet de construire des procédures de désaisonnalisa-
tion satisfaisantes à l'aide d'étapes simples.
Remarquons que les moyennes utilisées conservent la tendance et an-
nulent la saisonnalité, ou l'inverse, mais que toutes doivent éliminer la
perturbation ou t o u t au moins la réduire.

3.2 L'ensemble des moyennes mobiles


A. C o m p o s i t i o n d e m o y e n n e s mobiles
D é f i n i t i o n 3.3 :
L a c o m p o s é e ( o u p r o d u i t ) d e d e u x m o y e n n e s m o b i l e s M et M
d o n n é e s est l ' a p p l i c a t i o n M qui, à t o u t e série X, fait corres-
pondre M X - MMX.
Il est facile de voir que l'application composée M — M M est encore
une moyenne mobile. Ce résultat est très important en pratique, puisqu'il
permet de définir des moyennes mobiles à partir de moyennes d'ordres
inférieurs et donc plus simples ; il montre aussi que la méthode itérative
proposée au paragraphe précédent est encore une méthode de moyennes
mobiles. La composition des moyennes mobiles est évidemment une opéra-
tion associative ; elle est aussi commutative : M M = M M , c'est-à-dire
que les moyennes peuvent être appliquées dans un ordre quelconque à la
série brute.

P r o p r i é t é 3.4 :
La moyenne composée de deux moyennes mobiles centrées
est une moyenne mobile centrée.
Retrouver ce titre sur Numilog.com

Preuve :
Considérons deux moyennes centrées :

leur produit est égal à z .


Comme le degré de est égal à 2rh + 2m- la moyenne M est
centrée. Son ordre est égal à la somme des ordres de M et M moins 1 :
2m + 1 — (2m + 1) + (2m + 1) - 1.
a
Il faut noter qu'une moyenne mobile centrée peut aussi être obtenue
comme produit de deux moyennes mobiles non centrées. Considérons par
exemple les deux opérateurs "différence première" définis par :

A = Id —L ⇔ ∆Xt = Xt —X t - l (différence arrière),

et

V = F - Id = F ∆ ⇔ ∇Xt = Xt+1 - Xt (différence avant).

Leur composée : AV = (Id - L)(L-l - Id) = L - I - 2Id + L est une


moyenne centrée d'ordre 3.

B. M o y e n n e s m o b i l e s s y m é t r i q u e s
Définition 3.5 :
U n e moyenne mobile est s y m é t r i q u e si elle est centrée et si les
coefficients d'indices s y m é t r i q u e s p a r r a p p o r t à 0 p r e n n e n t
des valeurs égales :

θ = θ - , i = 1,..., m.
Les caractéristiques (ordre et coefficients) d'une telle moyenne mobile
sont notées symboliquement : {[2m + 1] ; [B-m, θ - + 1 , ..., θ0]} ; le terme
central θ0 est toujours dans la suite écrit en caractère gras.
P r o p r i é t é 3.6 :
U n e moyenne mobile est s y m é t r i q u e si et seulement si le
p o l y n ô m e 0 associé est symétrique.
Preuve :
Cette propriété découle directement des conditions Oi — θ - , i =
1..., m. O
Retrouver ce titre sur Numilog.com

La condition de symétrie du polynôme 0 peut encore s'écrire :

Θ(L) = θ - +θ+
-1L.+. + θ L

= L θ - F + θ - + 1 F + ... + θ]⇔ Θ(L) = L Θ ( F ) .

P r o p r i é t é 3.7 :
L'ensemble des m o y e n n e s mobiles s y m é t r i q u e s est stable p a r
composition des applications.
Preuve :
Considérons deux moyennes symétriques M et M; leurs polynômes
associés satisfont :

La moyenne composée M = M Mz est, d'après la propriété 3.4, centrée


et a pour polynôme associé : .
Comme

on en déduit que le polynôme est symétrique. 0

C. L ' e s p a c e v e c t o r i e l des m o y e n n e s m o b i l e s
L'ensemble des moyennes mobiles constitue un espace vectoriel sur M
de dimension infinie ; c'est le plus petit sous-espace contenant les puis-
sances de l'opérateur retard Li, i e Z.. D'autres systèmes de générateurs
de cet espace peuvent être utilisés, en particulier celui formé à partir des
opérateurs "différence première" : { ∇ i ∈ ℕ ; ∆ i , i C N*} (voir exercice
III.7). Ce système peut être intéressant d ' u n point de vue numérique, les
différences premières des valeurs d'une série X étant généralement moins
grandes en valeur absolue que les valeurs de X.
Finalement, nous pouvons remarquer que l'ensemble des moyennes
mobiles symétriques constitue un sous-espace vectoriel de l'espace des
moyennes mobiles. E n utilisant des résultats classiques sur les polynômes
symétriques, on peut montrer que ce sous-espace est engendré par le sys-
tème {(L + F ) i , i G N} ou de manière équivalente par le système

{ δ = ( ∇ ∆ ) = (L + F - 2 I d ) ; i e N}.

3.3 Vecteurs propres d'une moyenne mobile


Une moyenne mobile est une application linéaire de l'espace dans
lui-même. Nous pouvons donc chercher certaines de ses caractéristiques,
Retrouver ce titre sur Numilog.com

par exemple ses valeurs propres et vecteurs propres. Dans la suite nous
prenons des moyennes centrées, mais les résultats se généralisent sans dif-
ficulté au cas de moyennes quelconques.

A. R é s o l u t i o n d ' u n e é q u a t i o n de r é c u r r e n c e linéaire
Nous rappelons dans ce paragraphe quelques résultats classiques sur
les suites (Xt, t e Z) satisfaisant une équation du type :

(3.8)

dite équation de récurrence linéaire d'ordre 2m.


Les solutions d'une équation telle que (3.8) constituent un sous-espace
vectoriel de ℝ de dimension 2m. Il suffit donc pour connaître ce sous-
espace de trouver 2m solutions indépendantes de (3.8).
Cherchons s'il existe des solutions de la forme Xt — λ avec À G C.
La valeur À doit alors satisfaire l'équation caractéristique :

(3.9)

a) Lorsque cette équation admet 2m racines distinctes λ1, ..., λj, ...,
À2m, on obtient 2m solutions indépendantes de l'équation (3.2) :

La solution de l'équation de récurrence est alors donnée par :

(3.10)

Les racines Aj peuvent être réelles ou complexes.


Si Aj est réelle, la solution correspondante est une suite
exponentielle a d m e t t a n t divers types de graphes selon la valeur de Aj..
Retrouver ce titre sur Numilog.com

Ces séries pourraient s'interpréter comme des tendances.

Ces séries pourraient s'interpréter comme des composantes saison-


nières de période 2.
Lorsque la racine Aj est complexe, Xj = p e pi — | λ | > 0 et
ω e [0, 27r[, l'équation caractéristique à coefficients réels admet également
comme solution la valeur conjuguée λj' = Àj = p e Les combinaisons
réelles de X j t et Xj/t peuvent alors s'écrire :

Ces séries ont des formes sinusoïdales explosives ou convergentes selon


la position de pj par rapport à 1.

Une telle fonction pourrait, lorsque sa "période" (égale


V à " j ) cor-
respond à une "période naturelle" de la série initiale, s'interpréter comme
une composante saisonnière.
Lorsque la période est très grande (Wj petit), une telle série pourrait
être considérée comme une tendance (ou un cycle).
b) Dans le cas général certaines racines de l'équation caractéristique
peuvent être multiples. S'il y a J racines distinctes Ai,..., Aj,..., Xj ayant
respectivement pour ordres de multiplicité α1, ..., α,...α, la solution géné-
rale de (3.8) s'écrit sous la forme :
Retrouver ce titre sur Numilog.com

(3.11)

avec Cjk E C , j = 1,..., J, k = 1,..., α.


L'expression (3.11) peut aussi être écrite en distinguant les racines
réelles des racines complexes. Nous supposons que les racines réelles sont
les Jo premières. L'équation caractéristique étant à coefficients réels, si
Aj = est une racine complexe d'ordre a j , sa conjuguée Àj l'est
aussi avec le même ordre de multiplicité ctj. Nous pouvons alors regrouper
deux à deux les racines complexes de façon à faire apparaître des fonctions
cosinus et sinus.
Dans le cas général, les séries réelles solutions du noyau s'écrivent
donc :

les coefficients Cjk, α , bjk étant réels.

B. N o y a u d ' u n e m o y e n n e m o b i l e
Définition 3.12 :
Le noyau d ' u n e moyenne mobile M (noté Ker M) est l'en-
semble des séries temporelles annulées p a r cette moyenne :
Ker M = {X : M X = 0}.
Cette condition s'écrit :

Les éléments du noyau sont donc solutions d'une équation de récur-


rence linéaire et peuvent être explicités en utilisant l'approche décrite en
3.3.A.
P r o p r i é t é 3.13 :
Ker M M D Ker M + Ker M (le signe + désigne la somme des
sous-espaces vectoriels).
Retrouver ce titre sur Numilog.com

Preuve :
Si X c Ker M, on a : M M X = MO = 0.
Donc Ker M M D Ker M.
Par raison de symétrie, on a aussi Ker M M = Ker M M D Ker M et
comme Ker M M est un sous-espace vectoriel le résultat en découle. 0

Comme dim Ker M M = 2rh + 2m = dim Ker M + dim Ker M,


il y a égalité Ker , si et seulement si Ker M n
Ker M = {0}.

C. Séries i n v a r i a n t e s p a r u n e m o y e n n e m o b i l e
Définition 3.14 :
La série X est invariante p a r la moyenne mobile M si et
seulement si :

M X = Xt, Vt.
Les séries invariantes par M satisfont :

∀t : MXt = θ – X – + ... +
θX+ = X,

ou :
Vt : θ – X + e
Elles sont donc solutions d'une équation de récurrence linéaire d'ordre
2m et en particulier, elles constituent un sous-espace vectoriel J ( M ) de
dimension 2m. Ces solutions sont déterminées à partir des solutions de
l'équation caractéristique : Θ(λ) – λ = 0. Parmi les solutions seules celles
présentant peu de changements dans le sens de variation (fonctions expo-
nentielles ou sinusoïdales de longue période) peuvent s'interpréter comme
des tendances.
Conservation des polynômes de degré p
La moyenne mobile conserve les polynômes de degré inférieur ou égal
à p, si À = 1 est racine d'ordre p + 1 de l'équation caractéristique :
Θ(λ) - Am = 0. Le polynôme ©(F) - Fm est alors divisible par Vp+l =
(F – I d )
En fait, appliquer l'opérateur V permet de diminuer de 1 le degré
de tout polynôme. Par exemple si Xt — tn : V Xt = (t + l)n - tn =
n t + ... + 1.
P r o p r i é t é 3.15 :
a) U n e moyenne mobile conserve les constantes si et seule-
m e n t si :

9-m + θ – + 1 + ... + om — 1-
Retrouver ce titre sur Numilog.com

b) U n e moyenne mobile s y m é t r i q u e conservant les constantes


conserve les p o l y n ô m e s de degré 1.
Preuve :
Le a) est immédiat. Pour montrer b), il suffit de considérer la série :
Xt — t. On a :


I n v a r i a n t s d ' u n e moyenne mobile composée
Lorsque M s'écrit comme composée de deux moyennes mobiles MM,
on a : -
(3.16)

En effet, si X e J) ( n J ( M ) : .
La composée de deux moyennes mobiles conservant les polynômes de
degré inférieur ou égal à p conserve donc aussi ces polynômes.

D. S é r i e s t r a n s f o r m é e s d e séries g é o m é t r i q u e s
Les éléments du noyau et les séries invariantes sont des cas particuliers
de vecteurs propres de la moyenne mobile, M, associés respectivement aux
valeurs propres 0 et 1. Les séries géométriques quelconques fournissent
d'autres exemples de vecteurs propres.
Considérons la série X = λ où À est réel ou complexe :

La série initiale est multipliée par le facteur λ qui apparaît


ainsi comme une valeur propre. Lorsque À est réel, l'application équivaut
pour cette série à une homothétie de rapport λ
Considérons maintenant le cas général ou A est complexe λ = p e La
série V = p e est multipliée par un nombre complexe : λ = ce
avec c = p |Θ(λ)| et ϕ = arg [ λ ; donc :

Décomposant cette série complexe selon sa partie réelle et sa par-


tie imaginaire et utilisant la linéarité de la moyenne mobile, nous voyons
qu'une série de la forme p1 cos ut [resp.pt sin ωt] sera transformée en
cptcos(wt + <p)[resp cpt sin(ωt + ϕ)].
Retrouver ce titre sur Numilog.com

Il apparaît donc sur ces séries réelles un double effet :


- un effet d'amplitude par multiplication du module de Xt par c,
- un effet de phase dans l'addition de l'argument cp, ce qui revient à
changer l'origine des temps.

Effet d'amplitude (p = 1 ; c > 1, (p = 0) Effet de phase (p = 1 ; c = 1, ϕ # 0)

L'effet d'amplitude modifie l'importance des sommets de la série.


L'effet de phase est plus complexe, puisqu'il introduit des phénomènes
interprétables comme des saisonnalités (sommets ou creux) à des dates où
il n'y en avait pas.
Ce dernier effet peut cependant être partiellement supprimé lorsque
p = 1 en choisissant des moyennes mobiles symétriques, d'où l'intérêt de
ces dernières. Prenons une telle moyenne, nous avons :

λ = λ
car les polynôme 8 est symétrique, et comme À = elL0 :

La valeur propre associée à la série Xt — eiwt est donc réelle et l'argu-


ment cp est égal à 0 ou à 7r selon que ce réel est positif ou négatif. Dans le
premier cas, cp — 0, il n'y a pas d'effet de phase ; dans le second cas cp = 7T,
il y a opposition de phase (on verra dans la suite que ce phénomène n'a
pas de conséquences importantes) : les sommets sont transformés en creux
et réciproquement.
Notons que l'effet d'amplitude est alors égal à :

L'application w → | Θ ( e est appelé gain de la moyenne mobile.


Naturellement ces résultats sont applicables aux séries réelles de la forme
Xt = acos wt, ou X t — asin wt avec a G R.
Retrouver ce titre sur Numilog.com

3.4 Transformé d'un bruit blanc par une moyenne mobile 66


3.5 Moyennes arithmétiques 71
3.6 Moyennes construites à partir des moyennes arithmétiques 76
3.7 Régressions mobiles 79
3.8 Recherche de moyennes mobiles par minimisation sous
contraintes du pouvoir de réduction 84
3.9 Distribution des coefficients d'une moyenne mobile 85
3.10 Moyennes mobiles successives 88
3.11 Traitement des extrémités de la série 92
3.12 Changement de régimes 96
3.13 Application au trafic voyageur 98
Exercices 101

C h a p i t r e 4 : Les m é t h o d e s de lissage exponentiel 105


4.1 Le lissage exponentiel simple 105
4.2 Le lissage exponentiel double 110
4.3 Le lissage exponentiel généralisé 113
4.4 Les méthodes de Holt-Winters 117
Exercices 121

C h a p i t r e 5 : Quelques r é s u l t a t s sur les processus univariés 123


5.1 Processus stationnaires du second ordre 123
5.2 Opérateurs retard et avance 139
5.3 Processus ARMA 145
5.4 Processus ARIMA 167
Exercices 172

C h a p i t r e 6 : P r é v i s i o n p a r la m é t h o d e de Box et J e n k i n s 179
6.1 Description de la démarche 179
6.2 Estimation d'un modèle ARIMA 181
6.3 Identification 189
6.4 Prévision dans les modèles ARIMA 196
6.5 Quelques compléments 202
6.6 Application à l'étude du trafic voyageur 207
Exercices 214

C h a p i t r e 7 : Séries temporelles multivariées 229


7.1 Généralités 229
7.2 Processus stationnaires 231
7.3 Processus linéaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245
C h a p i t r e 8 : R e p r é s e n t a t i o n s des séries temporelles 255
8.1 Représentations ARMA 255
8.2 Représentation espace d'état 275
8.3 Domaine des fréquences 290
Exercices 299

C h a p i t r e 9 : E s t i m a t i o n s et tests (cas stationnaire) 303


9.1 Distributions limites des moments empiriques 304
9.2 Estimateur du maximum de vraisemblance 313
9.3 Procédures de test 328
9.4 Extensions au cas multivarié 341
Exercices 348

C h a p i t r e 10 : Causalité, exogénéité et chocs 351


10.1 Diverses formes des modèles macroéconométriques
dynamiques 351
10.2 Causalité 360
10.3 Exogénéité 375
10.4 Chocs et multiplicateurs 385
10.5 Causalité dans un système élargi 391
Exercices 396

C h a p i t r e 11 : E t u d e des c o m p o s a n t e s tendancielles 407


11.1 Décomposition d'une série à tendance polynomiale 408
11.2 Quelques liens avec la pratique macroéconométrique de
construction de modèles : modèles à correction d'erreurs
et cointégration 423
11.3 Processus fractionnaire 433
Exercices 449

C h a p i t r e 12 : Anticipations 451
12.1Rappels sur les schémas d'anticipation 452
12.2Modèle avec anticipation de la variable présente 456
12.3Modèles avec anticipation de la variable future 463
12.4Modèles contenant plusieurs anticipations 474
12.5Quelques éléments sur les modèles multivariés
à anticipations rationnelles 484
Exercices 489

C h a p i t r e 13 : Recherche de spécifications 491


13.1 Généralités sur la recherche d'un modèle 491
13.2 Tests de causalité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 498

Vous aimerez peut-être aussi