Vous êtes sur la page 1sur 32

BRUSSELS ECONOMIC REVIEW – CAHIERS ECONOMIQUES DE BRUXELLES

VOL. 56(2) SUMMER 2013

METHODES DE LISSAGE D’UNE SERIE


TEMPORELLE : LE PROBLEME DES EXTREMITES
MICHEL GRUN-REHOMME ET OLGA VASYECHKO*

RESUME:
De nombreuses méthodes, basées sur les filtres, ont été développées pour estimer la composante
tendance-cycle d’une série temporelle. Parmi ces outils, les moyennes mobiles demeurent
toujours efficaces. En particulier, la moyenne mobile symétrique d’Henderson est appliquée
pour estimer la tendance-cycle dans le programme de désaisonnalisation X11. Mais pour les
observations les plus récentes, il est nécessaire d’utiliser des filtres asymétriques. Dans cet
article, une nouvelle méthode de lissage, basée sur le noyau d’Epanechnikov, est utilisée pour
traiter les extrémités d’une série temporelle. Cette méthode est comparée au filtre d’Henderson
sur des données de l’Indice de Production Industrielle.

ABSTRACT:
Many filters have been developed to estimate trend-cycle component of time series does.
Among these tools, moving averages remain efficient. In particularity, the symmetric
Henderson smoother is applied for trend-cycle estimation in software as X11. But for the most
recently observations, it is necessary to use asymmetric filters. We propose a new smoothing
method, based on the Epanechnikov kernel, to treat the endpoints. We compare this method
with the Henderson filter on data.

JEL CLASSIFICATION: C22, C61, E30.

MOTS–CLES: Séries temporelles, Méthode de lissage, Moyennes mobiles


asymétriques, Noyaux.

KEYWORDS: Time Series Analysis, Smoothing techniques, Asymmetric Moving


Average, Kernels.

*
GENES, 60 rue Etienne Dolet, 92240 Malakoff, France. Email : o.vasyechko_stat@yahoo.fr;
grun@ensae.fr

143
METHODES DE LISSAGE D’UNE SERIE TEMPORELLE : LE PROBLEME DES EXTREMITES

INTRODUCTION

L’analyse des séries temporelles a pour but de rechercher et de mettre en évidence


les structures dynamiques présentes dans les données afin de résumer l’information
et de faciliter les comparaisons avec d’autres données. Fondamentalement, les
méthodes d’analyse des séries temporelles ont pour objectif de dégager les
différents rythmes d’évolution qui se superposent pour donner l’allure observée. On
peut distinguer plusieurs composantes dans la décomposition d’une série
temporelle : la tendance, le cycle, les effets saisonniers, les effets de calendrier et
une composante résiduelle. La tendance (souvent confondue avec le cycle dans une
première approche) traduit l’évolution à long terme de la série et est donc supposée
lisse.

Dans sa panoplie de méthodes pour aborder les problèmes de lissage (estimation de


la tendance en éliminant les fluctuations rapides pour ne retenir que l’évolution
moyenne) des séries temporelles, le statisticien dispose aujourd'hui d'un outil un
peu anachronique, qui résiste bien à l'usure du temps et aux innovations
statistiques : les moyennes mobiles. Le succès de cet outil est essentiellement dû
d'une part à son excellent rapport "qualité-prix" et, d'autre part, au succès des
logiciels de désaisonnalisation X11-ARIMA (Dagum, 1988) et X12-ARIMA
(Findley et al., 1998) qui en font un large usage, en particulier les moyennes
mobiles de Henderson (1916). Ces moyennes mobiles sont toujours utilisées pour
l’estimation finale de la tendance dans la nouvelle version X-13Arima-Seats (U.S.
Census Bureau).

Les moyennes mobiles sont en effet très simples de principe : elles n'impliquent pas
a priori l'utilisation de concepts ou de modèles sophistiqués et se révèlent
d'application particulièrement souple. Il est possible de construire une moyenne
mobile possédant les propriétés souhaitées en termes de conservation de tendance,
de réduction du bruit, de souplesse et/ou d’absence de déphasage, s'adaptant ainsi
au problème traité (Grun-Rehomme et Ladiray, 1994, Gray et Thomson, 1996,
Guggemos et al., 2012). Les moyennes mobiles symétriques ont de très bonnes
propriétés en ce sens, mais la question du traitement des extrémités reste posée. En
effet, une moyenne mobile symétrique d’ordre 2p + 1 ne permet pas de lisser les p
derniers points de la série (ni les p premiers, mais ces points étant les plus anciens,
leur importance est moindre).

Classiquement, trois types de démarches non paramétriques peuvent être


utilisées pour lisser les dernières valeurs observées (Bianconcini et Quenneville,
2010, Alexandrov et al., 2012) :

- Prolonger avec des prévisions la série observée par un modèle de type ARIMA et
continuer à utiliser la même moyenne mobile symétrique. Cas de X11-ARIMA
(Dagum, 1982).

- Utiliser un filtre asymétrique « le plus proche » de la moyenne mobile symétrique


de Henderson, idée développée par Musgrave (1964 a, b) Si le filtre de Musgrave
est optimal en termes de révision (connaissance d’une nouvelle donnée), il ne

144
MICHEL GRUN-REHOMME ET OLGA VASYECHKO

correspond pas au critère d’optimisation de Henderson. C’est la technique utilisée


dans X11 (Doherty, 2001, Ladiray et Quenneville, 2001, Queneville et al., 2003).

- Utiliser des moyennes mobiles de Henderson asymétriques qui vérifient le même


critère (Proietti, Luati, 2008).

On s’intéresse dans cet article au lissage des derniers points d’une série temporelle
en suivant une démarche de type Henderson.

La formalisation du problème et les moyennes mobiles de Henderson sont


présentées dans la section suivante. La section 2 décrit une variante du critère
d’Henderson. Une nouvelle approche est aussi proposée dans la section 3 en
utilisant le noyau d’Epanechnikov. Dans la section 4, une comparaison entre les
méthodes classiques et ces nouvelles méthodes est effectuée sur l’Indice de la
Production Industrielle en France. Une conclusion termine cet article.

1. PROBLEMATIQUE ET MOYENNES MOBILES DE HENDERSON

On s’intéresse à une série temporelle mensuelle (la démarche serait analogue pour
une série trimestrielle) dont on suppose qu’elle se décompose de façon additive en
une tendance-cycle (notée TC t ) et une composante résiduelle  t :

X t  TC t   t (1)

Le résidu, dans la décomposition de la série brute, est souvent modélisé sous la


forme d'un bruit blanc, suite de variables aléatoires (t) d'espérance nulle, non
corrélées, et de même variance  . En pratique, il est fréquent de trouver des
2

séries pour lesquelles la composante cyclique est inexistante ou non significative.


Dans un but de simplification, il est traditionnel d’assimiler le cycle à la tendance.
Des méthodes dites d’extraction du cycle peuvent ensuite estimer chacune de ces
deux composantes.

1.1. PROBLEMATIQUE

L’objectif de ce papier est d’estimer la tendance-cycle (plus simplement, nous


dirons la tendance), dont on suppose qu’elle est localement polynomiale de degré 2
(principe de parcimonie) et lisse. On s’intéresse ici aux méthodes basées sur les
moyennes mobiles (et en particulier, asymétriques pour les derniers points
observés) ayant un bon pouvoir de lissage et basées sur les noyaux.

Les méthodes d’estimation de la tendance sont nombreuses (Grun-Rehomme,


Ladiray, 1994) :

- Moyennes mobiles de Bongard (1962) qui ont pour objectif une réduction de la
variance résiduelle. En effet, le bruit blanc est transformé par la moyenne mobile
en une suite de variables aléatoires (t*), de même variance égale à :

145
METHODES DE LISSAGE D’UNE SERIE TEMPORELLE : LE PROBLEME DES EXTREMITES

i  f
 *   2   2i
2
. On y ajoute les contraintes inhérentes à la conservation d’un
i  p
polynôme de degré 2 (par exemple).

- Moyennes mobiles de Henderson qui ont un bon pouvoir de lissage et que nous
développerons dans ce texte (cf. 1.2).

- Lowess de Cleveland (1979), Cleveland et Devlin (1988), méthode non


paramétrique qui consiste à estimer la tendance par des régressions locales
pondérées. C’est une méthode de lissage robuste où la fonction lisse (tendance)
est obtenue numériquement par un algorithme qui se décompose en plusieurs
étapes. Chaque point est estimé par une régression locale polynomiale sur un
certain nombre de points voisins. Ces points voisins ont un poids d’autant plus
faible qu’ils sont éloignés du point considéré. Comme fonction de poids,
Cleveland utilise dans un premier temps la fonction « tri cube » (élimination des
points atypiques dans l’axe des temps), puis une fonction « bicarrée » (élimination
des points atypiques en valeurs).

- Médianes mobiles : ces lisseurs non linéaires permettent de construire une courbe
lisse à partir de données qui peuvent être très perturbées. On peut aussi concevoir
des compositions de moyennes et/ou médianes mobiles. Ces lisseurs sont d’autant
plus performants que le bruit est à queue épaisse.

- Filtres, comme celui de Hodrick-Prescott (1997), qui présente un caractère mixte :


fidélité (proximité avec la série) et lissage (dont la souplesse dépend d’un
paramètre de lissage). Plus la valeur de ce paramètre est élevée, plus la tendance
de long terme sera lisse. Il représente le partage des fluctuations entre la tendance
et les fluctuations de court terme. La tendance est obtenue comme solution d’un
problème de minimisation d’une forme quadratique qui combine ces deux aspects
(fidélité et souplesse).

- Estimateurs à noyaux, présentés au paragraphe 3.

La valeur à l'instant t de la série brute est donc remplacée par une moyenne
pondérée (de coefficients  t ) de p valeurs "passées" de la série, de la valeur
actuelle et de f valeurs "futures" de la série. La quantité p+f+1 est appelée ordre de
la moyenne mobile, notée MM.
Lorsque p est égal à f, la moyenne mobile est dite centrée.
Si, en outre, on a  t   t pour tout t, la moyenne mobile MM centrée est dite
symétrique.
La transformation de X t par la moyenne mobile MM s’écrit :
k f
X t*  MMX t  θ
k  p
k X t k (2)

146
MICHEL GRUN-REHOMME ET OLGA VASYECHKO

Il est clair, pour des raisons de définition, que les p premiers points et les f derniers
points de la série brute ne peuvent être transformés par l'opérateur MM.

Il est facile de montrer que pour qu'une moyenne mobile MM conserve les
polynômes de degré d, il faut et il suffit que ses coefficients vérifient :

i  f i f

 θi  1 et k  1,2,.....,d  i k
θi  0 (3)
i p i  p

Les moyennes mobiles symétriques ont de bonnes propriétés (absence d’effet de


phase), mais elles ont l’inconvénient de ne pas pouvoir résoudre le problème des
extrémités de la série.

Pour ces extrémités, on peut utiliser des moyennes mobiles asymétriques (de même
ordre et en gardant les mêmes contraintes que pour la moyenne mobile symétrique
utilisée pour les autres points) ou chercher une moyenne mobile asymétrique, la
plus proche (minimisation de l’erreur quadratique de la moyenne mobile
symétrique, Musgrave, 1964).

1.2. MOYENNES MOBILES D’HENDERSON

Les moyennes mobiles de type "Henderson" sont surtout utilisées pour lisser une
série. L'estimation T̂t de la tendance (ou tendance-cycle) doit donc être une courbe
lisse. Une base de l'ensemble des séries étant constituée des séries définies par :

1 si t  t 0
X t (t 0 )   (4)
0 si t  t 0

il suffit d'imposer que les transformées de ces séries par la moyenne mobile soient
souples. Ces séries transformées sont, à une translation des temps près, égales à la
série des coefficients de la moyenne mobile:

..... 0 0   f   f 1 .....  p 1  p

Il suffit donc d'imposer à la courbe des coefficients de la moyenne mobile d'être


souple. Henderson a proposé d'utiliser comme critère de "souplesse" la quantité :

i 

 (  )
i 
3
i
2
(5)

où  représente l'opérateur différence première (Xt = X t  X t 1 ).

147
METHODES DE LISSAGE D’UNE SERIE TEMPORELLE : LE PROBLEME DES EXTREMITES

Plus cette quantité est faible, plus la série transformée par la moyenne mobile est
jugée souple. De plus, les moyennes mobiles de Henderson sont supposées restituer
correctement des polynômes de degré 1 ou 2.

Le filtre de Henderson est un estimateur sans biais pour lisser une parabole.
Les moyennes d’Henderson (  t ) sont solutions du problème d’optimisation :

 f f f f

min  ( 3 t ) 2 /  t  1,  t t  0, t  2
t 0  (6)

 p p p p 
Dans cet article, à titre d’exemple, on s’intéresse aux moyennes mobiles d’ordre 13
(p+f+1=13) pour p variant de 6 (moyenne centrée) à 12 (dernier point connu).
Dagum et Bianconcini (2008, 2012) s’intéresse à cet ordre dans sa préoccupation de
désaisonnalisation de séries mensuelles et Alexandrov et al. (2012) à partir de
l’estimation du rapport signal sur bruit.
Comme on ne s’intéresse qu’à l’extrémité des valeurs les plus récentes de la série,
on suppose toujours que p  f .

TABLEAU 1. VALEUR DES COEFFICIENTS D’UNE MOYENNE MOBILE DE


HENDERSON SELON L’ORDRE DE CETTE MOYENNE

p H-12-0 H-11-1 H-10-2 H-9-3 H-8-4 H-7-5 H-6-6


-12 0,08514
-11 0,14861 0,04644
-10 0,10217 0,07662 0,01625
-9 -0,05239 0,04257 0,02167 -0,00542
-8 -0,23577 -0,04912 0 -0,01625 -0,01858
-7 -0,34294 -0,14736 -0,03930 -0,02554 -0,03715 -0,02322
-6 -0,30007 -0,18933 -0,06877 -0,02292 -0,03406 -0,04102 -0,01935
-5 -0,10288 -0,13503 -0,06001 0 0 -0,02554 -0,02786
-4 0,17683 0,01072 -0 0,04501 0,05894 0,02947 -0
-3 0,41914 0,19647 0,10002 0,10502 0,12574 0,10806 0,06549
-2 0,51083 0,34383 0,20630 0,16504 0,18004 0,18219 0,14736
-1 0,40867 0,38313 0,27506 0,20630 0,20576 0,22505 0,21434
0 0,18266 0,29334 0,27245 0,21285 0,19647 0,22220 0,24006
1 0,12771 0,19505 0,17879 0,15718 0,17683 0,21434
2 0,08127 0,11378 0,10217 0,10806 0,14736
3 0,04334 0,04954 0,04257 0,06549
4 0,01393 0,00232 0
5 -0,00697 -0,02786
6 -0,01935

Ces valeurs correspondent aux graphiques suivants :

148
MICHEL GRUN-REHOMME ET OLGA VASYECHKO

GRAPHIQUE 1. COEFFICIENTS DE LA MOYENNE MOBILE DE HENDERSON D’ORDRE


13 SELON LES VALEURS DE P

H-6-6

0,3
0,25
0,2
0,15
0,1
0,05
0
-8 -6 -4 -2 0 2 4 6 8
-0,05

H-7-5

0,25
0,2
0,15
0,1
0,05
0
-8 -6 -4 -2 0 2 4 6
-0,05
-0,1

H-8-4

0,25

0,2

0,15

0,1

0,05

0
-10 -8 -6 -4 -2 0 2 4 6
-0,05

149
METHO
ODES DE LISSAG
GE D’UNE SERIIE TEMPORELL
LE : LE PROBLE
EME DES EXTRE
REMITES

H-10-2
0,3

0,25

0,2

0,15

0,1

0,05

0
-12 -10 -8 -6 -4 -2 -0,05 0 2 4

-0,1

H-11-1
0,5

0,4

0,3

0,2

0,1

0
-12 -10 -8 -6 -4 -2 0 2
-0,1

-0,2

-0,3

150
MICHEL GRUN-REHOMME ET OLGA VASYECHKO

H-12-0

0,6
0,5
0,4
0,3
0,2
0,1
0
-14 -12 -10 -8 -6 -4 -2 -0,1 0
-0,2
-0,3
-0,4

Conséquences

1. Le caractère souple des coefficients est bien mis en évidence.


Pour les moyennes de H-6-6 à H-9-3, on constate que le coefficient de la valeur
actuelle est plus grand que les autres coefficients, ce qui correspond à l’idée
« économique » que la valeur actuelle est prépondérante pour estimer la valeur
de la tendance à la date actuelle.
Par contre à l’extrémité gauche, la valeur des coefficients augmente, ce qui
correspond à la troncature du filtre infini par des zéros.

2. Pour les trois derniers ordres (de 10 à 12), la plus grande valeur des coefficients
reste bloquée à la date t - 2, ce qui n’est pas satisfaisant, puisque la dernière
valeur observée pèse moins que celle à t-2.
Ces remarques ont déjà été formulées par Dagum et Bianconcini (2008, 2012).

Regardons maintenant, pour essayer de lever cet inconvénient, ce qui se passe si on


ne conserve que les droites :

Les moyennes d’Henderson (  t ) sont alors solutions du problème d’optimisation :

 f f f

min  ( 3 t ) 2 /  t  1,  t t 0  (7)

 p p p 

151
METHODES DE LISSAGE D’UNE SERIE TEMPORELLE : LE PROBLEME DES EXTREMITES

GRAPHIQUE 2. COEFFICIENTS DE LA MOYENNE MOBILE DE HENDERSON


D’ORDRE 13 QUI NE CONSERVE QUE LES DROITES

MH-6-6

0,15

0,1

0,05

0
-8 -6 -4 -2 0 2 4 6 8

MH-7-5

0,2

0,15

0,1

0,05

0
-8 -6 -4 -2 0 2 4 6

MH-8-4

0,2

0,15

0,1

0,05

0
-10 -8 -6 -4 -2 0 2 4 6
-0,05

152
MICHEL GRUN-REHOMME ET OLGA VASYECHKO

MH-9-3

0,25
0,2

0,15
0,1

0,05
0
-10 -8 -6 -4 -2 0 2 4
-0,05
-0,1

MH-10-2

0,3
0,25
0,2
0,15
0,1
0,05
0
-12 -10 -8 -6 -4 -2 -0,05 0 2 4

-0,1

MH-11-1

0,4

0,3

0,2

0,1

0
-12 -10 -8 -6 -4 -2 0 2
-0,1

-0,2

Conséquences

Les formes sont assez proches des précédentes. Pour les derniers ordres, le point de
retournement est en t-4, t-5 et donc les dernières valeurs observées ont moins
d’influence sur le lissage que la valeur actuelle en ces derniers points de la série.
Cette démarche ne permet pas de répondre à notre objection précédente.

153
METHODES DE LISSAGE D’UNE SERIE TEMPORELLE : LE PROBLEME DES EXTREMITES

2. UNE VARIANTE DU CRITERE DE HENDERSON

On se propose de chercher les coefficients de la moyenne mobile sur une parabole


en conservant les polynômes du second degré.
Comme on ne s’intéresse qu’à l’extrémité des valeurs les plus récentes de la série,
on suppose toujours que 0  f  p .
Soit le problème d’optimisation :

 
f
min   t  (at 2  bt  c) (8)
a, b, c
p

sous les contraintes de conservation des polynômes du second degré :

f f f

 t  1,
p
 t t  0,
p
t 
p
2
t 0 (9)

Soit ( a , b, c ) la fonction objectif à minimiser. Cette fonction étant strictement


convexe, le minimum est atteint pour d ( a , b, c )  0

Posons

S0  p  f  1

f f p
f ( f  1)  p ( p  1)
S1   t   t   t 
p 1 1 2

f p f
p ( p  1)(2 p  1)  f ( f  1)(2 f  1)
S 2   t   t  t 2 
2 2
(10)
p 1 1 6

f f p
f 2 ( f  1) 2  p 2 ( p  1) 2
S 3   t 3   t 3  t 3 
p 1 1 4

f p f
S 4   t 4   t 4  t 4
p 1 1

p ( p  1)(6 p  9 p 2  p  1)  f ( f  1)(6 f 3  9 f 2  f  1)
3

30
En tenant compte des contraintes, on obtient le système :

154
MICHEL GRUN-REHOMME ET OLGA VASYECHKO

aS 4  bS 3  cS 2  0

 aS 3  bS 2  cS1  0 (11)
 aS  bS  cS  1
 2 1 0

 S4 S3 S2 
 
Soit A   S 3 S2 S1  (11b)
S S1 S 0 
 2

a 0
  1
  S S  S 22 S S  S1 S 4
D’où  b   A  0  et a  1 3 ,b 2 3 ,
c 1 det( A) det( A)
   

S 2 S 4  S 32
c (12)
det( A)

Les coefficients a, b et c dépendent des valeurs de p et f, mais sont indépendants des


t .

TABLEAU 2. VALEUR DES PARAMETRES a, b ET c SELON L’ORDRE DE LA MOYENNE


MOBILE

p f a b c
6 6 -0,006993 0 0,17482517
7 5 -0,006493 -0,007492 0,16683317
8 4 -0,004995 -0,008991 0,14885115
9 3 -0,002497 0,001498 0,13886114
10 2 0,000999 0,029970 0,16683317
11 1 0,005494 0,082418 0,27472527
12 0 0,010989 0,164835 0,51648352

Puis on pose :  t  at 2  bt  c .

155
METHODES DE LISSAGE D’UNE SERIE TEMPORELLE : LE PROBLEME DES EXTREMITES

TABLEAU 3. COEFFICIENTS DE LA MOYENNE MOBILE SELON L’ORDRE DE CETTE


MOYENNE

t MM-12-0 MM-11-1 MM-10-2 MM-9-3 MM-8-4 MM-7-5 MM-6-6


-12 0,120879
-11 0,032967 0,032967
-10 -0,032967 0 -0,032967
-9 -0,076923 -0,021978 -0,021978 -0,076923
-8 -0,098901 -0,032967 -0,008991 -0,032967 -0,098901
-7 -0,098901 -0,032967 0,0059940 0,005994 -0,032967 -0,098901
-6 -0,076923 -0,021978 0,0229770 0,039960 0,022977 -0,021978 -0,076923
-5 -0,032967 0 0,0419580 0,068931 0,068931 0,041958 0
-4 0,032967 0,032967 0,0629371 0,092907 0,104895 0,092907 0,062937
-3 0,120879 0,076923 0,085914 0,111888 0,130869 0,130869 0,111888
-2 0,230769 0,131868 0,110889 0,125874 0,146853 0,155844 0,146853
-1 0,362637 0,197802 0,137862 0,134865 0,152847 0,167832 0,167832
0 0,516483 0,274725 0,166833 0,138861 0,148851 0,166833 0,174825
1 0,362637 0,197802 0,137862 0,134865 0,152847 0,167832
2 0,230769 0,131868 0,110889 0,125874 0,146853
3 0,120879 0,076923 0,085914 0,111888
4 0,032967 0,032967 0,062937
5 -0,032967 0
6 -0,076923

156
MICHEL GRUN-REHOMME ET OLGA VASYECHKO

GRAPHIQUE 3. COEFFICIENTS DE LA MOYENNE MOBILE DE LA VARIANTE DE


HENDERSON D’ORDRE 13 QUI CONSERVE LES PARABOLES

MM-6-6

0,2

0,15

0,1

0,05

0
0 2 4 6 8 10 12 14
-0,05

-0,1

MM-7-5

0,2
0,15
0,1
0,05
0
0 2 4 6 8 10 12 14
-0,05
-0,1
-0,15

MM-8-4

0,2
0,15
0,1
0,05
0
-0,05 0 2 4 6 8 10 12 14

-0,1
-0,15

157
METHODES DE LISSAGE D’UNE SERIE TEMPORELLE : LE PROBLEME DES EXTREMITES

MM9-3

0,15

0,1

0,05

0
0 2 4 6 8 10 12 14
-0,05

-0,1

MM10-2

0,25
0,2
0,15
0,1
0,05
0
0 2 4 6 8 10 12 14
-0,05

MM-11-1

0,4

0,2

0
0 5 10 15
‐0,2

MM-12-0

0,6
0,5
0,4
0,3
0,2
0,1
0
-0,1 0 2 4 6 8 10 12 14
-0,2

158
MICHEL GRUN-REHOMME ET OLGA VASYECHKO

Les coefficients restent bien sur une parabole et la plus grande valeur est obtenue
chaque fois à la date actuelle jusqu’à la moyenne mobile d’ordre 9-3, ce qui semble
satisfaisant. Mais comme dans les approches classiques de Henderson, on obtint
deux groupes de moyennes mobiles : celles de 6 à 9 (fonction concave) et celles de
10 à 12 (convexes), et dans ces derniers cas, la dernière valeur a le plus de poids.
Envisageons donc une autre approche.

3. NOYAUX ET MOYENNES MOBILES

La méthode des noyaux est utilisée, en général, pour estimer la densité d’une loi de
probabilité à partir d’un échantillon, en prenant en compte le caractère local de cette
densité (Bosq, Lecoutre, 1990).

Un noyau K est une application numérique bornée d’une variable réelle qui vérifie :

 K ( x) dx  1 et
R
lim x K ( x)  0
x 

On suppose souvent K positif, pair et max K ( x )  K (0) . Par exemple :


x

K ( x)   1 / 2,1 / 2  ( x) (  désigne une fonction indicatrice) ou


2
1 x
K ( x)  exp( ).
2 2
Le noyau permet de définir des poids p t pour estimer la densité d’une fonction f
en un point x, par

 X  x  n  Xt  x 
pt  K  t  /  K   (13)
 n  t 1  n 
n
Par construction, on a : p
1
t  1.
n
La valeur de f est alors estimée par : fˆn ( x)   pt xt .
1

Remarquons que fˆn dépend de n (nombre d’observations), du paramètre de


lissage  n et du choix du noyau K.
Pour estimer une densité, si  n est grand, le biais augmente et la variance diminue
et on a la situation inverse si  n est petit, d’où l’idée de chercher à minimiser
l’erreur quadratique moyenne. . On montre (Weyman, Wright, 1983) que dans la

x K ( x) dx  1 , l’optimum de l’EQI
2
classe des noyaux positifs, pairs et vérifiant
R

159
METHODES DE LISSAGE D’UNE SERIE TEMPORELLE : LE PROBLEME DES EXTREMITES

(Erreur Quadratique Intégrée), à savoir min


K   2
E f ( x)  fˆn ( x ) dx , est atteint
R
pour le noyau d’Epanechnikov défini par :

t2
3
K (t )  (1  )   5, 5  (t ) (14)
4 5 5

Le noyau peut être utilisé définir les coefficients  t des moyennes mobiles.

K (t /  )
En effet, on pose : t  f
,
 K (t /  )
t  p

où  est un paramètre de lissage choisit en fonction de la longueur du filtre. Cette


f
moyenne mobile conserve, par construction, les constantes puisque  p
t 1 .

Par exemple, pour   1, p  f  m et K    m , m  , on obtient la moyenne


arithmétique.

On pourrait choisir d’autres noyaux (Dagum et Bianconcini, 2008), mais le noyau


d’Epanechnikov présente l’avantage d’être un bon compromis entre le biais et la
précision, d’autre part son expression parabolique permet une comparaison
pertinente avec la variante de Henderson présentée au paragraphe précédent (cf.
tableau 4).

On cherche toujours à lisser une série X t qui se décompose de façon additive en


une tendance-cycle (notée TC t ) et une composante résiduelle  t (bruit blanc) :

X t  TC t   t (15)

Les coefficients de la moyenne mobile symétrique sont alors définis par :

K (t /  )
t  m

 K (t /  )
t  m

De suite, on peut remarquer que 0 (poids de la date actuelle pour le lissage) sera
toujours plus grands que les poids attribués aux dates antérieures ou postérieures).

160
MICHEL GRUN-REHOMME ET OLGA VASYECHKO

m
Pour une moyenne mobile symétrique d’ordre 2m+1, il faut choisir  pour
5
rester dans l’intervalle  m, m,
t 3 t2 m
t m
3 t2
on obtient K ( ) 
 4 5
(1 
m2
) et 
m
K (

)  
m 4 5
(1 
m2
),

d’où

m
t 3 t2 m


m
K( ) 
 4 5
( 2 m  1  2 2 )
m m

3 (m  1)(2m  1) 4m 2  1
 ( 2m  1  )
4 5 3m 4m 5

et

3m t2
t  (1  )
4m 2  1 m2
On compare les coefficients obtenus par le noyau d’Epanechnikov avec ceux de
notre variante du critère de Henderson pour différents ordres de la moyenne mobile.
La proximité des coefficients dépend peu de l’ordre de la moyenne mobile.
L’exemple de l’ordre 13 peut se généraliser.

TABLEAU 4. COMPARAISON ENTRE LES COEFFICIENTS OBTENUS PAR LE NOYAU


ET CEUX DE LA VARIANTE DE HENDERSON POUR DES MOYENNES
MOBILES SYMETRIQUES

Ordre Coefficients par le noyau Coefficients de Henderson


de la moyenne mobile modifié
5
 0.4(1  0.25t 2 )  0.5(1  0.30t 2 )
7
 0.3(1  0.11t 2 )  0.33(1  0.14t 2 )
9
 0.2(1  0.06t 2 )  0.25(1  0.10t 2 )
11
 0.15(1  0.04t 2 )  0.20(1  0.06t 2 )
13
 0.13(1  0.03t 2 )  0.17(1  0.04t 2 )

Avec la moyenne de Henderson d’ordre 13 qui ne conserve que les droites, on


obtient  0.13(1  0.16t ) et un R proche de 0.95.
2 2

161
METHODES DE LISSAGE D’UNE SERIE TEMPORELLE : LE PROBLEME DES EXTREMITES

Pour des moyennes asymétriques, avec 0  f  p (on ne s’intéresse qu’aux


p p
derniers points observés), il faut choisir  , par exemple :  et dans
5 5
t2
(1  )
p2
ce cas : t  , où la somme S 2 est définie en (10).
S
( p  f  1  22 )
p
Les poids de ces moyennes mobiles asymétriques associées au filtre symétrique de
Henderson sont calculés en appliquant la méthode « cut and normalize » de Gasser
et Muller (1979).

TABLEAU 5. COEFFICIENTS DE LA MOYENNE MOBILE D’APRES LE NOYAU


D’EPANECHNIKOV

t N-12-0 N-11-1 N-10-2 N-9-3 N-8-4 N-7-5 N-6-6


-12 0
-11 0,018821 0
-10 0,036006 0,019700 0
-9 0,051555 0,037523 0,020879 0
-8 0,065466 0,053471 0,039560 0,022546 0
-7 0,077741 0,067542 0,056044 0,042440 0,025084 0
-6 0,088380 0,079737 0,070330 0,059681 0,046823 0,029412 0
-5 0,097381 0,090056 0,082418 0,074271 0,065217 0,054299 0,038461
-4 0,104746 0,098499 0,092308 0,086210 0,080267 0,074661 0,069930
-3 0,110475 0,105065 0,1 0,095490 0,091973 0,090498 0,094406
-2 0,114566 0,10975 0,105494 0,102122 0,100334 0,101810 0,111888
-1 0,117021 0,112570 0,108791 0,10610 0,105351 0,108597 0,122377
0 0,117840 0,113508 0,109890 0,107427 0,107023 0,110859 0,125874
1 0,112570 0,108791 0,106100 0,105351 0,108597 0,122378
2 0,105494 0,102122 0,100334 0,101810 0,111888
3 0,095491 0,091973 0,090498 0,094406
4 0,080267 0,074661 0,069930
5 0,054299 0,038461
6 0

Le graphique suivant représente les coefficients de cette moyenne mobile obtenue


par le noyau d’Epanechnikov.

162
MICHEL GRUN-REHOMME ET OLGA VASYECHKO

GRAPHIQUE 4. COEFFICIENTS PAR LE NOYAU D’EPANECHNIKOV (D’APRES LE


TABLEAU 6)

Noyau-6-6

0,14
0,12
0,1
0,08
0,06
0,04
0,02
0
-8 -6 -4 -2 0 2 4 6 8

Noyau-7-5

0,12

0,1

0,08

0,06

0,04

0,02

0
-8 -6 -4 -2 0 2 4 6

Noyau-8-4

0,12

0,1

0,08

0,06

0,04

0,02

0
-10 -8 -6 -4 -2 0 2 4 6

163
METHODES DE LISSAGE D’UNE SERIE TEMPORELLE : LE PROBLEME DES EXTREMITES

Noyau-9-3

0,12

0,1

0,08

0,06

0,04

0,02

0
-10 -8 -6 -4 -2 0 2 4

Noyau-10-2

0,12

0,1

0,08

0,06

0,04

0,02

0
-12 -10 -8 -6 -4 -2 0 2 4

Noyau-11-1

0,12

0,1

0,08

0,06

0,04

0,02

0
-12 -10 -8 -6 -4 -2 0 2

164
MICHEL GRUN-REHOMME ET OLGA VASYECHKO

Noyau-12-0

0,14
0,12
0,1
0,08
0,06
0,04
0,02
0
-14 -12 -10 -8 -6 -4 -2 0

Cette approche par le noyau présente l’avantage que la valeur présente a plus de
poids que les autres valeurs, et le poids diminue, aussi bien dans le passé que dans
le futur, en s’éloignant de la valeur présente. Et cette propriété reste valable pour
toutes les moyennes mobiles asymétriques. De plus elle conserve les constantes,
mais non les droites et les paraboles.

On peut alors chercher la moyenne mobile la plus proche de celle obtenue avec le
noyau et qui conserve les paraboles.
f
Soit xt les coefficients de la moyenne mobile associée du noyau, avec x
p
t 1 .

Il faut résoudre le problème d’optimisation :

 f f f f

min  ( t  xt ) /  t  1,
2
 t t  0, t  2
t 0  (17)

 p p p p 
Comme la fonction objectif est convexe et les contraintes linéaires indépendantes,
la solution du problème d’optimisation vérifie les conditions de Kuhn et Tuker, on
obtient :

 f 2 
  t xt 
 3   p 
   f 
 2   A   t xt  , où l’expression de A est donnée en (11b), d’où
1

   p 
 1  0 
 
 
f f
( S 0 S 2  S12 )( t 2 xt )  ( S1 S 2  S 0 S 3 )( tx t )
p p
3  , (18)
det( A)

165
METHODES DE LISSAGE D’UNE SERIE TEMPORELLE : LE PROBLEME DES EXTREMITES

f f
( S1 S 2  S 0 S 3 )( t 2 xt )  ( S 0 S 4  S 22 )( txt )
p p
2 
det( A)
f f
( S1 S 3  S 22 )( t 2 xt )  ( S 2 S 3  S1 S 4 )( tx t )
p p
1  .
det( A)

Puis  t  xt  (3t 2   2 t  1 )

GRAPHIQUE 5. COEFFICIENTS PAR MINIMISATION DE L’ERREUR QUADRATIQUE


AU NOYAU D’EPANECHNIKOV EN CONSERVANT LES PARABOLES

NP-6-6

0,2

0,15

0,1

0,05

0
-8 -6 -4 -2 0 2 4 6 8
-0,05

-0,1

NP-7-5

0,14
0,12
0,1
0,08
0,06
0,04
0,02
0
-8 -6 -4 -2 0 2 4 6
-0,02

166
MICHEL GRUN-REHOMME ET OLGA VASYECHKO

NP-8-4

0,2

0,15

0,1

0,05

0
-10 -8 -6 -4 -2 0 2 4 6
-0,05

-0,1

-0,15

NP-9-3

0,15

0,1

0,05

0
-10 -8 -6 -4 -2 0 2 4

-0,05

-0,1

NP-10-2

0,25

0,2

0,15

0,1

0,05

0
-12 -10 -8 -6 -4 -2 0 2 4
-0,05

167
METHODES DE LISSAGE D’UNE SERIE TEMPORELLE : LE PROBLEME DES EXTREMITES

NP-11-1

0,4
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
-12 -10 -8 -6 -4 -2 -0,05 0 2
-0,1

NP-12-0

0,6
0,5
0,4
0,3
0,2
0,1
0
-14 -12 -10 -8 -6 -4 -2 0
-0,1
-0,2

On vérifie que cette approche est équivalente à la variante du critère d’Henderson


(paragraphe 3, graphique 3) du fait que les contraintes dans ce cas sont trop fortes
(espace de dimension trois seulement) et donc les coefficients ne dépendent pas de
la moyenne mobile de référence par rapport à laquelle on minimise la distance.

En conclusion, nous avons quatre approches de lissage de la série. Nous allons


comparer ces méthodes sur l'indice de la production industrielle en France.

4. APPLICATION

L'indice de la production industrielle (IPI) est un instrument statistique qui mesure


les variations des quantités produites dans l'industrie (source Insee). C’est un indice
de Laspeyres (pondération constante) calculés par l'Insee à partir des enquêtes de
branche, issues de services statistiques de différents ministères, de syndicats ou
d'organismes professionnels. Ces indices sont mensuels, corrigés des variations
saisonnières et des jours ouvrables.

L'usage est de parler de l'indice (au singulier) de la production industrielle lorsqu'on


ne n'intéresse qu'à l'indicateur macro-économique relatif à l'ensemble de l'industrie
manufacturière nationale.

Nous disposons (source INSEE) de l’IPI mensuel corrigé des variations


saisonnières (CVS) et corrigé des effets de jours ouvrables (CJO) de janvier 2007 à

168
MICHEL GRUN-REHOMME ET OLGA VASYECHKO

septembre 2011 (base 100 en 2005) pour trois secteurs d’activité agrégés :
l’ensemble de l’industrie (industrie manufacturière, industries extractives et autres),
l’industrie manufacturière et la construction (graphiques 6, 7, 8 en annexe). Ces
graphiques permettent de visualiser les différentes méthodes de lissage sur
l’ensemble de la série, mais on aussi limiter les graphiques à la fin des valeurs
observées, les douze dernières valeurs, de façon à mieux cerner les détails
(graphiques 6b, 7b et 8b en annexe)

Les quatre approches donnent globalement des résultats semblables au centre de la


série pour les trois secteurs. Toutefois on peut noter les différences suivantes :

- La moyenne d’Henderson qui ne conserve que les droites est très lisse, mais
n’appréhende pas les points de retournement à l’extrémité de la série. Cette
approche, certes plus simple, ne nous donne pas une estimation suffisamment
sensible aux points de retournement à la fin de la série.

- L’estimation par le noyau d’Epanechnikov est proche de celle d’Henderson


simplifiée (conservation locale des droites) au centre de la série, mais elle donne
une meilleure allure à l’extrémité. Cette approche nous semble pertinente.

- La variante d’Henderson est proche de la moyenne d’Henderson classique, mais


plus souple.

CONCLUSION

A travers ces multiples approches, deux éléments restent constants :

- Dans les méthodes qui conservent les paraboles, un basculement s’opère entre les
moyennes mobiles asymétriques d’ordre 9-3 et celles d’ordre 10-2, où l’on passe
d’une concavité de la courbe des coefficients avec un poids prépondérant à la
valeur actuelle (ce qui semble raisonnable) à une convexité qui attribue le plus
grand poids à la dernière valeur observée (ce qui est moins raisonnable).

- Avec la méthode du noyau d’Epanechnikov qui par construction ne conserve que


les constantes (comme les autres noyaux, mais présente l’avantage de minimiser
l’erreur quadratique intégrée), le poids de la valeur présente est toujours le plus
grand et ce poids décroît quand on s’éloigne de la valeur présente. Ceci laisse à
penser que pour les dernières valeurs, il est préférable de prendre des moyennes
mobiles qui ne conservent que les constantes (voire les droites), sinon les
dernières valeurs observées ont trop de poids et entraînent fortement la tendance.
Ce qui est contraire à la définition de la tendance qui marque l’évolution à long
terme de la série et donc doit être relativement lisse (ou robuste).

La décomposition d’une série temporelle en ses différentes composantes n’est pas


unique, la multitude des approches en témoigne. L’ajout d’hypothèses sur les
composantes, comme le fait que la tendance soit lisse et localement polynomiale de
degré deux n’y change rien. Il revient donc au statisticien économiste de choisir ce
qui lui semble le meilleure lissage en fonction de son expérience pratique. Ce papier
apporte deux contributions nouvelles intéressantes à la panoplie des méthodes de

169
METHODES DE LISSAGE D’UNE SERIE TEMPORELLE : LE PROBLEME DES EXTREMITES

lissage et des combinaisons convexes de ces différentes moyennes mobiles peuvent


être envisagées.

REFERENCES

Alexandrov, T., S. Bianconcini, E.B. Dagum, P. Maass and T.S. McElroy, 2012.
“A review of some modern approaches to the problem of trend extraction”,
Econometric Reviews, 31(6), pp. 593-624.
Bianconcini, S. and B. Quenneville, 2010. “Real time analysis based on
reproducing kernel Henderson filters”, Estudios de Economia Aplicada, 28(3),
pp.1-22.
Bongard, J., 1962. Quelques remarques sur les moyennes mobiles in l’élimination
des variations saisonnières à l’aide de calculatrices électroniques, OCDE.
Bosq, D. and J.P. Lecoutre, 1990. Théorie de l’estimation fonctionnelle,
Economica.
Cleveland, W.S., 1979. “Robust locally weighted regression and smoothing
scatterplots”, Journal of the American Statistical Association, 74 (368), pp.829–
836.
Cleveland, W.S. and S.J. Devlin, 1988. “Locally-weighted regression: an
approach to regression analysis by local fitting”, Journal of the American Statistical
Association, 83 (403), pp. 596–610.
Dagum, E.B., 1982. “The effects of asymmetric filters of seasonal factor
revisions”, Journal of the American Statistical Association, 77, pp. 732-738.
Dagum, E.B., 1988. The X11ARIMA/88 seasonal adjustment method, foundation
and user’s manual, research paper, Time Series Research and Analysis Division,
Statistics Canada.
Dagum, E.B. and S. Bianconcini, 2008. “The Henderson smoother in reproducing
kernel Hilbert space”, J. of Business & Economic Statistics, 26(4), pp. 536-545.
Dagum, E.B. and S. Bianconcini, 2012. “Reducing revisions in real time trend-
cycle estimation”, JSM 2012 Online Program.
Doherty, M., 2001. “The surrogate Henderson filters in X11”, Australian and New
Zealand journal of Statistics, 43, pp. 385-392.
Findley, D., B. Monsell, W. Bell, M. Otto and B. Chen, 1998. “New capabilities
and methods of the X12ARIMA seasonal adjustment program”, Journal of Business
& Economic Statistics, 16, pp. 127-152.
Gasser, T. and H.G. Müller, 1979. Kernel estimation of regression functions.
Smoothing techniques for curve estimation (Proceedings of a Workshop held in
Heidelberg, April 2-4, 1979), Lectures Notes in Math., 737 Springer, pp. 23-68.
Gray, A. and P. Thomson, 1996. “Design of moving-average trend filters using
fidelity and smoothness criteria”, Time Series Analysis, vol. 2 (in memory of E.J.
Hannan), Springer Lectures Notes in Statistics, vol. 15, pp. 205-219.
Guggemos, F., D. Ladiray and M. Grun-Rehomme, 2012. “New results on linear
filters minimizing phase-shift for seasonal adjustment”, Joint Statistical Meetings,
San Diego, USA, July28-August 3, 2012.
Grun-Rehomme, M. and D. Ladiray, 1994. “Moyennes mobiles centrées et non
centrées: construction et comparaison“, Revue de Statistiques Appliquées (RSA),
vol. XLII, n. 3, pp. 33-61.
Henderson, R., 1916. “Note on graduation by adjusted average”, Transaction of
Actuarial Society of America, 17, pp. 43-48.

170
MICHEL GRUN-REHOMME ET OLGA VASYECHKO

Hodrick, R. and E. Prescott, 1997. “Postwar u. s. business cycles”, Journal of


Money, Credit and Banking, 29(1), pp. 1-16.
Ladiray, D. and B. Quenneville, 2001. Seasonal adjustment with X11-method,
Lecture notes in statistics, 158, Springer, New York.
Musgrave, J., 1964a. A set of end weights to end all end weights, US Bureau of
Census, Washington DC. http://www.census.gov/ts/papers/Musgrave1964a.pdf
Musgrave, J., 1964b. Alternative sets of weights for proposed X-11 seasonal factor
curve moving averages, working paper, US Bureau of Census, Washington DC.
http://www.census.gov/ts/papers/Musgrave1964b.pdf
Proietti, F. and A. Luati, 2008. “Real time estimation in local polynomial
regression, with application to trend-cycle analysis”, The Annals of Applied
Statistics, 2(4), pp. 1523-1553.
Quenneville, B., D. Ladiray and B. Lefrançois, 2003. “A note on Musgrave
asymmetrical trend-cycles filters”, International Journal of Forecasting, 19, pp.
727-734. U.S. Census Bureau, X-13Arima-Seats,
http://www.census.gov/ts/x13as/docX13ASHTML.pdf, document du 10 septembre
2013.
Weyman, D.J. and J.W. Wright, 1983. “Splines in statistics”, Journal of the
American Statistical Association, 78(382), pp. 351-365.

171
METHODES DE LISSAGE D’UNE SERIE TEMPORELLE : LE PROBLEME DES EXTREMITES

ANNEXE. COMPARAISON DES METHODES DE LISSAGE SUR DES IPI

GRAPHIQUE 6. COMPARAISON DES METHODES DE LISSAGE SUR L’IPI CVS-CJO


(INDUSTRIE MANUFACTURIERE, INDUSTRIES EXTRACTIVES ET
AUTRES)
IPI CVS-CJO Industrie manufacturière, industries extractives et autres (NAF rév.2, niveau
A10, poste BE)

110

105

100
Valeurs
base 100 en 2005

Henderson
95 "classique"
Henderson
"simplifié"
droites
90

85

80
2007-…
2007-…
2007-…
2007-…
2007-…
2007-…
2008-…
2008-…
2008-…
2008-…
2008-…
2008-…
2009-…
2009-…
2009-…
2009-…
2009-…
2009-…
2010-…
2010-…
2010-…
2010-…
2010-…
2010-…
2011-…
2011-…
2011-…
2011-…
2011-…

GRAPHIQUE 6B. COMPARAISON DES METHODES DE LISSAGE SUR L’IPI CVS-CJO


(INDUSTRIE MANUFACTURIERE, INDUSTRIES EXTRACTIVES ET
AUTRES) POUR LES DOUZE DERNIERES VALEURS DU GRAPHIQUE 6

Valeurs Henderson "classique"
Henderson "simplifié"droites varHend. Coeffs sur parabole
Epanechnikov

172
MICHEL GRUN-REHOMME ET OLGA VASYECHKO

GRAPHIQUE 7. COMPARAISON DES METHODES DE LISSAGE SUR L’IPI CVS-CJO


DE L’INDUSTRIE MANUFACTURIERE
IPI CVS-CJO Industrie manufacturière (NAF rév. 2, niveau A10, poste CZ)

110

105

100
Valeurs
base 100 en 2005

Henderson
95 "classique"
Henderson
"simplifié"
droites
90

85

80
2007…
2007…
2007…
2007…
2007…
2007…
2008…
2008…
2008…
2008…
2008…
2008…
2009…
2009…
2009…
2009…
2009…
2009…
2010…
2010…
2010…
2010…
2010…
2010…
2011…
2011…
2011…
2011…
2011…
GRAPHIQUE 7B. COMPARAISON DES METHODES DE LISSAGE SUR L’IPI CVS-
CJO DE L’INDUSTRIE MANUFACTURIERE POUR LES DOUZE
DERNIERES VALEURS DU GRAPHIQUE 7

Valeurs Henderson "classique"
Henderson "simplifié"droites varHend. Coeffs sur parabole
Epanechnikov

173
METHODES DE LISSAGE D’UNE SERIE TEMPORELLE : LE PROBLEME DES EXTREMITES

GRAPHIQUE 8. COMPARAISON DES METHODES DE LISSAGE SUR L’IPI CVS-CJO


DANS LA CONSTRUCTION
IPI CVS-CJO Construction (NAF rév. 2, niveau A10, poste FZ)

110

105

100
Valeurs
base 100 en 2005

Henderson
95 "classique"
Henderson
"simplifié"
droites
90

85

80
2007…
2007…
2007…
2007…
2007…
2007…
2008…
2008…
2008…
2008…
2008…
2008…
2009…
2009…
2009…
2009…
2009…
2009…
2010…
2010…
2010…
2010…
2010…
2010…
2011…
2011…
2011…
2011…
2011…
GRAPHIQUE 8B. COMPARAISON DES METHODES DE LISSAGE SUR L’IPI CVS-CJO
DANS LA CONSTRUCTION POUR LES DOUZE DERNIERES VALEURS
DU GRAPHIQUE 8

Valeurs Henderson "classique"
Henderson "simplifié"droites varHend. Coeffs sur parabole
Epanechnikov

174

Vous aimerez peut-être aussi