Les Previsions de Vente

Rgis Bourbonnais - Prvision des ventes
PREVISION DES VENTES

Polycopi du produit multimdia

Auteur : Rgis Bourbonnais
Universit de Paris-Dauphine

Octobre 2001


Sommaire

Chapitre 1 : LA PREVISION DES VENTES : QUELQUES REFLEXIONS PRELIMINAIRES

1. Pourquoi laborer des prvisions des ventes ?........................................................................ 4
1.1. La prvision conditionne l'optimisation.......................................................................... 4
1.2. L'obligation de prvoir est lie aux dlais de raction.................................................... 4
2. Ce qui caractrise un problme de prvision.......................................................................... 5
3. Qui prvoit ?............................................................................................................................ 6
3.1. Le processus dlaboration de la prvision..................................................................... 6
3.2. La prvision comme une aide la dcision.................................................................... 7

Chapitre 2 : LA DECOMPOSITION DUN HISTORIQUE DES VENTES

1. La notion d'historique ............................................................................................................. 9
2. Le calcul des statistiques de base et la prsentation des donnes......................................... 10
2.1. Le calcul des statistiques de base.................................................................................. 10
2.2. La prsentation des donnes ......................................................................................... 11
3. L'analyse de srie chronologique et la prvision .................................................................. 14
3.1. Les tapes de la prvision des ventes............................................................................ 14
3.2. Recherche et correction de valeur s anormales.............................................................. 15
3.2.1 La dtection des valeurs anormales ...................................................................... 15
3.2.2 La correction des valeurs anormales..................................................................... 17
3.3. Le schma de dcomposition........................................................................................ 18
3.4. La tendance................................................................................................................... 20
3.5. La saisonnalit............................................................................................................... 22
3.5.1 Pourquoi analyser une saisonnalit ? .................................................................... 22
3.5.2 La correction des jours ouvrables ......................................................................... 22
3.5.3 Le calcul de la saisonnalit ................................................................................... 23
3.5.4 Test sur la saisonnalit.......................................................................................... 30
3.5.5 Famille de saisonnalit.......................................................................................... 32
3.6. La composante cyclique................................................................................................ 33
3.7. Le facteur rsiduel......................................................................................................... 33

Chapitre 3 : PRINCIPALES METHODES (1) : LES METHODES FONDEES SUR LE
LISSAGE EXPONENTIEL

1. Caractristiques des mthodes de lissage.............................................................................. 34
1.1. Principes de base........................................................................................................... 34
1.2. Formulation................................................................................................................... 34
1.3. Rle de la constante de lissage...................................................................................... 36
2. Le lissage simple : le modle stationnaire ............................................................................ 38
3. Le lissage exponentiel double : le modle linaire ............................................................... 39
4. Les modles de Holt et HoltWinters................................................................................... 42
4.1. Le modle de Holt ......................................................................................................... 42
4.2. Le modle avec tendance et saisonnalit (modle de HoltWinters) ........................... 42
5. Comment choisir le coefficient de lissage ?.......................................................................... 45
5.1. Principes gnraux ........................................................................................................ 45
5.2. Valeur de qui minimise la somme des carrs des erreurs de prvision..................... 45
5.3. Procdure de rgulation d'un coefficient de lissage...................................................... 46
5.3. 1 Principes gnraux ................................................................................................ 46
5.3.2 Les variables de contrle....................................................................................... 47
5.3.3 Application............................................................................................................ 50

Chapitre 4 : PRINCIPALES METHODES (2) : BOX-JENKINS ET MODELE CAUSAL

1. La corrlation et le corrlogramme ....................................................................................... 54
1.1. La corrlation................................................................................................................ 54
1.1.1 Mesure du coefficient de corrlation linaire ....................................................... 54
1.1.2 Limites de la notion de corrlation ....................................................................... 56
1.2. Le corrlogramme et la fonction d'autocorrlation....................................................... 56
1.3. Introduction la mthodologie de Box et Jenkins ........................................................ 60
1.3.1 Typologie des modles.......................................................................................... 60
1.3.2 Le problme de la stationnarit............................................................................. 62
1.3.3 Recherche de la reprsentation adquate.............................................................. 62
2. L'approche exogne .............................................................................................................. 65
2.1. La notion d'ajustement et le modle de rgression simple............................................ 66
2.2. La modlisation plusieurs variables : l'conomtrie .................................................. 67
2.3. Interprtation statistique d'un modle........................................................................... 68
2.4. Exemples destimation conomtrique laide des outils sur tableur Excel ................ 71
2.5. La slection de variables explicatives........................................................................... 74
1. Mesure de la qualit d'une prvision..................................................................................... 79

Chapitre 5 : EVALUATION DES METHODES DE PREVISION

1.1. Les indicateurs de mesure............................................................................................ 79
1.2. La prvision est-elle biaise ? ....................................................................................... 80
1.3. Convergence de la prvision......................................................................................... 81
1.4. Dtection de la cause de l'erreur ................................................................................... 82
1.5. Quelle erreur de prvision est admissible ? .................................................................. 83
1.6. La simulation................................................................................................................. 83
2. Evaluation synthtique de la qualit de la prvision............................................................. 84
2.1. Calcul dun indice pondr........................................................................................... 84
2.2. Evaluation graphique .................................................................................................... 85
3. Procdures d'valuation ........................................................................................................ 87
3.1. Dure de la mesure........................................................................................................ 87
3.2. Comparaisons de prvisions ......................................................................................... 88
3.3. Exemples doutils dalerte ............................................................................................ 89


Chapitre 1

LA PREVISION DES VENTES : QUELQUES REFLEXIONS
PRELIMINAIRES

Nous examinons dans ce chapitre introductif en quoi l'obligation de prvoir la demande dpend
de l'organisation mme de l'entreprise et de son secteur d'activit. Nous prsentons ensuite
comment aborder la prvision des ventes dans l'entreprise : comment la caractriser en terme de
problme et de solution. Puis nous proposerons quelques dfinitions permettant de distinguer les
notions de prvision et d'objectif. Enfin nous montrons que ce problme de prvision est transversal
par rapport aux fonctions de l'entreprise.

1. Pourquoi laborer des prvisions des ventes ?
Cette question peut sembler triviale, cependant elle mrite rflexion et s'avre plus complexe
quil ny parat dans sa rponse. Deux points sont abords.
1.1. La prvision conditionne l'optimisation
La prvision de la demande est la base de loptimisation de la chane logistique. Quel que soit
le type dorganisation dune entreprise (flexibilit et ractivit) et son degr dintgration dans le
pilotage des flux, deux lments sont essentiels pour dterminer le calcul d'un approvisionnement
optimal :
la prvision de consommation,
la fiabilit attendue de cette prvision.
La prvision de consommation dtermine de manire directe une partie du niveau
d'approvisionnement ; il s'agit de couvrir au minimum le besoin pour un certain dlai.
La fiabilit attendue de cette prvision, ou la crdibilit de la prvision, permet de dimensionner
de manire optimale le niveau du stock de scurit.

1.2. L'obligation de prvoir est lie aux dlais de raction
Toutes les entreprises ne sont pas dans l'obligation de prvoir, du moins dans le cadre de leur
systme de pilotage des flux.
Le cas extrme est reprsent par les entreprises qui travaillent la commande , c'est--dire
celles dont le dlai de livraison accept par ses clients est suprieur au dlai d'approvisionnement
des matires auprs des fournisseurs et au dlai de production. Quelques entreprises sont dans ce
cas : notamment celles du secteur aronautique, des travaux publics, des chantiers navals. Pour
elles, le problme de la prvision des ventes, court et moyen terme, ne se pose pas.
A l'oppos, figure la grande majorit des entreprises du secteur de la grande consommation. Le
dlai de livraison est de quelques jours, voire de quelques heures (rpartiteur pharmaceutique) ; le
stockage des produits finis est alors impratif sous peine d'tre en rupture. Les consquences sont le
risque de la perte de la vente et la dgradation de l'image de marque.

Pour optimiser le niveau de stock, l'obligation de prvoir la demande s'impose.

Le Tableau 1 illustre l'arbitrage que l'entreprise est en mesure d'effectuer : flexibilit ou
stockage. Souvent, on cherche rsoudre un problme de prvision qui peut trouver sa solution
plus facilement par un accroissement de la ractivit et/ou de la flexibilit. Cependant, ce choix
souvent nexiste pas pour lentreprise, il est impos par les dlais de livraison que les fournisseurs
exigent.
Tableau 1 Pourquoi prvoir ?

Approvisionnement
matire
Fabrication Emballage
personnalisation
Stock

la commande la commande la
commande
Aucun
sur prvision la commande la
commande
matire
sur prvision sur prvision la
commande
semi -finis
sur prvision sur prvision sur prvision
produits finis

Quelques dfinitions prliminaires

2. Ce qui caractrise un problme de prvision
La premire approche de la prvision consiste en mesurer les spcificits. Pour envisager une
typologie des problmes de prvision en terme d'horizon, de type de produit ou de secteur, ou en
terme de but oprationnel, il est utile de dgager quelques traits qui diffrencient
fondamentalement :
le secteur d'activit,
l'utilisation oprationnelle,
la (ou les) fonction(s) utilisatrice(s) de la prvision,
l'horizon.

L'approche est trs dpendante du secteur d'activit : on ne prvoit pas des livraisons de ciment
par les mmes mthodes que des ventes de savons. Les causalits conomiques sous-jacentes sont
diffrentes suivant que le secteur est plus ou moins en amont dans le circuit industriel donc plus ou
moins proche de la demande finale, suivant que le produit est stockable ou non, qu'il donne lieu
un march de renouvellement (tlvision) ou non (acier), que le produit est standardis ou non.
Tous ces lments jouent un rle dans la dfinition d'une typologie de trois grands secteurs, qui
dans cet ouvrage sont tudis dans les diffrents chapitres de la deuxime partie (approche
sectorielle).

Nous pouvons distinguer :
le domaine des biens industriels intermdiaires (acier, produits chimiques, matriaux de
construction) qui dpendent troitement de l'environnement conomique gnral, et de l'volution
de la demande dans de grandes branches (btiment, automobile ...).
L'influence de la firme, par sa politique volontariste sur le march, est assez limite : le
problme du prvisionniste est alors de savoir quand se passera le retournement de conjoncture ;
le domaine des produits de grande consommation est l'extrme oppos : l'influence de la
conjoncture gnrale est relativement faible ; ceci est largement compens par une forte sensibilit
l'environnement concurrentiel. Le prvisionniste doit dterminer quel sera le volume des ventes
compte tenu de l'action marketing de la firme et de celle de ses concurrents ;
mi-chemin se situent les biens de consommation durables (automobile, lectro-mnager,
tlvision, etc.). Sensibles la fois la conjoncture conomique gnrale et des variables
marketing (efforts promotionnels, effets de mode, par exemple), ils sont l'objet de mthodes de
prvision diffrentes. Ce qui caractrise ces marchs est la prsence juxtapose d'une demande de
premier quipement et d'une demande de renouvellement.

3. Qui prvoit ?
3.1.Le processus dlaboration de la prvision
La responsabilit d'laboration de la prvision est trs variable d'une entreprise l'autre.
Quelques phrases issues dinterviews en entreprise sur ce sujet :
Les commerciaux sont les mieux placs car ils sont en contact permanent avec les clients,
cependant leur manque de recul et, surtout, de motivation par rapport aux travaux administratifs
font que nous ne tenons plus compte de leur avis .
Les hommes de marketing connaissent bien leur march, malheureusement ils confondent
leurs dsirs avec la ralit .
Les logisticiens sont isols du march et des clients. Ils ont l'il riv sur les stocks et prfrent
la rupture au sur-stock. Cependant, par leur habitude de mesurer les flux de sortie, ils ont un sens
aigu des chiffres. Ce sont les seuls rellement obligs laborer des prvisions .
Ces trois affirmations sont rvlatrices de l'tat d'esprit de chacun.

La solution traditionnelle est de laisser l'homme du terrain (vendeur, reprsentant, directeur
rgional, etc.) le soin de raliser des prvisions. Les arguments favorables sont nombreux : en
contact perptuel avec le produit et les acheteurs, il a le sens du march ; il est galement le premier
intress bien prvoir puisqu'il sera jug sur l'cart entre sa ralisation et sa prvision.
Mais les dfauts sont manifestes :
d'une part cela revient, comme nous venons de le voir au point prcdent, confondre
prvision et objectif, l'homme de terrain faisant un mlange entre ce qu'il suppute de l'volution du
march et ce qu'il pense pouvoir faire auprs de la clientle ;
d'autre part, il existe une forte tendance la prvision marginale . Il suffit que le dernier
client, rencontr avant d'mettre la prvision, ait pass une commande importante, ou que le jour
prcdent ait t trs faste, pour que la prvision pour les 3 ou 6 mois venir devienne trs
optimiste. Et inversement.

L'exprience prouve que la prvision des hommes de terrain est souvent biaise (les carts sont
systmatiquement positifs ou ngatifs), pour deux raisons :
le temprament personnel du prvisionniste intervient non seulement suivant qu'il est optimiste
ou pessimiste, mais aussi suivant sa prfrence pour des carts potentiels positifs ou ngatifs. Ainsi
un vendeur peut, par prudence, mettre des prvisions trs conservatrices , alors qu'un autre ne
craindra pas les carts ngatifs, souhaitant au contraire tre entran par sa prvision ;
le systme de gestion prvisionnelle biaise trs sensiblement les prvisions des individus. Si
par exemple les moyens sont affects aux directions rgionales de vente en fonction de la prvision,
ils auront tendance l'optimisme. Si les primes sont lies la ralisation de l'objectif, ils auront
tendance au pessimisme.
Nous appellerons prvision entre guillemets ( prvision ) ce type de donnes btardes, mi-
chemin entre un objectif rel et une vritable prvision. Leur mauvaise qualit ne met pas en cause
la performance des hommes du terrain et leur capacit effectuer un apport essentiel dans un
systme de prvision : elle condamne tout systme de gestion prvisionnelle qui biaise d'emble les
donnes d'entre qui lui sont ncessaires.
Souvent lorsque des carts trop importants apparaissent sur les prvisions , l'entreprise est
tente de ne plus accorder sa confiance aux hommes de terrain, qui se voient ainsi disqualifis par
rapport une tche qui ne leur semblait pourtant pas la moins intressante. En consquence,
l'entreprise recourt des profils entirement opposs : la prvision devient l'affaire de statisticiens,
qui ne seront pas suspects d'implication dans le fonctionnement interne de la firme. On assiste alors
au dveloppement de ce que l'on peut nommer familirement la mthode des matheux :
l'application aveugle d'une mthodologie statistique des prvisions de ventes en est une bonne
illustration. Les ventes deviennent une srie chronologique, suite abstraite de nombres, laquelle il
importe d'ajuster le meilleur modle.

L'loignement de toute rfrence concrte aboutit deux consquences :
une autosatisfaction mthodologique : le souci de la modlisation (comment identifier la
structure du modle ? quelle mthode d'estimation statistique utiliser ? etc.) va rapidement dborder
et provisoirement dominer celui de la prvision. Le but, bien prvoir, disparat devant les moyens
de l'atteindre, la qualit du modle statistique est une fin en soi. Si la liaison entre les deux tait
biunivoque et directe, cela ne poserait pas de problme. Un bon modle au sens statistique
donnerait automatiquement une bonne prvision. Malheureusement l'exprience prouve que parfois
tel n'est pas le cas ;
une coupure avec les utilisateurs, due l'absence de langage commun, et l'loignement des
rationalits, mathmatique et explicite pour les uns, intuitive et implicite pour les autres. Cette
coupure provoque un scepticisme face aux modles ds que le moindre cart se rvle entre
prvisions et ralisations.
L'utilisation d'une pure mthodologie statistique a rarement pu aboutir l'installation durable
d'un systme de prvision dans une entreprise. Entre ces deux cueils, que faire ? Mme si cela peut
apparatre difficile aux uns et aux autres : dvelopper une coopration entre ces deux approches, en
tablissant des systmes de prvision qui ne sont pas simplement des modles de traitement
statistique, mais qui associent les utilisateurs en intgrant des variables significatives par rapport
leurs schmas de rfrence.
Le plus souvent, c'est la fonction logistique qui est en charge de la prvision ; et pourtant les
hommes de logistique ne sont pas les mieux placs du fait de leur isolement vis vis du march.
Mais l'obligation de fournir des prvisions quantitatives et fines aux fournisseurs ou la production
fait qu'ils sont jugs responsables en cas de problme.
De manire idale, l'laboration de la prvision doit se faire en commun au sein d'un comit
runissant l' ensemble des fonctions cites prcdemment. Chacun doit s'engager sur des chiffres
et ce titre en est responsable. Ainsi, le risque de focaliser tous les problmes ruptures ou sur-
stocks auprs d'une unique personne, le prvisionniste , est trs fortement diminu.
Lobjectif est de disposer, au sein dun mme outil, de toutes les informations susceptibles
damliorer le processus dlaboration de la prvision des ventes.
Des capteurs informations terrains (vendeurs) indiquent, via un micro-ordinateur portable,
leur prvision en fonction des actions promotionnelles planifies ainsi que toutes informations
susceptibles dinfluencer les ventes (nouveau client, rfrencement, promotion client ). Ces
informations sont consolides au niveau central et directement accessibles par le responsable
commercial. Cette prvision est ensuite confronte la prvision marketing et la prvision
statistique lors du Comit Prvision .
3.2. La prvision comme une aide la dcision
La vision que l'on a de l'apport du prvisionniste est souvent un peu magique : elle s'appuie sur
un besoin irrationnel qui prend ses racines dans des poques recules. La divination tait
l'honneur dans les civilisations mditerranennes avant l're chrtienne : le christianisme mit fin
aux mthodes divinatoires qu'il considrait comme lies aux cultes pa ens. Ainsi, Saint Augustin se
dressa contre l'illusion des horoscopes et arriva la conclusion suivante : Il n'y a donc point d'art
divinatoire. C'est par hasard qu'on prdit vrai .
L'utilisation directement oprationnelle de la prvision n'est pas souhaitable : elle apparat plus
comme un outil d'aide la dcision qu'un substitut complet de la rflexion personnelle. L'utilisation
directe, sans une tape de validation, de donnes prvisionnelles serait dangereuse mme si parfois
cette tape peut tre rduite comme par exemple pour une application de gestion de stock et
d'approvisionnement. De plus cest la conjonction de l'utilisation d'un systme de prvision
formalis et de la capacit de rflexion du prvisionniste qui permet d'amliorer notablement la
qualit finale de la prvision.

La prvision a doublement hrit des techniques divinatoires : d'une part elle satisfait le mme
besoin irrationnel et immense de connatre l'avenir, d'autre part elle se pare d'un ct magique en
utilisant l'outil mathmatique, sotrique comme l'tait l'hpatoscopie ou l'astrologie, mme si elle
justifie son efficacit par la rationalit de l'outil. L'utilisateur attend beaucoup de la prvision ; cet
espoir constitue pour le prvisionniste la fois un atout et un risque : l'intrt qui existe lors de la
mise en place du systme peut tre suivi d'une dception si les premiers rsultats ne correspondent
pas l'attente.

L'apport d'un systme de prvision se situe deux niveaux :
dans la dure c'est--dire la suite de nombreuses missions de prvisions pour sa capacit
rduire significativement la marge d'incertitude. Exprim en termes statistiques, on pourra
considrer comme une bonne performance de rduire de moiti l'cart-type de l'erreur de
prvision ;
ponctuellement, savoir anticiper les retournements de conjoncture. Ou alternativement : savoir
prdire si un retournement observ rcemment a un caractre durable ou non.

L'entreprise peut attendre beaucoup de la prvision condition de bien l'utiliser. Il faut tout
prix viter la vision passiste qu'entrane le sentiment que la prvision est ce que la firme subira
invitablement. Elle est bien au contraire un outil d'aide la dcision : elle doit servir l'entreprise
agir sur son futur et non le subir.


Chapitre 2

LA DECOMPOSITION DUN HISTORIQUE DES VENTES

Dans ce chapitre, nous allons aborder ce qui caractrise d'un point de vue statistique les donnes
servant de base l'tude prvisionnelle, en examinant la notion d'historique et de srie
chronologique. L'examen des donnes est le pralable toute tude quantitative, que ce soit dans un
but d'analyse ou de prvision.
Nous traiterons ensuite en dtail de l'analyse de srie chronologique : Quest-ce quune
observation anormale ? Comment la corriger ? Comment calculer une tendance ? Comment retirer
une saisonnalit ? En dfinissant un schma de dcomposition, nous pouvons retirer d'un historique
les effets rptitifs qui peuvent tre facilement extrapols, afin de dgager un terme rsiduel
reprsentant les fluctuations erratiques de la chronique.

1. La notion d'historique
Une srie chronologique est compose d'un historique, c'est--dire d'une suite de valeurs
ordonnes dans le temps priodicit constante : par exemple, l'indice mensuel des prix la
consommation de la France entire publi par l'INSEE en base 100 en 1980. La suite des
valeurs de janvier 1995 jusqu' septembre 2000 au mois le mois reprsente l'historique de l'indice
des prix la consommation. Les ventes mensuelles, pour un article, de mars 1997 fvrier 2000
serviront de base historique afin d'laborer la prvision.

Un historique doit runir certaines proprits :

Il ne se compose que de valeurs connues et calcules, qui sont effectivement ralises.

Il est reprsentatif de ce que l'on cherche prvoir. Un historique des livraisons ne permet pas
de prvoir la demande !

Il est homogne dans le temps. Pour reprendre notre exemple d'indice de prix, toutes les
valeurs sont en base 100 en 1980 et correspondent au mme mode de calcul et de collecte
statistique.

Il comprend un nombre minimal dobservations. Il semble logique d'crire que plus
l'historique est long, meilleure sera la qualit de l'analyse et par voie de consquence de la
prvision. La longueur minimum d'un historique, c'est--dire son nombre de valeurs, est variable
selon le but recherch et la priodicit des donnes.
Si l'objectif est de fournir des prvisions de priodicit mensuelle un horizon de 6/12 mois,
nous considrons alors que le minimum de valeurs disponibles est de 3 ans, soit 36 observations
mensuelles, alors que la dimension souhaitable d'un historique se situe aux alentours de 4/5 ans
(surtout en ce qui concerne le calcul de coefficients saisonniers significatifs).
Cette dimension permet d'atteindre un niveau lev de signification statistique, elle reprsente un
chantillon suffisant pour qu'il ne s'loigne pas trop de la population totale qu'il est cens
reprsenter et offre une cohrence conomique satisfaisante.
Le nombre d'observations composant un historique est fonction de la priodicit des donnes.
Ainsi, pour une prvision hebdomadaire un horizon de 15 semaines, il faut disposer de 156
observations, soit 3 ans.
Il ne sert rien de vouloir remonter trop loin dans le temps ; en effet, des modifications de
structure de la chronique (telles que la tendance ou la saisonnalit, ou la corrlation avec des
indicateurs) apparaissent avec le temps et risquent de venir perturber la prvision court terme,
voire mme de la dgrader.
Dans un cadre de priodicit diffrent (bimestre, trimestre, quadrimestre ou annuel), nous
pourrons retenir moins de ralisations car une valeur plus agrge reprsente une quantit
d'informations suprieure. En d'autres termes, une donne annuelle est videmment moins fine que
les douze donnes mensuelles qui la composent, mais elle contient nanmoins une quantit
d'informations, disponible pour l'analyse, infiniment suprieure n'importe quel chiffre mensuel.
C'est ainsi que des modles conomtriques labors partir de statistiques annuelles sont
couramment estims sur une dizaine d'annes, alors qu'il est illusoire d'estimer un modle de
prvision mensuelle sur dix mois.

2. Le calcul des statistiques de base et la prsentation des donnes
2.1. Le calcul des statistiques de base
Dans ce paragraphe, nous prsentons les modes de calcul des statistiques simples :
caractristique de valeur centrale et caractristique de dispersion.

La moyenne
La formule gnrale de la moyenne d'une srie chronologique de terme gnral x
t
pour laquelle
nous disposons de n observations est :
x
x
n
t
t
n
1

Le calcul de la moyenne prsente un intrt limit : deux sries des ventes peuvent avoir une
moyenne identique alors que leur allure gnrale est trs diffrente. Egalement dans le cas de sries
ayant une forte tendance soit la hausse soit la baisse, la moyenne variera fortement chacune
des nouvelles ralisations. C'est pourquoi il est prfrable de prsenter avec la moyenne un
coefficient permettant de prendre en compte la dispersion.

La dispersion
La variance d'une srie chronologique permet d'valuer la dispersion autour de la moyenne.
Nous devons distinguer deux cas, selon que nous sommes en prsence de toute la population de
faon exhaustive ou que nous disposons seulement d'un chantillon de ralisations considr
comme reprsentatif de la population totale.
La formule de la variance (Var) dans le cas d'une population connue totalement (variance
thorique) est :
Var(x) =
( )
n
x x
n t
t
t
2
1

La formule de la variance dans le cas d'un chantillon (variance empirique) est donne par :

Var(x) =
( )
x x
n
t
t
t n
1
2
1

Dans le cas du calcul de la variance d'une srie chronologique, la deuxime formule est la seule
retenue ; en effet, nous ne connaissons pas toutes les valeurs, aussi bien les ralisations futures que
celles qui sont trs loignes dans le pass ; la srie chronologique constitue donc un chantillon
reprsentatif de la srie des ventes vraie mais inconnue.
Dans la littrature statistique ou conomique, on prfre prsenter la racine carre de la variance
appele cart-type (
x
) :
x
= Var x ( )

Cet cart -type est lun des indicateurs fondamentaux de la difficult prvoir
1
une chronique, il
prsente lavantage de sexprimer dans la mme unit que lhistorique. Pour pouvoir interprter sa
valeur, il convient de le rapporter la moyenne.

Coefficient de variation
Le coefficient de variation se dfinit comme tant le rapport de l'cart-type la moyenne calcul
partir de la srie brute :
CV =
x
x

Il rend compte de la difficult prvisionnelle d'un historique. Plus il est lev, plus la variance de
la srie est importante rapporte la moyenne et, donc, plus la tche du prvisionniste est a priori
dlicate.
Nous pouvons classer les historiques des ventes en fonction de ce coefficient :
infrieur 0,5 : a priori facile prvoir,
compris entre 0,5 et 1 : de dispersion moyenne,
suprieur 1 : la variance de la srie est importante rapporte sa moyenne et donc, cette srie
peut s'avrer difficile prvoir.

Nanmoins le coefficient de dispersion de la srie brute ne prjuge pas compltement des
difficults ultrieures : une srie fortement fluctuante peut tre largement explique par des
coefficients saisonniers trs marqus et/ou par un facteur explicatif trs influent.
2.2. La prsentation des donnes
Lorsque le prvisionniste dispose d'un historique, le premier rflexe qu'il doit avoir est de tracer
le graphique de la srie chronologique appele aussi courbe reprsentative du phnomne. Cela
permet de visualiser l'volution de la chronique, de dceler les accidents ventuels (pics ou creux),
et d'en tirer une tendance gnrale.
Pour aider une meilleure visualisation du graphique, il est possible d'appliquer la srie des
valeurs brutes une transformation ou un filtre. Une transformation logarithmique
2
crase les

1
Nous pouvons noter que si l'cart-type de lhistorique est significativement suprieur celui de lcart-type de
lerreur de prvision, le systme de prvision est performant.
2
Attention aux valeurs ngatives ou nulles.
valeurs fortes afin de se ramener une chelle plus restreinte, elle est utilise pour des sries
affecte d'une tendance trs forte. Le graphe est alors en chelle semi-logarithmique.
Appliquer un filtre consiste calculer depuis la srie brute une autre srie, appele srie filtre,
dduite de la premire partir d'un processus dynamique. Alors que pour une srie transforme, il
est possible pour chacune de ces valeurs de revenir la srie initiale (par exemple, le passage aux
exponentielles pour une chronique pralablement transforme par les logarithmes). Pour une srie
filtre, il s'avre impossible de recalculer la srie initiale, mme en disposant du type de filtre
employ.
Le filtre le plus employ est la moyenne mobile qui permet d'crter les pics et les creux afin de
mieux dceler la tendance de fond de la chronique. Il s'agit de calculer une moyenne sur un certain
nombre de valeurs de la srie et de l'affecter un mois donn.
Soit x
t
le terme gnral de la srie brute, la ralisation la priode t, par exemple la vente
observe en octobre 2000. La srie filtre MMt l'aide d'une moyenne mobile, par exemple, d'ordre
3 a pour expression : MMt = (x
t-1
+ x
t
+ x
t+1
) / 3
Il est noter que cette moyenne mobile dordre trois ne peut tre calcule que pour t = 2 n 1
(n tant le nombre dobservations), car on ne dispose pas dobservations prcdant x
1
et suivant x
n
.

Graphiquement, nous observons que la moyenne mobile se trouve au barycentre des trois
observations (cf. Graphique 1).

Graphique 1 Moyenne mobile dordre 3

Le choix de lordre de la moyenne mobile dpend de lobjectif recherch. Plus lordre est lev,
plus la srie est lisse et les phnomnes de court terme sont alors gomms, au risque de perdre en
ractivit ; seul reste le mouvement de fond (la tendance). L'inconvnient rside alors dans la perte
plus grande d'informations en dbut et fin d'historique. Une mention particulire concerne la
moyenne mobile dordre douze qui, pour des sries historiques de priodicit mensuelle, reprsente
lvolution des consommations (ou des ventes) hors phnomnes saisonniers.
Dans les publications statistiques et les revues d'information conomique (BMS
3
, l'Expansion, Le
Nouvel Economiste, ...), la plupart des graphiques reprsentent des phnomnes filtrs par moyenne
mobile sur 3 mois. Ceci a pour effet de rendre la courbe plus lisse, de gommer les fluctuations
en rpartissant d'un mois sur l'autre les valeurs extrmes ; d'o le terme de lissage des donnes ou
de courbe lisse lorsqu'on procde un filtrage par moyenne mobile.

Les formules gnrales de filtrage par moyenne mobile sont les suivantes :

3
Bulletin Mensuel de Statistique de lINSEE.
xt
t
xt
xt-1
x
t+1

t-1 t t+1
MM
t

Si lordre correspond un nombre impair (2 m + 1),
MM
t
=
1
2 1 m+
xt i
i m
i m
+

Si lordre correspond un nombre pair (2 m), il nous faut recourir un artifice de calcul
afin de faire correspondre le terme central x
t
la valeur de la moyenne mobile MM
t
.
MM
t
=
1
2
1
2
1
2
1
1
m
x x x t m t i t m
i m
i m
+ + + +
1
]
1
+

Nous voyons que, pour des raisons de commodit des calculs, il est prfrable de retenir des
moyennes mobiles d'ordre impair
4
.

Le Tableau 2 prsente un exemple de calcul dune moyenne mobile dordre trois et dune
moyenne mobile dordre six, ainsi que la moyenne, lcart-type et le coefficient de variation.

Tableau 2 Exemple de calcul de moyennes mobiles et de coefficients de variation
temps Consommation MM3 MM6
1 100,00
2 89,00 96,00
3 99,00 81,33
4 56,00 100,67 92,67
5 147,00 96,67 93,25
6 87,00 96,67 101,50
7 56,00 94,33 113,83
8 140,00 114,33 118,17
9 147,00 147,67 118,42
10 156,00 134,00 126,33
11 99,00 131,00 139,25
12 138,00 112,33 149,25
13 100,00 163,00 149,25
14 251,00 169,00 148,42
15 156,00 184,67 148,00
16 147,00 133,67 149,92
17 98,00 126,33 146,67
18 134, 00 119,67
19 127,00 148,67
20 185,00

Moyenne 125,60 125,00 128,21
Ecart -type 44,11 28,28 21,09
CV 0,35 0,23 0,16

Exemple de calculs :

Pour t = 10 (moyennes mobiles dordre 3 et 6 la dixime priode)

MM3
10
= (147 + 156 + 99) / 3 = 134

4
La technique des moyennes mobiles est trs utilise par les chartistes afin danalyser lvolution des marchs
financiers (cf. Bchu et Bertrand, 1997). Dans ce cas particulier, la valeur de la moyenne mobile est indique en face de
la dernire observation sans se proccuper dun quelconque centrage.

MM6
10
= (56/2 + 140 + 147 + 156 + 99 + 138 + 100/2) / 6 = 126,33

Nous observons que le coefficient de variation de la srie brute est suprieur celui de la srie
lisse MM3 qui lui-mme est suprieur celui de la srie MM6 ; nous retrouvons bien la mcanique
du lissage qui crte les pics et les creux.

3. L'analyse de srie chronologique et la prvision
3.1. Les tapes de la prvision des ventes
L'tude des phnomnes conomiques a distingu depuis longtemps divers types d'volution, qui
peuvent ventuellement se combiner :
La tendance (T
t
) correspond une variation lente s'effectuant dans un sens dtermin qui se
maintient pendant de longues priodes.
Le cycle (Ct) est un mouvement d'allure quasi priodique comportant une phase croissante et
une phase dcroissante. En conjoncture, il est reprsent par le cycle de Kitchin dune priode de 4
5 ans. Dans la plupart des travaux sur les sries temporelles, la tendance et le cycle sont regroups
en une seule composante.
La composante saisonnire (S
t
) correspond des variations s'effectuant rgulirement au cours
de la semaine, du mois, du trimestre, etc. Elle tient aux saisons, des habitudes sociologiques et
aux rythmes de l'activit humaine.
Les fluctuations accidentelles (Rt) sont des mouvements erratiques, de frquences leves,
prsentant une allure gnrale plus ou moins stable. Elles rsultent des influences, que toutes sortes
d'vnements exercent sur la grandeur en cause, si nombreuses que l'on a renonc (ou que l'on ne
peut) les tudier toutes dans le dtail.
Certaines sries statistiques prsentent l'un ou l'autre de ces mouvements l'tat pur. Mais la
plupart d'entre elles ont une allure plus complexe. Il est possible d'y dceler par exemple une
croissance gnrale et certaines variations saisonnires auxquelles se superposent des fluctuations
accidentelles. Remarquons que ces diffrentes composantes sentendent pour des sries
conomiques lies la conjoncture, le plus souvent mensuelles ou trimestrielles. Dans le domaine
de lentreprise, les composantes sont conserves mais les priodicits sont parfois diffrentes
(hebdomadaire, par exemple).

Lobjectif de toute mthodologie prvisionnelle est de dcomposer les ventes, que lon cherche
prvoir, en composantes fondamentales afin de les isoler, puis de les extrapoler indpendamment
les unes des autres. La prvision finale est obtenue en ragrgeant tous ces phnomnes.
Le Schma 1 illustre les tapes classiques de la prvision des ventes.

Schma 1 Les tapes de la prvision des ventes
Lissage exponentiel Modle explicatif Tendance par rgression
Prvision par lissage, modle explicatif
ou tendance
Prvision de la srie des ventes
Prvision par ragrgation des composantes
Ajout de la saisonnalit et correction des jours ouvrables
Analyse de l'historique hors phnomnes accidentels
ou rptitifs
Analyse de la saisonnalit
Correction des jours ouvrables
Calcul des coefficients saisonniers
Dtection et correction des valeurs anormales

3.2. Recherche et correction de valeurs anormales
Pralablement tout traitement statistique sur un historique de ventes, il convient d'effectuer une
partition entre :
une activit rgulire et habituelle, qualifie par l'homme d'exprience de normale ;
un vnement accidentel, imprvisible, qualifi alors danormal.
Ces consommations anormales sont observes frquemment dans la grande consommation,
mais aussi dans d'autres secteurs. Les demandes exceptionnelles provenant de l'exportation ou
d'importantes centrales d'achat, ou encore des alas de la distribution (grves des transports par
exemple) peuvent perturber fortement le processus habituel.
Il sagit dun phnomne non rptitif et qui revt un caractre exceptionnel : par exemple, une
vente promotionnelle nest pas anormale car elle fait partie de la vie normale de lentreprise.

Le problme est donc double : d'une part, identifier l'observation juge anormale et, d'autre part,
la corriger afin de neutraliser ses effets.
3.2.1 La dtection des valeurs anormales
Plusieurs mthodes existent sans toutefois qu'aucune ne donne entire satisfaction. Nous
prsentons succinctement quatre techniques, le lecteur intress par les dveloppements
mathmatiques et une description de la littrature dans le domaine se reportera la rfrence cite.
5

La mthode de l'intervalle de confiance
Cette mthode suppose la normalit des observations
6
; sa mise en uvre est trs simple. Elle
consiste calculer l'cart-type de lhistorique des consommations, puis filtrer toutes les
observations qui sortent d'un intervalle de confiance dtermin.

5
Vallin (1984).
6
Lhypothse que les observations suivent une loi normale (la fameuse courbe en cloche ) entrane une symtrie
de la distribution par rapport la moyenne.
Soit
x
l'cart-type de la srie, nous pouvons calculer l'intervalle de confiance de la manire
suivante :
IC = x t 1,96
x

o 1,96 est la valeur de la loi normale pour un seuil de confiance de 0,05.
Toute observation extrieure cet intervalle est considre comme anormale.
Cette mthode pose des problmes d'application lorsque les sries sont trs saisonnires. En
effet, les mois forts ou faibles risquent de sortir de l'intervalle de confiance et donc d'tre
dtects.
En reprenant les donnes du Tableau 2, lintervalle de confiance est donn par :

IC = 125,60 t 1,96 44,11 soit IC = [39,14 ; 212,05]

Lobservation de la priode t = 14 (x
14
= 251) est extrieure lintervalle de confiance, elle est
donc dtecte comme douteuse.

La mthode du test de moyenne
Cette mthode suppose, l encore, la normalit des observations. Pour tester la conformit de
l'observation x
t
, on applique un test de comparaison de moyennes entre deux chantillons :
l'un rduit un seul lment, l'observation x
t
que l'on dsire tester ;
l'autre est compos des n 1 lments de lhistorique (n tant le nombre d'observations).

Nous calculons la statistique suivante (dite du Student empirique) :
t
cal =
( )
x x
x x
n n
t
j
j t
2
1 2 ( )( )

Si t
cal
> t
lu
(valeur de rfrence lue dans une table de Student pour n 2 degrs de libert et un
risque fix 0,05), alors l'observation est considre comme anormale ; dans le cas contraire
(t
cal
< t
lu
), l'observation est classe comme normale.
En reprenant les donnes du Tableau 2 et en appliquant cette formule lobservation t = 14,
nous trouvons les lments suivants :
x = 119 (hors lobservation x
14
) ;
( )
x x j
j t

2
= 22 362 ; t
cal
=
132
22362
19 18
= 16,32
t
cal
= 16,32 > t
lu
=2,101 ( = 0,05 et pour un nombre de degrs de libert de 20 2 = 18)

Le rsultat de ce test corrobore le prcdent, lobservation t = 14 est anormale.

La mthode du double intervalle de confiance
Cette mthode est une extension de la premire et est utilise pour des sries dont la saisonnalit
est trs marque. Elle consiste calculer un intervalle de confiance pour chaque anne et pour
chaque mois (ou trimestre). Une observation est considre comme douteuse si elle sort la fois
de l'intervalle de confiance anne et de l'intervalle de confiance mois (trimestre). Le Tableau 3
illustre cette mthode.

Tableau 3 Calcul d'un double intervalle de confiance
T1 T2 T3 T4 MOYENNE ECART-TYPE IC1 IC2
Anne 1 164 198 85 179 156,5 43,00 72,21 240,79
Anne 2 168 201 98 197 166 41,27 85,10 246,90
Anne 3 197 209 100 216 180,5 46,97 88,44 272,56
Anne 4 223 245 119 260 211,75 55,14 103,67 319,83
Anne 5 298 309 124 267 249,5 74,08 104,31 394,69

MOYENNE 210 232,4 105,2 223,8
ECART-TYPE 48,91 41,82 14,36 34,53
IC1 114,13 150,44 77,06 156,11
IC2 305,87 314,36 133,34 291,49

IC1 et IC2 sont les bornes de l'intervalle de confiance.

Chaque observation est compare l'intervalle de confiance de l'anne et du trimestre laquelle
elle appartient. Si elle est extrieure au moins deux intervalles, l'observation est classe comme
tant anormale. Par exemple, la valeur du deuxime trimestre 1989 (Anne 3) est compare
l'intervalle de confiance de son trimestre [150,44 ; 314,36] et de son anne [88,44 ; 272,56]. Elle
appartient aux deux intervalles de confiance. Nous pouvons conclure qu'elle est donc normale.
Cette dernire mthode fonctionne d'autant mieux que le nombre d'observations est important.
Elle est donc particulirement adapte aux sries de priodicit mensuelle.

Ces trois mthodes supposent que les observations suivent une loi de Gauss. Or, les sries de
ventes obissent rarement une telle loi qui impose la symtrie de la rpartition par rapport la
moyenne. Cependant, malgr cette limite, ces tests sont les plus utiliss car ils ont un caractre
oprationnel simple.

Dtection par rgression
Le principe consiste constituer une variable muette
7
relative l'observation que l'on dsire
tester. Cette variable est compose de 0 sauf pour la priode de l'observation potentiellement
anormale, pour laquelle on indique 1. Si le coefficient estim par rgression de cette variable est
significativement diffrent de 0, alors l'observation est anormale.
Cette mthode, la plus rigoureuse sur le plan statistique (aucune hypothse sur la distribution des
observations), est efficace pour tester ponctuellement une observation, mais reste lourde mettre en
uvre dans le cas d'un traitement industriel , c'est--dire automatis, portant sur de trs
nombreuses sries des ventes.

3.2.2 La correction des valeurs anormales
L'objectif est de neutraliser les effets de l'observation anormale en la remplaant par une autre.
Nous allons donc prciser les diffrentes procdures permettant de dterminer cette nouvelle
valeur.

7
Nous revenons plus en dtails sur cette technique qui suppose de connatre le modle de rgression multiple et son
interprtation (cf. chapitres 4 et 6).

Intervention humaine
Le plus simple et le plus logique consiste laisser au gestionnaire la responsabilit de la
modification ; en effet, c'est lui par sa connaissance des causes qui est le mieux plac pour
connatre la part d'anormalit qui existe dans une observation. Cependant, en cas de rfrences
logistiques nombreuses (plus dune centaine), le gestionnaire du systme se trouve dans
lincapacit matrielle de consacrer le temps ncessaire cet exercice.

Intervalle de confiance
L'observation dtecte comme anormale est ramene la limite haute ou basse de l'intervalle de
confiance. Cette mthode est simple dans son fonctionnement et facilement automatisable.
Cependant il ne s'agit pas d'une vritable neutralisation car les bornes de l'intervalle sont une limite
thorique qui n'a aucune existence et peut donc venir perturber par la suite le calcul des coefficients
saisonniers.

Valeur estime par prvision
Cette mthode consiste remplacer l'observation anormale en t par la valeur prvue en t 1,
l'aide du modle de prvision, pour cette mme priode. Il s'agit d'effectuer une simulation de
prvision et non pas de remplacer l'observation dtecte par sa valeur ajuste car celle-ci incorpore
une partie de l'information dfectueuse.
L'avantage de cette mthode rside dans la neutralisation totale de l'observation puisqu'elle est,
par construction, conforme au modle, mais sa contrepartie est une lourdeur informatique accrue.
3.3.Le schma de dcomposition
La technique de dcompositioncomposition repose, bien videmment, sur un modle qui
lautorise. Ce modle porte le nom de schma de dcomposition. Il en existe essentiellement trois
grands types :
Le schma additif qui suppose lorthogonalit (indpendance) des diffrentes composantes. Il
scrit : x
t
= T
t
+ S
t
+ R
t
. Dans ce schma, la saisonnalit est rigide en amplitude et en priode.
Le schma multiplicatif : x
t
= T
t
S
t
+ R
t
, dans lequel la composante saisonnire est lie la
tendance (saisonnalit souple avec variation de lamplitude au cours du temps).
Le schma multiplicatif complet : xt = Tt St Rt (interaction gnrale des trois
composantes). Il est actuellement le plus utilis en conomie. Il est commode puisque le logarithme
de la chronique conduit au schma additif.

Graphique 2 Exemple de schma additif
50
70
90
110
130
150
170
190
210
T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4

Graphique 3 Exemple de schma multiplicatif
0
10
20
30
40
50
60
70
T
1
T
2
T
3
T
4
T
1
T
2
T
3
T
4
T
1
T
2
T
3
T
4
T
1
T
2
T
3
T
4
T
1
T
2
T
3
T
4

Le schma additif (cf. Graphique 2) correspond une chronique dont le profil saisonnier ne se
modifie pas au cours du temps et dont la tendance est peu marque.
Le schma multiplicatif (cf. Graphique 3) rend compte de sries chronologiques dont l'amplitude
du profil saisonnier volue au cours du temps proportionnellement la valeur de la tendance. Ce
schma se ramne au prcdent par passage au logarithme (Log (ab) = Log a + Log b)
Log(x
t
) = Log (T
t
S
t
C
t
R
t
) = Log T
t
+ Log S
t
+ Log C
t
+ Log R
t

Nous allons tudier successivement ces quatre composantes fondamentales en insistant
particulirement sur les deux plus importantes : tendance et saisonnalit.

3.4. La tendance
Lorsque nous observons un graphe de srie chronologique, mentalement nous dduisons une
tendance. Notre but ici est de donner des mthodes de calcul simple permettant de connatre avec le
maximum de prcisions la tendance moyen terme de la chronique. Pour estimer la tendance,
plusieurs procds lmentaires viennent l'esprit. En faisant par exemple le rapport des 2 valeurs
extrmes, un pourcentage total d'augmentation est calcul, ce qui nous permet de dfinir un
accroissement mensuel moyen. Le choix des observations extrmes est arbitraire. Il ne s'impose
pas : d'autres observations pourraient tre slectionnes. De plus, on est certain de ne pas tirer le
meilleur parti de l'historique, puisqu'un grand nombre de valeurs sont ignores, en ne prenant que
deux observations.
Afin de mieux estimer la tendance, il est ncessaire de faire appel la statistique mathmatique
qui fournit un certain nombre d'outils de calcul.

Tendance par moyenne mobile
Nous avons dfini prcdemment ce qu'est une moyenne mobile et son effet de lissage sur les
courbes. En retenant un ordre de moyenne mobile lev, nous rduirons les fluctuations de la
chronique (plus l'ordre est lev, plus les fluctuations de la courbe lisse sont amorties).
Les moyennes mobiles prsentent deux dfauts en tant que technique pour la dtermination de la
tendance. En premier lieu, elles conduisent une srie plus courte que la srie traite. La tendance
n'est obtenue que pour la priode allant de la (m + 1)-ime observation la (n m)-ime.
En second lieu, aucun principe n'apparat naturellement pour l'extrapolation d'une tendance
dtermine par moyenne mobile. Si l'on veut faire des projections, il faut introduire un modle plus
explicatif pour la reprsentation de la tendance.
Aussi les moyennes mobiles sont-elles employes soit dans des travaux purement descriptifs
d'histoire conomique, soit lorsqu'il s'agit d'liminer (c'est--dire soustraire terme terme) la
tendance en vue de l'tude de telle ou telle particularit de la composante rsiduelle, par exemple en
vue de l'tude des cycles de l'activit.

Tendance par rgression
Le but est d'estimer une tendance l'aide d'un polynme :
x
t
= a
0
+ a
1
t + a
2
t
2
+ a
3
t
3
...
En retenant un polynme de degr 1 : x
t
= a
1
t + a
0
, on considre que la tendance est linaire
(Graphique 4) et peut tre reprsente l'aide d'une droite correspondant l'ajustement des
moindres carrs.

Le but est d'estimer la tendance long terme de la chronique l'aide d'une droite (ou par un
polynme de degr plus lev) estime par un ajustement des moindres carrs. La technique des
Moindres Carrs Ordinaires (MCO) fournit non seulement les estimateurs de a
1
et a
0

respectivement nots
1
et
0
, mais aussi les carts-types des coefficients et permet ainsi deffectuer
les tests associs (tests des paramtres cf. chapitre 3). Cette mthode postule des paramtres a
1
et a
0

constants dans le temps et la prvision porte le nom dextrapolation de la chronique. Elle reste utile
pour estimer les tendances lourdes des phnomnes conomiques, toutes choses tant gales
par ailleurs .

Les coefficients de ce polynme sont estims l'aide des formules suivantes :

n t
t
n t
t
t
t t
t t x x
a
1
2
1
1
) (
) )( (
t a x a
1 0

n = nombre d'observations.

La prvision calcule en n (dernire observation) lhorizon h est donne par :
x
n+h
=
1
(n + h) +
0

h = horizon de prvision

Les tableurs fournissent directement, par lappel de fonctions statistiques, les estimations de
cette droite de tendance. Pour un exemple dutilisation cf. Fichier Web.

Graphique 4 Exemple d'ajustement par une droite de tendance

Lquation de la droite ajuste est : T
t
= 243,39 t + 4986,32
Par rapport une valeur dorigine de 4986,32, les ventes augmentent en moyenne sur la
priode de 243,39 units par mois. La prvision consiste donc extrapoler cette tendance
dvolution.

Le choix du degr de polynme dpend de plusieurs critres, dont l'horizon de prvision, les
ruptures de tendance dans la vie du produit et l'historique disponible. Les fonctions du tableur
(insertion dune courbe de tendance) permettent destimer diffrentes formes de fonctions.

L'avantage de la mthode d'estimation de tendance par rgression rside dans sa facilit et sa
souplesse d'utilisation (choix du degr de polynme). Cependant ce modle connat deux limites
fortes :
il utilise le temps comme unique variable de synthse,
les paramtres estims sont fixes sur la totalit de la priode.

0
5000
10000
15000
20000
25000
A
n
n
1
-
J
M M
J S N
A
n
n
2
-
J
M M
J S N
A
n
n
3
-
J
M M
J S N
A
n
n
4
-
J
M M
J S N
VENTES TENDANCE
3.5. La saisonnalit
3.5.1 Pourquoi analyser une saisonnalit ?
Le problme est maintenant d'interprter une srie ventuellement affecte d'un mouvement
saisonnier. On veut apprcier l'volution de cette srie en faisant abstraction de ce mouvement.
Avant d'examiner les mthodes d'tude de la saisonnalit, il faut comprendre les inconvnients
que prsente pour l'analyse conjoncturelle une mthode souvent employe en pratique, celle qui
consiste comparer le dernier mois (ou trimestre, etc.) observ au mois (ou trimestre, etc.)
correspondant de l'anne prcdente ou bien comparer directement lvolution des ventes dun
mois sur lautre. Le but est de dterminer l'volution rcente du phnomne. Mais les rsultats
risquent d'tre relativement errons pour deux raisons :
la tendance moyenne entre un mois (ou trimestre, etc.) et le mois (ou trimestre, etc.)
correspondant de l'anne prcdente peut diffrer trs sensiblement de l'volution rcente ;
une comparaison assise sur deux observations est affecte par les causes accidentelles qui ont
pu agir sur le phnomne ces dates prcises. Un jugement correct sur la tendance conjoncturelle
doit reposer sur une analyse de la srie observe et non seulement sur la considration de deux
observations, aussi judicieux que soit leur choix.

La saisonnalit des ventes dun article cache la vritable volution des ventes, les ventes dune
srie brute ne sont donc pas interprtables.
Par ailleurs, il est plus facile de prvoir les ventes hors phnomnes saisonniers :
la tendance vraie peut tre calcule,
limpact rel des facteurs explicatifs (publicit, promotion ...) peut tre mis en vidence.

3.5.2 La correction des jours ouvrables
Avant de calculer les coefficients saisonniers, il convient de pratiquer une correction des jours
ouvrables (CJO) afin de tenir compte du nombre de jours effectivement travaills dans un mois
donn. Par exemple, le mois de fvrier comporte en gnral moins de jours ouvrables que le mois
de mars. Nous devons diffrencier suivant qu'il s'agit de production (trs lie aux jours ouvrables),
de livraisons (moins lies) ou de commandes (trs peu lies aux jours ouvrables).
Dans le secteur industriel, cette influence est assez faible du fait de l'anticipation des entreprises
qui livrent par avance leur client. Dans le secteur des biens de grande consommation, la
rpercussion des jours ouvrables sur les ventes au consommateur est forte du fait de la fermeture
des commerces.

Cette correction s'effectue de la manire suivante :

Soit MJO le nombre moyen de jours ouvrables, par mois dans l'anne (environ 21).

La srie CJO est gale : (x
t
NJO) / MJO 100

avec :
xt observation du mois t pour la srie brute,
NJO nombre de jours ouvrables pour le mois t.

3.5.3 Le calcul de la saisonnalit
Il n'existe pas de mthode parfaitement satisfaisante d'estimation des coefficients saisonniers :
quelle que soit la mthode retenue, le risque d'incorporer dans la saisonnalit des fluctuations dues
des valeurs erratiques (appeles indiffremment valeurs aberrantes ou valeurs anormales) est
toujours prsent. Lors du calcul de la saisonnalit, il convient de faire un certain nombre de choix
concernant le type de coefficients saisonniers (additifs/multiplicatifs, fixes/glissants) que nous
allons prsenter. Les coefficients saisonniers sont lgrement diffrents selon la mthodologie
suivie. Pourtant, ils doivent toujours respecter certaines rgles.

a) Le principe de la conservation des aires
La moyenne de la srie brute doit tre gale la moyenne de la srie CVS (Corrige des
Variations Saisonnires). En effet, l'analyse de saisonnalit a pour but une nouvelle rpartition du
profil intra-annuel de lhistorique, sans modifier le niveau atteint en cumul annuel : les moyennes
annuelles de la srie brute et de la srie CVS doivent tre identiques. Ce principe de base est appel
le principe de la conservation des aires.

b) Choix du schma de dcomposition
Nous avons vu quil existe deux schmas de dcomposition :
Additif x
t
= T
t
+ S
t
+ R
t
(dans ce schma la saisonnalit est rigide en amplitude et en priode)
Multiplicatif x
t
= T
t
S
t
R
t
(interaction gnrale des trois composantes)

Dans le cas d'un schma additif, les coefficients sont exprims dans la mme unit que la
chronique ; par exemple pour une srie de livraison d'acier en millier de tonnes, si le coefficient du
mois d'aot est de 125 cela signifie qu'au mois d'aot on livre en moyenne 125 milliers de tonnes
d'acier en moins. Dans ce schma danalyse, les coefficients saisonniers ne tiennent donc pas
compte de la tendance de la srie.
La somme des coefficients doit tre gale zro afin de respecter le principe de la conservation
des aires.

Dans le cas d'un schma multiplicatif, les coefficients saisonniers sont des pourcentages (par
exemple, si le coefficient du mois d'aot est de 0,82 en moyenne on livre 18 % en moins en aot).
Dans ce schma danalyse, les coefficients saisonniers intgrent donc la tendance de la srie. Cest
le schma utilis de manire classique.
La somme des coefficients est gale au nombre de facteurs saisonniers (la moyenne
8
doit tre
gale 1) : dans un cadre mensuel la somme est gale 12, pour une srie trimestrielle la somme
est gale 4 afin de respecter le principe de la conservation des aires.

Le choix du schma de dcomposition dpend de lhistorique. Si la tendance est peu marque,
lun ou lautre des deux schmas de dcomposition restitue des rsultats quasiment identiques. En
revanche, si la tendance est marque, il convient de retenir un schma multiplicatif dont les effets
saisonniers sadaptent automatiquement ce sont des pourcentages au profil de lhistorique.
Le seul effet pervers utiliser des coefficients saisonniers multiplicatifs est rencontr lorsque la
srie des ventes est affecte par une saisonnalit trs marque ; dans certaines industries, les ventes
peuvent tre nulles certains mois de lanne. La division ou la multiplication par des valeurs trs

8
Cest, en fait, le produit des coefficients saisonniers qui doit tre gal 1, cette approximation est valable si les
coefficients saisonniers ne sont pas trop disperss.
faibles amplifie le mouvement saisonnier et peut engendrer une srie CVS comprenant des valeurs
aberrantes.

c) Coefficients fixes ou glissants ?
Coefficients fixes : les coefficients calculs sont les mmes quelle que soit lanne danalyse.

Coefficients glissants :les coefficients voluent tous les ans.

Un mouvement saisonnier est rptitif dune anne sur l'autre, et doit se rpter lidentique. Il
nous semble donc impropre de calculer des coefficients diffrents par anne.
Cependant, dans certaines circonstances o une rflexion conomique suggre une volution des
comportements, il peut tre intressant dintgrer une saisonnalit glissante.
En calculant un coefficient pour chaque mois, le risque d'incorporer une partie de bruit dans
la saisonnalit s'intensifie. En effet, la distinction entre saisonnalit et rsidu sera plus difficile
effectuer en l'absence d'une contrainte de rigidit des coefficients saisonniers. Par exemple si, pour
des raisons climatiques, une anne a t particulirement propice la consommation de bire, une
saisonnalit glissante rpercutera cette saisonnalit lanne suivante sans aucune raison a priori, ne
connaissant pas la temprature lavance.

Un autre risque mrite dtre soulign : la confusion possible entre la saisonnalit relle et une
saisonnalit fictive cre par lentreprise. Il sagit des entreprises effectuant la mme priode de
chaque anne des promotions ou des variations de tarif. Le calcul des coefficients saisonniers
attribue la saisonnalit cette sur-vente due la politique volontariste de lentreprise. Un
problme surgit alors lorsque lentreprise modifie la date des promotions ... Dans ce cas,
lutilisation des coefficients saisonniers glissants permet dintgrer plus rapidement cette
modification.

Sauf, rflexion marketing motivant une volution ou modification prvues des habitudes des
consommateurs, on utilise des coefficients saisonniers fixes.

d) Mthodes de calcul
Il n'existe pas de mthode parfaitement satisfaisante d'estimation des coefficients saisonniers.
Quelle que soit la mthode retenue, le risque d'incorporer dans la saisonnalit des fluctuations dues
des valeurs erratiques ou des habitudes promotionnelles est toujours prsent.
Cependant, le cas le plus classique consiste calculer des coefficients saisonniers fixes selon un
schma multiplicatif.

Les coefficients saisonniers sont lgrement diffrents selon la mthodologie suivie. Nous allons
prsenter deux exemples de calcul partir du mme historique (il sagit des ventes dun produit
festif, donc fortement saisonnier) en explicitant les diffrentes phases.

A) Analyse de saisonnalit selon un schma additif et des coefficients fixes

Les Tableau 4 et Tableau 5 illustrent le calcul des coefficients saisonniers selon un schma
additif et des coefficients fixes.

Tableau 4 Analyse de saisonnalit : tableau de calcul selon un schma additif
DATES VENTES MM12 ECART Ventes CVS
Anne 1-J 401,60 607,17
F 395,70 628,85
M 451,00 605,58
A 427,60 545,92
M 496,80 637,88
J 467,70 560,96
J 352,30 566 -213 498,96
A 182,10 555 -373 535,99
S 522,20 546 -24 529,76
O 687,20 539 148 552,48
N 1080,3 529 552 579,05
D 1391,6 517 874 573,50
Anne 2-J 263,90 517 -253 469,47
F 289,90 520 -230 523,05
M 337,00 519 -182 491,58
A 374,00 518 -144 492,32
M 292,70 512 -219 433,78
J 398,60 504 -106 491,86
J 421,70 506 -84 568,36
A 173,80 513 -339 527,69
S 522,10 517 5 529,66
O 642,40 525 117 507,68
N 984,20 538 446 482,95
D 1307,6 550 757 489,50
Anne 3-J 393,40 556 -162 598,97
F 316,20 557 -241 549,35
M 428,60 560 -131 583,18
A 467,60 565 -97 585,92
M 501,00 569 -68 642,08
J 487,40 573 -85 580,66
J 463,30 609,96
A 165,90 519,79
S 595,10 602,66
O 698,10 563,38
N 1012,00 510,75
D 1380,00 561,90
MOYENNE 549 549
E-T 325 51
CV 0,59 0,09

Tableau 5 Analyse de saisonnalit : coefficients provisoires et dfinitifs
COEF
PROVISOIRE S
p

DEFINITIF
S1 (-253,31 162,17) / 2 = -207,74 -205,57
S2 (-229,85 240,77) / 2 = -235,31 -233,15
S3 (-182,40 131,08) / 2 = -156,74 -154,58
S4 (-143,53 97,45) = -120,49 -118,32
S5 (-218,96 67,52) = -143,24 -141,08
S6 (-105,56 85,30) = -95,43 -93,26
S7 (-213,30 84,35) / 2 = -148,83 -146,66
S8 (-373,36 338,75) / 2 = -356,05 -353,89
S9 (-24,10 + 4,64) / 2 = -9,73 -7,56
S10 (147,88 + 117,22) / 2 = 132,55 134,72
S11 (551,72 + 446,45) / 2 = 499,08 501,25
S12 (874,40 + 754,47) / 2 = 815,94 818,108

SOMME -25,99 0,00
MOYENNE -2,17 0,00

Le Tableau 4 prsente les diffrentes phases de calcul :

Etape 1 : Estimer la tendance par une moyenne mobile
9
dordre 12 (colonne MM12).

9
Nous pouvons aussi calculer la tendance laide dune droite de rgression sur le temps.
En appliquant la formule prsente en 1.1, nous ne pouvons pas calculer les six premires
valeurs de MM12 (de janvier juin de lanne 1), ainsi que celles de la fin de lhistorique (juillet
dcembre de lanne 3). MM12 ne contient plus de composante saisonnire.

Exemple de calcul pour janvier de lanne 2 :

MM12
J-Anne2
= (0,5 352,30 + 182,10 + 522,20 + ... + 398,6 + 0,5 421,7) / 12 = 517,20

Etape 2 : Calculer les carts la srie observe.

Nous calculons les carts observs entre la srie brute et la moyenne mobile :
e
t
= x
t
MM12
t

Exemple de calcul pour janvier de lanne 2 : e
J-Anne2
= 263,9 517,21 = 253,31

Etape 3 : Rassembler les carts relatifs aux mmes mois pour les diffrentes annes et calcul de
la moyenne.

Dans le Tableau 5, nous calculons dans la premire colonne les coefficients saisonniers
provisoires. Il sagit de rassembler les carts relatifs au mme mois et de calculer la moyenne de
ces carts, ces nombres sont des coefficients saisonniers provisoires, car leur somme nest pas
gale 0.

1 er mois : e
13
, e
25

S
P
1
= (-253,31 162,17) / 2 = 207,74
2 me mois : e
14
, e
26

S
P
2
= (-229,85 240,77) / 2 = 235,31
...
12 me mois : e
12
, e
24
.

S
P
12
= (757,47 + 874,40) / 2 = 815,94

Etape 4 : Calculer S = S
P
1
+

S
P
2
+ ... + S
P
12

Les coefficients saisonniers sont ensuite norms afin que leur somme soit nulle.

Si S = 0, les S
P
1
,

S
P
2
, ..., S
P
12
sont les coefficients saisonniers dfinitifs.

Si S 0, les 12 coefficients dfinitifs sont donns par :

S
1

= S
P
1
S / 12 ; S
2

= S
P
2
S / 12 ; ... ; S
12

= S
P
12
S / 12

Exemple : S = 25,99 do S
2
= 235,31 (-25,99 / 12) = 233,15

Etape 5 : Calcul de la srie CVS

La srie CVS est calcule par diffrence entre la srie brute et le coefficient saisonnier du mois
considr.

Pour le mois de janvier de lanne 2, la vente CVS est gale : 263,90 ( 205,57) = 607,17

Le Graphique 5 prsente la srie brute et la srie CVS. Nous remarquons que la
dsaisonnalisation a rduit considrablement la variance de la srie (ceci tant illustr par la baisse
du coefficient de variation, cf. Tableau 4) et que les ventes, hors saisonnalit, savrent stables et de
prvision aise.

Graphique 5 Analyse de saisonnalit : coefficients saisonniers fixes et additifs

B) Analyse de saisonnalit selon un schma multiplicatif et des coefficients glissants

Le Tableau 6 prsente le calcul des coefficients saisonniers partir du mme historique que
prcdemment, selon un schma multiplicatif et des coefficients glissants.
0.00
200.00
400.00
600.00
800.00
1000.00
1200.00
1400.00
1600.00
A
n
n
e

1
-
J F
M A M
J J
A S O N D
A
n
n
e

2
-
J F
M A M
J J
A S O N D
A
n
n
e

3
-
J F
M A M
J J
A S O N D
VENTES Ventes CVS

Tableau 6 Calcul des coefficients saisonniers glissants et multiplicatifs
DATES VENTES MM12 RAPPORT NORME Ventes CVS
Anne 1-J 401,60 0,51 0,52 768,55
F 395,70 0,56 0,57 692,73
M 451,00 0,65 0,66 678,74
A 427,60 0,72 0,74 577,77
M 496,80 0,57 0,59 847,99
J 467,70 0,79 0,81 577,63
J 352,30 565,60 0,62 0,64 552,28
A 182,10 555,46 0,33 0,34 542,38
S 522,20 546,30 0,96 0,98 533,44
O 687,20 539,32 1,27 1,30 526,62
N 1080,3 528,58 2,04 2,09 516,13
D 1391,6 517,20 2,69 2,76 505,02
Anne 2-J 263,90 517,21 0,51 0,54 491,94
F 289,90 519,75 0,56 0,59 494,37
M 337,00 519,40 0,65 0,68 494,03
A 374,00 517,53 0,72 0,76 492,25
M 292,70 511,66 0,57 0,60 486,67
J 398,60 504,16 0,79 0,83 479,53
J 421,70 506,05 0,83 0,88 481,33
A 173,80 512,55 0,34 0,36 487,51
S 522, 10 517,46 1,01 1,06 492,18
O 642,40 525,17 1,22 1,29 499,52
N 984,20 537,75 1,83 1,92 511,49
D 1307,6 550,13 2,38 2,50 523,26
Anne 3-J 393,40 555,57 0,71 0,70 565,43
F 316,20 556,97 0,57 0,56 566,86
M 428,60 559,68 0,77 0,75 569,62
A 467,60 565,05 0,83 0,81 575,08
M 501,00 568,53 0,88 0,87 578,62
J 487,40 572,71 0,85 0,84 582,88
J 463,30 0,83 0,82 565,85
A 165,90 0,34 0,33 497,94
S 595,10 1,01 0,99 600,28
O 698,10 1,22 1,20 580,85
N 1012,10 1,83 1,80 562,82
D 1380,00 2,38 2,34 590,90

MOYENNE 549,24 558,07
E-T 320,46 79,42
CV 0,58 0,14

Les diffrentes tapes de calcul sont les suivantes.

Etape 1 : Estimer la tendance par moyenne mobile.

Cette tape est identique celle du schma additif.

Etape 2 : Calculer le rapport entre la srie observe et la moyenne mobile.

Nous sommes en schma multiplicatif, nous effectuons donc le rapport entre la srie brute et la
moyenne mobile.
S
t
P
= x
t
/ MM12
t
En ce qui concerne les six premiers mois et les six derniers mois, la moyenne mobile dordre 12
ne peut pas tre calcule. Afin de complter cette colonne, on intgre la valeur du mme mois de
lanne suivante pour les six premiers mois et la valeur du mme mois de lanne prcdente pour
les six derniers mois.

Etape 3 : Normer les coefficients (conservation des aires).

Les coefficients saisonniers sont ensuite norms afin que leur moyenne, pour une anne donne,
soit gale 1.
Nous normons les coefficients saisonniers anne par anne afin que leur somme soit gale 12.

Calcul de S = S
P
1
+

S
P
2
+ ... + S
P
12

S
1
= ( S
P
1
12 / S) ; S
2
= ( S
P
2
12 / S) ; ...; S
12
= ( S
P
12
12 / S).

Etape 4 : Calcul de la srie CVS

La srie CVS est calcule par le rapport entre la srie brute et le coefficient saisonnier du mois
considr.

Exemple de calcul pour fvrier de lanne 2.

Calcul de la somme des 12 coefficients provisoires de janvier dcembre de lanne 2 :

S = 0,51 + 0,56 + 0,65 + ... + 2,38 = 11,41

S
fev-Anne 2
= (0,56 12) / 11,41 = 0,59

Pour le mois de fvrier de lanne 2, la vente CVS est gale : 289,90 / 0,59 = 494,37

C) Analyse de saisonnalit selon un schma multiplicatif et des coefficients fixes (Fichier Web).
Le lecteur analysera lui-mme les rsultats partir du fichier Excel.

e) Autre mthode de dsaisonnalisation : CENSUS
En 1954, Shiskin, spcialiste des cycles conomiques, propose une mthode de
dsaisonnalisation utilisant, de faon itrative, plusieurs moyennes mobiles. Shiskin, chercheur au
Bureau of Census des Etats-Unis, a donn le nom de Census-1 cette mthode. Depuis 1954,
elle a connu de nombreuses amliorations : Census-2, Census-3 et en 1967 Shiskin associ Young
et Musgrave a propos la version Census 11 qui est, actuellement, la mthode la plus utilise pour
dsaisonnaliser les chroniques (notamment par lINSEE). Il convient de noter lamlioration
apporte cette technique en 1979 par Dagum qui propose la version Census 11 ARMMI.
CENSUS II permet une analyse de saisonnalit par des moyennes mobiles en particulier l'aide
des formules de Spencer (moyenne mobile d'ordre 15). Il est largement diffus et son emploi s'est
gnralis dans beaucoup dorganismes dtudes statistiques mais peu en entreprises. Dans la
mthode CENSUS II, des coefficients saisonniers glissants sont calculs en vue d'intgrer des
modifications de structure de la saisonnalit. Ceci est donc critiquable comme nous lavons
soulign.
Comme la mthode Census est btie partir ditrations successives de moyennes mobiles
dordre diffrent pour mieux apprhender lextra saisonnalit de la chronique ainsi que les
fluctuations de la saisonnalit, elle fait perdre de linformation lextrmit terminale de la
chronique. Cest pourquoi la mthode Census ne peut tre employe que pour des sries de ventes
longues (10 ans), ce qui en limite lutilisation oprationnelle en entreprise.

Comme nous pouvons l'entrevoir, l'analyse de saisonnalit reste un traitement relativement
complexe qui ncessite rapidement des moyens informatiques. C'est une tape importante de la
dmarche prvisionnelle, car les coefficients saisonniers permettent de rpartir un niveau annuel
escompt l'intrieur de l'anne.

f) Une premire prvision par extrapolation de la tendance et de la saisonnalit
Le Graphique 6 illustre une prvision calcule par lextrapolation de la tendance et de la
saisonnalit. Pour les calculs de la tendance et de la saisonnalit dj prsents, le lecteur se rfre
au fichier Excel.
Graphique 6 Prvision par extrapolation de la tendance et de la saisonnalit

3.5.4 Test sur la saisonnalit
Avant de corriger une chronique de ces variations saisonnires, il convient d'laborer un test
permettant de dtecter l'existence d'une saisonnalit. Le test le plus communment employ est
celui de Fisher par analyse de la variance du facteur mensuel (ou trimestriel) par rapport la
variance totale de la srie.
La question pose est la suivante : l'adjonction d'une saisonnalit la tendance contribue-t-elle
amliorer de manire significative l'explication de la srie brute ? Cela revient comparer :
la somme des carrs des carts entre prvision et ralisation du modle tendance seule,
la somme des carrs des carts du modle tendance et saisonnalit.

Pour rpondre cette question, nous recourons un test de Fisher expos ci-aprs.

a) Calculer la somme des carrs des carts du modle avec tendance simple.
Estimation de la droite de tendance : T
t
=
1
t +
0
, puis calcul de :
U* =
n
t
t t ) - T (x
1

0
200
400
600
800
1000
1200
1400
1600
A
n
n
e

1
-
J M M
J S
N
A
n
n
e

2
-
J M M
J S
N
A
n
n
e

3
-
J M M
J S
N
A
n
n
e

4
-
J M M
J S
N
VENTES PREV
Pour U*, le nombre de degrs de libert
10
est donc ddl
U*
= n 2 (n = nombre total
d'observations) car nous avons estim deux paramtres a
0
et a
1
.

b) Calculer la somme des carrs des carts du modle avec tendance et saisonnalit.
Estimation des coefficients saisonniers S
t
, puis calcul de :
U** =
n
t
t t t )) S - (T (x
1

Pour U**, le nombre de degrs de libert est donc ddl
U**
= n 2 11 car nous avons estim
deux paramtres a0 et a1 et 11 coefficients saisonniers (le douzime se dduit des onze autres
daprs le principe de la conservation des aires).

c) Calculer la valeur du Fisher empirique.
F* = ((U* U**)/11) / (U** / (n 13))

La valeur du F* empirique, calcul partir de l'historique, est comparer la valeur du Fisher
thorique donne par la table de la loi
11
de Fisher-Snedecor aux degrs de libert correspondants
(v1 = ddl
U*
ddl
U**
= 11 ; v2 = ddl
U**
= n 13 ).

Si F* > F lu alors la srie est saisonnire, sinon la srie n'est pas saisonnire.

Dans le cas de chroniques relativement longues (4 ans en donnes mensuelles), F lu peut tre
approch par 2 ; cela vite une lecture systmatique de la table pour un risque d'erreur trs faible.
Le Tableau 7 illustre la mthode de calcul.

10
La notion de degrs de libert correspond au nombre de valeurs restant rellement disposition aprs une
procdure destimation statistique. Si un chantillon comprend 10 observations et quon dispose en plus de la moyenne
de cet chantillon, on ne peut choisir librement les valeurs que pour 9 de ces observations, la dixime se dduisant de la
valeur de la moyenne. Le nombre de degrs de libert est donc de n 1 = 9.
11
Les tables statistiques sont en fin douvrage.
Tableau 7 Test de dtection de saisonnalit
DATES VENTES Tt ECART CARRE Vt/Tt St ECART CARRE
Anne 1-J 401,60 418 269 0,96 0,79 5330
F 395,70 426 889 0,93 0,76 5174
M 451,00 433 324 1,04 0,85 6722
A 427,60 441 167 0,97 0,79 6042
M 496,80 448 2381 1,11 0,91 8156
J 467,70 456 149 1,03 0,84 7229
J 352,30 463 12256 0,76 0,62 4102
A 182,10 471 83177 0,39 0,32 1096
S 522,20 478 1953 1,09 0,89 9012
O 687,20 486 40682 1,42 1,16 15606
N 1080,3 493 344920 2,19 1,79 38567
D 1391,6 500 794059 2,78 2,27 63996
Anne 2-J 263,90 508 59584 0,52 0,58 998
F 289,90 515 50894 0,56 0,63 1205
M 337,00 523 34595 0,64 0,72 1628
A 374,00 530 24491 0,71 0,79 2005
M 292,70 538 60169 0,54 0,61 1228
J 398,60 545 21577 0,73 0,82 2278
J 421,70 553 17237 0,76 0,85 2550
A 173,80 560 149529 0,31 0,35 433
S 522,10 568 2106 0,92 1,03 3908
O 642,40 575 4477 1,12 1,25 5917
N 984,20 583 160973 1,69 1,89 13887
D 1307,6 590 514254 2,21 2,48 24513
Anne 3-J 393,40 598 41854 0,66 0,74 2451
F 316,20 605 83684 0,52 0,59 1583
M 428,60 613 33996 0,70 0,79 2909
A 467,60 620 23372 0,75 0,85 3462
M 501,00 628 16123 0,80 0,90 3975
J 487,40 635 21927 0,77 0,86 3762
J 463,30 643 32283 0,72 0,81 3399
A 165,90 650 234812 0,26 0,29 436
S 595,10 658 3953 0,90 1,02 5608
O 698,10 665 1065 1,05 1,18 7717
N 1012,10 673 115009 1,50 1,69 16221
D 1380,00 680 489343 2,03 2,28 30157

SOMME 19773 U* = 3478534 U** = 313262

F* = ((U* U**)/11) / (U** / (n 13)) = ((3478534 313262)/11) / (313262/ (36 13))= 21,13
F lu 11 et 23 degrs de libert = 2,24
La srie est donc saisonnire (ce qui se distingue lexamen du Graphique 5).

3.5.5 Famille de saisonnalit
Il savre parfois prfrable de calculer les coefficients saisonniers non pas partir de
lhistorique de larticle lui-mme mais sur un agrgat darticles appel famille de saisonnalit .
Cette famille de saisonnalit est donc compose darticles homognes vis--vis des variations
saisonnires, cest pourquoi elle est souvent diffrente, en terme de composition darticles, de la
famille commerciale.
Les avantages sont manifestes :
les coefficients saisonniers sont plus robustes car calculs sur un agrgat,
les effets sur la saisonnalit dun cannibalisme ponctuel (un article est en promotion au
dtriment des ventes dun autre) sont neutraliss,
un article nouveau avec un historique faible peut tre rattach une famille de saisonnalit et
ainsi la prvision de cet article intgre les variations saisonnires.

3.6. La composante cyclique
La tendance et la composante saisonnire sont souvent les caractristiques les plus videntes
d'une srie chronologique, particulirement dans le domaine conomique. Mais si on prend une
chronique pour laquelle ces composantes sont de peu d'importance, ou si on peut mentalement les
filtrer et les ignorer (par observation visuelle), la caractristique la plus visible qui subsiste dans
une chronique suffisamment longue est une srie de fluctuations irrgulires. Quelquefois ces
fluctuations ont une amplitude et une frquence rgulire (il s'agit alors vritablement de cycles),
principalement de priodes longues (deux ans ou plus), mais bien souvent il s'agit de simples
phnomnes de hausse et de baisse irrguliers.
L'analyse spectrale
12
est la seule mthode spcifique d'analyse de cycles. Son but est de
dcomposer ces fluctuations en cycles de priodes et d'amplitudes diffrents.
Les cycles tudis un niveau macro-conomique (cycles de Kondratieff, de Kuznets, de Juglar,
etc.) ne sont pas observs directement au niveau micro-conomique o les secteurs sont affects de
cycles de priode plus courte.
Les mthodes spectrales, drives de la physique (dcomposition de Fourier), fournissent une
approche mathmatique naturelle ce mlange de rgularit et d'irrgularit dans les sries
chronologiques.
Leur dmarche est de dcomposer la srie en une somme finie de sinuso des et de calculer pour
chacune d'elles la contribution la variance gnrale de la srie.
Le plus souvent, cette composante cyclique est ignore soit qu'il est impossible de la mettre en
vidence du fait de son inexistence, soit que nous ne disposons pas d'un historique assez long. La
composante cyclique est traite par de nombreux auteurs comme combine la tendance de moyen
terme : cette composante mixte est appele en anglais trend-cycle. Elle peut galement tre intgre
au rsidu (le facteur rsiduel explicit ci-dessous), considr comme une srie prvoir pure de
la tendance et de la saisonnalit. Cela justifie l'emploi ultrieur de mthodes explicatives.

3.7. Le facteur rsiduel
En reprenant le schma de dcomposition : x
t
= T
t
+ S
t
+ C
t
+ R
t
, il nous est possible maintenant
d'isoler le facteur rsiduel : Rt = xt Tt St Ct

Cette composante reprsente les fluctuations erratiques de la chronique dues aux accidents
conjoncturels. Il est intressant de savoir s'il s'agit de phnomnes purement alatoires au sens
gaussien du terme (esprance mathmatique nulle, symtrie de la distribution par rapport la
moyenne, constance de la variance), ou s'il est possible de trouver une loi de reproduction du
processus. Nous pouvons distinguer les deux termes, rsiduel et alatoire, de la faon suivante :
facteur rsiduel : il est possible de trouver une loi de reproduction de cette composante,
facteur alatoire : il n'est pas possible de l'expliquer.

En vue d'tablir avec certitude dans lequel des deux cas nous nous situons, le calcul du
corrlogramme
13
(ou fonction d'autocorrlation) fournit une indication sur la nature de cette
composante. Nous pourrons employer alors le terme de facteur rsiduel ou le terme de facteur
alatoire de faon adapte (c'est--dire un processus pour lequel on ne peut plus rien expliquer).

12
Cf. Bourbonnais et Terraza (1998) Chapitre 4.
13
Le calcul du corrlogramme et son interprtation sont examins au chapitre suivant.

Chapitre 3

PRINCIPALES METHODES (1) :

LES METHODES FONDEES SUR LE LISSAGE EXPONENTIEL

Les dveloppements de la pratique statistique ont permis de disposer dun certain nombre
d'outils de calcul. Ce chapitre a pour finalit de passer en revue les mthodes de prvision
extrapolatives fondes sur le principe du lissage exponentiel, en indiquant pour chacune d'elles les
dveloppements thoriques minimaux ncessaires leur comprhension. Le lecteur intress par
plus de dtails mthodologiques se reportera en fin d'ouvrage o une bibliographie lui fournira les
rfrences.
Les techniques de lissage exponentiel ont t introduites par Holt en 1957 mais surtout par
Brown en 1962. Le lissage regroupe lensemble des techniques empiriques qui ont pour
caractristiques communes daccorder un poids plus important aux valeurs rcentes de la
chronique.

1. Caractristiques des mthodes de lissage
1.1. Principes de base
Premier principe : la dvalorisation croissante de l'information avec l'ge
La mthode du lissage exponentiel repose sur l'ide de dpart que les informations contenues
dans une srie chronologique ont d'autant plus d'importance qu'elles sont plus rcentes. Pour
effectuer une prvision il faut donc affecter aux informations un poids d'autant plus faible qu'elles
proviennent d'poques plus loignes.

Deuxime principe : la synthtisation des informations
L'historique complet d'une srie chronologique est difficile manier.
La technique du lissage exponentiel permet de condenser cet historique sous forme de quelques
paramtres. Pour effectuer une prvision l'aide de cette technique, il n'est ncessaire de conserver
en mmoire que quelques valeurs.

Troisime principe : la ractualisation permanente des paramtres moyennant des calculs
relativement simples
La mthode du lissage exponentiel est adaptative, c'estdire qu'elle reprend en permanence les
paramtres, avec la mme priodicit que celle qui prside l'arrive des informations. Ce principe
n'est d'ailleurs qu'une consquence de l'association des deux principes prcdents.

Nous allons dmontrer ces trois principes.
1.2. Formulation
Supposons que x
t
reprsente les ventes dun produit quelconque la date t. Ces ventes x
t
peuvent
tre considres comme le rsultat dune combinaison linaire infinie de ses valeurs passes, le
poids (ou linfluence) du pass sur le prsent tant dcroissant avec son anciennet.

Notations
x
t
= ralisation de la chronique (les ventes) x la priode t, (un mois donn par exemple),
S
t
= valeur lisse de la chronique,
$ x
t
= prvision de la chronique x
t
pour t + 1 calcule en t, cestdire que x
t
doit tre compar
$ xt 1 ,
= coefficient de lissage, avec [0 ; 1].

Le principe de base du lissage exponentiel nous propose pour $ x
t
:

$ x
t
= S
t
= $ xt 1 + (x
t
$ xt 1 ) [1]

Le lissage apparat comme le rsultat de la dernire valeur lisse corrig par une pondration de
lcart entre la ralisation et la prvision. Nous retrouvons le troisime principe de ladaptation du
lissage lerreur de prvision.

L'quation [1] peut se modifier de la faon suivante

$ x
t
= x
t
+ (1 )
1
t
x [2]

Sous cette forme, le lissage apparat comme tant une moyenne pondre de la dernire
ralisation et de la dernire valeur lisse.

Pour observer l'influence du coefficient , nous posons dans la premire quation :
= 0 alors $ x
t
=
1
t
x , ce qui signifie que les nouvelles observations ne sont pas intgres pour
calculer les prvisions, le lissage est inerte par rapport aux ralisations, les prvisions restent
inchanges.
= 1 alors $ x
t
= x
t

Ici, le modle suit les dernires informations, la nouvelle valeur lisse est toujours gale la
dernire ralisation, le lissage est hyperractif.

La relation [2] peut tre dveloppe en remontant dans le temps (t 1, t 2,..., t n,..., 0) et
laisse apparatre que la nouvelle valeur lisse $ x
t
est une combinaison linaire de toutes les
observations du pass, affectes d'un poids dcroissant avec l'ge. Les poids sont de plus en plus
faibles au fur et mesure que l'on s'loigne de lobservation actuelle.

$ x
t
= x
t
+ (1 ) x
t1
+ (1 )
2
x
t2
+ (1 )
3
x
t3
+ ...+ (1 )
n1
x
tn1
+ (1 )
n
x
0

[3]

Nous avons ainsi dmontr les premier et deuxime principes :
Puisque le coefficient est compris entre 0 et 1, le poids accord aux valeurs est
gomtriquement dcroissant, comme lillustrent le Tableau 8 et le Graphique 7.
Dans la dernire valeur lisse est contenue de manire synthtique toute linformation
historique.

Tableau 8 Dvalorisation de linformation avec son anciennet
Comparaison entre une moyenne classique et trois valeurs de

Temps Moyenne classique Poids Pondration gomtriquement dcroissante
pour = 0,30
0 0,1 0,30
1 0,1 (1 ) 0,21
2 0,1 (1 )
2
0,15
3 0,1 (1 )
3
0,10
4 0,1 (1 )
4
0,07
5 0,1 (1 )
5
0,05
6 0,1 (1 )
6
0,04
7 0,1 (1 )
7
0,02
8 0,1 (1 )
8
0,02
9 0,1 (1 )
9
0,01
10 0,1 (1 )
10
0,01

Pour = 0,30 la dernire valeur xt de la chronique est pondre par 0,3. L'avant dernire xt1 est
pondre par 0,21 (c'estdire que 21 % de sa valeur contribue au calcul de la prvision) et ainsi
de suite ..., partir de la huitime valeur x
t8
le coefficient de pondration est infrieur 0,02.
Graphique 7 Dvalorisation de linformation avec son anciennet
Comparaison entre une moyenne classique et trois valeurs de
0
0, 1
0, 2
0, 3
0, 4
0, 5
0, 6
0, 7
0, 8
0 -1 -2 -3 -4 -5 -6 -7 -8 -9 - 10
Temps
MOYENNE 0, 3
0, 6 0, 8

1.3. Rle de la constante de lissage
Nous avons observ prcdemment les consquences de deux choix extrmes : = 0 et =1.
Un compromis doit donc tre trouv entre stabilit, c'estdire effacement des variations purement
alatoires, et rapidit de rponse pour reprer des changements de tendance. Le paramtre , appel
la constante de lissage, joue un rle trs important :
lorsque est proche de 0, la pondration stale sur un grand nombre de termes du pass, la
mmoire du phnomne tudi est forte et la prvision est peu ractive aux dernires observations ;
lorsque est proche de 1, les observations les plus rcentes ont un poids prpondrant sur les
termes anciens, la mmoire du phnomne est faible et le lissage est trs ractif aux dernires
observations.
Il est possible de calculer le dlai moyen de raction certains auteurs parlent dge moyen de
linformation qui est la moyenne pondre des coefficients de lissage. Il est donn par :
D =
1

Si = 1, lge moyen est nul puisque seule la dernire valeur est prise en compte ; si = 0 lge
moyen est infini puisque seule la valeur initiale est prise en compte.

Le lissage joue un rle de rducteur de variance, on dmontre la formule suivante :
2 ) (
) (
t
t
x Var
x Var
, si = 0, $ x
t
est de variance nulle (puisque la prvision est constante quelles que
soient les valeurs de x
t
.), si = 1, $ x
t
a la mme variance que x
t
.(la nouvelle valeur lisse est
toujours gale la dernire ralisation).
Pour assurer un rle de filtrage efficace, il convient de choisir un faible, mais alors on perd en
ractivit.
Le Graphique 8 prsente en ordonne les valeurs du rapport de lcarttype de la srie lisse
lcarttype de la srie brute (
2
) et, en abscisse, lge du lissage pour diffrentes valeurs de
.
A la lecture de cette courbe, on comprend pourquoi la valeur de = 0,3 est trs couramment
choisie : lorsque le coefficient est infrieur 0,20, lge du lissage saccrot trs vite pour un gain
faible de filtrage ; audel de 0,4, la qualit du filtrage dcrot trs vite pour une faible rduction de
lge moyen.
Graphique 8 Valeur du coefficient , ge moyen de linformation et filtrage

Nous reviendrons en dtail la section 5 sur le choix optimal de la (ou des) coefficient (s) de
lissage.
2. Le lissage simple : le modle stationnaire
Les formules de lissage simple sont donc les suivantes :

$ x
t
= S
t
= x
t
+ (1 )
1
t
x
avec
1
x = x
1
pour initialiser
et la prvision calcule en n lhorizon de h priodes est gale :
h x x
n h n

+

Nous observons que la prvision est constante quel que soit lhorizon.
Le Tableau 9 illustre un calcul.
0,00
0,20
0,40
0,60
0,80
1,00
1,20
0,00 2,00 4,00 6,00 8,00 10,00 12,00 14,00 16,00 18,00 20,00
Age moyen de l'information
R
a
p
p
o
r
t

d
e
s

c
a
r
t
s
-
t
y
p
e
s

s
r
i
e

l
i
s
s
e

s
u
r

s
r
i
e

b
r
u
t
e

R
l
e

d
e

f
i
l
t
r
a
g
e

d
u

l
i
s
s
a
g
e
ALPHA
ALPHA=0,6
ALPHA=0,2
ALPHA=0,3
Tableau 9 Prvision partir du modle de lissage exponentiel simple
t xt $ x
t
et= xt $ x
t

1 30 30,00 0
2 40 33,00 10,00
3 40 35,10 7,00
4 30 33,57 5,10
5 20 29,50 13,57
6 20 26,65 9,50
7 30 27,65 3,35
8 30 28,36 2,35
9 28,36
10 28,36
11 28,36

On initialise $ x
1
= x
1
= 30
Pour t = 2 (prvision calcule en t = 1 pour t = 2) nous avons :
$ x
2
= 0,3 x
2
+ 0,7 $ x
1
= 0,3 40 + 0,7 30 = 33 = x
1

Pour t = 3 : $ x
3
= 0,3 40 + 0,7 33 = 35,10

Pour t = 8, $ x
8
= 0,3 30 + 0,7 27,65 = 28,36
Pour t = 9, 10, 11 $ x
11
= $ x
10
= $ x
9
= 28,36

Nous vous proposons titre dexercice de charger le fichier Web et deffectuer la simulation
demande.
La simulation a montr que si la srie est affecte dune tendance, le lissage exponentiel simple
est dfaillant. Or, en prvision des ventes, la plupart des sries sont affectes dune tendance la
hausse ou la baisse. Dans la pratique, le lissage simple nest pas utilis. Cest pourquoi on prfre
utiliser le lissage exponentiel double qui permet dintgrer ces phnomnes de tendance.
3. Le lissage exponentiel double : le modle linaire
Les formules prcdentes permettent de calculer une prvision pour des sries chronologiques
stationnaires, sans tendance. Nous pouvons dfinir un lissage exponentiel double qui est utilis en
cas de srie avec tendance :
Le modle du lissage exponentiel double (LED) sapplique une chronique du type :
x
t
= a
0t
+ a
1t
t
Nous remarquons quil sagit de la mme spcification que pour une droite de tendance (cf.
chapitre 2), la moyenne (
0 t
) et la tendance (pente de la droite
1 t
) voluent au cours du temps.
Comme son nom lindique, la technique du LED consiste effectuer un lissage de la srie dj
lisse.
On dmontre
14
les formules suivantes :
double) lissage de terme le o (d' ) 1 (
) 1 (
1
1
+
+
t t t
t t t
SS S SS
S x S

14
Cf. Bourbonnais et Terraza 1998, page 55.
'
t t
t
t t
t
SS S a
SS S a
2
) (
1
0
1

La prvision lhorizon h est donne par : h a a x t t h t + + 1 0

Le Tableau 10 prsente le calcul d'une prvision par lissage exponentiel double avec = 0,3.
Les Graphique 9 et
Graphique 10 illustrent une prvision par lissage exponentiel, sur les donnes, du Tableau 10
avec = 0,1 et = 0,9 (la prvision est fonction du poids accord au pass rcent et lointain).

Tableau 10 Prvision par lissage exponentiel double avec = 0,3
DATES VENTES CVS S SS a1t a0t PREV
Anne 1J 7281 7281,00 7281,00 0,00 7281,00
F 9163 7845,60 7450,38 169,38 8240,82 7281,00
M 7769 7822,62 7562,05 111,67 8083,19 8410,20
A 8485 8021,33 7699,84 137,78 8342,83 8194,86
M 7606 7896,73 7758,91 59,07 8034,56 8480,62
J 7364 7736,91 7752,31 6,60 7721,52 8093,63
J 6711 7429,14 7655,36 96,95 7202,92 7714,92
A 6894 7268,60 7539,33 116,03 6997,87 7105,97
S 5678 6791,42 7314,96 224,37 6267,88 6881,84
O 7606 7035,79 7231,21 83,75 6840,38 6043,51
N 7364 7134,26 7202,12 29,09 7066,39 6756,63
D 9789 7930,68 7420,69 218,57 8440,67 7037,30
Anne 2J 8082 7976,07 7587,30 166,62 8364,85 8659,24
F 8663 8182,15 7765,76 178,45 8598,55 8531,46
M 7720 8043,51 7849,08 83,32 8237,93 8777,00
A 7859 7988,15 7890,80 41,72 8085,50 8321,25
M 6936 7672,51 7825,32 65,49 7519,70 8127,23
J 6292 7258,36 7655,23 170,09 6861,48 7454,21
J 7572 7352,45 7564,39 90,83 7140,50 6691,40
A 6743 7169,61 7445,96 118,43 6893,27 7049,67
S 7152 7164,33 7361,47 84,49 6967,19 6774,83
O 9567 7885,13 7518,57 157,10 8251,69 6882,70
N 8522 8076,19 7685,86 167,29 8466,53 8408,79
D 8688 8259,73 7858,02 172,16 8661,45 8633,81
Anne 3J 5772 7513,41 7754,64 103,38 7272,19 8833,61
F 7682 7563,99 7697,44 57,19 7430,54 7168,81
M 8814 7938,99 7769,91 72,46 8108,08 7373,34
A 9432 8386,89 7955,00 185,10 8818,79 8180,54
M 7541 8133,13 8008,44 53,44 8257,81 9003,88
J 8765 8322,69 8102,72 94,27 8542,66 8311,25
J 7650 8120,88 8108,17 5,45 8133,60 8636,94
A 7152 7830,22 8024,78 83,38 7635,65 8139,05
S 9567 8351,25 8122,72 97,94 8579,78 7552,27
O 8522 8402,48 8206,65 83,93 8598,30 8677,72
N 8814 8525,93 8302,43 95,79 8749,43 8682,23
D 7892 8335,75 8312,43 10,00 8359,08 8845,22
Anne 4J 8369,07
F 8379,07
M 8389,06
A 8399,06
M 8409,06
J 8419,05
J 8429,05
A 8439,04
S 8449,04
O 8459,04
N 8469,03
D 8479,03

Toutes les explications de calcul sont indiques sur les cellules du fichier.

Graphique 9 Prvision par lissage exponentiel avec = 0,1

Graphique 10 Prvision par lissage exponentiel avec = 0,9

La lecture des deux graphiques prcdents illustre parfaitement la technique du lissage
exponentiel plusieurs gards :
d'une manire gnrale, nous observons que la prvision ragit avec retard une modification
de la chronique ; c'est le phnomne de course poursuite entre ralisation et prvision.
5000
6000
7000
8000
9000
10000
11000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48
VENTES CVS PREV
5000
6000
7000
8000
9000
10000
11000
12000
13000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48
VENTES CVS PREV
La courbe trace partir du coefficient = 0,8 est trs ractive ces modifications brusques ;
cependant, en prvision, elle amplifie fortement la tendance lie la dernire observation.
Les deux prvisions calcules sont trs diffrentes, la modification du coefficient entrane
des rsultats htrognes et instables.
Ces graphiques prsentent parfaitement les limites du lissage exponentiel.
4. Les modles de Holt et HoltWinters
4.1. Le modle de Holt
La mthode que nous venons de prsenter est celle de Brown. Nous pouvons aussi utiliser le
lissage de Holt qui comprend deux paramtres : lun pour la moyenne lisse a
0t
et lautre pour la
pente a
1t
.
Deux lissages distincts sont effectus :
le lissage de la moyenne a
0t
avec un coefficient de lissage , [0 ; 1],
le lissage de la tendance a
1t
avec un coefficient de lissage , [0 ; 1].
(Dans le cas particulier o = le modle de Holt se ramne au lissage exponentiel double de
Brown).

Formulation
Lissage de la moyenne : a
0t
= x
t
+ (1 ) (a
0t1
+ a
1t 1
)
(a0t1 + a1t 1 reprsente la nouvelle moyenne lisse en t)
Lissage de la tendance : a
1t
= (a
0t
a
0t1
) + (1 ) a
1t1

Prvision calcule en t un horizon de h priodes :
h t
x
+

= a
0t
+ h a
1t

avec :
x
t
= valeur observe de la srie en t

Initialisation (pour t = 1)
Initialisation de la moyenne lisse : a
01
= x
1

Initialisation de la tendance : a
11
= 0

Les formules gnrales peuvent ensuite tre utilises.

Nous vous proposons titre dexercice de charger le fichier Web.

Un exemple complet de calcul est prsent, par la suite, partir du modle de HoltWinters.
4.2. Le modle avec tendance et saisonnal it (modle de HoltWinters)
Le modle de HoltWinters prsente lavantage dintgrer une composante saisonnire et donc
de raliser le calcul de la prvision en un seul traitement. Cest ce modle qui est employ le plus
couramment dans les progiciels de prvision des ventes. Trois lissages
15
distincts sont effectus :

le lissage de la moyenne avec un coefficient de lissage , avec [0 ; 1],
le lissage de la tendance avec un coefficient de lissage , avec [0 ; 1],
le lissage de la saisonnalit avec un coefficient de lissage , avec [0 ; 1],

15
Si la srie nest pas saisonnire, on utilise alors le modle de Holt deux lissages : moyenne et tendance.
Formulation

Lissage de la moyenne : a
0t
= (x
t
/ S
tp
) + (1 ) (a
0t1
+ a
1t1
)
(On utilise S
tp
car S
t
nest pas encore connue).

Lissage de la tendance : a
1t
= (a
0t
a
0t1
) + (1 ) a
1t1

Lissage de la saisonnalit : S
t
= (x
t
/ a
0t
) + (1 ) S
tp

Prvision un horizon de h priodes : $ xt h +

= (a
0t
+ h a
1t
) S
tp+h
si 1 h p
$ xt h +

= (a
0t
+ h a
1t
) S
tp+2h
si p + 1 h 2 p
avec :

a0t = moyenne lisse de la srie en t
x
t
= valeur observe de la srie en t
S
t
= coefficient saisonnier en t
p = priodicit des donnes (p = 12 en mensuel, p = 4 en trimestriel)
a
1t
= tendance estime en t.

Initialisation (pour la premire anne, t = 1, p)

Initialisation de la saisonnalit
Les coefficients saisonniers pour la premire anne sont estims par la valeur observe en t (x
t
)
divise par la moyenne x des p premires observations (celles de la premire anne).

S
t
= x
t
/ x pour t = 1, p

Initialisation de la moyenne lisse : a
0p
= x

Initialisation de la tendance : a1p
= 0

Le Tableau 11 illustre un calcul de prvision laide du modle de HoltWinters. Les donnes
concernent les ventes dun produit festif (vin de champagne).

Tableau 11 Calcul dune prvision par le modle de HoltWinters
avec = 0,3 ; = 0,1 ; = 0,2
DATES VENTES
a0t
a1t
S
t

$ x
t

Anne 1J 401,60 0,70
F 395,70 0,69
M 451,00 0,79
A 427,60 0,75
M 496,80 0,87
J 467,70 0,82
J 352,30 0,62
A 182,10 0,32
S 522,20 0,91
O 687,20 1,20
N 1080,3 1,89
D 1391,6 571,3 0,0 2,44
Anne 2J 263,90 512,6 5,9 0,67
F 289,90 480,3 8,5 0,67 350,93
M 337,00 458,3 9,9 0,78 372,38
A 374,00 463,8 8,3 0,76 335,61
M 292,70 419,8 11,9 0,84 396,06
J 398,60 431,6 9,5 0,84 333,94
J 421,70 500,6 1,7 0,66 260,28
A 173,80 512,9 0,3 0,32 159,04
S 522,10 530,2 1,5 0,93 468,51
O 642,40 532,4 1,6 1,20 639,48
N 984,20 529,9 1,1 1,88 1009,59
D 1307,6 532,8 1,3 2,44 1293,50
Anne 3J 393,40 551,3 3,0 0,67 355,35
F 316,20 528,6 0,5 0,66 374,05
M 428,60 535,5 1,1 0,78 411,91
A 467,60 560,2 3,5 0,77 407,82
M 501,00 574,6 4,6 0,84 470,70
J 487,40 579,5 4,6 0,84 486,21
J 463,30 618,9 8,1 0,68 386,56
A 165,90 593,1 4,7 0,31 202,37
S 595,10 610,8 6,0 0,94 554,84
O 698,10 605,8 4,9 1,19 742,35
N 1012,10 588,6 2,7 1,85 1150,55
D 1380,00 583,6 1,9 2,42 1442,40
Anne 4J 395,22
F 387,41
M 461,43
A 458,21
M 499,74
J 499,82
J 405,46
A 188,16
S 563,23
O 719,31
N 1119,40
D 1470,68

Exemples de calculs
16
.

Initialisation : x = 571,34 (pour la premire anne).
La saisonnalit : S
avrAnne 1
= 427,60 / 571,34 = 0,75
La moyenne : a
0
dcAnne 1
= 571,34
La tendance : a
1
dcAnne 1
= 0

16
Des lgres diffrences peuvent apparatre entre les valeurs calcules et les valeurs du tableau du fait que le
tableur utilise un nombre de dcimales important.

Ici, en rgime permanent (lhorizon h est choisi gal 1) pour la ligne de septembre de lanne 2
:
a
0
sepAnne 2
= 0,3 (522,1 / 0,91) + 0,7 (512,9 0,3) = 530,2
a
1
sepAnne 2
= 0,1 (530,2 512,9) + 0,9 0,3 = 1,5
S
sepAnne 2
= 0,2 (522,1 / 530,2) + 0,8 0,91 = 0,93
x
sepAnne 2
= (512,9 + ( 0,3) 1) 0,91 = 468,51 (calcule en aot 1992, avec h = 1).

La prvision pour septembre de lanne 4 (horizon h = 9), calcule en dcembre de lanne 3, est
gale : x
sepAnne 4
= (583,6 + 1,9 9) 0,94 = 563,23
5. Comment choisir le coefficient de lissage ?
5.1. Principes gnraux
Pour dbuter le processus de lissage, il convient de choisir une valeur pour la constante (par
exemple = 0,3). Ce choix est trs important car il conditionne la prvision future travers le
degr de pondration que l'on affecte au pass rcent et au pass lointain.
Diverses procdures d'estimation de ont t tablies ; la plus classique consiste retenir une
valeur de qui minimise l'cart entre la prvision et la ralisation sur la partie connue de la
chronique (cf. 5.2.). Une autre approche consiste laborer des procdures de rgulation et de
contrle qui permettent de modifier la constante du lissage. Ainsi, en cas de divergence
systmatique de la prvision, s'ajuste automatiquement en vue de s'adapter ce changement de
structure (cf. 5.3).
5.2. Valeur de qui minimise la somme des carrs des erreurs de prvision
C'est la technique de calcul la plus couramment employe, son principe est simple : pour un
intervalle donn de valeurs de (
1
;
2
) avec un pas assez fin (0,05 par exemple), les
prvisions sont simules et la somme des carrs des erreurs de prvision est alors calcule. Nous
retenons la valeur de qui rend minimum la somme des carrs des carts. Cette technique peut tre
gnralise pour la dtermination des trois coefficients (, , ). Lutilisation du SOLVEUR sur
les tableurs permet sans trop de difficults de rsoudre ce problme.

La dmarche peut tre illustre de la manire suivante :

On cherche la valeur du coefficient de lissage qui minimise la somme des carrs des erreurs de
prvision passe : Min e x x
t
t
n
t t
t
n
2
1
2
1

( $ ) en faisant varier la valeur de tel que :

1
= 0,1 ;
2
= 0,6 ; pas = 0,05
Soit = 0,1 ; = 0,15 ; = 0,20 ; ; = 0,6

Le coefficient retenu est celui qui correspond au minimum de
n
t
t t
x x
1
2
) ( .

A titre dillustration, recherche des coefficients de lissage optimaux dans un modle de Holt
Winters cf. Fichier Web.

Cette technique de dtermination du coefficient de lissage est optimale selon le critre des
moindres carrs. Si nous sommes certains de trouver le meilleur coefficient sur l'ensemble de la
priode de l'estimation (c'estdire sur le pass), nous ne sommes plus du tout certains d'tre
l'optimum au moment o la prvision est calcule. La mthode suivante pallie cet inconvnient.
5.3. Procdure de rgulation d'un coefficient de lissage
5.3.1 Principes gnraux
La valeur optimale
17
rsulte d'un compromis entre linertie lie l'intgration de donnes
lointaines et la sensibilit aux valeurs rcentes.
En cas d'erreur de prvision constate, deux interprtations sont possibles :
il s'agit d'un accident, le coefficient doit alors diminuer afin de gommer l'effet de cette
valeur anormale ;
il s'agit d'une rupture de tendance durable, le coefficient doit tre augment afin d'intgrer
plus rapidement cette rupture.
L'arbitrage est dlicat entre ces deux hypothses.
Prenons lexemple dune chronique de ventes qui connat deux perturbations :
une rupture de tendance partir de la priode 13,
une valeur anormale pour les priodes 25 et 26.
Nous calculons une prvision (cf. Graphique 11) pour cette chronique laide dun lissage
exponentiel double avec = 0,1 et = 0,5.

17
Si tant est quelle puisse exister, cest--dire quun critre stable doptimalit puisse tre dfini. A chaque
nouvelle ralisation, la restimation des paramtres tenant compte de lerreur de prvision dfinit un nouveau
coefficient de lissage. Il sagit alors dune course poursuite entre les prvisions et lerreur de prvision, sans
possibilit danticipation de la nouvelle structure de la chronique. On doit donc parler de valeur optimale instantane.

Graphique 11 Exemple de prvision avec = 0,1 et = 0,5

Si = 0,1 : la raction au changement de tendance et le rajustement sont longs. En revanche, ce
coefficient permet d'effacer de faon trs satisfaisante la perturbation,
Si = 0,5 : le systme s'ajuste bien et vite la nouvelle moyenne mais sa sensibilit le fait ragir
trop fort la perturbation.
Lidal est donc un coefficient susceptible dvoluer au cours du temps ! La procdure de
contrle du coefficient rpond cette question.

Reprenons le modle du lissage exponentiel simple dfinit par l'quation :
$ x
t
= x
t
+ (1 )
1
t
x
x
t
= ralisation de la chronique (les ventes) x la priode t (un mois donn par exemple),
$ x
t
= prvision de la chronique x
t
pour t + 1 calcule en t,
= coefficient de lissage, avec [0 ; 1].

On est naturellement conduit essayer de rguler de faon automatique et chaque instant t, le
paramtre , afin de tenir compte, soit du pass immdiat, soit des valeurs rtrospectives plus
anciennes.
On envisage un modle du type :
$ x
t
=
t
x
t
+ (1
t
)
1
t
x dans lequel
t
volue chaque instant t par un systme de rgulation.

5.3.2 Les variables de contrle
Les notations sont les suivantes :

0
100
200
300
400
500
600
700
800
900
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48
VENTES LISSAGE ALPHA = 0,1 LISSAGE ALPHA = 0,5
x
1
, x
2
, x
t
sont les valeurs successives de la chronique qu'il s'agit de prvoir aux diffrentes
dates 1, 2,..., t ;
t
x x x , , ,
2 1
K sont les valeurs qui ont t prvues pour ces mmes dates par la procdure de
prvision.

Sur les diffrents graphiques, les croix reprsentent les ralisations x
t
; les points reprsentent les
prvisions $ x
t
.

Indicateur d'cart instantan (EPSt)

L'cart entre prvision et ralisation (cf. Graphique 12) l'instant t est la premire variable qui
vient l'esprit pour juger de la performance du systme de prvision : EPS
t
= x
t
$ x
t

Graphique 12 Indicateur d'cart instantan

Indicateur de valeur cumule des carts (SUMEPS, somme des EPS)

Soit T priodes de prvision successives (par exemple les 12 dernires prvisions) :
Il est dfini par :
t
T t i
i t
EPS SUMEPS
1

Si les observations sont rparties rgulirement autour des prvisions, la valeur de SUMEPS
est voisine chaque instant de 0 (Graphique 13).
Si, en revanche, partir d'un certain moment, SUMEPS crot en valeur absolue, cela indique un
changement de tendance ou de niveau (Graphique 14).

Graphique 13 Erreur de prvision rpartie

x
t

x
t

x
t
$ x
t

Graphique 14 Prvision biaise

Indicateur de la valeur absolue moyenne des carts (Mean Absolute Deviation)

Il est dfini l'instant t par :
T
EPS
MAD
t
T t i
i
t
1

Il s'agit d'une caractristique de dispersion : MAD
t
est l'analogue d'un cart type instantan des
carts de prvision.

Si les carts EPS deviennent de plus en plus importants, la valeur de MAD s'accrot. Une erreur
de prvision anormalement leve entrane une augmentation instantane de la valeur MAD, cela
correspond souvent une observation aberrante (ou anormale) (cf. Graphique 15).

Graphique 15 MAD crot avec t

Un cart instantan EPS
t
ne peut se comprendre que par rapport aux fluctuations moyennes de la
srie (un cart instantan de 5 10 % peut paratre satisfaisant pour une srie dont les oscillations
sont violentes, mais anormal si la srie est stable).
C'est pourquoi, il est souhaitable de comparer systmatiquement EPS et SUMEPS l'indicateur
d'cart moyen MAD, ce qui conduit deux signaux de rgulation NF et AWS.

Signal NF (Normal Forecast)

x
t

|SUMEPS| crot

x
t

|MAD| crot
Il est dfini par :
t
t
t
MAD
EPS
NF
Ce signal est l'analogue d'une variable centre rduite (que l' on obtiendrait en remplaant MAD
t
,
dans la formule prcdente, par l'carttype des carts de prvision).
Cet indicateur est trs sensible aux observations anormales (si |EPS
t
| est particulirement lev,
|NF
t
| est aussi lev).

Signal AWS (Alert Warning Signal)

Il est dfini par :
t
t
t
MAD
SUMEPS
AWS
Dans le cas d'un changement de tendance, la somme algbrique des carts de prvision est de
mme signe sur plusieurs priodes : la prvision ne s'ajuste pas convenablement au niveau des
ralisations, le filtre SUMEPS cumule ces carts, |AWS| augmente.

5.3.3 Application

Cas d'un changement de tendance (Graphique 16)
Jusqu la priode T, aucun indicateur naugmente, reste stable.
A partir de T + 1, la somme algbrique des erreurs est de mme signe sur plusieurs priodes : la
prvision est biaise. Le filtre SUMEPS va considrer ces carts comme systmatiques, NF
augmente la premire priode du changement de structure et peut par la suite, soit rester stable,
soit maintenir son volution ; AWS est le signal d'cart qui dclenchera l'augmentation de , en
considrant que la pondration accorde la dernire information est trop faible.

Graphique 16 Changement de tendance
EPS = 0
SUMEPS
MAD

AWS
NF
inchang
x
t
T T+3 T+4 T+1 T+2
NF
AWS
NF stable
AWS
NF = 0
AWS
Stabilit
Stabilit
Changement de tendance
augmente
revient la normale

Incident de type conjoncturel (Graphique 17)
Le phnomne a un caractre phmre. Dans ce cas, les erreurs n'ont pas un caractre
systmatique mais peuvent tre considres comme anormales (filtre MAD). AWS augmente la
premire priode. Il peut demeurer stable, ou mme s'annuler par la suite dans le cas d'carts
successifs importants de signes diffrents.
NF est le signal d'cart qui dclenche une diminution de en considrant que la pondration
accorde la dernire information a un poids trop important puisqu'il s'agit d'un accident.

Graphique 17 Accident conjoncturel
x
t
T T+3 T+4 T+1 T+2
NF grand
AWS = 0
NF = 0
AWS = 0
Stabilit
Stabilit
Accident
AWS
NF
revient la normale
diminue

La prvision a rejoint la nouvelle tendance o la valeur anormale est passe
Dans ce cas, , qui a pu subir des variations importantes prcdemment, revient au niveau de
dpart ( de base).

Procdure oprationnelle
Lindicateur NF est donc spcifique dune valeur anormale (en cas daugmentation de NF, il
convient de diminuer le coefficient de lissage) et lindicateur AWS permet de dtecter les ruptures
de tendance (en cas daugmentation de AWS, le coefficient de lissage doit tre augment).
La question se pose alors de combiner dune manire pertinente ces deux informations.
La constitution du tableau de dcision (cf. Tableau 12) permet de rpondre ce problme. A
partir de seuils exprimentaux
18
, nous dfinissons trois classes pour les valeurs de NF (en ligne) et
AWS (en colonne) :
NF est faible si sa valeur est infrieure 1,5 le code NF est alors 1,
NF est moyen si sa valeur est comprise entre 1,5 et 3 le code NF est 2,
NF est fort si sa valeur est suprieure 3 le code NF est 3,
AWS est faible si sa valeur est infrieure 3 le code AWS est 3,
AWS est moyen si sa valeur est comprise entre 3 et 5 le code AWS est 2,

18
Cest--dire issus dexpriences en entreprise.
AWS est fort si sa valeur est suprieure 5 le code AWS est 1.

La stratgie adopter en ce qui concerne la valeur de se trouve lintersection dune ligne
et dune colonne :
si NF est faible et AWS fort, nous sommes confronts une rupture de tendance, le coefficient
doit fortement augmenter,
si NF est fort et AWS moyen, nous avons une prsomption dune valeur anormale, le
coefficient doit lgrement diminuer,
etc.

Tableau 12 Table de dcision en fonction des valeurs de NF et AWS

NF
t

AWS
t

FAIBLE
< 1,5
CODE = 1
MOYEN
] 1,5 ; 3 [
CODE = 2
FORT
> 3
CODE = 3
FAIBLE
< 3
CODE = 3

moyen
rgime permanent
faible
prsomption de
valeur anormale
trs faible
valeur anormale
MOYEN
] 3 ; 5 [
CODE = 2
fort
prsomption de
rupture de tendance
moyen
attente
faible
prsomption de
valeur anormale
FORT
> 5
CODE = 1
trs fort
rupture de
tendance
fort
prsomption de
rupture de tendance
moyen
rupture de
tendance ou valeur
anormale ?

La valeur du coefficient correspondant la stratgie se trouve lintersection des valeurs de
NF et AWS. Dune manire oprationnelle et afin de pouvoir automatiser le pilotage du coefficient
de lissage, il convient de calculer la somme des deux codes NF et AWS :

SOMME = CODE NF + CODE AWS

Puis la valeur du coefficient se dduit directement de cette valeur selon lquation empirique
suivante :
t
= 0,7 0,1 SOMME

Le Tableau 13 prsente en fonction des diffrentes valeurs de la somme des codes NF et AWS la
valeur dduite de .

Tableau 13 Valeurs de en fonction de la somme des codes NF et AWS

SOMME

6 0,1
5 0,2
4 0,3
3 0,4
2 0,5

Dans le cas dun modle de Holt ou Holt Winters, nous sommes confronts au pilotage de deux
ou trois coefficients. La stratgie est alors la suivante :
le coefficient de lissage de la moyenne est pilot comme indiqu ci-dessus,
le coefficient de lissage de la tendance , sur lequel on dsire tre lgrement moins ractif
que celui de la moyenne, se dduit de la valeur de par lquation t = t 0,05,
enfin, le coefficient de la saisonnalit, dans le cas du modle de HoltWinters, reste statique
et gal 0,2 car les ruptures de tendance ou les valeurs anormales naffectent pas la composante
saisonnire.

A titre dillustration : Fichier Web (pilotage dun coefficient dans un modle de lissage double).

L'avantage des mthodes fondes sur le lissage exponentiel rside dans leur grande facilit de
mise en uvre et leur simplicit relative de calcul. En revanche, nous pouvons leur reprocher une
rusticit qui s'avre suffisante en cas de chronique assez peu fluctuante, mais devient vite gnante si
la srie est fortement chahute. De surcrot, par son inspiration mme, l'environnement extrieur
n'est pas pris en compte et n'a donc aucun effet. Cependant, dans certains cas il est possible
d'intgrer, de manire rudimentaire, des facteurs explicatifs qui viennent alors a priori amliorer la
prvision obtenue (voir chapitre 7).

En conclusion de ce chapitre, nous pouvons synthtiser les avantages et les inconvnients de
cette technique de prvision laide du Tableau 14.

Tableau 14 Points forts et points faibles du lissage exponentiel

Avantages Inconvnients
Simplicit des calculs pour l'laboration des
prvisions en rgime permanent
Mthode purement extrapolative, qui ignore les
vnements exognes
Systme adaptatif avec calculs itratifs,
facilement ralisable sur tableur
Choix dlicat de la constante de lissage
Rapidit de calcul Systme ragissant avec retard
Matrise du fonctionnement par l'utilisateur


Chapitre 4

PRINCIPALES METHODES (2) :

BOX-JENKINS ET MODELE CAUSAL

Dans ce chapitre nous tudions deux mthodes de prvision :
La mthodologie de Box et Jenkins est une technique d'extrapolation par rfrence une loi de
reproduction du phnomne tudi. L'information permettant de mettre en vidence le processus est
contenue dans la srie chronologique elle-mme, sans apport externe, d'o le nom de prvision
endogne ;
les modles causals ou modles explicatifs cherchent expliquer les fluctuations de la srie
des ventes par rfrence des facteurs explicatifs externes reprsentatifs soit de la politique
marketing de la firme, soit de la demande.
1. La corrlation et le corrlogramme
Deux concepts doivent tout d'abord tre explicits : la corrlation et le corrlogramme.
1.1. La corrlation
Lorsque deux phnomnes ont une volution commune, ils sont dits corrls . La corrlation
simple mesure le degr de liaison existant entre ces deux phnomnes reprsents par des variables
x et y.
Nous pouvons distinguer la corrlation linaire, lorsque tous les points du couple de valeurs (x,
y) des deux variables semblent aligns sur une droite, de la corrlation non linaire lorsque le
couple de valeurs se trouve sur une mme courbe d'allure quelconque.
Deux variables peuvent tre :
en corrlation positive, on constate une augmentation (ou diminution, ou constance)
simultane des valeurs des deux variables ;
en corrlation ngative, lorsque les valeurs de l'une augmentent, les valeurs de l'autre
diminuent ;
non corrles, lorsquil n'y a aucune relation entre les variations des valeurs de l'une des
variables et les valeurs de l'autre.
1.1.1 Mesure du coefficient de corrlation linaire
La reprsentation graphique ne donne qu'une impression de la corrlation entre deux
variables sans donner une ide prcise de l'intensit de la liaison ; c'est pourquoi nous calculons une
statistique appele coefficient de corrlation linaire simple not
xy
. Il est gal :

xy
=
y x
y x Cov

) , (
=
( )( )
( ) ( )
x x y y
x x y y
t t
t t
t
t n
t
t n
t
t n

_
,
_
,

1
2
1
2
1

=
n x y x y
n x x n y y
t t t t
t t
t
t n
t
t n
t
t n
t
t
t n
t
t n
t
t
t n
t
t n

1 1 1
2 2
1 1
2
1
2
1
( ) ( )
)

avec :
x
t
et y
t
= valeurs des deux historiques linstant t,
Cov(x,y) = covariance entre x et y,
x
et
y
= cart-type de x et cart-type de y,
x et y = moyenne de x et moyenne de y,
n = nombre d'observations.

On peut dmontrer que, par construction, ce coefficient reste compris entre -1 et 1 :
proche de 1, les variables sont corrles positivement,
proche de -1, les variables sont corrles ngativement,
proche de 0, les variables ne sont pas corrles.
Dans la pratique, ce coefficient est rarement trs proche de l'une de ces trois bornes et il est donc
difficile de proposer une interprtation fiable la simple lecture de ce coefficient. La thorie des
tests statistiques nous permet de lever cette indtermination. Nous calculons un ratio (appel le t de
Student empirique) :
t
cal
=
( )
2
1
2
,
,
n
y x
y x

Si t
cal
> t
lu
lu dans une table de Student
19
n 2 degrs de libert (si le nombre dobservations
est suprieur 30, on peut prendre par approximation t
lu
=2), le coefficient de corrlation est
significativement diffrent de 0 ; dans le cas contraire, l'hypothse d'un coefficient de corrlation
nul est accepte.

Que veut dire significativement diffrent de 0 ?
On cherche dterminer le risque de se tromper en affirmant que le coefficient (vrai et inconnu)
est diffrent de 0. Ce risque admissible est en gnral de 5 % (on accepte de se tromper dans 5%
des cas) ; mais plus le seuil de risque fix est faible, plus forte est notre certitude quant lexistence
de la corrlation entre les deux variables.
La liaison est en gnral considre comme significative si on a un risque de se tromper
infrieur 5% en affirmant que le coefficient de corrlation est bien diffrent de 0.

Le Tableau 15 prsente un exemple de calcul dun coefficient de corrlation entre les ventes
trimestrielles dun produit (x
t
) et les dpenses publicitaires (y
t
) trimestrielles.

19

Tableau 15 Exemple de calcul dun coefficient de corrlation

Trimestre x y x y x y

1 16 20 256 400 320
2 18 24 324 576 432
3 23 28 529 784 644
4 24 22 576 484 528
5 26 32 676 1024 832
6 28 32 784 1024 896
7 29 28 841 784 812
8 31 36 961 1296 1116
9 32 41 1024 1681 1312
10 34 41 1156 1681 1394

Somme 261 304 7127 9734 8286

x,y
=
2 2
304 ) 9734 )( 10 ( 261 ) 7127 )( 10 (
) 304 )( 261 ( ) 8286 )( 10 (

= 0,89

t
cal
=
0 89
1 0 89
10 2
2
,
,
= 5,49 > t
lu
= 2,306 (8 degrs de libert et = 0,05).
La corrlation est donc significative.
1.1.2 Limites de la notion de corrlation
a) Corrlation n'est pas causalit
Le fait d'avoir un coefficient de corrlation lev entre deux variables ne signifie pas qu'il existe
un lien de causalit. En d'autres termes, une covariance significativement diffrente de 0 n'implique
pas une liaison d'ordre conomique, physique ou autres. Nous appelons corrlation fortuite ce type
de corrlation que rien ne peut expliquer.
L'exemple le plus fameux concerne la forte corrlation existant entre le nombre de taches
solaires observes et le taux de criminalit aux Etats-Unis. Cela ne signifie pas qu'il existe une
relation entre les deux variables, mais qu'un troisime phnomne, l'volution de long terme (la
tendance) ici, explique conjointement les deux phnomnes.

b) La relation teste est linaire
L'application de la formule de calcul ne permet de dterminer que des corrlations linaires entre
variables. Un coefficient de corrlation nul indique que la covariance entre la variable x et la
variable y est gale 0. C'est ainsi que deux variables en totale dpendance peuvent avoir un
coefficient de corrlation nul, comme l'illustre l'exemple suivant : l'quation d'un cercle nous est
donne par x
2
+ y
2
= R
2
, les variables x et y sont bien lies entre elles par une relation et pourtant
leur covariance est nulle et donc leur coefficient de corrlation est gal 0.
Pour pallier cette limite, il convient ventuellement de transformer les variables, pralablement
au calcul du coefficient de corrlation, afin de linariser leur relation, par exemple, au moyen ici
d'une transformation de type logarithmique.
1.2. Le corrlogramme et la fonction d'autocorrlation
L'autocorrlation est un concept li celui de corrlation : il s'agit non pas d'un calcul entre deux
chroniques diffrentes mais entre la srie et elle-mme diffrents dcalages dans le temps.
On appelle coefficient dautocorrlation dordre 1 le coefficient de corrlation linaire calcul
entre la srie chronologique et cette mme srie dcale dune priode de temps. Les coefficients
dautocorrlation sont calculs pour des ordres allant de 0 K, K tant le dcalage maximum
admissible (en gnral
n
K
n
6 3
ou K
n
5
si n 150 ) pour que le coefficient
dautocorrlation ait un sens (cf. Tableau 16).

Tableau 16 Exemple de calcul dune autocorrlation

Retards Autocorrlation
1 2 3 ... t ... n 0 r
0
= 1
1 2 3 ... t-1 n-1 1 r
1

1 2 3 t-2 n-2 2 r
2

.... ... ...
t-k ...n-k k r
k

... ...
t-K ...n-K

K r
K

La reprsentation graphique de la Fonction dAutoCorrlation (note FAC) est appele le
corrlogramme comme lillustre le Graphique 18.

Graphique 18 Exemple de corrlogramme
r
k

1
r1

2 k r
K

0 k
1 r
k
K
r2

-1

Le coefficient dautocorrlation dordre k est donn par :
r
x x x x
x x x x
k
t t k
t k
n
t
t k
n
t k
t k
n
+
+

( )( )
( ) ( )
1 2
1
1
1
2
2
1
2
=
x x n k x x
x n k x x n k x
t t k
t k
n
t
t k
n
t k
t k
n
+
+
_
,

_
,

( )
( ) ( )
1 2
1
2
1
2
1
2
2
2
1

x
n k
xt
t k
n
1
1
1
x
n k
x
t k
t k
n
2
1
1

Le test de signification sur le coefficient r
k
permet de slectionner les coefficients
dautocorrlation significativement diffrents de 0 ; il seffectue comme pour un coefficient de
corrlation linaire simple. Soit le calcul de la quantit t
c
=
r
r
n
k
k
1
2
2
. Si t
c
> t
n2
2 /
, le
coefficient dautocorrlation est significativement diffrent de 0 (
t
n 2
2 /
valeur de la loi de Student au
seuil n 2 degrs de libert).

Le calcul de rk permet de dceler des liaisons internes la srie. Par exemple, une srie
saisonnire, avant dsaisonnalisation, montre une valeur leve pour r
12
. A travers la connaissance
des valeurs de la fonction d'autocorrlation, le processus de reproduction interne la srie peut tre
dcel. Pour toutes les mthodes endognes, il s'agit donc d'une tape ncessaire, pralable la
modlisation.

Deux proprits doivent tre signales :
r0 = 1 (corrlation parfaite de la srie avec elle-mme dcalage zro),
r
-k
= r
k
(les valeurs du corrlogramme sont identiques pour deux dcalages temporels
symtriques par rapport la priode de rfrence).

Le corrlogramme est la reprsentation graphique de cette fonction d'autocorrlation.
Il est souhaitable de prsenter sur ce graphe l'intervalle de confiance autour de zro (t 2/ n ),
permettant d'liminer visuellement tous les termes non significativement diffrents de zro.
Ainsi, si tous les r
k
se trouvent l'intrieur de cette bande de confiance, la chronique dont le
corrlogramme a t calcul est purement alatoire ; c'est--dire qu'il s'avre impossible de trouver
une loi statistique de reproduction du phnomne. Nous allons dtailler les calculs, partir des
donnes de ventes dune srie trimestrielle (cf. Tableau 17), pour un coefficient, par exemple r
2
,
cest--dire la corrlation entre x
t
et x
t-2
.

Tableau 17 Exemple de calcul pour un coefficient dautocorrlation dordre 2
t xt xt-2 ( )( ) x x x x
t t

1 2 2

( ) x x
t

1
2

( ) x x
t

2 2
2

1 1057 1248 195360,56 431162,99 88518,15
2 3159 1392 -222259,17 2090540,47 23629,84
3 891 1057 402349,24 676391,15 239336,23
4 1065 3159 -1045292,60 419813,28 2602672,82
5 1118 891 390149,56 354775,05 429051,24
6 2934 1065 -586700,47 1490767,59 230899,47
7 1138 1118 246239,35 330659,57 183372,34
8 1456 2934 -357132,95 66167,26 1927598,84
9 1224 1138 199297,67 239052,53 166154,12
10 3090 1456 -123679,42 1896046,27 8067,63
Somme 17132,30 15458,20 -901668,23 7995376,17 5899300,68

x
1
1713,2 et x
2
1545,8
7995376,17 5899300,68
901668,23
) ( ) (
) )( (
2
1
2 2 2
1
1
1
2 2 1
2

+
+
n
k t
t
n
k t
t
n
k t
t t
x x x x
x x x x
r = -0,13
Le t calcul est gal pour n = 10 et r
k
= 0,13 : t
c
=
r
r
n
k
k
1
2
2
= 0,38 <
2 / 05 , 0
2 10
t = 2,306. Le
coefficient nest pas significativement diffrent de 0.
Le Tableau 18 indique lensemble des valeurs de la fonction dautocorrlation que lon compare
la valeur lue dans la table de Student pour un seuil de 5% et n 2 degrs de libert. Seul le
coefficient dautocorrlation dordre 4 est significativement diffrent de 0 ; la priodicit des
donnes tant trimestrielle, ce pic est donc attribu la saisonnalit des donnes.

Tableau 18 Calcul dune fonction dautocorrlation
Retards r
k
n t
c
d d l t
lu
0,05
0 1 12 - - -
1 -0,395 11 1,29 9 2,262
2 -0,132 10 0,38 8 2,306
3 -0,392 9 1,13 7 2,365
4 0,952 8 7,62 6 2,447

Dans une approche endogne, la premire tape consiste toujours dcomposer une chronique
en trois composantes fondamentales : tendance, saisonnalit, rsidu, puis les extrapoler
indpendamment les unes des autres et enfin les agrger en vue d'obtenir une prvision en termes
directement exploitables.
L'extrapolation de la tendance et de la saisonna lit ne pose pas de problme particulier ; en ce
qui concerne l'extrapolation du facteur rsiduel, de nombreuses mthodes existent, toutes fondes
sur l'tude pralable du corrlogramme.
Si au lieu de traiter le facteur rsiduel, on s'intresse la srie dsaisonnalise (tendance et
rsidus), l'allure du corrlogramme est alors typique d'une chronique non stationnaire (la moyenne
de la srie est instable au cours du temps, car la tendance est incluse dans la srie, cf. Graphique
19.) et nous ne pourrons obtenir aucune information exploitable. C'est pourquoi il est impratif
d'effectuer les calculs de la fonction dautocorrlation sur la srie hors tendance et saisonnalit.
Graphique 19 Corrlogramme d'une srie non stationnaire ( trende )

Comme nous l'avons voqu plus haut, il est possible qu'aucun terme du corrlogramme ne soit
significativement diffrent de zro. Ceci laisse prsager un processus purement alatoire et donc,
par dfinition, imprvisible. La prvision ne peut alors tre calcule qu' l'aide d'une extrapolation
de la tendance ou d'un lissage exponentiel. Dans le cas contraire, Box et Jenkins proposent une
mthodologie permettant de dterminer le processus de reproduction sous-jacent la srie de vente.
1.3. Introduction la mthodologie de Box et J enkins
Dans le cas o les premiers termes du corrlogramme diffrent de zro, il convient de modliser
le terme rsiduel, c'est--dire de trouver la loi de reproduction du phnomne.
Plusieurs modles endognes existent, plus ou moins complexes
20
. Seule la mthode de Box-
Jenkins, qui a fait l'objet d'importantes applications dans le domaine de la prvision, est prsente
ici.
Box et Jenkins
21
ont dvelopp une vritable mthodologie de recherche systmatique d'un
modle adquat en fonction de l'tude des corrlogrammes empiriques, ils se rfrent deux types
de modle : des processus moyennes mobiles, des modles autorgressifs, ou une combinaison
des deux.
1.3.1 Typologie des modles
Les modles ARMA permettent de reprsenter la plupart des processus alatoires stationnaires
(Wold, 1954) ; ainsi ils sont censs recouvrir une gamme trs large d'volutions possibles de sries
chronologiques. Nous pouvons distinguer deux types de processus : les processus autorgressifs
(AR) et les processus de moyenne mobile (MA). Chacun de ces modles est caractris par sa
fonction dautocorrlation simple (FAC) et sa fonction dautocorrlation partielle (FAP).

20
Dans le cadre de cet ouvrage, nous nous limitons des dveloppements succincts, le lecteur intress par la
mthode de Box et Jenkins peut se rfrer Bourbonnais et Terraza (1998).
21
Box et Jenkins (1976).
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
La Fonction Autocorrlation Partielle (note FAP) est une notion plus complexe que la FAC. Il
sagit de la corrlation entre x
t
et x
t-k
, linfluence des variables x
t-k-i
pour (i < k) ayant t retire.

Les modles AR
La partie autorgressive dun processus, note AR, est constitue par une combinaison li naire
finie des valeurs passes du processus. Le processus AR(p) est donc dfini partir de la formule
gnrale : x x x a
t t p t p t
+ + +

1 1
... avec a
t
un processus de bruit blanc gaussien ; par exemple :
AR(1) : x x a
t t t
+
1 1
; AR(2) : x x x a
t t t t
+ +

1 1 2 2
; etc.
Un processus AR(p) a les caractristiques suivantes :
la FAC est une exponentielle et/ou une sinuso de amortie,
seuls les p premiers termes de la FAP sont significativement diffrents de 0.

Les modles MA
La partie moyenne mobile, note MA, est constitue dune combinaison linaire finie en t des
valeurs passes dun bruit blanc. Un processus MA(q) est dfini partir de la formule :
x a a a
t t t q t q

1 1
.... . avec a
t
processus de bruit blanc gaussien ; par exemple :
MA(1) : x a a
t t t

1 1
; MA(2) : x a a a
t t t t

1 1 2 2

Un processus MA(q) a les caractristiques suivantes :
seuls les q premiers termes de la FAC sont significativement diffrents de 0,
la FAP est une exponentielle et/ou une sinuso de amortie.
Nous pouvons constater la symtrie parfaite des comportements de la FAC dun AR(p) et de la
FAP dun MA(q) dune part, et de la FAP dun AR(p) et de la FAC dun MA(q) dautre part. En
effet, nous pouvons dmontrer lquivalence suivante : AR(1) = MA() et MA(1) = AR().

Les modles ARMA
Les processus ARMA sont des mlanges de processus AR et MA ; ils sont donc dfinis par le
modle suivant :
ARMA(p, q) : x x x a
t t p t p t
+ + +

1 1
.. .

1 1
a a
t q t q
.. .. . Par exemple :
ARMA(1, 1) : x x a
t t t
+
1 1

1 1
a
t

ARMA(2, 1) : x x x a
t t t t
+ +

1 1 2 2

1 1
a
t
; etc.
On remarque que : ARMA(0, q) MA(q) et ARMA(p, 0) AR(p)
Le Tableau 19 synthtise les caractristiques, en termes de corrlogrammes, des processus AR,
MA et ARMA.
Tableau 19 Rsum des proprits des fonctions dautocorrlation simple et partielle
Processus

FAC FAP
AR(1) Dcroissance exponentielle(1 > 0) ou
sinuso dale amortie (
1
< 0)
Pic significatif pour le premier retard: Positif si 1
> 0 et ngatif si
1
< 0, les autres coefficients nuls
pour des retards > 1
AR(2) Dcroissance exponentielle ou sinuso dale selon
les signes de 1 et 2
Pics significatifs pour le premier et second retards,
les autres coefficients sont nuls pour des retards > 2
AR(p) Dcroissance exponentielle et/ou sinuso dale Pics significatifs pour les p premiers retards, les
autres coefficients sont nuls pour des retards > p
MA(1) Pic significatif pour le premie r retard : positif si
1 < 0 et ngatif si 1 > 0. Les autres coefficients
sont nuls pour des retards > 1
Dcroissance exponentielle(
1
> 0) ou sinuso dale
amortie (1 < 0)
MA(2) Pics significatifs pour le premier et second
retards. Les autres coefficients sont nuls pour
des retards > 2
Dcroissance exponentielle ou sinuso dale selon les
signes de
1
et
2

MA(q) Pics significatifs pour les q premiers retards. Les
autres coefficients nuls pour des retards > q
Dcroissance exponentielle et/ou sinuso dale
ARMA(1, 1) Dcroissance gomtrique partir du premier
retard, le signe est dtermin par 1 1
Dcroissance exponentielle(
1
> 0) ou sinuso dale
amortie (1 < 0)
ARMA(p, q) Dcroissance exponentielle ou sinuso dale
amortie tronque aprs (q p) retards
Dcroissance exponentielle ou sinuso dale amortie
tronque aprs p q retards

Conditions d'utilisation
Les modles AR, MA, ARMA ne sont reprsentatifs que de chroniques :
stationnaires en moyenne (c'est--dire hors tendance),
corriges des variations saisonnires.
1.3.2 Le problme de la stationnarit
Nous ne pouvons interprter valablement les corrlogrammes que sur des sries stationnaires
(sans tendance). Les tests de Dickey-Fuller (1979) et Dickey-Fuller Augment (1981) permettent
de dterminer si la srie est stationnaire et, dans le cas dune non stationnarit, de quel type il
sagit : TS ( Trend Stationnary ) qui reprsente une non stationnarit de type dterministe ou DS
( Differency Stationnary ) pour les processus non stationnaires stochastiques. Si la srie tudie
est de type TS, il convient de la stationnariser par rgression sur le temps ; le rsidu destimation
est alors tudi selon la mthodologie de Box-Jenkins. Ceci permet de dterminer les ordres p et q
des parties AR et MA du rsidu. Le modle est toujours dans ce cas un ARMA(p, q).
Si la srie tudie est de type DS, il convient de la stationnariser par passage aux diffrences
selon lordre dintgration I = d (d est le nombre de fois quil faut diffrencier la srie pour la
rendre stationnaire). La srie diffrencie est alors tudie selon la mthodologie de Box-Jenkins
qui permet de dterminer les ordres p et q des parties AR et MA. On note ce type de modle
ARIMA(p, d, q).
1.3.3 Recherche de la reprsentation adquate
L'objectif est de rechercher parmi tous les modles (AR, MA, ARMA) celui qui semble le
mieux adapt, puis de spcifier le (ou les) degr(s) du processus retenu. Plusieurs tapes sont
ncessaires.

Lidentification
La phase d'identification est la plus importante et la plus difficile : elle consiste dterminer le
modle adquat, cest--dire les valeurs des paramtres p, d, q du modle ARIMA. Elle est fonde
sur l'tude des corrlogrammes simple et partiel.
Dans la mthodologie de Box et Jenkins, le problme de l'identification du modle est donc
crucial.

Estimation et validation
Lestimation des paramtres du modle est fonde sur la maximisation dune fonction de
vraisemblance. La validation de la reprsentation porte sur :
Les coefficients du modle qui doivent tre significativement diffrents de 0 (le test de Student
s'applique de manire classique). Si un coefficient n'est pas significativement diffrent de 0, il
convient d'envisager une nouvelle spcification liminant l'ordre du modle AR ou MA non valide.
L'analyse des rsidus (cart entre la srie observe et la srie prvue) permet de vrifier quils
sont :
de moyenne nulle ; dans le cas contraire, il convient d'ajouter une constante au modle ;
reprsentatif dun bruit blanc. Si le rsidu n'est pas un bruit blanc, cela signifie que la
spcification du modle est incomplte et qu'il manque au moins un ordre un processus.
La phase de validation du modle est trs importante et ncessite le plus souvent un retour la
phase d'identification.

Prvision
Lorsque le modle est valid, la prvision peut alors tre calcule un horizon h de quelques
priodes, limit par la variance de l'erreur de prvision qui augmente rapidement avec l'horizon.
A ltape de la transformation, plusieurs techniques ont pu tre employes afin de stationnariser
le processus gnrateur pour quil soit identifiable dans la classe des processus ARMA. Il est
ncessaire, lors de ltape de prvision, de prendre en compte la ou les transformations retenues
( recoloration de la prvision ).
Si on a utilis la rgression afin de retirer une ou plusieurs composantes dterministes estimes
par les Moindres Carrs Ordinaires, ces dernires sont extrapoles jusqu lhorizon prvisionnel
choisi puis combines aux valeurs prvisionnelles de lARMA.
Si la srie a t pralablement dsaisonnalise, il convient de re-saisonnaliser la srie des
ventes afin dobtenir une prvision en termes bruts.
Ces modles de type ARIMA connaissent un grand succs et de nombreux raffinements dans
leur spcification (ARCIMA, ARFIMA ...) sont appliqus au domaine particulier de la finance. Il
est noter quon dmontre que le lissage exponentiel est un cas particulier de modle ARIMA.

Le Schma 2 illustre la dmarche de la mthodologie de Box et Jenkins.

Schma 2 Mthodologie de Box et Jenkins

L'examen visuel du corrlogramme est la seule information initiale dont le prvisionniste
dispose pour faire son choix.
Si le corrlogramme est caractristique d'un modle, la dcision est immdiate ; en ralit, le
plus souvent, on est confront plusieurs possibilits qu'il faut tester les unes aprs les autres. Des
procdures existent en vue de dfinir des critres rigoureux concernant la slection des modles.
Le modle tant spcifi tant sous sa forme que par son degr, lunivers des modles possibles
est donc important et la tentation d'effectuer un trs grand nombre de tests existe.
Trs vite l'utilisateur risque d'tre noy sous les rsultats ( chaque spcification correspond une
mission de prvision). Ainsi, d'un systme conu initialement pour tre trs automatique, on
aboutit rapidement une perte en temps humain (l'utilisateur) et machine, ceci pour une
amlioration parfois faible de la qualit prvisionnelle.
La mthodologie de Box et Jenkins savre donc plus complexe dans sa mise en uvre et dans
sa gestion au quotidien que les techniques de lissage exponentiel pour un gain en qualit incertain.
Ceci explique que cette mthode danalyse est rarement employe en entreprise (et dans les
progiciels de prvision) ; elle reste rserve aux travaux de recherche universitaires sur donnes
Rgression sur le temps
si TS
Passage aux diffrences
si DS
Tests sur les rsidus
Sont-ils des bruits blancs ?
Recoloration de la srie
(exponentiel, saisonnalit ...)
Prvision par ARMA
Oui Non
ajout d'un ordre p ou q
Test de Student
Les coefficients non significatifs sont supprims
Estimation des paramtres
Dtermination des ordres
p et q du processus ARMA
Analyse des corrlogrammes
simple et partiel
Srie stationnaire yt
Test de Dickey-Fuller
Analyse de saisonnalit
Srie xt
Analyse du graphique
et du corrlogramme
micro-conomiques telles que des produits financiers (actions, produits drivs, taux dintrt )
haute frquence (jour ou parfois heure).

L'approche endogne, lissage exponentiel ou mthodologie de Box et Jenkins, autorise le
traitement en chane d'un grand nombre de sries chronologiques ; en effet, l'intervention humaine
est rduite au minimum, voire nulle, dans le cas d'une utilisation automatique.
Cette mthode de prvision ne peut s'appliquer qu' des chroniques relativement stables, peu
sujettes aux -coups de la conjoncture ou aux influences de la politique marketing de la firme.
Certains produits du secteur de la grande consommation correspondent ce profil ; en revanche, les
produits de type industriel, trs lis l'environnement conomique, et les produits de grande
consommation, o la concurrence joue un rle important, ne peuvent tre traits par cette
technique.
Dans le cadre d'un systme de gestion de stock, ce systme d'analyse de sries permet de traiter
rapidement un grand nombre de rfrences et ainsi d'laborer des prvisions peu coteuses un
niveau trs fin.
Ainsi une bote noire (le programme informatique) traite l'historique de la srie des ventes et
produit une prvision l'horizon choisi par l'utilisateur ; celui-ci pouvant tre ignorant du
fonctionnement du systme.
Cet avantage a une contrepartie vidente : par la philosophie mme de cette approche, le
retournement de conjoncture s'avre difficile prvoir. En outre, limpact de la conjoncture ou des
dpenses publicitaires ne peuvent tre intgrs efficacement. Le systme ne peut en tenir compte
qu'a posteriori par la rectification de certains paramtres, mais en aucun cas il ne peut anticiper.
Pour le prvisionniste ceci constitue un handicap important.

Les mthodes exognes apportent des lments de rponse au problme de l'anticipation des
retournements de conjoncture et de l'intgration des variables dont on sait pertinemment qu'elles
influent sur la srie prvoir.
2. L'approche exogne
La recherche d'une explication des fluctuations d'une chronique l'aide d'autres sries sert de
cadre gnral aux mthodes exognes. Dans cette partie, sont dcrits les aspects mthodologiques
fondamentaux
22
; la deuxime partie (approche sectorielle) de cet ouvrage indique les utilisations
possibles de ces techniques, partir d'exemples pratiques.
Nombre de variables conomiques sont lies entre elles. L'exemple le plus classique est celui de
la relation existant entre consommation et revenu. Nous ne retiendrons pas d'exemples de liaison
macro-conomique : ce n'est pas l'objet de cet ouvrage. Mais, l'intrieur d'un secteur d'activit,
d'un march ou d'une firme, des relations peuvent galement tre mises en vidence. Les exemples
ne manquent pas, comme nous le verrons dans les chapitres consacrs aux applications
sectorielles : ventes expliques par des logements demands, des taux dintrt, des dpenses
publicitaires, des variables climatiques, des promotions Il sagit de lensemble des donnes
suivies par les conomistes d'entreprise, les prvisionnistes et les chefs de produit.
Le but de ce qui suit est de prsenter les mthodes de rgression simple et multiple qui
permettent :
dobtenir la quantification, aussi prcise que possible, de la liaison entre la srie que l'on
cherche prvoir et la srie ou les sries explicatives,
de dterminer la prcision de cette quantification afin de savoir quelle confiance accorder aux
facteurs explicatifs.

22
Le lecteur intress par les dveloppements de lconomtrie peut se rfrer Bourbonnais (2000).
2.1. La notion d'ajustement et le modle de rgression simple
Nous avons vu que le coefficient de corrlation donne le degr de liaison entre deux chroniques.
Une fois ce lien mis en vidence, nous pouvons quantifier la relation entre les deux variables
conomiques (les ventes et le facteur explicatif des ventes).
La formulation d'un modle simple est alors possible sous la forme : V
t
= a
1
x
t
+ a
0
+
t

a
1
et a
0
sont les coefficients inconnus,
V
t
est la srie des ventes ou variable expliquer,
x
t
est la variable explicative ou variable exogne,
t
est un terme alatoire qui reprsente tout ce qui nest pas expliqu par le modle (la variable
explicative).
t
est gaussien c'est--dire que les hypothses habituelles sont respectes : esprance
mathmatique de l'erreur nulle (E(
t
) = 0), variance de l'erreur constante (V(
t
) =
2
) et
indpendance des erreurs (E(t, t') = 0, pour t t').
Nous disposons de n observations.

Le principe de l'ajustement par les moindres carrs (mthode de rgression) consiste choisir
comme estimateur pour a
0
et a
1
celui qui minimise la somme des carrs des carts entre les valeurs
ajustes (
t
y ) l'aide de la variable explicative x
t
, et les observations relles y
t
:
,
_

,
_

n
t
t t
n
t
y y Min Min
1
2
1
2
) (
Le minimum est donn par :
n t
t
t
n t
t
t t
x x
x x y y
a
1
2
1
1
) (
) )( (

x a y a
1 0

Le Graphique 20 illustre la notion d'ajustement partir des donnes du Tableau 15.

Graphique 20 La notion d'ajustement

L'estimation de a1 et a0 est entache d'une erreur (mesure par un cart-type). Il faut dterminer
si cette erreur d'estimation n'est pas trop importante et ne remet pas en cause le bien-fond de la
relation. Un test, dont le fonctionnement sera dtaill la partie 2.3, permet de connatre la
significativit d'un coefficient par rapport zro (un coefficient nul implique l'absence d'influence
d'une variable explicative).
Ce modle une seule variable explicative se rvle le plus souvent trop simpliste pour rendre
compte d'une ralit complexe. Il est alors souhaitable d'intgrer ce modle d'autres variables
explicatives.
2.2. La modlisation plusieurs variables : l'conomtrie
La science conomique fait souvent appel des modles contenant plusieurs variables exognes.
Les mthodes conomtriques servent alors estimer l'ensemble des paramtres liant la variable
expliquer aux variables explicatives. Par exemple :
y
t
= a
1
x
1t
+ a
2
x
2t
+ a
3
x
3t
+ a
0
+
t

est un modle trois variables explicatives x
1t
, x
2t
, x
3t
et quatre coefficients : a
1
, a
2
, a
3
,

a
0
.
L'erreur t reprsente l'cart entre le modle thorique reprsentatif du phnomne et les valeurs
observes, sur l'ensemble de la population ;
t
est donc inconnue. L'estimation de l'erreur
t
(e
t
) est
appele le rsidu (diffrence entre les valeurs des ventes estimes (
t
y ) l'aide des variables
explicatives et les observations y
t
).
Le modle estim s'crit de la manire suivante :
y
t
=
1
x
1t
+
2
x
2t
+
3
x
3t
+
0
+ et
les valeurs estimes sont donc
1
,
2
,
3
,
0
, avec e
t
= rsidu, c'est--dire la diffrence entre la
valeur observe et la valeur ajuste : e
t
= y
t

t
y .
avec
t
y =
1
x
1t
+
2
x
2t
+
3
x
3t
+
0

15
20
25
30
35
40
45
15 17 19 21 23 25 27 29 31 33 35
X
Y

La mthodologie d'estimation des paramtres est identique celle d'une rgression une seule
variable exogne (minimisation de la somme des carrs des carts) ; mais la formulation devient
plus complexe : nous ne pouvons plus nous situer dans un espace deux dimensions, mais k + 1
dimensions (k = nombres de variables explicatives). Les tableurs permettent laide de fonctions de
calculer ces statistiques. Nous en verrons lusage en 2.4.
Les modles peuvent tre synchrones : les variables sont toutes lies la mme priode.
Cependant, dans la pratique, lorsque nous raisonnons partir de donnes priodicit mensuelle
voire hebdomadaire, linfluence des variables peut tre dcale dans le temps. Linfluence de la
publicit ou dune promotion peut sexercer 2 ou 3 mois selon le dlai de raction. Afin daffiner
les relations entre les variables, l'analyse des dcalages temporels permet de se rapprocher de la
ralit. Nous spcifions un modle du type :

y
t
= a
1
x
1;t- 1
+ a
2
x
2;t-2
+ a
3
x
3;t-3
+ a
0

o les
i
reprsentent les dcalages temporels entre chacune des variables x
i,t
et la srie y
t
.
L'utilisation de modles dcalage permet, d'une part, une description beaucoup plus fine des
mcanismes de causalit en quantifiant prcisment et de manire impartiale les effets des
facteurs explicatifs et, d'autre part, l'anticipation du retournement de conjoncture grce l'emploi
d'indicateurs en avance. Pour le prvisionniste, ceci est d'un intrt remarquable.
2.3. I nterprtation statistique d'un modle
Lorsque le prvisionniste a estim un modle conomtrique aprs l'avoir formul, il est
important qu'il puisse juger de sa validit statistique. Pour cela, il dispose de diffrents tests,
reprsents par des statistiques calcules lors de l'estimation du modle.
Dans un but didactique, nous partons de la prsentation standard d'une quation de rgression en
indiquant pour chaque paramtre la manire d'interprter sa valeur.

Soit l'quation de rgression :

y
t
=
1
x
1t
+
2
x
2t
+
3
x
3t
+
0
+ et
(
1
a
t ) (
2
a
t ) (
3
a
t ) (
0
a
t )

DW
R
n

Ce modle est limit trois variables exognes ; le dveloppement ci-dessous reste identique
dans le cas d'un nombre diffrent.
1
,
2
,
3
,
0
, valeurs estimes des coefficients du modle,
1
a
t ,
2
a
t ,
3
a
t ,
0
a
t ratios de Student,
DW statistique de Durbin et Watson,
R coefficient de dtermination (R = coefficient de corrlation multiple),
n nombre d'observations.

Les coefficients du modle (
1
,
2
,
3
,
0
)
Il sagit des poids relatifs accords chacun des facteurs explicatifs. Ce sont des estimations des
coefficients rels et inconnus puisque nous ne disposons que d'un chantillon de chaque chronique
et non de la population dans son ensemble. Ces coefficients sont donc des variables alatoires
assorties d'un cart-type. Ils reprsentent limpact des variables explicatives sur le phnomne que
l'on cherche expliquer (les ventes).
Dans le cas d'un modle spcifi de faon lgrement diffrente (introduction d'une variable
explicative supplmentaire, ouremplacement d'une variable par une autre), la nouvelle estimation
des coefficients de rgression (
1
,
2
,
3
,
0
) est diffrente de la prcdente, y compris pour les
variables explicatives qui ont t conserves. En effet, le calcul des coefficients de rgression tient
compte des intercorrlations entre les variables explicatives ; ceci introduit donc des variations dans
l'estimation de ces valeurs.

Les ratios de Student (
1
a
t ,
2
a
t ,
3
a
t ,
0
a
t )
Le coefficient de chaque variable explicative (nous verrons plus loin un exemple destimation)
est en fait une variable alatoire et, ce titre, entach dune certaine erreur lors de son estimation.
Cette erreur est mesure par lcart-type du coefficient. Plus l'estimation du coefficient est
disperse (ce qui se traduit par une valeur leve de l'cart-type par rapport la valeur du
coefficient), plus l'influence de la variable explicative concerne sera douteuse. Le ratio de Student
est calcul en faisant le rapport d'un coefficient de rgression (
i
) et de son cart-type (
i
a
). Ce
ratio suit une loi de Student ; ceci va permettre de tester si le coefficient de rgression est
significativement diffrent de zro (cest--dire si la variable est bien explicative des ventes) ou s'il
doit tre considr comme nul. Dans ce dernier cas, la variable explicative correspondante devra
tre limine de l'quation de rgression car son influence sera considre comme nulle.
Le test est men de la manire suivante :
Si
i
a
t
>
2 /
lu
t lu dans une table de Student n k 1 degrs de libert (si le nombre
dobservations est suprieur 30, on peut prendre par approximation t
lu
=2) et pour un seuil de
confiance , le plus souvent gal 5 % (si = 0,05 on accepte de se tromper dans 5 % des cas) le
coefficient a
i
de la variable x
i
est significativement diffrent de zro ; la variable x
i
est bien
explicative des ventes.
Dans le cas contraire, l'hypothse d'un coefficient nul est accepte, la variable xi nest pas
explicative des ventes.
Cas particulier : en ce qui concerne le terme constant a
0
, le fait quil ne soit pas
significativement diffrent de 0 na aucune importance. Dans la pratique, nous ne testerons donc
pas sa significativit par rapport 0.

Test de Durbin et Watson (DW)
L'exprience montre que les modles de rgression ajusts des sries chronologiques
conomiques manifestent parfois un certain degr de dpendance stochastique entre les valeurs
successives du terme reprsentant les erreurs. En termes probabilistes, cela signifie que les erreurs
sont autocorrles, ou encore quune erreur commise en t a une influence sur lerreur en t + 1.
Durbin et Watson, en 1951, ont construit un test dont la fonction discriminante est la statistique
DW.
( )
n
t
t
n
t
t t
e
e e
DW
1
2
2
2
1

La table de Durbin et Watson
23
, laquelle il faut se rfrer pour effectuer le test, nous indique la
valeur des deux bornes d'un intervalle d
1
, d
2
.

23

Soit DW la valeur calcule de la statistique de Durbin et Watson , la rgle de dcision est :

si DW < d
1,
on rejette l'hypothse d'indpendance et on admet une autocorrlation des erreurs,
si d
1
< DW < d
2,
on est dans la zone d'indtermination des tables : il y a doute,
si d2 < DW < 4 d2, on accepte l'hypothse de l'indpendance des erreurs,
si 4 d
2
< DW < 4 d
1
, on est dans la zone d'indtermination des tables : il y a doute,
si 4 d
1
< DW, on rejette l'hypothse d'indpendance et on admet une corrlation ngative des
erreurs.
Dans la pratique le doute est interprt comme prsomption favorable d'absence
d'autocorrlation.
Le Schma 3 rsume ces rgles de dcision.

Schma 3 Interprtation de la statistique DW

0 d
1
d
2
2

4 d
2
4 d
2
4

Plusieurs causes peuvent entraner cette autocorrlation :
une mauvaise spcification du modle, la relation au lieu d'tre linaire peut, par exemple,
correspondre un schma logarithmique, ou en diffrences premires,
l'absence d'une variable explicative importante,
le lissage des donnes. C'est un phnomne apparent l'effet Slutzky
24
(cration dun cycle
artificiel dans les sries). L'application du filtre moyenne mobile a pour consquence automatique
de dgrader la statistique de Durbin-Watson sans pour cela entraner une remise en cause du
modle.
Dans la majorit des cas, le test de Durbin et Watson ne donne qu'une prsomption
d'autocorrlation des rsidus pour un ordre un (corrlation entre
t
et
t-1
) sans rechercher des
liaisons des ordres suprieurs (2, 3 ou 4). L'usage de ce test reste donc d'un intrt limit.
L'examen visuel du graphique de la srie des rsidus ou le calcul de son corrlogramme sont
souvent plus rvlateurs.

Coefficient de dtermination (R)
Le coefficient de dtermination mesure la qualit de l'ajustement du modle, il est gal au
rapport de la variance explique par les sries explicatives sur la variance totale. Le R ne prjuge
pas de la qualit relle du modle donc de la prvision qui en dcoule ; en effet, il est li au nombre
de facteurs explicatifs du modle. A titre d'exemple caricatural, un modle estim partir de 5
observations et 5 facteurs explicatifs a un R gal 1 (5 quations 5 inconnues), or ce modle n'a
aucune validit statistique et fournirait des prvisions errones. Ainsi, il est trs possible d'aboutir
un modle excellent avec un R de l'ordre de 0,5. Le coefficient de dtermination ne reprsente que
la qualit de l'ajustement par rapport la dispersion du nuage de points.

Exemple d'interprtation d'une rgression

24
Slutzky (1937).
Autocorrlation
positive
Autocorrlation
ngative
Doute
Absence
dautocorrlation
Doute
Soit le modle estim suivant :

y
t
= 3,4 x
1
,
t
+ 5,8 x
2
,
t
+ 7,4 x
3
,
t
+ 3 + e
t

(2,1) (0,8) (4,4) (7,1)

n = 54
R = 0,84
DW = 1,79
(.) = ratio de Student

La variable explicative x
2
,
t
n'est pas significative, son ratio de Student (0,8) tant trs infrieur
2, en revanche, les variables x
1
,
t
et x
3
,
t
sont significatives. La variable x
2
,
t
doit donc tre limine de
l'quation de rgression, puis le modle restim.

La nouvelle estimation de ce modle aprs avoir retir la variable x
2
,
t
est la suivante :

y
t
= 2,6 x
1
,
t
+ 6,5 x
3
,
t
+ 4,12 + e
t

(2,8) (7,5) (1,4)
n = 54
R = 0,81
DW = 1,88
(.) = ratio de Student

A la lecture des rsultats, nous observons que :

le R a lgrement diminu puisquun facteur explicatif a t retir ;
les valeurs des coefficients sont modifies par rapport la premire estimation ;
les ratios de Student des variables explicatives ont tous augment en particulier pour x
3
,
t
, ce
qui signifie que la corrlation entre x
2
,
t
et x
3
,
t
est importante (elles expliquent le mme phnomne,
c'est l'effet de masque). Le fait d'avoir retir la variable x
2
,
t
amliore considrablement l'estimation
du coefficient de x
3
,
t
;
le ratio de Student du terme constant est infrieur 2, le coefficient a0 nest donc pas
significativement diffrent de 0, cela na pas dimportance ;
le DW de Durbin et Watson ne laisse pas prsager d'une autocorrlation des rsidus (k = 2, la
lecture de la table de Durbin et Watson indique : d
1
= 1,49 ; d
2
= 1,64), ce qui est favorable quant
la spcification du modle ;
le coefficient de dtermination R traduit un ajustement correct en regard du nombre
d'observations.
En conclusion, ce modle s'avre maintenant satisfaisant.
2.4. Exemples destimation conomtrique laide des outils sur tableur Excel
Soit un modle conomtrique compos dune variable expliquer (les ventes) et de trois
variables explicatives (cf. Tableau 20) connues sur trois ans :
VENTES = ventes CVS de lentreprise en volume,
PROMO = les dpenses en promotion en KF,
PUB = les dpenses publicitaires en KF,
TREND = l'volution naturelle
25
des ventes reprsente par une tendance linaire.

25
La croissance de la demande primaire.
Tableau 20 Ventes, promotion, publicit
DATES VENTES PROMO PUB. TREND PREVISION
Anne 1-J 7281 597 3109 1 5571,27
F 9163 2139 267 2 7315,90
M 7769 859 3549 3 6350,85
A 8485 717 5083 4 6721,90
M 7606 2033 4051 5 8694,64
J 7364 1863 826 6 7413,00
J 6711 1393 4590 7 7981,23
A 3407 603 117 8 5229,43
S 4862 1702 3388 9 8286,45
O 11464 3891 2668 10 11841,74
N 10291 3968 2615 11 12048,06
D 9789 2867 1130 12 9777,90
Anne 2-J 8082 250 5948 13 7068,48
F 8663 342 1715 14 5890,18
M 7720 823 366 15 6342,99
A 7859 584 6005 16 7934,60
M 6936 813 115 17 6429,19
J 6292 0 0 18 5108,52
J 7572 0 2336 19 5990,40
A 3588 1077 0 20 7118,83
S 7152 874 674 21 7096,56
O 10672 2978 5 22 10525,21
N 8522 1066 7338 23 9857,17
D 8688 30 4036 24 7084,09
Anne 3-J 5772 803 5281 25 8906,04
F 7682 1984 1887 26 9853,57
M 8814 1044 115 27 7759,05
A 10864 3123 0 28 11332,27
M 5461 572 4348 29 8576,00
J 13109 4483 69 30 13844,76
J 16649 5328 5012 31 17035,95
A 12467 3890 71 32 13029,74
S 18277 6348 2128 33 17976,97
O 20836 7210 3879 34 20120,21
N 18253 3790 3782 35 14394,00
D 17483 3678 6152 36 15097,82
Anne 4-J 597 3109 37 8951,53
F 2139 267 38 10696,16
M 859 3549 39 9731,11
A 717 5083 40 10102,16
M 2033 4051 41 12074,90
J 1863 826 42 10793,25
J 1393 4590 43 11361,49
A 603 117 44 8609,69
S 1702 3388 45 11666,71
O 3891 2668 46 15222,00
N 3968 2615 47 15428,32
D 2867 1130 48 13158,16

Utilisation de la fonction DROITREG
26

26
Cf. Fichier Web pour utilisation de cette fonction.
Tableau 21 Rsultat de la fonction
93,8960 0,3373 1,6922 3418
34,5297 0,14276 0,1960 731,4
0,8181 1870,1717 #N/A #N/A
47,9904 32 #N/A #N/A
503546068,6 111921350,4 #N/A #N/A

Ratio de Student : 2,72 = 93,89/34,53 2,36 8,63 4,67

Tableau 22 Tableau dquivalence
3

2

1

0

$
$
a
3
$
$
a
2
$
$
a
1
$
$
a
0

R $

#N/A #N/A
F* ddl #N/A #N/A
SCT SCR #N/A #N/A

Sur la premire ligne des Tableau 21 et Tableau 22, les valeurs des coefficients sont estimes
(attention ! les coefficients apparaissent dans lordre inverse de la slection) ; sous chaque
coefficient figure son cart-type. Le coefficient de dtermination R = 0,81 est donn
lintersection de la premire colonne et de la troisime ligne. Le nombre de degrs de libert (ddl =
nombre dobservations nombre de paramtres estims, 36 4 = 32) figure lintersection de la
colonne 2 et de la ligne 4.
Les t de Student ne sont pas fournis par la fonction mais sont calculs (rapport du coefficient sur
son cart-type) sur la dernire ligne.
(Les signes #N/A signifient que le tableur Excel na aucune valeur indiquer cet endroit).

Signification de quelques statistiques supplmentaires pour les initis :
Ecart-type rsiduel :
1
1
2

k n
e
n
t
t
= 1870,17
Fisher empirique :
) 1 /( ) 1 (
/
2
2
*

k n R
k R
F
Somme des carrs totaux :

n
t
t
y y SCT
1
2
) (
Somme des carrs des rsidus :

n
t
t
e SCR
1
2

Utilisation de lutilitaire danalyse
Lutilitaire danalyse sobtient partir du menu outil aprs avoir t pralablement charg
laide des macros complmentaires.

Tableau 23 Rsultat de la fonction
RAPPORT DTAILL

Statistiques de la rgression
Coefficient de dtermination multiple 0,90
Coefficient de dtermination R^2 0,82
Coefficient de dtermination R^2 0,80
Erreur-type 1870,17
Observations 36,00

Coefficients Erreur-type Statistique t
Constante 3418,39 731,39 4,67
PROMO 1,69 0,20 8,63
PUB. 0,34 0,14 2,36
TREND 93,90 34,53 2,72

Nous retrouvons les mmes rsultats sous une forme diffrente.

N. B. : En cas de modifications de donnes sur le tableau initial, lutilisation de la fonction
DROITEREG met jour les rsultats de calcul ; en revanche, ce nest pas le cas par lutilisation
de lutilitaire danalyse.

Interprtations statistique et conomique, puis prvision
Les ratios de Student sont tous suprieurs 2, les coefficients des variables explicatives sont
significativement diffrents de 0. Les trois facteurs explicatifs contribuent bien lexplication des
ventes. Ce modle est donc valide sur le plan statistique.

Le modle est une combinaison des trois variables : PROMO, PUB et TREND. La plus
contributive lexplication des ventes est la Promotion (t de Student = 8,63 le plus lev), il sagit
aussi de la plus rentable, chaque KF investi en Promotion rapporte 1,69 unit de ventes, alors que
chaque KF investi en Publicit rapporte 0,34 unit de ventes.

Connaissant les dpenses promotionnelles et publicitaires, la prvision est calcule par
application du modle :
VENTE = 3418,39 +1,69 PROMO + 0,34 PUB + 93,90 TREND
Soit pour janvier de lanne 4 :
PREVISION
4-J
= 3418,39 +1,69 PROMO
4-J
+ 0,34 PUB
4-J
+ 93,90 TREND
4-J

PREVISION4-J = 3418,39 +1,69 597 + 0,34 3109 + 93,90 37 = 8951,53
Etc.
2.5. La slection de variables explicatives
Dans la pratique, le prvisionniste dentreprise est souvent confront au choix de plusieurs
variables explicatives candidates pour expliquer les ventes. Or, le plus souvent ces variables
apportent la mme information et ne peuvent donc pas figurer dans un mme modle. Nous allons
examiner quatre mthodes qui vont nous permettre de retenir les variables suivantes :
les plus corrles avec la variable expliquer,
les moins corrles entre elles.
Nous allons illustrer chacune des mthodes partir des donnes du Tableau 24.

Tableau 24 Quelles variables retenir ?
yt x1,t x2,t x3,t
12 2 45 121
14 1 43 132
10 3 43 154
16 6 47 145
14 7 42 129
19 8 41 156
21 8 32 132
19 5 33 147
21 5 41 128
16 8 38 163
19 4 32 161
21 9 31 172
25 12 35 174
21 7 29 180

Toutes les rgressions possibles.
La mthode la plus sre est sans aucun doute de tester toutes les quations de rgression
possibles et de choisir la meilleure, mais cela est pratiquement impossible au regard de l'ampleur
des calculs.
En effet lorsque k variables explicatives sont prises en considration, le nombre total d'quations
de rgression diffrentes est gal 2
k
1, soit par exemple, 1 023 quations pour dix variables
explicatives et 1 048 575 quations pour vingt variables explicatives.
Dans notre exemple cela engendre 2
3
1 = 7 modles diffrents. Pour ne pas alourdir la
prsentation de ce chapitre, nous ne prsentons pas tous les rsultats. Le choix du meilleur modle
seffectue de la manire suivante :
par limination des modles dans lesquels au moins une variable explicative nest pas
significative (hormis le terme constant),
en retenant parmi les modles restants, celui dont le coefficient de dtermination R est le plus
lev.
Dans notre exemple, le lecteur pourra vrifier que cest le modle contenant les variables x1,t et
x
2,t
qui est slectionn.

L'limination progressive ( Backward Elimination )
Cette procdure consiste, sur le modle complet k variables explicatives, liminer de proche
en proche (c'est--dire en restimant l'quation aprs chaque limination) les variables explicatives
dont les t de Student sont en dessous du seuil critique. Cette procdure n'est utilisable que si la
premire quation peut tre effectivement estime, ce qui n'est pas toujours le cas. En effet, lorsque
le modle comporte un nombre trop important de variables explicatives, le risque de colinarit
entre ces variables est lev.

Premire rgression :
3 2 1 0
Coefficient -0,0371 -0,3814 0,8019 32,8913
Ecart-type 0,05 0,16 0,30 11,66

t de Student 0,71 2,44 2,69 2,82

La variable x
3,t
nest pas significative (t
cal
= 0,71 < 2), elle est donc retire du modle :
2 1 0
Coefficient -0,3281 0,7149 25,8421
Ecart-type 0,13 0,27 6,06

t de Student 2,44 2,68 4,26

Toutes les variables sont maintenant significatives (t
cal
> 2), le modle est valid (les variables
x
1,t
et x
2,t
sont slectionnes).

Le processus d'introduction progressive ( Stepwise Regression )
Cette technique utilise une dmarche inverse ; les variables explicatives sont slectionnes
une par une jusqu' ce que l'quation de rgression se dgrade. Dans un premier passage, la variable
la plus fortement corrle avec la srie expliquer est choisie. Puis au deuxime stade, la variable
qui explique le plus la variance de la srie expliquer (selon le critre du t de Student) est
introduite. Le processus d'introduction s'arrte lorsque plus aucune variable complmentaire ne
contribue l'explication de la variance de la srie expliquer.

Etape 1 : Slection de la variable explicative la plus corrle avec la variable prvoir y
t
.
Nous calculons les trois coefficients de corrlation entre yt et chacune des trois variables
ainsi que son t de Student associ (cf. 1.1.1) :
x
1,t
x
2,t
x
3,t

Corrlation 0,72 -0,69 0,48
t de Student 3,88 3,61 2,05

La variable explicative x
1,t
est donc retenue (coefficient de corrlation le plus lev).

Etape 2 : Estimation des deux modles avec comme premire variable explicative x
1,t
puis
alternativement x
2,t
et x
3,t.

y
t
=a
1
x
1
,
t
+ a
2
x
2
,
t
+ a
0
+
t

2 1 0
-0,3281 0,7149 25,8421
0,13 0,27 6,06

t de Student= 2,44 2,68 4,26

y
t
=a
1
x
1
,
t
+ a
3
x
3
,
t
+ a
0
+
t

3 1 0
0,0232 0,9272 8,6092
0,06 0,35 7,28

t de Student= 0,42 2,62 1,18

La deuxime variable slectionne (ici x2,t) est celle dont le t de Student est le plus lev en
valeur absolue.

Etape 3 : Estimation dun modle avec comme variables x
1,t
et x
2,t
(les deux premires
slectionnes) et x3,t (la seule qui reste).
y
t
= a
1
x
1t
+ a
2
x
2t
+ a
3
x
3t
+ a
0
+
t

Nous connaissons le rsultat, car il sagit de la premire estimation de la procdure de
llimination progressive. La procdure est donc arrte car la variable x
3t
nest pas significative de
par linterprtation du t de Student.

Le modle final est donc le mme que dans les procdures prcdentes.

La rgression tages ( Stagewise Regression ) (cf. fichier Web).
C'est un processus de slection de variables explicatives permettant de rechercher les
contributions marginales, mais significatives, de chacune des variables explicatives candidates.
Comme pour la mthode prcdente, la variable ayant le coefficient de corrlation le plus
lev avec la srie prvoir est retenue.
Nous procdons alors une premire rgression, qui dgage un rsidu. Ce rsidu est
considr son tour comme une nouvelle variable expliquer. Dans un deuxime temps, la srie
explicative la mieux corrle avec ce premier rsidu est slectionne, une nouvelle rgression
deux variables dgagera un nouveau rsidu que l'on cherchera aussi expliquer, etc.

Etape 1 : Slection de la variable explicative la plus corrle avec la variable prvoir y
t
.
Nous calculons les trois coefficients de corrlation entre y
t
et chacune des trois variables
ainsi que son t de Student associ. La variable explicative x
1,t
est donc retenue (coefficient de
corrlation le plus lev).

Etape 2 : Estimation dun modle avec une variable explicative x
1,t
et calcul du rsidu.
y
t
=
1
x
1,t
+
0
+ e
1,t

e
1,t
= y
t
(
1
x
1,t
+
0
)

y
t
= 1,0118 x
1,t
+ 11,57 + e
1,t

Les coefficients estims nous permettent de calculer le rsidu e
1,t
:
e
1,t
= y
t
(1,0118 x
1,t
+ 11,57)
Par exemple :
e
1,1
= 12 (1,0118 2 + 11,57) = -1,59
e
1,2
= 14 (1,0118 1 + 11,57) = 1,42

e
1,14
= 21 (1,0118 7 + 11,57) = 2,35

Etape 3 : calcul des coefficients de corrlation simple entre e
1,t
et les diffrents x
i,t
.

x
1,t
x
2,t
x
3,t

Corrlation 0,00 -0,53 0,10
t de Student 0,00 2,32 0,39

La deuxime variable slectionne (ici x
2,t
) est celle dont le coefficient de corrlation est le
plus lev en valeur absolue.
On remarque que le coefficient de corrlation entre e1,t et x1,t est nul car la variable e1,t
reprsente la srie des ventes de laquelle nous avons retir l'influence de x
1,t
.

Etape 4 : Estimation dun modle avec deux variables explicatives x
1,t
et x
2,t
puis calcul du
rsidu.
e2,t = yt (1 x1,t + 2 x2,t + 0)

Les coefficients estims nous permettent de calculer le rsidu e2,t :
e
2,t
= y
t
(0,71 x
1,t
+ 0,33 x
2,t
+ 25,84)
Par exemple :
e
2,1
= 12 (0,71 2 + 0,33 45 + 25,84) = -0,51
e
2,2
= 14 (0,71 1 + 0,33 43 + 25,84) = 1,55

e
2,14
= 21 (0,71 7 + 0,33 29 + 25,84)

Etape 5 : calcul des coefficients de corrlation simple entre e
2,t
et les diffrents x
i,t
.

x
1,t
x
2,t
x
3,t

Corrlation 0,00 0,00 -0,16
t de Student 0,00 0,00 0,60

La procdure de slection s'arrte car plus aucun coefficient de corrlation entre le rsidu et
les variables explicatives n'est significativement diffrent de 0.

L'analyse des rsidus chaque tape permet de tirer le maximum d'informations des
variables explicatives en minimisant les inter-corrlations. Economiquement, cela se justifie
pleinement : une industrie peut dpendre 60 % d'un premier secteur, de 30 % d'un autre et de 10
% d'un dernier. Ainsi l'explication rsiduelle du deuxime secteur est mise en lumire aprs
soustraction de l'explication par le premier secteur ; quant au troisime, il apparat avec plus de
nettet sur le rsidu des 90 % dj expliqus. Ainsi, nous pouvons mettre en vidence les
explications marginales mais contributives de chacune des variables.

L'approche conomtrique est trs riche car elle recherche une explication non pas dans les
variations de la chronique elle-mme (comme les mthodes endognes) mais au travers des
fluctuations d'autres chroniques dont on a l'habitude d'valuer intuitivement l'influence. Elle permet
de tester explicitement des relations tablies de faon implicite.
L'inconvnient de ce type de mthode rside dans une mise en uvre un peu plus lourde.
Cependant les tableurs permettent une grande facilit de calcul (comme nous lavons vu dans ce
chapitre). L'utilisateur ne doit intervenir que dans la spcification du modle, l'valuation de sa
validit statistique, le suivi du modle et des indicateurs ainsi que la recherche et la constitution des
historiques de sries explicatives.


Chapitre 5

EVALUATION DES METHODES DE PREVISION

Ce dernier chapitre traite, dans une premire partie, de lvaluation de la qualit de la prvision.
Cette question parat a priori triviale. Elle ne l'est en fait pas du tout. Les entreprises prouvent
souvent de grandes difficults mesurer objectivement la qualit d'une prvision. La premire
tape de cette mesure consiste fixer des critres qui permettent d'valuer l'exactitude de la
prvision pour un article donn (section 1) puis, pour des entreprises grant un grand nombre de
rfrences, de proposer des mthodes dvaluation synthtique de la qualit de la prvision (section
2). La section 3 prsente des procdures dvaluation de la qualit de la prvision.
Une proccupation majeure avant de mettre en place un systme est de choisir la meilleure
mthode. La slection de celle-ci a fait l'objet de nombreuses tentatives de mesure, qui se situent
dans l'absolu, c'est--dire sans rfrence relle au type de donnes, au secteur, et l'horizon de
prvision. La section 4 de ce chapitre dcrit les tentatives de comparaison entre mthodes et met en
valeur leur caractre discutable : si des lments probants permettent de se dterminer en faveur de
l'une ou de l'autre des techniques, ce n'est pas dans ce type de recherche qu'on les trouvera.
La section 5 expose comparativement les avantages et les inconvnients des principales
techniques de prvision ; les jugements qui sont exposs sont de nature qualitative et ils sont
marqus par la prudence. En effet, les mthodes ne sont jamais entirement comparables parce
qu'elles ne sont pas conues rigoureusement pour des applications et des horizons semblables.
1. Mesure de la qualit d'une prvision
1.1. Les indicateurs de mesure
Il existe de trs nombreux indicateurs
27
permettant dvaluer la qualit de la prvision, nous
prsentons ici les plus importants.

Erreur relative en pourcentage la priode t (ER
t
)
Il s'exprime comme :
100
t
t t
t
x
x x
ER
o :
x
t
est la ralisation la priode t,
t
x est la prvision la priode t.
Il s'agit d'une approche simple et classique, qui est renouvele chaque fois que de nouvelles
ralisations connues permettent de calculer des carts.

Indicateur de la valeur absolue moyenne des carts (Mean Absolute Deviation)
Si on veut avoir une vision synthtique qui opre sur un ensemble de T priodes de prvision, le
calcul de la valeur absolue moyenne des erreurs s'impose. Il est dfini l'instant t par :

27
Cf. Bourbonnais et Terraza, Chapitre 7, 1998.
T
EPS
MAD
t
T t i
i
t
1

avec :
i i i
x x EPS

Indicateur de la variance de lerreur de prvision (MSE, Mean Squared Error )
Afin de rendre compte des erreurs importantes, tout en ignorant, comme dans la formule
prcdente, leur signe, lindicateur utilis communment est celui de la variance de lerreur de
prvision. Il est dfini l'instant t par :
T
EPS
MSE
t
T t i
i
t
1
2

La racine carre de cet indicateur MSEest similaire lcart-type de lerreur de prvision non
centre sur sa moyenne. Sa valeur dimensionne donc le stock de scurit
28
pour larticle considr.

Indicateur de comparaison des performances de deux prvisions, statistique dite U de
Theil
29
.
Cet indicateur compare la prvision de lentreprise avec une mthode de prvision na ve
consistant prendre comme nouvelle prvision la dernire ralisation. Il est dfini l'instant t par :
( )
( )
+ +
1
1
2
1
1
1
2
1 1
T i
i
i
T i
i
i i
CRR
CRR CRP
U
Avec :
T = nombre de priodes de prvision (exemple = 12)
CRP = Changement Relatif Prvu (exemple = + 5,2 %)
CRR = Changement Relatif Rel (exemple = + 3,2 %)
L'interprtation des valeurs de la statistique U peut se rsumer de la faon suivante :
U = 1 la technique de prvision est quivalente une mthode na ve qui consiste prendre
comme prvision la dernire ralisation.
U < 1 la technique de prvision est meilleure que cette mthode et dautant meilleure que U
est proche de 0.
U > 1 la technique de prvision est trs mdiocre, car elle est pire que cette mthode.
1.2. La prvision est-elle biaise ?
Une autre approche de la mesure de la qualit de la prvision consiste dtecter l'existence d'un
biais. Le biais de prvision doit tre dtect rapidement car il est gnrateur, terme, soit dun
surstock soit dune rupture. Hormis lindicateur AWS, prsent au chapitre 3, qui permet de dtecter
des ruptures de tendance et donc des biais, nous prsentons deux tests statistiques supplmentaires.

La premire procdure consiste spcifier, puis estimer le modle de rgression suivant :
x
t
= a
0
+ a
1

t
x
o :

28
Cf. Bourbonnais et Vallin, 1995.
29
Theil, 1966.
x
t
est la valeur observe en t,
t
x est la valeur prvue en t.
Si le coefficient a
0
est significativement diffrent de 0, cela rvle l'existence d'un biais. Le
coefficient a0 devrait en effet tre nul (non significativement diffrent de 0) si en moyenne les
prvisions sont gales aux ralisations.
L'exemple suivant illustre cette mthode. Soit le modle estim :
x
t
= 3,32 + 0,931
t
x
(0,42) (9,52)
R = 0,91
T = 18 (nombre de priodes de prvision)
(.) = t de Student
Le coefficient a
0
n'est pas significativement diffrent de 0 puisque t* = 0,42 < 13 , 2
05 , 0
16
t , les
prvisions ne sont donc pas biaises.

Le deuxime test consiste calculer le rapport de la racine de lindicateur MSE la moyenne
arithmtique des erreurs de prvision sur T priodes :
EPS
MSE
t

Avec :
T
EPS
EPS
t
T t i
1

Puis comparer cet indicateur la racine carre de T divise par 2, soit le test suivant :
Si
2
T
EPS
MSE
t
, alors il ny a pas de prsomption de biais.
1.3. Convergence de la prvision
La question peut se poser de lamlioration de la qualit de la prvision lorsque lon se
rapproche de la date de ralisation de la vente. En thorie, il semble plus facile dlaborer une
prvision pour le mois prochain que pour dans 12 mois. Les prvisions glissantes font que, pour un
mme mois de ralisation, des prvisions diffrentes saccumulent : celle calcule il y a 12 mois,
puis celle calcule il y a 11 mois, etc., jusqu celle calcule le mois davant ; ainsi au bout de 12
mois, on dispose de 12 prvisions mises successivement diffrentes pour un mme mois. Il
peut tre intressant danalyser lvolution de la prvision au fur et mesure que lon sapproche de
la ralisation. Une prvision trs fluctuante dune mission lautre est perturbante pour la
planification de la production, car elle oblige des rvisions importantes du programme de
fabrication (besoins humains et en matriel). De plus, nous pouvons nous interroger sur la
convergence de la prvision, cest--dire sur son amlioration au fur et mesure que lchance
approche.
Le Graphique 21 illustre cette convergence partir dun exemple rel issu dun constructeur
automobile (prvision dimmatriculations dun modle automobile). Linterprtation est la
suivante : la droite reprsente la ralisation pour juillet de l'anne A+1, (le nombre de modles
rellement immatriculs est de 3680), la courbe reprsente les diffrentes prvisions calcules pour
le mois de juillet de l'anne A+1, celle calcule au 1
er
juillet de l'anne A+1 est de 3200, celle
calcule en juin de l'anne A+1 est de 2600, etc., en remontant jusquen juillet de l'anne A (la
prvision pour juillet de l'anne A+1 est alors de 3070).

Graphique 21 Evolution de la prvision glissante
2500
2700
2900
3100
3300
3500
3700
3900
j
u
i
l
l
e
t

A
a
o
t

A
s
e
p
t
e
m
b
r
e

A
o
c
t
o
b
r
e

A
n
o
v
e
m
b
r
e

A
d
c
e
m
b
r
e

A
j
a
n
v
i
e
r

A
+
1
f
v
r
i
e
r

A
+
1
m
a
r
s

A
+
1
a
v
r
i
l

A
+
1
m
a
i

A
+
1
j
u
i
n

A
+
1
j
u
i
l
l
e
t

A
+
1
PREVISION EN DEBUT DE MOIS REALISE POUR JUILLET DE A+1

Nous constatons que les diffrentes prvisions calcules depuis juillet de l'anne A jusquen
avril de l'anne A+1 se sont plutt dgrades au cours du temps. Celle calcule en mai est trs
proche de la ralisation, puis sen loigne fortement le mois suivant (juin) ; enfin, en dbut juillet,
la prvision retend vers la valeur finale. Nous pouvons remarquer :
que la prvision de juillet de l'anne A+1 nest pas notablement de meilleure qualit que
celle de juillet de l'anne A ;
quaprs avoir t trs proche de la ralisation, le prvisionniste a dgrad cette prvision ;
quenfin lamplitude des variations de la prvision sur les quatre derniers mois est trs
forte.
Ce type de phnomne se produit assez souvent en entreprise o nous pouvons observer que
la proximit de la date de ralisation rend fbrile le prvisionniste qui, en perdant toute objectivit
dune vision de moyen terme, dgrade la prvision initiale labore avec plus de recul.
1.4. Dtection de la cause de l'erreur
Plusieurs auteurs (Theil, 1971 ; Jorgenson, 1970 ; Granger et Newbold, 1973) proposent une
mesure de l'importance relative de chaque source de l'erreur quadratique moyenne (biais,
amplitude, composante strictement alatoire).
On pose :
x x x x
x x E
2 2
2
2 ) ( + +
o :
x = moyenne des ralisations,
x = moyenne des prvisions,
2
x
= variance des ralisations,
2
x
= variance des prvisions,
= coefficient de corrlation entre valeurs ralises et prvues.
Les conditions pour que l'erreur quadratique de prvision soit minimum sont les suivantes :
x = x (prvision sans biais) et
x x
,
si = 1, l'cart-type des prvisions et l'cart-type des ralisations sont identiques.
Nous pouvons crire cette mme quation de la manire suivante :
2 2
2
) 1 ( ) ( ) (
x x x
x x E + +
E = EB + EA + ER
avec :
EB=
2
) ( x x = composante associe au biais,
EA = ) (
x x
= composante associe l'amplitude de l'erreur,
ER =
2 2
) 1 (
x
= composante alatoire.
L'objectif du suivi des carts du systme de prvision est alors d'liminer EB (le biais), puis
ensuite de rduire EA (l'amplitude de l'erreur), en amliorant progressivement le modle.
1.5. Quelle erreur de prvision est admissible?
Les entreprises se posent cette question frquemment, elles la formulent parfois autrement :
Une erreur de prvision de 15 % est-elle admissible ?
Comment dterminer un objectif de qualit de la prvision ?
Comment talonner a priori les performances attendues ?
La qualit attendue de la prvision dpend troitement du secteur dactivit et de la difficult
intrinsque (variance de la srie historique) de prvoir larticle. Par exemple, pour un produit de
grande consommation, une erreur de prvision de 5% est considre comme importante, alors que
dans le domaine industriel la mme erreur de prvision est juge tout fait acceptable.
Nous prsentons une technique fonde sur le coefficient de variation (cf. chapitre 2) permettant
de rpondre cette question.
Le Coefficient de Variation (CV) de la srie brute rend compte de la difficult prvisionnelle
d'un historique. Plus il est lev, plus la variance de la srie est importante rapporte la moyenne.
Cependant, une saisonnalit marque peut augmenter artificiellement le CV. Cest pourquoi, il
convient de raisonner sur la srie CVS. La procdure est la suivante :
estimation de la srie CVS,
calcul du coefficient de variation (CV
CVS
) de la srie CVS.
Si, par exemple, CV
CVS
= 0,12 la plage de variation intrinsque de cet article est de t12 %, nous
pouvons considrer que la valeur ajoute du modle de prvision et du prvisionniste permet de
diviser par 2 cette variation, lobjectif de performance pour cet article est donc de 6% derreur de
prvision.
Il sagit dun talonnage trs simple mettre en uvre et qui permet aux entreprises de se fixer a
priori un objectif de qualit de prvision.
1.6. La simulation
Une autre manire permettant dvaluer la qualit attendue des prvisions consiste oprer des
simulations des prvisions. Il convient dtre extrmement prudent quant leurs interprtations et
les consquences que lon peut en tirer. En effet, cela dpend du type de simulation effectue.

Les diffrents types de simulation

Diffrents types de simulation sont possibles (cf. Schma 4).

Schma 4 Diffrents types de simulation

Dans le Schma 4, T1 et T2 reprsentent les dates de dbut et de fin de la priode sur laquelle est
estim le modle, T3 reprsente la date actuelle.
La premire modalit de simulation est appele simulation ex post ou simulation historique : elle
correspond aux modles de simulation. La totalit de l'historique de T1 en T2 est utilise en ce qui
concerne la srie des ventes que lon cherche prvoir et ventuellement aussi les facteurs
explicatifs. Aprs lestimation des paramtres du modle, les prvisions sont simules sur le mme
historique. Ce type de simulation donne peu dindications sur la qualit relle attendue des
prvisions
30
. En effet, lobjectif statistique de lestimation du modle tant de minimiser la somme
des erreurs de prvision, cela permet de vrifier seulement que les algorithmes utiliss fonctionnent
convenablement.
Le deuxime type de simulation (prvision ex post ou simulation de prvision) implique une
simulation du modle aprs la priode d'estimation ; une partie de lhistorique connue nest pas
utilise pour estimer les paramtres du modle de prvision mais sert exclusivement comparer les
prvisions issues de cette estimation et les ralisations. Cette procdure permet de qualifier les
rsultats attendus en terme de qualit et constitue un test rellement interprtable.
Quant au backcasting , il s'agit d'un type de simulation o l'on prvoit reculons dans le
pass : partir d'un modle estim sur la priode T1 T2, on prvoit les annes antrieures.
L'intrt de cette procdure, relativement peu frquente en pratique, n'est pourtant pas mince : elle
permet de tester la stabilit dynamique du modle comme s'il voluait vers le pass, au lieu d'aller
en avant dans le temps.
Enfin, la prvision ex ante consiste effectuer une prvision pour une priode non connue.
2. Evaluation synthtique de la qualit de la prvision
Les formules dveloppes aux parties prcdentes s'appliquent pour un article donn. Or, pour
des entreprises qui grent un grand nombre de rfrences, il devient trs difficile d'apprhender
dans sa globalit la qualit des prvisions.
De plus, l'valuation de l'erreur en terme de pourcentage n'a pas toujours beaucoup de sens ; en
effet, il est plus grave de se tromper de 5% pour un article dont les quantits vendues sont en
moyenne de 100 000 units par an que de faire une erreur de prvision de 50% pour un article
vendu 50 units par an (pour des valeurs unitaires comparables).
2.1. Calcul dun indice pondr
Pour pallier ces inconvnients, nous proposons une premire technique qui permet, la lecture
d'un simple chiffre, d'avoir une vision synthtique de la qualit de la prvision.

30
Pourtant cest une pratique courante et trompeuse
T1 T2
T3
(aujourdhui)
Temps
Backcasting
Simulation ex post
ou simulation
historique

Prvision ex post ou
simulation de
prvision

Prvision ex ante
Priode destimation
Le principe consiste calculer la somme des produits des erreurs de prvision pondres par le
volume ou le chiffre daffaires.
Le Tableau 25 illustre la mthode de calcul.

Tableau 25 Calcul dun indice pondr par le volume et le chiffre daffaires
REF1, REF2, REF3, REF4, REF5, REF6, REF7, REF8,
Prvision
Ligne 1
3450 869 900 4309 3300 2100 70 320
Ralisation
Ligne 2
3477 858 919 5074 2774 2919 134 200
Ecart
Ligne 3
-0,78% 1,28% -2,07% -15,08% 18,96% -28,06% -47,76% 60,00%
Ecart
absolu
Ligne 4
0,78% 1,28% 2,07% 15,08% 18,96% 28,06% 47,76% 60,00%
Chiffre
d'affaires
Ligne 5
14000 16000 20000 15000 8000 17000 15000 22000
Chiffre
d'affaires
pondr
Ligne 6
109 205 413 2262 1517 4770 7164 13200
Volume
Pondr
Ligne 7
27 11 19 765 526 819 64 120

En colonne figurent les rfrences gres (au nombre de huit), en ligne nous avons les
diffrentes tapes de calcul. Les cinq premires lignes ne posent aucun problme de
comprhension. Nous explicitons seulement les deux dernires lignes :
Chiffre d'affaires pondr (ligne 6) = chiffre daffaires (ligne 5) cart absolu (ligne 4)
Volume pondr (ligne 7) = ralisation (ligne 2) cart absolu (ligne 4)
Lindice de la qualit de la prvision pondr par le chiffre daffaires est alors gal la somme
de la ligne 6 divise par la somme de la ligne 5, soit = 29 640 / 127 000 = 0,2334. Lerreur de
prvision moyenne tenant compte du chiffre daffaires de chaque article est de 23,34%.
Lindice de la qualit de la prvision pondr par le volume
31
est alors gal la somme de la
ligne 7 divise par la somme de la ligne 2, soit = 2 351 / 16 355 = 0,1437. Lerreur de prvision
moyenne tenant compte du volume de chaque article est de 23,34%.
Lerreur de prvision pondre par le chiffre daffaires est de 23,34% et lerreur de prvision
pondre par le volume est de 14,37%, les prvisions sont donc de moins bonne qualit pour les
articles valeur unitaire leve.
Ces indices, calculs tous les mois, permettent de suivre de faon dynamique lamlioration ou
la dtrioration de la prvision.
2.2. Evaluation graphique
Une autre approche permet, la lecture d'un graphique, d'avoir une vision synthtique de la
qualit de la prvision.
Le Tableau 26 illustre la construction du graphique pour une socit qui gre 81 rfrences :
classement des articles par ordre croissant de l'erreur relative de prvision (en %) en valeur
absolue (colonne 4),

31
Si cela a un sens de comparer les volumes des articles.
calcul du poids relatif de l'article rapport la totalit des ventes de l'entreprise (ralisation en
volume de l'article divise par la totalit du volume des ventes),
cumul de ces poids (en % ; colonne 6) .

Tableau 26 Construction d'un graphique d'valuation
Rfrence
Colonne 1
Ralisation
Colonne 2
Prvision
Colonne 3
% Ecart
Colonne 4
Cumul des ventes
Colonne 5
% ventes totales
Colonne 6
Ref1 40 40 0,00 40 0,01
Ref2 33 34 3,03 73 0,01
Ref3 5872 5685 3,18 5945 0,86
Ref4 91 88 3,30 6036 0,87
Ref5 11021 10501 4,72 17057 2,46
Ref6 1684 1599 5,05 18741 2,70
Ref7
Ref8
Ref72 4148 6404 54,39 645488 93,05
Ref73 38 17 55,26 645526 93,06
Ref74 687 291 57,64 646213 93,16
Ref75 1853 2950 59,20 648066 93,43
Ref76 48 78 62,50 648114 93,43
Ref77 800 1331 66,38 648914 93,55
Ref78 1513 2544 68,14 650427 93,77
Ref79 1297 2186 68,54 651724 93,95
Ref80 41770 72759 74,19 693494 99,97
Ref81 180 44 75,56 693674 100,00

Le Graphique 22 reprsente en abscisse les erreurs en pourcentage (colonne 4) et en ordonne
(colonne 6) le cumul des poids (jusqu' 100% du volume trait).
L'interprtation est alors aise :
plus la courbe se situe gauche et crot rapidement (forme convexe), meilleure est la qualit
de la prvision,
pour juger de la qualit globale, il suffit de se placer par exemple 10 et 20 sur l'abscisse.
Cela correspond environ 25 % puis 49 % du volume trait. Pour 25 % du volume prvu, l'erreur
de prvision est infrieure ou gale 10 % et, pour 49 % (la moiti) du volume prvu, l'erreur de
prvision est infrieure ou gale 20%.
Graphique 22 Evaluation synthtique d'un systme de prvision

Cette technique est utile pour viter de donner trop d'importance une erreur isole, mme trs
importante. En outre elle peut aussi bien s'appliquer des donnes en volume (units), comme dans
notre exemple, qu' des donnes en valeur, lorsque les articles ont des units de mesure
htrognes.
Dans cet exemple, nous avons considr les erreurs de prvision en valeur absolue en faisant
lhypothse quil est aussi grave de se tromper en positif quen ngatif. Cependant, certaines
entreprises craignent avant tout la rupture et considrent donc quune erreur de prvision positive
(ralisation > prvision) est plus grave que linverse. La constitution de deux graphiques lun
pour les erreurs de prvisions positives et lautre pour les ngatives permet de rpondre cette
proccupation.
3. Procdures d'valuation
3.1. Dure de la mesure
Une prvision ne se juge pas ds le premier essai. Que le rsultat soit favorable ou dfavorable,
il est ncessaire de faire un essai suffisamment long pour que des carts faibles ou forts dpassent
le stade de la co ncidence pour atteindre celui de la signification statistique d'un vritable degr de
prcision.
Elle ne doit pas non plus tre trop longue : si le long terme est ncessaire pour valuer
l'exactitude de la prvision court terme, quand l'utilisera-t-on ?
Une rgle empirique est de faire un test sur une priode qui reprsente trois fois l'horizon de
prvision. Par exemple, pour une prvision semestrielle mise tous les 3 mois, on calcule les carts
pendant une priode de 18 mois, ce qui revient tester six missions de prvision.
Partant d'un exemple (prvision 6 mois, actualise tous les trimestres, en valeurs mensuelles),
o le problme est une mesure de l'cart prvisions ralisations et non une comptition entre
diffrentes mthodes, nous proposons la dmarche suivante :
0,00
10,00
20,00
30,00
40,00
50,00
60,00
70,00
80,00
90,00
100,00
0,00 10,00 20,00 30,00 40,00 50,00 60,00 70,00 80,00
Tous les 3 mois, on procde une valuation de la qualit de la prvision au niveau individuel
(cf. 1) et synthtique (cf. 2), selon un pas mensuel et trimestriel (une prvision non fiable au niveau
mensuel peut tre fiable trimestriellement).
Il faut se mfier d'interprter trop rapidement un rsultat favorable. Une srie brute dont le
coefficient de variation de 20 % (cart-type exprim en pourcentage de la valeur moyenne), qui une
fois dsaisonnalise n'a plus qu'un coefficient de variation de 8 %, est prvue avec une erreur
quadratique moyenne de 7 %, la performance prvisionnelle ne doit pas tre considre comme trs
satisfaisante. L'apport d'une mthode de prvision, sa prcision, ne se mesurent pas de faon
linaire. Certaines composantes peuvent tre faciles dgager et donc prvoir, la saisonnalit par
exemple. Dans le cas voqu prcdemment, la prcision hors saisonnalit tait en ralit trs
faible.
En outre, la qualit ne se mesure pas de faon continue. Prenons l'exemple suivant : la prvision
est errone, la baisse sur un march o une reprise technique semble se faire jour. Durant les trois
mois qui suivent, elle redevient prcise, cependant que les chiffres rels diminuent, accrditant ainsi
l'ide que cette reprise tait un leurre. On peut dire alors que son apport a t important car elle a
jet un doute sur la durabilit d'une modification de tendance et elle a jou un rle modrateur.
3.2. Comparaisons de prvisions
Plusieurs possibilits existent : elles tmoignent du contexte dans lequel s'effectue l'tude,
suivant que l'on essaie de prvoir la ralit ou de comparer diffrentes mthodes. La rfrence peut
tre :
les valeurs ralises,
la prvision obtenue par diffrentes mthodes (prvision du terrain, statistique, etc.).
Prenons lexemple dune entreprise qui gre trois sources diffrentes de prvision :
statistique issue dun modle de prvision,
terrain manant de la consolidation des prvisions des commerciaux,
valide en comit prvision (cf. chapitres 1 et 10).
Il peut tre intressant de comparer, sur un graphique, lvolution dans le temps des diffrentes
prvisions glissantes pour une mme priode de prvision.
Pour le mois daot de lanne A, nous avons trac lvolution de trois prvisions glissantes
diffrentes :

Graphique 23 Comparaison entre ralisation et trois prvisions (statistique, terrain, valide)
2400
2500
2600
2700
2800
2900
3000
3100
3200
3300
j
u
i
n

A
-
1
j
u
i
l
l
e
t

A
-
1
a
o
t

A
-
1
s
e
p
t
.

A
-
1
o
c
t
b
.

A
-
1
n
o
v
e
.

A
-
1
d
c
e
.

A
-
1
j
a
n
v
i
e
r

A
f
v
r
i
e
r

A
m
a
r
s

A
a
v
r
i
l

A
m
a
i

A
j
u
i
n

A
j
u
i
l
l
e
t

A
Ralis aot A Prev. Statistique Prev. Terrain Prev. Valide

Nous constatons que 12 mois avant lchance, la prvision terrain sousestime le ralis et
reste relativement stable jusqu lapproche du mois daot o elle subit des modifications brutales.
La prvision statistique volue jusqu convergence vers le ralis. La prvision valide se situe le
plus souvent entre la prvision statistique et terrain, ne sachant laquelle privilgier ...
3.3. Exemples doutils dalerte
Dans tout systme de prvision portant sur un grand nombre de rfrences, le gestionnaire
doit pouvoir disposer doutils dalerte permettant de ragir par exception. Nous proposons ici une
panoplie dindicateurs oprationnels concernant un systme mensuel de prvision de ventes.
La prvision historise (les prvisions successives conserves) servant de rfrence est la
prvision valide par lutilisateur ; le nombre de prvisions historises est gal T = 12. Tous les
indicateurs sont donc calculs sur les 12 dernires priodes de prvision. Les indicateurs prsents
au dbut de ce chapitre ne font pas lobjet dexplications.

Dtection des valeurs anormales et filtrage
Si une observation de la srie CVS en dehors de 2
x
suspicion de valeur anormale.
(
x
= cart-type de la srie CVS).

Amplitude de lerreur de prvision anormalement leve
Si EPSt / MAD
t
> 3 erreur de prvision anormalement leve.

Rupture de tendance
Indicateur SUMEPS (somme des erreurs cumules, cf. chapitre 3)
Si SUMEPS
t
/ MAD
t
> 3 risque de biais.

Ou test statistique
Si
2
T
EPS
MSE
t
< risque de biais.

Efficacit du modle de prvision
Indicateur MSE (Mean Squared Error)
Si MSE
t
> variance des ventes CVS (
2
x
) modle de prvision non efficace car la variance de
lerreur de prvision (lala) est suprieure la variance intrinsque de la srie. Le modle de
prvision na pas rduit lala.

A chaque mission des prvisions le gestionnaire, par exception, va se consacrer en priorit aux
articles dont lune de ces anomalies a t constate.

Les Previsions de Vente

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Les Previsions de Vente

Transféré par

Droits d'auteur :

Formats disponibles

Rgis Bourbonnais - Prvision des ventes

PREVISION DES VENTES

Vous aimerez peut-être aussi