Académique Documents
Professionnel Documents
Culture Documents
Poly 1 PDF
Poly 1 PDF
Octobre 2001
Nous examinons dans ce chapitre introductif en quoi l'obligation de prvoir la demande dpend
de l'organisation mme de l'entreprise et de son secteur d'activit. Nous prsentons ensuite
comment aborder la prvision des ventes dans l'entreprise : comment la caractriser en terme de
problme et de solution. Puis nous proposerons quelques dfinitions permettant de distinguer les
notions de prvision et d'objectif. Enfin nous montrons que ce problme de prvision est transversal
par rapport aux fonctions de l'entreprise.
L'approche est trs dpendante du secteur d'activit : on ne prvoit pas des livraisons de ciment
par les mmes mthodes que des ventes de savons. Les causalits conomiques sous-jacentes sont
diffrentes suivant que le secteur est plus ou moins en amont dans le circuit industriel donc plus ou
moins proche de la demande finale, suivant que le produit est stockable ou non, qu'il donne lieu
un march de renouvellement (tlvision) ou non (acier), que le produit est standardis ou non.
Tous ces lments jouent un rle dans la dfinition d'une typologie de trois grands secteurs, qui
dans cet ouvrage sont tudis dans les diffrents chapitres de la deuxime partie (approche
sectorielle).
L'exprience prouve que la prvision des hommes de terrain est souvent biaise (les carts sont
systmatiquement positifs ou ngatifs), pour deux raisons :
le temprament personnel du prvisionniste intervient non seulement suivant qu'il est optimiste
ou pessimiste, mais aussi suivant sa prfrence pour des carts potentiels positifs ou ngatifs. Ainsi
un vendeur peut, par prudence, mettre des prvisions trs conservatrices , alors qu'un autre ne
craindra pas les carts ngatifs, souhaitant au contraire tre entran par sa prvision ;
le systme de gestion prvisionnelle biaise trs sensiblement les prvisions des individus. Si
par exemple les moyens sont affects aux directions rgionales de vente en fonction de la prvision,
ils auront tendance l'optimisme. Si les primes sont lies la ralisation de l'objectif, ils auront
tendance au pessimisme.
Nous appellerons prvision entre guillemets ( prvision ) ce type de donnes btardes, mi-
chemin entre un objectif rel et une vritable prvision. Leur mauvaise qualit ne met pas en cause
la performance des hommes du terrain et leur capacit effectuer un apport essentiel dans un
systme de prvision : elle condamne tout systme de gestion prvisionnelle qui biaise d'emble les
donnes d'entre qui lui sont ncessaires.
Souvent lorsque des carts trop importants apparaissent sur les prvisions , l'entreprise est
tente de ne plus accorder sa confiance aux hommes de terrain, qui se voient ainsi disqualifis par
rapport une tche qui ne leur semblait pourtant pas la moins intressante. En consquence,
l'entreprise recourt des profils entirement opposs : la prvision devient l'affaire de statisticiens,
qui ne seront pas suspects d'implication dans le fonctionnement interne de la firme. On assiste alors
La prvision a doublement hrit des techniques divinatoires : d'une part elle satisfait le mme
besoin irrationnel et immense de connatre l'avenir, d'autre part elle se pare d'un ct magique en
utilisant l'outil mathmatique, sotrique comme l'tait l'hpatoscopie ou l'astrologie, mme si elle
justifie son efficacit par la rationalit de l'outil. L'utilisateur attend beaucoup de la prvision ; cet
espoir constitue pour le prvisionniste la fois un atout et un risque : l'intrt qui existe lors de la
mise en place du systme peut tre suivi d'une dception si les premiers rsultats ne correspondent
pas l'attente.
L'entreprise peut attendre beaucoup de la prvision condition de bien l'utiliser. Il faut tout
prix viter la vision passiste qu'entrane le sentiment que la prvision est ce que la firme subira
invitablement. Elle est bien au contraire un outil d'aide la dcision : elle doit servir l'entreprise
agir sur son futur et non le subir.
Dans ce chapitre, nous allons aborder ce qui caractrise d'un point de vue statistique les donnes
servant de base l'tude prvisionnelle, en examinant la notion d'historique et de srie
chronologique. L'examen des donnes est le pralable toute tude quantitative, que ce soit dans un
but d'analyse ou de prvision.
Nous traiterons ensuite en dtail de l'analyse de srie chronologique : Quest-ce quune
observation anormale ? Comment la corriger ? Comment calculer une tendance ? Comment retirer
une saisonnalit ? En dfinissant un schma de dcomposition, nous pouvons retirer d'un historique
les effets rptitifs qui peuvent tre facilement extrapols, afin de dgager un terme rsiduel
reprsentant les fluctuations erratiques de la chronique.
1. La notion d'historique
Une srie chronologique est compose d'un historique, c'est--dire d'une suite de valeurs
ordonnes dans le temps priodicit constante : par exemple, l'indice mensuel des prix la
consommation de la France entire publi par l'INSEE en base 100 en 1980. La suite des
valeurs de janvier 1995 jusqu' septembre 2000 au mois le mois reprsente l'historique de l'indice
des prix la consommation. Les ventes mensuelles, pour un article, de mars 1997 fvrier 2000
serviront de base historique afin d'laborer la prvision.
Il est reprsentatif de ce que l'on cherche prvoir. Un historique des livraisons ne permet pas
de prvoir la demande !
Il est homogne dans le temps. Pour reprendre notre exemple d'indice de prix, toutes les
valeurs sont en base 100 en 1980 et correspondent au mme mode de calcul et de collecte
statistique.
La moyenne
La formule gnrale de la moyenne d'une srie chronologique de terme gnral xt pour laquelle
nous disposons de n observations est :
x t
x= t =1
n
Le calcul de la moyenne prsente un intrt limit : deux sries des ventes peuvent avoir une
moyenne identique alors que leur allure gnrale est trs diffrente. Egalement dans le cas de sries
ayant une forte tendance soit la hausse soit la baisse, la moyenne variera fortement chacune
des nouvelles ralisations. C'est pourquoi il est prfrable de prsenter avec la moyenne un
coefficient permettant de prendre en compte la dispersion.
La dispersion
La variance d'une srie chronologique permet d'valuer la dispersion autour de la moyenne.
Nous devons distinguer deux cas, selon que nous sommes en prsence de toute la population de
faon exhaustive ou que nous disposons seulement d'un chantillon de ralisations considr
comme reprsentatif de la population totale.
La formule de la variance (Var) dans le cas d'une population connue totalement (variance
thorique) est :
(x x )
t= n 2
t =1
Var(x) =
n
La formule de la variance dans le cas d'un chantillon (variance empirique) est donne par :
Rgis Bourbonnais - Prvision des ventes
( )
t =n 2
x x
t
t= 1
Var(x) =
n1
Dans le cas du calcul de la variance d'une srie chronologique, la deuxime formule est la seule
retenue ; en effet, nous ne connaissons pas toutes les valeurs, aussi bien les ralisations futures que
celles qui sont trs loignes dans le pass ; la srie chronologique constitue donc un chantillon
reprsentatif de la srie des ventes vraie mais inconnue.
Dans la littrature statistique ou conomique, on prfre prsenter la racine carre de la variance
appele cart-type (x) :
x = Var (x )
Cet cart-type est lun des indicateurs fondamentaux de la difficult prvoir1 une chronique, il
prsente lavantage de sexprimer dans la mme unit que lhistorique. Pour pouvoir interprter sa
valeur, il convient de le rapporter la moyenne.
Coefficient de variation
Le coefficient de variation se dfinit comme tant le rapport de l'cart-type la moyenne calcul
partir de la srie brute :
x
CV =
x
Il rend compte de la difficult prvisionnelle d'un historique. Plus il est lev, plus la variance de
la srie est importante rapporte la moyenne et, donc, plus la tche du prvisionniste est a priori
dlicate.
Nous pouvons classer les historiques des ventes en fonction de ce coefficient :
infrieur 0,5 : a priori facile prvoir,
compris entre 0,5 et 1 : de dispersion moyenne,
suprieur 1 : la variance de la srie est importante rapporte sa moyenne et donc, cette srie
peut s'avrer difficile prvoir.
1
Nous pouvons noter que si l'cart-type de lhistorique est significativement suprieur celui de lcart-type de
lerreur de prvision, le systme de prvision est performant.
2
Attention aux valeurs ngatives ou nulles.
Rgis Bourbonnais - Prvision des ventes
valeurs fortes afin de se ramener une chelle plus restreinte, elle est utilise pour des sries
affecte d'une tendance trs forte. Le graphe est alors en chelle semi-logarithmique.
Appliquer un filtre consiste calculer depuis la srie brute une autre srie, appele srie filtre,
dduite de la premire partir d'un processus dynamique. Alors que pour une srie transforme, il
est possible pour chacune de ces valeurs de revenir la srie initiale (par exemple, le passage aux
exponentielles pour une chronique pralablement transforme par les logarithmes). Pour une srie
filtre, il s'avre impossible de recalculer la srie initiale, mme en disposant du type de filtre
employ.
Le filtre le plus employ est la moyenne mobile qui permet d'crter les pics et les creux afin de
mieux dceler la tendance de fond de la chronique. Il s'agit de calculer une moyenne sur un certain
nombre de valeurs de la srie et de l'affecter un mois donn.
Soit xt le terme gnral de la srie brute, la ralisation la priode t, par exemple la vente
observe en octobre 2000. La srie filtre MMt l'aide d'une moyenne mobile, par exemple, d'ordre
3 a pour expression : MMt = (x t-1 + x t + x t+1 ) / 3
Il est noter que cette moyenne mobile dordre trois ne peut tre calcule que pour t = 2 n 1
(n tant le nombre dobservations), car on ne dispose pas dobservations prcdant x 1 et suivant xn .
Graphiquement, nous observons que la moyenne mobile se trouve au barycentre des trois
observations (cf. Graphique 1).
xt MMt
x t-1
x t+1
xt
t-1 t t+1 t
Le choix de lordre de la moyenne mobile dpend de lobjectif recherch. Plus lordre est lev,
plus la srie est lisse et les phnomnes de court terme sont alors gomms, au risque de perdre en
ractivit ; seul reste le mouvement de fond (la tendance). L'inconvnient rside alors dans la perte
plus grande d'informations en dbut et fin d'historique. Une mention particulire concerne la
moyenne mobile dordre douze qui, pour des sries historiques de priodicit mensuelle, reprsente
lvolution des consommations (ou des ventes) hors phnomnes saisonniers.
Dans les publications statistiques et les revues d'information conomique (BMS3 , l'Expansion, Le
Nouvel Economiste, ...), la plupart des graphiques reprsentent des phnomnes filtrs par moyenne
mobile sur 3 mois. Ceci a pour effet de rendre la courbe plus lisse, de gommer les fluctuations
en rpartissant d'un mois sur l'autre les valeurs extrmes ; d'o le terme de lissage des donnes ou
de courbe lisse lorsqu'on procde un filtrage par moyenne mobile.
Les formules gnrales de filtrage par moyenne mobile sont les suivantes :
3
Bulletin Mensuel de Statistique de lINSEE.
Rgis Bourbonnais - Prvision des ventes
Si lordre correspond un nombre impair (2 m + 1),
i= m
1
MMt =
2m + 1
x
i = m
t + i
Si lordre correspond un nombre pair (2 m), il nous faut recourir un artifice de calcul
afin de faire correspondre le terme central x t la valeur de la moyenne mobile MMt.
1 1 i = m 1
1
MMt =
2 m 2
x t m + x t + i + x t + m
i = m +1 2
Nous voyons que, pour des raisons de commodit des calculs, il est prfrable de retenir des
moyennes mobiles d'ordre impair4 .
Le Tableau 2 prsente un exemple de calcul dune moyenne mobile dordre trois et dune
moyenne mobile dordre six, ainsi que la moyenne, lcart-type et le coefficient de variation.
Exemple de calculs :
4
La technique des moyennes mobiles est trs utilise par les chartistes afin danalyser lvolution des marchs
financiers (cf. Bchu et Bertrand, 1997). Dans ce cas particulier, la valeur de la moyenne mobile est indique en face de
la dernire observation sans se proccuper dun quelconque centrage.
Rgis Bourbonnais - Prvision des ventes
MM610 = (56/2 + 140 + 147 + 156 + 99 + 138 + 100/2) / 6 = 126,33
Nous observons que le coefficient de variation de la srie brute est suprieur celui de la srie
lisse MM3 qui lui-mme est suprieur celui de la srie MM6 ; nous retrouvons bien la mcanique
du lissage qui crte les pics et les creux.
Lobjectif de toute mthodologie prvisionnelle est de dcomposer les ventes, que lon cherche
prvoir, en composantes fondamentales afin de les isoler, puis de les extrapoler indpendamment
les unes des autres. La prvision finale est obtenue en ragrgeant tous ces phnomnes.
Le Schma 1 illustre les tapes classiques de la prvision des ventes.
Analyse de la saisonnalit
Correction des jours ouvrables
Calcul des coefficients saisonniers
Le problme est donc double : d'une part, identifier l'observation juge anormale et, d'autre part,
la corriger afin de neutraliser ses effets.
5
Vallin (1984).
6
Lhypothse que les observations suivent une loi normale (la fameuse courbe en cloche ) entrane une symtrie
de la distribution par rapport la moyenne.
Rgis Bourbonnais - Prvision des ventes
Soit x l'cart-type de la srie, nous pouvons calculer l'intervalle de confiance de la manire
suivante :
IC = x 1,96 x
Lobservation de la priode t = 14 (x14 = 251) est extrieure lintervalle de confiance, elle est
donc dtecte comme douteuse.
t cal =
(x x)
2
j
j t
( n 1)(n 2 )
Si t cal > t lu (valeur de rfrence lue dans une table de Student pour n 2 degrs de libert et un
risque fix 0,05), alors l'observation est considre comme anormale ; dans le cas contraire
(t cal < tlu), l'observation est classe comme normale.
En reprenant les donnes du Tableau 2 et en appliquant cette formule lobservation t = 14,
nous trouvons les lments suivants :
2
(x x)
132
x = 119 (hors lobservation x 14) ; j = 22 362 ; t cal = = 16,32
j t 22362
19 18
t cal = 16,32 > tlu =2,101 ( = 0,05 et pour un nombre de degrs de libert de 20 2 = 18)
Ces trois mthodes supposent que les observations suivent une loi de Gauss. Or, les sries de
ventes obissent rarement une telle loi qui impose la symtrie de la rpartition par rapport la
moyenne. Cependant, malgr cette limite, ces tests sont les plus utiliss car ils ont un caractre
oprationnel simple.
7
Nous revenons plus en dtails sur cette technique qui suppose de connatre le modle de rgression multiple et son
interprtation (cf. chapitres 4 et 6).
Rgis Bourbonnais - Prvision des ventes
Intervention humaine
Le plus simple et le plus logique consiste laisser au gestionnaire la responsabilit de la
modification ; en effet, c'est lui par sa connaissance des causes qui est le mieux plac pour
connatre la part d'anormalit qui existe dans une observation. Cependant, en cas de rfrences
logistiques nombreuses (plus dune centaine), le gestionnaire du systme se trouve dans
lincapacit matrielle de consacrer le temps ncessaire cet exercice.
Intervalle de confiance
L'observation dtecte comme anormale est ramene la limite haute ou basse de l'intervalle de
confiance. Cette mthode est simple dans son fonctionnement et facilement automatisable.
Cependant il ne s'agit pas d'une vritable neutralisation car les bornes de l'intervalle sont une limite
thorique qui n'a aucune existence et peut donc venir perturber par la suite le calcul des coefficients
saisonniers.
210
190
170
150
130
110
90
70
50
T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4 T1 T2 T3 T4
70
60
50
40
30
20
10
0
T1
T2
T3
T4
T1
T2
T3
T4
T1
T2
T3
T4
T1
T2
T3
T4
T1
T2
T3
T4
Le schma additif (cf. Graphique 2) correspond une chronique dont le profil saisonnier ne se
modifie pas au cours du temps et dont la tendance est peu marque.
Le schma multiplicatif (cf. Graphique 3) rend compte de sries chronologiques dont l'amplitude
du profil saisonnier volue au cours du temps proportionnellement la valeur de la tendance. Ce
schma se ramne au prcdent par passage au logarithme (Log (ab) = Log a + Log b)
Log(xt) = Log (Tt St Ct Rt) = Log Tt + Log St + Log Ct + Log Rt
Le but est d'estimer la tendance long terme de la chronique l'aide d'une droite (ou par un
polynme de degr plus lev) estime par un ajustement des moindres carrs. La technique des
Moindres Carrs Ordinaires (MCO) fournit non seulement les estimateurs de a1 et a0
respectivement nots 1 et 0, mais aussi les carts-types des coefficients et permet ainsi deffectuer
les tests associs (tests des paramtres cf. chapitre 3). Cette mthode postule des paramtres a1 et a0
constants dans le temps et la prvision porte le nom dextrapolation de la chronique. Elle reste utile
pour estimer les tendances lourdes des phnomnes conomiques, toutes choses tant gales
par ailleurs .
(x t x)(t t )
a1 = t =1
t= n
a 0 = x a1 t
n = nombre d'observations.
h = horizon de prvision
Les tableurs fournissent directement, par lappel de fonctions statistiques, les estimations de
cette droite de tendance. Pour un exemple dutilisation cf. Fichier Web.
25000
20000
15000
10000
5000
0
Ann1-J
Ann2-J
Ann3-J
Ann4-J
N
N
S
S
M
VENTES TENDANCE
Le choix du degr de polynme dpend de plusieurs critres, dont l'horizon de prvision, les
ruptures de tendance dans la vie du produit et l'historique disponible. Les fonctions du tableur
(insertion dune courbe de tendance) permettent destimer diffrentes formes de fonctions.
La saisonnalit des ventes dun article cache la vritable volution des ventes, les ventes dune
srie brute ne sont donc pas interprtables.
Par ailleurs, il est plus facile de prvoir les ventes hors phnomnes saisonniers :
la tendance vraie peut tre calcule,
limpact rel des facteurs explicatifs (publicit, promotion ...) peut tre mis en vidence.
Soit MJO le nombre moyen de jours ouvrables, par mois dans l'anne (environ 21).
avec :
x t observation du mois t pour la srie brute,
NJO nombre de jours ouvrables pour le mois t.
Dans le cas d'un schma additif, les coefficients sont exprims dans la mme unit que la
chronique ; par exemple pour une srie de livraison d'acier en millier de tonnes, si le coefficient du
mois d'aot est de 125 cela signifie qu'au mois d'aot on livre en moyenne 125 milliers de tonnes
d'acier en moins. Dans ce schma danalyse, les coefficients saisonniers ne tiennent donc pas
compte de la tendance de la srie.
La somme des coefficients doit tre gale zro afin de respecter le principe de la conservation
des aires.
Dans le cas d'un schma multiplicatif, les coefficients saisonniers sont des pourcentages (par
exemple, si le coefficient du mois d'aot est de 0,82 en moyenne on livre 18 % en moins en aot).
Dans ce schma danalyse, les coefficients saisonniers intgrent donc la tendance de la srie. Cest
le schma utilis de manire classique.
La somme des coefficients est gale au nombre de facteurs saisonniers (la moyenne8 doit tre
gale 1) : dans un cadre mensuel la somme est gale 12, pour une srie trimestrielle la somme
est gale 4 afin de respecter le principe de la conservation des aires.
8
Cest, en fait, le produit des coefficients saisonniers qui doit tre gal 1, cette approximation est valable si les
coefficients saisonniers ne sont pas trop disperss.
Rgis Bourbonnais - Prvision des ventes
faibles amplifie le mouvement saisonnier et peut engendrer une srie CVS comprenant des valeurs
aberrantes.
Un mouvement saisonnier est rptitif dune anne sur l'autre, et doit se rpter lidentique. Il
nous semble donc impropre de calculer des coefficients diffrents par anne.
Cependant, dans certaines circonstances o une rflexion conomique suggre une volution des
comportements, il peut tre intressant dintgrer une saisonnalit glissante.
En calculant un coefficient pour chaque mois, le risque d'incorporer une partie de bruit dans
la saisonnalit s'intensifie. En effet, la distinction entre saisonnalit et rsidu sera plus difficile
effectuer en l'absence d'une contrainte de rigidit des coefficients saisonniers. Par exemple si, pour
des raisons climatiques, une anne a t particulirement propice la consommation de bire, une
saisonnalit glissante rpercutera cette saisonnalit lanne suivante sans aucune raison a priori, ne
connaissant pas la temprature lavance.
Un autre risque mrite dtre soulign : la confusion possible entre la saisonnalit relle et une
saisonnalit fictive cre par lentreprise. Il sagit des entreprises effectuant la mme priode de
chaque anne des promotions ou des variations de tarif. Le calcul des coefficients saisonniers
attribue la saisonnalit cette sur-vente due la politique volontariste de lentreprise. Un
problme surgit alors lorsque lentreprise modifie la date des promotions ... Dans ce cas,
lutilisation des coefficients saisonniers glissants permet dintgrer plus rapidement cette
modification.
Sauf, rflexion marketing motivant une volution ou modification prvues des habitudes des
consommateurs, on utilise des coefficients saisonniers fixes.
d) Mthodes de calcul
Il n'existe pas de mthode parfaitement satisfaisante d'estimation des coefficients saisonniers.
Quelle que soit la mthode retenue, le risque d'incorporer dans la saisonnalit des fluctuations dues
des valeurs erratiques ou des habitudes promotionnelles est toujours prsent.
Cependant, le cas le plus classique consiste calculer des coefficients saisonniers fixes selon un
schma multiplicatif.
Les coefficients saisonniers sont lgrement diffrents selon la mthodologie suivie. Nous allons
prsenter deux exemples de calcul partir du mme historique (il sagit des ventes dun produit
festif, donc fortement saisonnier) en explicitant les diffrentes phases.
Les Tableau 4 et Tableau 5 illustrent le calcul des coefficients saisonniers selon un schma
additif et des coefficients fixes.
Etape 1 : Estimer la tendance par une moyenne mobile9 dordre 12 (colonne MM12).
9
Nous pouvons aussi calculer la tendance laide dune droite de rgression sur le temps.
Rgis Bourbonnais - Prvision des ventes
En appliquant la formule prsente en 1.1, nous ne pouvons pas calculer les six premires
valeurs de MM12 (de janvier juin de lanne 1), ainsi que celles de la fin de lhistorique (juillet
dcembre de lanne 3). MM12 ne contient plus de composante saisonnire.
MM12 J-Anne2 = (0,5 352,30 + 182,10 + 522,20 + ... + 398,6 + 0,5 421,7) / 12 = 517,20
Nous calculons les carts observs entre la srie brute et la moyenne mobile :
et = xt MM12t
Etape 3 : Rassembler les carts relatifs aux mmes mois pour les diffrentes annes et calcul de
la moyenne.
Dans le Tableau 5, nous calculons dans la premire colonne les coefficients saisonniers
provisoires. Il sagit de rassembler les carts relatifs au mme mois et de calculer la moyenne de
ces carts, ces nombres sont des coefficients saisonniers provisoires, car leur somme nest pas
gale 0.
Les coefficients saisonniers sont ensuite norms afin que leur somme soit nulle.
La srie CVS est calcule par diffrence entre la srie brute et le coefficient saisonnier du mois
considr.
Pour le mois de janvier de lanne 2, la vente CVS est gale : 263,90 ( 205,57) = 607,17
1600.00
1400.00
1200.00
1000.00
800.00
600.00
400.00
200.00
0.00
F
D
Anne 1-J
Anne 2-J
Anne 3-J
Le Tableau 6 prsente le calcul des coefficients saisonniers partir du mme historique que
prcdemment, selon un schma multiplicatif et des coefficients glissants.
Nous sommes en schma multiplicatif, nous effectuons donc le rapport entre la srie brute et la
moyenne mobile.
S tP = x t / MM12t
En ce qui concerne les six premiers mois et les six derniers mois, la moyenne mobile dordre 12
ne peut pas tre calcule. Afin de complter cette colonne, on intgre la valeur du mme mois de
lanne suivante pour les six premiers mois et la valeur du mme mois de lanne prcdente pour
les six derniers mois.
La srie CVS est calcule par le rapport entre la srie brute et le coefficient saisonnier du mois
considr.
Pour le mois de fvrier de lanne 2, la vente CVS est gale : 289,90 / 0,59 = 494,37
C) Analyse de saisonnalit selon un schma multiplicatif et des coefficients fixes (Fichier Web).
Le lecteur analysera lui-mme les rsultats partir du fichier Excel.
1600
1400
1200
1000
800
600
400
200
0
S
S
J
N
M
M
Anne 1-J
Anne 2-J
Anne 3-J
Anne 4-J
VENTES PREV
Pour rpondre cette question, nous recourons un test de Fisher expos ci-aprs.
a) Calculer la somme des carrs des carts du modle avec tendance simple.
Estimation de la droite de tendance : Tt = 1 t + 0 , puis calcul de :
n
U* = (x - T ) t t
t =1
b) Calculer la somme des carrs des carts du modle avec tendance et saisonnalit.
Estimation des coefficients saisonniers St , puis calcul de :
n
U** = (x - (T
t =1
t t S t))
Pour U**, le nombre de degrs de libert est donc ddlU** = n 2 11 car nous avons estim
deux paramtres a0 et a1 et 11 coefficients saisonniers (le douzime se dduit des onze autres
daprs le principe de la conservation des aires).
Si F* > F lu alors la srie est saisonnire, sinon la srie n'est pas saisonnire.
Dans le cas de chroniques relativement longues (4 ans en donnes mensuelles), F lu peut tre
approch par 2 ; cela vite une lecture systmatique de la table pour un risque d'erreur trs faible.
Le Tableau 7 illustre la mthode de calcul.
10
La notion de degrs de libert correspond au nombre de valeurs restant rellement disposition aprs une
procdure destimation statistique. Si un chantillon comprend 10 observations et quon dispose en plus de la moyenne
de cet chantillon, on ne peut choisir librement les valeurs que pour 9 de ces observations, la dixime se dduisant de la
valeur de la moyenne. Le nombre de degrs de libert est donc de n 1 = 9.
11
Les tables statistiques sont en fin douvrage.
Rgis Bourbonnais - Prvision des ventes
Tableau 7 Test de dtection de saisonnalit
DATES VENTES Tt ECART CARRE Vt/Tt St ECART CARRE
Anne 1-J 401,60 418 269 0,96 0,79 5330
F 395,70 426 889 0,93 0,76 5174
M 451,00 433 324 1,04 0,85 6722
A 427,60 441 167 0,97 0,79 6042
M 496,80 448 2381 1,11 0,91 8156
J 467,70 456 149 1,03 0,84 7229
J 352,30 463 12256 0,76 0,62 4102
A 182,10 471 83177 0,39 0,32 1096
S 522,20 478 1953 1,09 0,89 9012
O 687,20 486 40682 1,42 1,16 15606
N 1080,3 493 344920 2,19 1,79 38567
D 1391,6 500 794059 2,78 2,27 63996
Anne 2-J 263,90 508 59584 0,52 0,58 998
F 289,90 515 50894 0,56 0,63 1205
M 337,00 523 34595 0,64 0,72 1628
A 374,00 530 24491 0,71 0,79 2005
M 292,70 538 60169 0,54 0,61 1228
J 398,60 545 21577 0,73 0,82 2278
J 421,70 553 17237 0,76 0,85 2550
A 173,80 560 149529 0,31 0,35 433
S 522,10 568 2106 0,92 1,03 3908
O 642,40 575 4477 1,12 1,25 5917
N 984,20 583 160973 1,69 1,89 13887
D 1307,6 590 514254 2,21 2,48 24513
Anne 3-J 393,40 598 41854 0,66 0,74 2451
F 316,20 605 83684 0,52 0,59 1583
M 428,60 613 33996 0,70 0,79 2909
A 467,60 620 23372 0,75 0,85 3462
M 501,00 628 16123 0,80 0,90 3975
J 487,40 635 21927 0,77 0,86 3762
J 463,30 643 32283 0,72 0,81 3399
A 165,90 650 234812 0,26 0,29 436
S 595,10 658 3953 0,90 1,02 5608
O 698,10 665 1065 1,05 1,18 7717
N 1012,10 673 115009 1,50 1,69 16221
D 1380,00 680 489343 2,03 2,28 30157
F* = ((U* U**)/11) / (U** / (n 13)) = ((3478534 313262)/11) / (313262/ (36 13))= 21,13
F lu 11 et 23 degrs de libert = 2,24
La srie est donc saisonnire (ce qui se distingue lexamen du Graphique 5).
Cette composante reprsente les fluctuations erratiques de la chronique dues aux accidents
conjoncturels. Il est intressant de savoir s'il s'agit de phnomnes purement alatoires au sens
gaussien du terme (esprance mathmatique nulle, symtrie de la distribution par rapport la
moyenne, constance de la variance), ou s'il est possible de trouver une loi de reproduction du
processus. Nous pouvons distinguer les deux termes, rsiduel et alatoire, de la faon suivante :
facteur rsiduel : il est possible de trouver une loi de reproduction de cette composante,
facteur alatoire : il n'est pas possible de l'expliquer.
En vue d'tablir avec certitude dans lequel des deux cas nous nous situons, le calcul du
corrlogramme 13 (ou fonction d'autocorrlation) fournit une indication sur la nature de cette
composante. Nous pourrons employer alors le terme de facteur rsiduel ou le terme de facteur
alatoire de faon adapte (c'est--dire un processus pour lequel on ne peut plus rien expliquer).
12
Cf. Bourbonnais et Terraza (1998) Chapitre 4.
13
Le calcul du corrlogramme et son interprtation sont examins au chapitre suivant.
Rgis Bourbonnais - Prvision des ventes
Chapitre 3
1.2. Formulation
Supposons que x t reprsente les ventes dun produit quelconque la date t. Ces ventes x t peuvent
tre considres comme le rsultat dune combinaison linaire infinie de ses valeurs passes, le
poids (ou linfluence) du pass sur le prsent tant dcroissant avec son anciennet.
x$ t = St = x$ t 1 + (x t x$
t 1 ) [1]
Le lissage apparat comme le rsultat de la dernire valeur lisse corrig par une pondration de
lcart entre la ralisation et la prvision. Nous retrouvons le troisime principe de ladaptation du
lissage lerreur de prvision.
x$ t = x t + (1 ) xt 1 [2]
Sous cette forme, le lissage apparat comme tant une moyenne pondre de la dernire
ralisation et de la dernire valeur lisse.
La relation [2] peut tre dveloppe en remontant dans le temps (t 1, t 2,..., t n,..., 0) et
laisse apparatre que la nouvelle valeur lisse x$ t est une combinaison linaire de toutes les
observations du pass, affectes d'un poids dcroissant avec l'ge. Les poids sont de plus en plus
faibles au fur et mesure que l'on s'loigne de lobservation actuelle.
Pour = 0,30 la dernire valeur x t de la chronique est pondre par 0,3. L'avantdernire x t1 est
pondre par 0,21 (c'estdire que 21 % de sa valeur contribue au calcul de la prvision) et ainsi
de suite ..., partir de la huitime valeur x t8 le coefficient de pondration est infrieur 0,02.
Graphique 7 Dvalorisation de linformation avec son anciennet
Comparaison entre une moyenne classique et trois valeurs de
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
0 -1 -2 -3 -4 -5 -6 -7 -8 -9 -10
Temps
MOYENNE 0,3
0,6 0,8
1,20
Rapport des carts-types srie lisse sur srie brute
1,00
ALPHA=0,6
Rle de filtrage du lissage
0,80
0,60 ALPHA=0,3
ALPHA=0,2
0,40
0,20
0,00
0,00 2,00 4,00 6,00 8,00 10,00 12,00 14,00 16,00 18,00 20,00
Age moyen de l'information
ALPHA
Nous reviendrons en dtail la section 5 sur le choix optimal de la (ou des) coefficient (s) de
lissage.
x$ t = St = x t + (1 ) x t 1
avec x1 = x 1 pour initialiser
et la prvision calcule en n lhorizon de h priodes est gale :
x n + h = x n h
Nous observons que la prvision est constante quel que soit lhorizon.
Le Tableau 9 illustre un calcul.
On initialise x$1 = x 1 = 30
Pour t = 2 (prvision calcule en t = 1 pour t = 2) nous avons :
x$ 2 = 0,3 x 2 + 0,7 x$1 = 0,3 40 + 0,7 30 = 33 = x1
Nous vous proposons titre dexercice de charger le fichier Web et deffectuer la simulation
demande.
La simulation a montr que si la srie est affecte dune tendance, le lissage exponentiel simple
est dfaillant. Or, en prvision des ventes, la plupart des sries sont affectes dune tendance la
hausse ou la baisse. Dans la pratique, le lissage simple nest pas utilis. Cest pourquoi on prfre
utiliser le lissage exponentiel double qui permet dintgrer ces phnomnes de tendance.
14
Cf. Bourbonnais et Terraza 1998, page 55.
Rgis Bourbonnais - Prvision des ventes
a1t = 1 ( St SSt )
a 0 t = 2S SS
t t
Le Tableau 10 prsente le calcul d'une prvision par lissage exponentiel double avec = 0,3.
Les Graphique 9 et
Graphique 10 illustrent une prvision par lissage exponentiel, sur les donnes, du Tableau 10
avec = 0,1 et = 0,9 (la prvision est fonction du poids accord au pass rcent et lointain).
Toutes les explications de calcul sont indiques sur les cellules du fichier.
Rgis Bourbonnais - Prvision des ventes
Graphique 9 Prvision par lissage exponentiel avec = 0,1
11000
10000
9000
8000
7000
6000
5000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48
13000
12000
11000
10000
9000
8000
7000
6000
5000
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48
Formulation
Lissage de la moyenne : a0t = x t + (1 ) (a0t1 + a1t 1 )
(a0t1 + a1t 1 reprsente la nouvelle moyenne lisse en t)
Lissage de la tendance : a1t = (a0t a0t1 ) + (1 ) a1t1
Initialisation (pour t = 1)
Initialisation de la moyenne lisse : a0 1 = x 1
Initialisation de la tendance : a1 1 = 0
Un exemple complet de calcul est prsent, par la suite, partir du modle de HoltWinters.
15
Si la srie nest pas saisonnire, on utilise alors le modle de Holt deux lissages : moyenne et tendance.
Rgis Bourbonnais - Prvision des ventes
Formulation
Initialisation de la saisonnalit
Les coefficients saisonniers pour la premire anne sont estims par la valeur observe en t (x t)
divise par la moyenne x des p premires observations (celles de la premire anne).
St = xt / x pour t = 1, p
Initialisation de la tendance : a1 p = 0
Exemples de calculs16 .
16
Des lgres diffrences peuvent apparatre entre les valeurs calcules et les valeurs du tableau du fait que le
tableur utilise un nombre de dcimales important.
Rgis Bourbonnais - Prvision des ventes
Ici, en rgime permanent (lhorizon h est choisi gal 1) pour la ligne de septembre de lanne 2
:
a0 sepAnne 2 = 0,3 (522,1 / 0,91) + 0,7 (512,9 0,3) = 530,2
a1 sepAnne 2 = 0,1 (530,2 512,9) + 0,9 0,3 = 1,5
S sepAnne 2 = 0,2 (522,1 / 530,2) + 0,8 0,91 = 0,93
x sepAnne 2 = (512,9 + ( 0,3) 1) 0,91 = 468,51 (calcule en aot 1992, avec h = 1).
La prvision pour septembre de lanne 4 (horizon h = 9), calcule en dcembre de lanne 3, est
gale : x sepAnne 4= (583,6 + 1,9 9) 0,94 = 563,23
5.2. Valeur de qui minimise la somme des carrs des erreurs de prvision
C'est la technique de calcul la plus couramment employe, son principe est simple : pour un
intervalle donn de valeurs de (1 ; 2 ) avec un pas assez fin (0,05 par exemple), les
prvisions sont simules et la somme des carrs des erreurs de prvision est alors calcule. Nous
retenons la valeur de qui rend minimum la somme des carrs des carts. Cette technique peut tre
gnralise pour la dtermination des trois coefficients (, , ). Lutilisation du SOLVEUR sur
les tableurs permet sans trop de difficults de rsoudre ce problme.
On cherche la valeur du coefficient de lissage qui minimise la somme des carrs des erreurs de
n n
prvision passe : Min e = ( x
2
t t x$t ) 2 en faisant varier la valeur de tel que :
t =1 t =1
1 = 0,1 ; 2 = 0,6 ; pas = 0,05
Soit = 0,1 ; = 0,15 ; = 0,20 ; ; = 0,6
n
Le coefficient retenu est celui qui correspond au minimum de (x
t =1
t x t ) 2 .
A titre dillustration, recherche des coefficients de lissage optimaux dans un modle de Holt
Winters cf. Fichier Web.
17
Si tant est quelle puisse exister, cest--dire quun critre stable doptimalit puisse tre dfini. A chaque
nouvelle ralisation, la restimation des paramtres tenant compte de lerreur de prvision dfinit un nouveau
coefficient de lissage. Il sagit alors dune course poursuite entre les prvisions et lerreur de prvision, sans
possibilit danticipation de la nouvelle structure de la chronique. On doit donc parler de valeur optimale instantane.
Rgis Bourbonnais - Prvision des ventes
Graphique 11 Exemple de prvision avec = 0,1 et = 0,5
900
800
700
600
500
400
300
200
100
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48
Sur les diffrents graphiques, les croix reprsentent les ralisations x t ; les points reprsentent les
prvisions x$ t .
L'cart entre prvision et ralisation (cf. Graphique 12) l'instant t est la premire variable qui
vient l'esprit pour juger de la performance du systme de prvision : EPS t = x t x$ t
Graphique 12 Indicateur d'cart instantan
x
xt
x$ t
SUMEPS crot t
EPS i
Il est dfini l'instant t par : MADt = i =t T +1
T
Il s'agit d'une caractristique de dispersion : MADt est l'analogue d'un cart type instantan des
carts de prvision.
Si les carts EPS deviennent de plus en plus importants, la valeur de MAD s'accrot. Une erreur
de prvision anormalement leve entrane une augmentation instantane de la valeur MAD, cela
correspond souvent une observation aberrante (ou anormale) (cf. Graphique 15).
MAD crot t
Un cart instantan EPS t ne peut se comprendre que par rapport aux fluctuations moyennes de la
srie (un cart instantan de 5 10 % peut paratre satisfaisant pour une srie dont les oscillations
sont violentes, mais anormal si la srie est stable).
C'est pourquoi, il est souhaitable de comparer systmatiquement EPS et SUMEPS l'indicateur
d'cart moyen MAD, ce qui conduit deux signaux de rgulation NF et AWS.
SUMEPSt
Il est dfini par : AWSt =
MADt
Dans le cas d'un changement de tendance, la somme algbrique des carts de prvision est de
mme signe sur plusieurs priodes : la prvision ne s'ajuste pas convenablement au niveau des
ralisations, le filtre SUMEPS cumule ces carts, |AWS| augmente.
5.3.3 Application
x Stabilit
Stabilit Changement de tendance
EPS = 0 t
T T+1 T+2 T+3 T+4
SUMEPS
NF NF stable NF = 0
MAD AWS AWS AWS
NF
AWS
augmente
inchang
revient la normale
x Stabilit
Stabilit Accident
T T+1 T+2 t
T+3 T+4
NF
NF grand NF = 0
AWS AWS = 0 AWS = 0
Procdure oprationnelle
Lindicateur NF est donc spcifique dune valeur anormale (en cas daugmentation de NF, il
convient de diminuer le coefficient de lissage) et lindicateur AWS permet de dtecter les ruptures
de tendance (en cas daugmentation de AWS, le coefficient de lissage doit tre augment).
La question se pose alors de combiner dune manire pertinente ces deux informations.
La constitution du tableau de dcision (cf. Tableau 12) permet de rpondre ce problme. A
partir de seuils exprimentaux18 , nous dfinissons trois classes pour les valeurs de NF (en ligne) et
AWS (en colonne) :
NF est faible si sa valeur est infrieure 1,5 le code NF est alors 1,
NF est moyen si sa valeur est comprise entre 1,5 et 3 le code NF est 2,
NF est fort si sa valeur est suprieure 3 le code NF est 3,
AWS est faible si sa valeur est infrieure 3 le code AWS est 3,
AWS est moyen si sa valeur est comprise entre 3 et 5 le code AWS est 2,
18
Cest--dire issus dexpriences en entreprise.
Rgis Bourbonnais - Prvision des ventes
AWS est fort si sa valeur est suprieure 5 le code AWS est 1.
Puis la valeur du coefficient se dduit directement de cette valeur selon lquation empirique
suivante :
t = 0,7 0,1 SOMME
Le Tableau 13 prsente en fonction des diffrentes valeurs de la somme des codes NF et AWS la
valeur dduite de .
SOMME
6 0,1
5 0,2
4 0,3
3 0,4
2 0,5
Dans le cas dun modle de Holt ou Holt Winters, nous sommes confronts au pilotage de deux
ou trois coefficients. La stratgie est alors la suivante :
le coefficient de lissage de la moyenne est pilot comme indiqu ci-dessus,
le coefficient de lissage de la tendance , sur lequel on dsire tre lgrement moins ractif
que celui de la moyenne, se dduit de la valeur de par lquation t = t 0,05,
enfin, le coefficient de la saisonnalit, dans le cas du modle de HoltWinters, reste statique
et gal 0,2 car les ruptures de tendance ou les valeurs anormales naffectent pas la composante
saisonnire.
A titre dillustration : Fichier Web (pilotage dun coefficient dans un modle de lissage double).
L'avantage des mthodes fondes sur le lissage exponentiel rside dans leur grande facilit de
mise en uvre et leur simplicit relative de calcul. En revanche, nous pouvons leur reprocher une
rusticit qui s'avre suffisante en cas de chronique assez peu fluctuante, mais devient vite gnante si
la srie est fortement chahute. De surcrot, par son inspiration mme, l'environnement extrieur
n'est pas pris en compte et n'a donc aucun effet. Cependant, dans certains cas il est possible
d'intgrer, de manire rudimentaire, des facteurs explicatifs qui viennent alors a priori amliorer la
prvision obtenue (voir chapitre 7).
Avantages Inconvnients
Simplicit des calculs pour l'laboration des Mthode purement extrapolative, qui ignore les
prvisions en rgime permanent vnements exognes
Systme adaptatif avec calculs itratifs, Choix dlicat de la constante de lissage
facilement ralisable sur tableur
Rapidit de calcul Systme ragissant avec retard
Matrise du fonctionnement par l'utilisateur
1. La corrlation et le corrlogramme
Deux concepts doivent tout d'abord tre explicits : la corrlation et le corrlogramme.
1.1. La corrlation
Lorsque deux phnomnes ont une volution commune, ils sont dits corrls . La corrlation
simple mesure le degr de liaison existant entre ces deux phnomnes reprsents par des variables
x et y.
Nous pouvons distinguer la corrlation linaire, lorsque tous les points du couple de valeurs (x,
y) des deux variables semblent aligns sur une droite, de la corrlation non linaire lorsque le
couple de valeurs se trouve sur une mme courbe d'allure quelconque.
Deux variables peuvent tre :
en corrlation positive, on constate une augmentation (ou diminution, ou constance)
simultane des valeurs des deux variables ;
en corrlation ngative, lorsque les valeurs de l'une augmentent, les valeurs de l'autre
diminuent ;
non corrles, lorsquil n'y a aucune relation entre les variations des valeurs de l'une des
variables et les valeurs de l'autre.
t= n
Cov ( x, y )
(x x )(y y )
t t
xy = = t= 1
x y t= n 2 2
t =n
(x x ) ( y y)
t =1 t =1
t t
t= 1 t =1 t =1
=
t= n t= n t =n t =n
n x t2 ( x ) 2 t n y t2 ( y ) 2 t
t =1 t =1 t= 1 t =1 )
avec :
x t et yt = valeurs des deux historiques linstant t,
Cov(x,y) = covariance entre x et y,
x et y = cart-type de x et cart-type de y,
x et y = moyenne de x et moyenne de y,
n = nombre d'observations.
n2
Si t cal > t lu lu dans une table de Student19 n 2 degrs de libert (si le nombre dobservations
est suprieur 30, on peut prendre par approximation t lu =2), le coefficient de corrlation est
significativement diffrent de 0 ; dans le cas contraire, l'hypothse d'un coefficient de corrlation
nul est accepte.
Le Tableau 15 prsente un exemple de calcul dun coefficient de corrlation entre les ventes
trimestrielles dun produit (x t) et les dpenses publicitaires (yt) trimestrielles.
19
Les tables statistiques sont en fin douvrage.
Rgis Bourbonnais - Prvision des ventes
Tableau 15 Exemple de calcul dun coefficient de corrlation
Trimestre x y x y xy
0 ,89
t cal = = 5,49 > t lu = 2,306 (8 degrs de libert et = 0,05).
1 0 ,89 2
10 2
La corrlation est donc significative.
Retards Autocorrlation
1 2 3 ... t ... n 0 r0 = 1
1 2 3 t-2 n-2 2 r2
t-k ...n-k k rk
... ...
t-K ...n-K K rK
2 k rK
0 k
1 rk K
r2
-1
( x t x 1)( x t k x 2 ) xx t t k ( n k ) x1 x 2
rk = t = k +1
= t = k +1
n 2 2 2
n n n
(x
t = k +1
t x 1) 2 (x
t = k +1
t k x 2) 2 x t ( n k ) x 1 x t k (n k ) x 2
t = k +1 t = k +1
2
n n
1 1
x1 =
n k
x t x2 =
nk
x t k
t =k +1 t = k +1
Le calcul de rk permet de dceler des liaisons internes la srie. Par exemple, une srie
saisonnire, avant dsaisonnalisation, montre une valeur leve pour r12 . A travers la connaissance
des valeurs de la fonction d'autocorrlation, le processus de reproduction interne la srie peut tre
dcel. Pour toutes les mthodes endognes, il s'agit donc d'une tape ncessaire, pralable la
modlisation.
x1 = 1713,2 et x2 = 1545,8
n
( x x )( x
t 1 t 2 x2 )
901668,23
r2 = t = k +1
= = -0,13
(x x ) (x
n n
5899300,68 7995376,17
t 1 2 t 2 x 2)2
t = k +1 t = k +1
rk
Le t calcul est gal pour n = 10 et rk = 0,13 : t c = n 2 = 0,38 < t10
0, 05 / 2
2 = 2,306. Le
1 r k
2
Dans une approche endogne, la premire tape consiste toujours dcomposer une chronique
en trois composantes fondamentales : tendance, saisonnalit, rsidu, puis les extrapoler
indpendamment les unes des autres et enfin les agrger en vue d'obtenir une prvision en termes
directement exploitables.
L'extrapolation de la tendance et de la saisonna lit ne pose pas de problme particulier ; en ce
qui concerne l'extrapolation du facteur rsiduel, de nombreuses mthodes existent, toutes fondes
sur l'tude pralable du corrlogramme.
Si au lieu de traiter le facteur rsiduel, on s'intresse la srie dsaisonnalise (tendance et
rsidus), l'allure du corrlogramme est alors typique d'une chronique non stationnaire (la moyenne
de la srie est instable au cours du temps, car la tendance est incluse dans la srie, cf. Graphique
19.) et nous ne pourrons obtenir aucune information exploitable. C'est pourquoi il est impratif
d'effectuer les calculs de la fonction dautocorrlation sur la srie hors tendance et saisonnalit.
Rgis Bourbonnais - Prvision des ventes
Graphique 19 Corrlogramme d'une srie non stationnaire ( trende )
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Comme nous l'avons voqu plus haut, il est possible qu'aucun terme du corrlogramme ne soit
significativement diffrent de zro. Ceci laisse prsager un processus purement alatoire et donc,
par dfinition, imprvisible. La prvision ne peut alors tre calcule qu' l'aide d'une extrapolation
de la tendance ou d'un lissage exponentiel. Dans le cas contraire, Box et Jenkins proposent une
mthodologie permettant de dterminer le processus de reproduction sous-jacent la srie de vente.
20
Dans le cadre de cet ouvrage, nous nous limitons des dveloppements succincts, le lecteur intress par la
mthode de Box et Jenkins peut se rfrer Bourbonnais et Terraza (1998).
21
Box et Jenkins (1976).
Rgis Bourbonnais - Prvision des ventes
La Fonction Autocorrlation Partielle (note FAP) est une notion plus complexe que la FAC. Il
sagit de la corrlation entre xt et xt-k , linfluence des variables x t-k-i pour (i < k) ayant t retire.
Les modles AR
La partie autorgressive dun processus, note AR, est constitue par une combinaison linaire
finie des valeurs passes du processus. Le processus AR(p) est donc dfini partir de la formule
gnrale : xt = 1 xt 1 + ...+ p xt p + a t avec at un processus de bruit blanc gaussien ; par exemple :
AR(1) : xt = 1 xt 1 + at ; AR(2) : xt = 1 xt 1 + 2 xt 2 + at ; etc.
Un processus AR(p) a les caractristiques suivantes :
la FAC est une exponentielle et/ou une sinusode amortie,
seuls les p premiers termes de la FAP sont significativement diffrents de 0.
Les modles MA
La partie moyenne mobile, note MA, est constitue dune combinaison linaire finie en t des
valeurs passes dun bruit blanc. Un processus MA(q) est dfini partir de la formule :
xt = at 1at 1 ....q at q . avec at processus de bruit blanc gaussien ; par exemple :
MA(1) : xt = at 1a t 1 ; MA(2) : xt = a t 1 a t 1 2 a t 2
Un processus MA(q) a les caractristiques suivantes :
seuls les q premiers termes de la FAC sont significativement diffrents de 0,
la FAP est une exponentielle et/ou une sinusode amortie.
Nous pouvons constater la symtrie parfaite des comportements de la FAC dun AR(p) et de la
FAP dun MA(q) dune part, et de la FAP dun AR(p) et de la FAC dun MA(q) dautre part. En
effet, nous pouvons dmontrer lquivalence suivante : AR(1) = MA() et MA(1) = AR().
AR(1) Dcroissance exponentielle(1 > 0) ou Pic significatif pour le premier retard: Positif si 1
sinusodale amortie (1 < 0) > 0 et ngatif si 1 < 0, les autres coefficients nuls
pour des retards > 1
AR(2) Dcroissance exponentielle ou sinusodale selon Pics significatifs pour le premier et second retards,
les signes de 1 et 2 les autres coefficients sont nuls pour des retards > 2
AR(p) Dcroissance exponentielle et/ou sinusodale Pics significatifs pour les p premiers retards, les
autres coefficients sont nuls pour des retards > p
MA(1) Pic significatif pour le premie r retard : positif si Dcroissance exponentielle(1 > 0) ou sinusodale
1 < 0 et ngatif si 1 > 0. Les autres coefficients amortie (1 < 0)
sont nuls pour des retards > 1
MA(2) Pics significatifs pour le premier et second Dcroissance exponentielle ou sinusodale selon les
retards. Les autres coefficients sont nuls pour signes de 1 et 2
des retards > 2
MA(q) Pics significatifs pour les q premiers retards. Les Dcroissance exponentielle et/ou sinusodale
autres coefficients nuls pour des retards > q
ARMA(1, 1) Dcroissance gomtrique partir du premier Dcroissance exponentielle(1 > 0) ou sinusodale
retard, le signe est dtermin par 1 1 amortie (1 < 0)
ARMA(p, q) Dcroissance exponentielle ou sinusodale Dcroissance exponentielle ou sinusodale amortie
amortie tronque aprs (q p) retards tronque aprs p q retards
Conditions d'utilisation
Les modles AR, MA, ARMA ne sont reprsentatifs que de chroniques :
stationnaires en moyenne (c'est--dire hors tendance),
corriges des variations saisonnires.
Lidentification
Estimation et validation
Lestimation des paramtres du modle est fonde sur la maximisation dune fonction de
vraisemblance. La validation de la reprsentation porte sur :
Les coefficients du modle qui doivent tre significativement diffrents de 0 (le test de Student
s'applique de manire classique). Si un coefficient n'est pas significativement diffrent de 0, il
convient d'envisager une nouvelle spcification liminant l'ordre du modle AR ou MA non valide.
L'analyse des rsidus (cart entre la srie observe et la srie prvue) permet de vrifier quils
sont :
de moyenne nulle ; dans le cas contraire, il convient d'ajouter une constante au modle ;
reprsentatif dun bruit blanc. Si le rsidu n'est pas un bruit blanc, cela signifie que la
spcification du modle est incomplte et qu'il manque au moins un ordre un processus.
La phase de validation du modle est trs importante et ncessite le plus souvent un retour la
phase d'identification.
Prvision
Lorsque le modle est valid, la prvision peut alors tre calcule un horizon h de quelques
priodes, limit par la variance de l'erreur de prvision qui augmente rapidement avec l'horizon.
A ltape de la transformation, plusieurs techniques ont pu tre employes afin de stationnariser
le processus gnrateur pour quil soit identifiable dans la classe des processus ARMA. Il est
ncessaire, lors de ltape de prvision, de prendre en compte la ou les transformations retenues
( recoloration de la prvision ).
Si on a utilis la rgression afin de retirer une ou plusieurs composantes dterministes estimes
par les Moindres Carrs Ordinaires, ces dernires sont extrapoles jusqu lhorizon prvisionnel
choisi puis combines aux valeurs prvisionnelles de lARMA.
Si la srie a t pralablement dsaisonnalise, il convient de re-saisonnaliser la srie des
ventes afin dobtenir une prvision en termes bruts.
Ces modles de type ARIMA connaissent un grand succs et de nombreux raffinements dans
leur spcification (ARCIMA, ARFIMA ...) sont appliqus au domaine particulier de la finance. Il
est noter quon dmontre que le lissage exponentiel est un cas particulier de modle ARIMA.
Srie xt
Analyse du graphique
et du corrlogramme
Analyse de saisonnalit
Test de Dickey-Fuller
Srie stationnaire yt
Test de Student
Les coefficients non significatifs sont supprims
Oui Non
ajout d'un ordre p ou q
Recoloration de la srie
(exponentiel, saisonnalit ...)
Les mthodes exognes apportent des lments de rponse au problme de l'anticipation des
retournements de conjoncture et de l'intgration des variables dont on sait pertinemment qu'elles
influent sur la srie prvoir.
2. L'approche exogne
La recherche d'une explication des fluctuations d'une chronique l'aide d'autres sries sert de
cadre gnral aux mthodes exognes. Dans cette partie, sont dcrits les aspects mthodologiques
fondamentaux22 ; la deuxime partie (approche sectorielle) de cet ouvrage indique les utilisations
possibles de ces techniques, partir d'exemples pratiques.
Nombre de variables conomiques sont lies entre elles. L'exemple le plus classique est celui de
la relation existant entre consommation et revenu. Nous ne retiendrons pas d'exemples de liaison
macro-conomique : ce n'est pas l'objet de cet ouvrage. Mais, l'intrieur d'un secteur d'activit,
d'un march ou d'une firme, des relations peuvent galement tre mises en vidence. Les exemples
ne manquent pas, comme nous le verrons dans les chapitres consacrs aux applications
sectorielles : ventes expliques par des logements demands, des taux dintrt, des dpenses
publicitaires, des variables climatiques, des promotions Il sagit de lensemble des donnes
suivies par les conomistes d'entreprise, les prvisionnistes et les chefs de produit.
Le but de ce qui suit est de prsenter les mthodes de rgression simple et multiple qui
permettent :
dobtenir la quantification, aussi prcise que possible, de la liaison entre la srie que l'on
cherche prvoir et la srie ou les sries explicatives,
de dterminer la prcision de cette quantification afin de savoir quelle confiance accorder aux
facteurs explicatifs.
22
Le lecteur intress par les dveloppements de lconomtrie peut se rfrer Bourbonnais (2000).
Rgis Bourbonnais - Prvision des ventes
2.1. La notion d'ajustement et le modle de rgression simple
Nous avons vu que le coefficient de corrlation donne le degr de liaison entre deux chroniques.
Une fois ce lien mis en vidence, nous pouvons quantifier la relation entre les deux variables
conomiques (les ventes et le facteur explicatif des ventes).
La formulation d'un modle simple est alors possible sous la forme : Vt = a1 x t + a0 + t
a1 et a0 sont les coefficients inconnus,
Vt est la srie des ventes ou variable expliquer,
x t est la variable explicative ou variable exogne,
t est un terme alatoire qui reprsente tout ce qui nest pas expliqu par le modle (la variable
explicative). t est gaussien c'est--dire que les hypothses habituelles sont respectes : esprance
mathmatique de l'erreur nulle (E(t) = 0), variance de l'erreur constante (V(t) = 2 ) et
indpendance des erreurs (E(t, t') = 0, pour t t').
Nous disposons de n observations.
Le principe de l'ajustement par les moindres carrs (mthode de rgression) consiste choisir
comme estimateur pour a0 et a1 celui qui minimise la somme des carrs des carts entre les valeurs
ajustes ( y t ) l'aide de la variable explicative x t, et les observations relles yt :
n n
Min 2 = Min ( yt y t ) 2
t =1 t =1
Le minimum est donn par :
t =n
(y t y )( xt x )
a1 = t =1
t= n
(x
t =1
t x )2
a 0 = y a 1 x
45
40
35
Y
30
25
20
15
15 17 19 21 23 25 27 29 31 33 35
X
L'estimation de a1 et a0 est entache d'une erreur (mesure par un cart-type). Il faut dterminer
si cette erreur d'estimation n'est pas trop importante et ne remet pas en cause le bien-fond de la
relation. Un test, dont le fonctionnement sera dtaill la partie 2.3, permet de connatre la
significativit d'un coefficient par rapport zro (un coefficient nul implique l'absence d'influence
d'une variable explicative).
Ce modle une seule variable explicative se rvle le plus souvent trop simpliste pour rendre
compte d'une ralit complexe. Il est alors souhaitable d'intgrer ce modle d'autres variables
explicatives.
yt = 1 x 1t + 2 x 2t + 3 x 3t + 0 + et
( t a )
1
( t a ) ( t a ) ( t a )
2 3 0
DW
R
n
Ce modle est limit trois variables exognes ; le dveloppement ci-dessous reste identique
dans le cas d'un nombre diffrent.
1 , 2 , 3 , 0 , valeurs estimes des coefficients du modle,
t a1 , t a2 , t a3 , t a0 ratios de Student,
DW statistique de Durbin et Watson,
R coefficient de dtermination (R = coefficient de corrlation multiple),
n nombre d'observations.
Le coefficient de chaque variable explicative (nous verrons plus loin un exemple destimation)
est en fait une variable alatoire et, ce titre, entach dune certaine erreur lors de son estimation.
Cette erreur est mesure par lcart-type du coefficient. Plus l'estimation du coefficient est
disperse (ce qui se traduit par une valeur leve de l'cart-type par rapport la valeur du
coefficient), plus l'influence de la variable explicative concerne sera douteuse. Le ratio de Student
est calcul en faisant le rapport d'un coefficient de rgression (i) et de son cart-type ( ai ). Ce
ratio suit une loi de Student ; ceci va permettre de tester si le coefficient de rgression est
significativement diffrent de zro (cest--dire si la variable est bien explicative des ventes) ou s'il
doit tre considr comme nul. Dans ce dernier cas, la variable explicative correspondante devra
tre limine de l'quation de rgression car son influence sera considre comme nulle.
Le test est men de la manire suivante :
Si ta > t lu / 2 lu dans une table de Student n k 1 degrs de libert (si le nombre
i
dobservations est suprieur 30, on peut prendre par approximation t lu =2) et pour un seuil de
confiance , le plus souvent gal 5 % (si = 0,05 on accepte de se tromper dans 5 % des cas) le
coefficient ai de la variable x i est significativement diffrent de zro ; la variable x i est bien
explicative des ventes.
Dans le cas contraire, l'hypothse d'un coefficient nul est accepte, la variable x i nest pas
explicative des ventes.
Cas particulier : en ce qui concerne le terme constant a0 , le fait quil ne soit pas
significativement diffrent de 0 na aucune importance. Dans la pratique, nous ne testerons donc
pas sa significativit par rapport 0.
(e et 1 )
2
t
DW = t =2
n
e
t =1
2
t
La table de Durbin et Watson23, laquelle il faut se rfrer pour effectuer le test, nous indique la
valeur des deux bornes d'un intervalle d1, d2 .
23
Les tables statistiques sont en fin douvrage.
Rgis Bourbonnais - Prvision des ventes
Soit DW la valeur calcule de la statistique de Durbin et Watson , la rgle de dcision est :
si DW < d1, on rejette l'hypothse d'indpendance et on admet une autocorrlation des erreurs,
si d1 < DW < d2, on est dans la zone d'indtermination des tables : il y a doute,
si d2 < DW < 4 d2, on accepte l'hypothse de l'indpendance des erreurs,
si 4 d2 < DW < 4 d1, on est dans la zone d'indtermination des tables : il y a doute,
si 4 d1 < DW, on rejette l'hypothse d'indpendance et on admet une corrlation ngative des
erreurs.
Dans la pratique le doute est interprt comme prsomption favorable d'absence
d'autocorrlation.
Le Schma 3 rsume ces rgles de dcision.
0 d1 d2 2 4 d2 4 d2 4
24
Slutzky (1937).
Rgis Bourbonnais - Prvision des ventes
Soit le modle estim suivant :
n = 54
R = 0,84
DW = 1,79
(.) = ratio de Student
La variable explicative x 2 ,t n'est pas significative, son ratio de Student (0,8) tant trs infrieur
2, en revanche, les variables x1 ,t et x 3 ,t sont significatives. La variable x 2,t doit donc tre limine de
l'quation de rgression, puis le modle restim.
2.4. Exemples destimation conomtrique laide des outils sur tableur Excel
Soit un modle conomtrique compos dune variable expliquer (les ventes) et de trois
variables explicatives (cf. Tableau 20) connues sur trois ans :
VENTES = ventes CVS de lentreprise en volume,
PROMO = les dpenses en promotion en KF,
PUB = les dpenses publicitaires en KF,
TREND = l'volution naturelle25 des ventes reprsente par une tendance linaire.
25
La croissance de la demande primaire.
Rgis Bourbonnais - Prvision des ventes
Tableau 20 Ventes, promotion, publicit
DATES VENTES PROMO PUB. TREND PREVISION
Anne 1-J 7281 597 3109 1 5571,27
F 9163 2139 267 2 7315,90
M 7769 859 3549 3 6350,85
A 8485 717 5083 4 6721,90
M 7606 2033 4051 5 8694,64
J 7364 1863 826 6 7413,00
J 6711 1393 4590 7 7981,23
A 3407 603 117 8 5229,43
S 4862 1702 3388 9 8286,45
O 11464 3891 2668 10 11841,74
N 10291 3968 2615 11 12048,06
D 9789 2867 1130 12 9777,90
Anne 2-J 8082 250 5948 13 7068,48
F 8663 342 1715 14 5890,18
M 7720 823 366 15 6342,99
A 7859 584 6005 16 7934,60
M 6936 813 115 17 6429,19
J 6292 0 0 18 5108,52
J 7572 0 2336 19 5990,40
A 3588 1077 0 20 7118,83
S 7152 874 674 21 7096,56
O 10672 2978 5 22 10525,21
N 8522 1066 7338 23 9857,17
D 8688 30 4036 24 7084,09
Anne 3-J 5772 803 5281 25 8906,04
F 7682 1984 1887 26 9853,57
M 8814 1044 115 27 7759,05
A 10864 3123 0 28 11332,27
M 5461 572 4348 29 8576,00
J 13109 4483 69 30 13844,76
J 16649 5328 5012 31 17035,95
A 12467 3890 71 32 13029,74
S 18277 6348 2128 33 17976,97
O 20836 7210 3879 34 20120,21
N 18253 3790 3782 35 14394,00
D 17483 3678 6152 36 15097,82
Anne 4-J 597 3109 37 8951,53
F 2139 267 38 10696,16
M 859 3549 39 9731,11
A 717 5083 40 10102,16
M 2033 4051 41 12074,90
J 1863 826 42 10793,25
J 1393 4590 43 11361,49
A 603 117 44 8609,69
S 1702 3388 45 11666,71
O 3891 2668 46 15222,00
N 3968 2615 47 15428,32
D 2867 1130 48 13158,16
26
Cf. Fichier Web pour utilisation de cette fonction.
Rgis Bourbonnais - Prvision des ventes
Tableau 21 Rsultat de la fonction
93,8960 0,3373 1,6922 3418
34,5297 0,14276 0,1960 731,4
0,8181 1870,1717 #N/A #N/A
47,9904 32 #N/A #N/A
503546068,6 111921350,4 #N/A #N/A
R $ #N/A #N/A
F* ddl #N/A #N/A
SCT SCR #N/A #N/A
Sur la premire ligne des Tableau 21 et Tableau 22, les valeurs des coefficients sont estimes
(attention ! les coefficients apparaissent dans lordre inverse de la slection) ; sous chaque
coefficient figure son cart-type. Le coefficient de dtermination R = 0,81 est donn
lintersection de la premire colonne et de la troisime ligne. Le nombre de degrs de libert (ddl =
nombre dobservations nombre de paramtres estims, 36 4 = 32) figure lintersection de la
colonne 2 et de la ligne 4.
Les t de Student ne sont pas fournis par la fonction mais sont calculs (rapport du coefficient sur
son cart-type) sur la dernire ligne.
(Les signes #N/A signifient que le tableur Excel na aucune valeur indiquer cet endroit).
et2
Ecart-type rsiduel : = t =1
= 1870,17
n k 1
R2 / k
Fisher empirique : F * =
(1 R 2 ) /( n k 1)
n
Somme des carrs totaux : SCT = ( yt y) 2
t =1
n
Somme des carrs des rsidus : SCR = et2
t =1
Statistiques de la rgression
Coefficient de dtermination multiple 0,90
Coefficient de dtermination R^2 0,82
Coefficient de dtermination R^2 0,80
Erreur-type 1870,17
Observations 36,00
Le modle est une combinaison des trois variables : PROMO, PUB et TREND. La plus
contributive lexplication des ventes est la Promotion (t de Student = 8,63 le plus lev), il sagit
aussi de la plus rentable, chaque KF investi en Promotion rapporte 1,69 unit de ventes, alors que
chaque KF investi en Publicit rapporte 0,34 unit de ventes.
Premire rgression :
3 2 1 0
Coefficient -0,0371 -0,3814 0,8019 32,8913
Ecart-type 0,05 0,16 0,30 11,66
Toutes les variables sont maintenant significatives (t cal > 2), le modle est valid (les variables
x 1,t et x 2,t sont slectionnes).
Etape 1 : Slection de la variable explicative la plus corrle avec la variable prvoir yt.
Nous calculons les trois coefficients de corrlation entre yt et chacune des trois variables
ainsi que son t de Student associ (cf. 1.1.1) :
x1,t x2,t x 3,t
Corrlation 0,72 -0,69 0,48
t de Student 3,88 3,61 2,05
La variable explicative x 1,t est donc retenue (coefficient de corrlation le plus lev).
Etape 2 : Estimation des deux modles avec comme premire variable explicative x 1,t puis
alternativement x 2,t et x 3,t.
yt =a1 x1 ,t + a2 x 2 ,t + a0 + t
2 1 0
-0,3281 0,7149 25,8421
0,13 0,27 6,06
yt =a1 x1 ,t + a3 x 3 ,t + a0 + t
3 1 0
0,0232 0,9272 8,6092
0,06 0,35 7,28
La deuxime variable slectionne (ici x 2,t) est celle dont le t de Student est le plus lev en
valeur absolue.
Etape 3 : Estimation dun modle avec comme variables x1,t et x 2,t (les deux premires
slectionnes) et x 3,t (la seule qui reste).
yt = a1 x 1t + a2 x 2t + a3 x 3t + a0 + t
Etape 1 : Slection de la variable explicative la plus corrle avec la variable prvoir yt.
Nous calculons les trois coefficients de corrlation entre yt et chacune des trois variables
ainsi que son t de Student associ. La variable explicative x 1,t est donc retenue (coefficient de
corrlation le plus lev).
Etape 2 : Estimation dun modle avec une variable explicative x 1,t et calcul du rsidu.
yt = 1 x 1,t + 0 + e1,t
e1,t = yt (1 x 1,t + 0 )
yt = 1,0118 x1,t + 11,57 + e1,t
Les coefficients estims nous permettent de calculer le rsidu e1,t :
e1,t = yt (1,0118 x 1,t + 11,57)
Par exemple :
e1,1 = 12 (1,0118 2 + 11,57) = -1,59
e1,2 = 14 (1,0118 1 + 11,57) = 1,42
e1,14 = 21 (1,0118 7 + 11,57) = 2,35
Etape 3 : calcul des coefficients de corrlation simple entre e1,t et les diffrents x i,t.
La deuxime variable slectionne (ici x 2,t) est celle dont le coefficient de corrlation est le
plus lev en valeur absolue.
On remarque que le coefficient de corrlation entre e1,t et x1,t est nul car la variable e1,t
reprsente la srie des ventes de laquelle nous avons retir l'influence de x 1,t.
Etape 4 : Estimation dun modle avec deux variables explicatives x1,t et x2,t puis calcul du
rsidu.
e2,t = yt (1 x1,t + 2 x 2,t + 0)
Etape 5 : calcul des coefficients de corrlation simple entre e2,t et les diffrents x i,t.
La procdure de slection s'arrte car plus aucun coefficient de corrlation entre le rsidu et
les variables explicatives n'est significativement diffrent de 0.
L'analyse des rsidus chaque tape permet de tirer le maximum d'informations des
variables explicatives en minimisant les inter-corrlations. Economiquement, cela se justifie
pleinement : une industrie peut dpendre 60 % d'un premier secteur, de 30 % d'un autre et de 10
% d'un dernier. Ainsi l'explication rsiduelle du deuxime secteur est mise en lumire aprs
soustraction de l'explication par le premier secteur ; quant au troisime, il apparat avec plus de
nettet sur le rsidu des 90 % dj expliqus. Ainsi, nous pouvons mettre en vidence les
explications marginales mais contributives de chacune des variables.
L'approche conomtrique est trs riche car elle recherche une explication non pas dans les
variations de la chronique elle-mme (comme les mthodes endognes) mais au travers des
fluctuations d'autres chroniques dont on a l'habitude d'valuer intuitivement l'influence. Elle permet
de tester explicitement des relations tablies de faon implicite.
L'inconvnient de ce type de mthode rside dans une mise en uvre un peu plus lourde.
Cependant les tableurs permettent une grande facilit de calcul (comme nous lavons vu dans ce
chapitre). L'utilisateur ne doit intervenir que dans la spcification du modle, l'valuation de sa
validit statistique, le suivi du modle et des indicateurs ainsi que la recherche et la constitution des
historiques de sries explicatives.
Ce dernier chapitre traite, dans une premire partie, de lvaluation de la qualit de la prvision.
Cette question parat a priori triviale. Elle ne l'est en fait pas du tout. Les entreprises prouvent
souvent de grandes difficults mesurer objectivement la qualit d'une prvision. La premire
tape de cette mesure consiste fixer des critres qui permettent d'valuer l'exactitude de la
prvision pour un article donn (section 1) puis, pour des entreprises grant un grand nombre de
rfrences, de proposer des mthodes dvaluation synthtique de la qualit de la prvision (section
2). La section 3 prsente des procdures dvaluation de la qualit de la prvision.
Une proccupation majeure avant de mettre en place un systme est de choisir la meilleure
mthode. La slection de celle-ci a fait l'objet de nombreuses tentatives de mesure, qui se situent
dans l'absolu, c'est--dire sans rfrence relle au type de donnes, au secteur, et l'horizon de
prvision. La section 4 de ce chapitre dcrit les tentatives de comparaison entre mthodes et met en
valeur leur caractre discutable : si des lments probants permettent de se dterminer en faveur de
l'une ou de l'autre des techniques, ce n'est pas dans ce type de recherche qu'on les trouvera.
La section 5 expose comparativement les avantages et les inconvnients des principales
techniques de prvision ; les jugements qui sont exposs sont de nature qualitative et ils sont
marqus par la prudence. En effet, les mthodes ne sont jamais entirement comparables parce
qu'elles ne sont pas conues rigoureusement pour des applications et des horizons semblables.
27
Cf. Bourbonnais et Terraza, Chapitre 7, 1998.
Rgis Bourbonnais - Prvision des ventes
t
EPS i
MADt = i =t T +1
T
avec : EPSi = xi xi
EPS i
2
MSEt = i =t T +1
T
La racine carre de cet indicateur M S E est similaire lcart-type de lerreur de prvision non
centre sur sa moyenne. Sa valeur dimensionne donc le stock de scurit28 pour larticle considr.
(C R P C R Ri + 1 )
2
i +1
U = i =1
i =T 1
(C R R ) i+1
2
i =1
Avec :
T = nombre de priodes de prvision (exemple = 12)
CRP = Changement Relatif Prvu (exemple = + 5,2 %)
CRR = Changement Relatif Rel (exemple = + 3,2 %)
L'interprtation des valeurs de la statistique U peut se rsumer de la faon suivante :
U = 1 la technique de prvision est quivalente une mthode nave qui consiste prendre
comme prvision la dernire ralisation.
U < 1 la technique de prvision est meilleure que cette mthode et dautant meilleure que U
est proche de 0.
U > 1 la technique de prvision est trs mdiocre, car elle est pire que cette mthode.
28
Cf. Bourbonnais et Vallin, 1995.
29
Theil, 1966.
Rgis Bourbonnais - Prvision des ventes
x t est la valeur observe en t,
x t est la valeur prvue en t.
Si le coefficient a0 est significativement diffrent de 0, cela rvle l'existence d'un biais. Le
coefficient a0 devrait en effet tre nul (non significativement diffrent de 0) si en moyenne les
prvisions sont gales aux ralisations.
L'exemple suivant illustre cette mthode. Soit le modle estim :
x t = 3,32 + 0,931 x t
(0,42) (9,52)
R = 0,91
T = 18 (nombre de priodes de prvision)
(.) = t de Student
Le coefficient a0 n'est pas significativement diffrent de 0 puisque t* = 0,42 < t160 , 05 = 2,13 , les
prvisions ne sont donc pas biaises.
EPS
Avec : EPS = i =t T +1
T
Puis comparer cet indicateur la racine carre de T divise par 2, soit le test suivant :
MSEt T
Si , alors il ny a pas de prsomption de biais.
EPS 2
3900
3700
3500
3300
3100
2900
2700
2500
janvier A+1
dcembre A
septembre A
novembre A
fvrier A+1
mai A+1
mars A+1
juillet A
aot A
juillet A+1
avril A+1
octobre A
juin A+1
PREVISION EN DEBUT DE MOIS REALISE POUR JUILLET DE A+1
Nous constatons que les diffrentes prvisions calcules depuis juillet de l'anne A jusquen
avril de l'anne A+1 se sont plutt dgrades au cours du temps. Celle calcule en mai est trs
proche de la ralisation, puis sen loigne fortement le mois suivant (juin) ; enfin, en dbut juillet,
la prvision retend vers la valeur finale. Nous pouvons remarquer :
que la prvision de juillet de l'anne A+1 nest pas notablement de meilleure qualit que
celle de juillet de l'anne A ;
quaprs avoir t trs proche de la ralisation, le prvisionniste a dgrad cette prvision ;
quenfin lamplitude des variations de la prvision sur les quatre derniers mois est trs
forte.
Ce type de phnomne se produit assez souvent en entreprise o nous pouvons observer que
la proximit de la date de ralisation rend fbrile le prvisionniste qui, en perdant toute objectivit
dune vision de moyen terme, dgrade la prvision initiale labore avec plus de recul.
1.6. La simulation
Une autre manire permettant dvaluer la qualit attendue des prvisions consiste oprer des
simulations des prvisions. Il convient dtre extrmement prudent quant leurs interprtations et
les consquences que lon peut en tirer. En effet, cela dpend du type de simulation effectue.
Dans le Schma 4, T1 et T2 reprsentent les dates de dbut et de fin de la priode sur laquelle est
estim le modle, T3 reprsente la date actuelle.
La premire modalit de simulation est appele simulation ex post ou simulation historique : elle
correspond aux modles de simulation. La totalit de l'historique de T1 en T2 est utilise en ce qui
concerne la srie des ventes que lon cherche prvoir et ventuellement aussi les facteurs
explicatifs. Aprs lestimation des paramtres du modle, les prvisions sont simules sur le mme
historique. Ce type de simulation donne peu dindications sur la qualit relle attendue des
prvisions 30 . En effet, lobjectif statistique de lestimation du modle tant de minimiser la somme
des erreurs de prvision, cela permet de vrifier seulement que les algorithmes utiliss fonctionnent
convenablement.
Le deuxime type de simulation (prvision ex post ou simulation de prvision) implique une
simulation du modle aprs la priode d'estimation ; une partie de lhistorique connue nest pas
utilise pour estimer les paramtres du modle de prvision mais sert exclusivement comparer les
prvisions issues de cette estimation et les ralisations. Cette procdure permet de qualifier les
rsultats attendus en terme de qualit et constitue un test rellement interprtable.
Quant au backcasting , il s'agit d'un type de simulation o l'on prvoit reculons dans le
pass : partir d'un modle estim sur la priode T1 T2, on prvoit les annes antrieures.
L'intrt de cette procdure, relativement peu frquente en pratique, n'est pourtant pas mince : elle
permet de tester la stabilit dynamique du modle comme s'il voluait vers le pass, au lieu d'aller
en avant dans le temps.
Enfin, la prvision ex ante consiste effectuer une prvision pour une priode non connue.
30
Pourtant cest une pratique courante et trompeuse
Rgis Bourbonnais - Prvision des ventes
Le principe consiste calculer la somme des produits des erreurs de prvision pondres par le
volume ou le chiffre daffaires.
Le Tableau 25 illustre la mthode de calcul.
En colonne figurent les rfrences gres (au nombre de huit), en ligne nous avons les
diffrentes tapes de calcul. Les cinq premires lignes ne posent aucun problme de
comprhension. Nous explicitons seulement les deux dernires lignes :
Chiffre d'affaires pondr (ligne 6) = chiffre daffaires (ligne 5) cart absolu (ligne 4)
Volume pondr (ligne 7) = ralisation (ligne 2) cart absolu (ligne 4)
Lindice de la qualit de la prvision pondr par le chiffre daffaires est alors gal la somme
de la ligne 6 divise par la somme de la ligne 5, soit = 29 640 / 127 000 = 0,2334. Lerreur de
prvision moyenne tenant compte du chiffre daffaires de chaque article est de 23,34%.
Lindice de la qualit de la prvision pondr par le volume31 est alors gal la somme de la
ligne 7 divise par la somme de la ligne 2, soit = 2 351 / 16 355 = 0,1437. Lerreur de prvision
moyenne tenant compte du volume de chaque article est de 23,34%.
Lerreur de prvision pondre par le chiffre daffaires est de 23,34% et lerreur de prvision
pondre par le volume est de 14,37%, les prvisions sont donc de moins bonne qualit pour les
articles valeur unitaire leve.
Ces indices, calculs tous les mois, permettent de suivre de faon dynamique lamlioration ou
la dtrioration de la prvision.
31
Si cela a un sens de comparer les volumes des articles.
Rgis Bourbonnais - Prvision des ventes
calcul du poids relatif de l'article rapport la totalit des ventes de l'entreprise (ralisation en
volume de l'article divise par la totalit du volume des ventes),
cumul de ces poids (en % ; colonne 6) .
90,00
80,00
70,00
60,00
50,00
40,00
30,00
20,00
10,00
0,00
0,00 10,00 20,00 30,00 40,00 50,00 60,00 70,00 80,00
Cette technique est utile pour viter de donner trop d'importance une erreur isole, mme trs
importante. En outre elle peut aussi bien s'appliquer des donnes en volume (units), comme dans
notre exemple, qu' des donnes en valeur, lorsque les articles ont des units de mesure
htrognes.
Dans cet exemple, nous avons considr les erreurs de prvision en valeur absolue en faisant
lhypothse quil est aussi grave de se tromper en positif quen ngatif. Cependant, certaines
entreprises craignent avant tout la rupture et considrent donc quune erreur de prvision positive
(ralisation > prvision) est plus grave que linverse. La constitution de deux graphiques lun
pour les erreurs de prvisions positives et lautre pour les ngatives permet de rpondre cette
proccupation.
3. Procdures d'valuation
3300
3200
3100
3000
2900
2800
2700
2600
2500
2400
mars A
juin A-1
juin A
dce. A-1
janvier A
fvrier A
mai A
juillet A
juillet A-1
sept. A-1
octb. A-1
avril A
aot A-1
nove. A-1
Nous constatons que 12 mois avant lchance, la prvision terrain sousestime le ralis et
reste relativement stable jusqu lapproche du mois daot o elle subit des modifications brutales.
La prvision statistique volue jusqu convergence vers le ralis. La prvision valide se situe le
plus souvent entre la prvision statistique et terrain, ne sachant laquelle privilgier ...
Rupture de tendance
Indicateur SUMEPS (somme des erreurs cumules, cf. chapitre 3)
Si SUMEPS t / MADt > 3 risque de biais.
Rgis Bourbonnais - Prvision des ventes
Ou test statistique
MSEt T
Si < risque de biais.
EPS 2
A chaque mission des prvisions le gestionnaire, par exception, va se consacrer en priorit aux
articles dont lune de ces anomalies a t constate.