Explorer les Livres électroniques
Catégories
Explorer les Livres audio
Catégories
Explorer les Magazines
Catégories
Explorer les Documents
Catégories
|PE|
Cet indicateur a le dfaut de donner la mme importance aux erreurs anciennes quaux
erreurs rcentes. En dautres termes, il ne montre pas la justesse des dernires pr-
visions. Pour corriger ce dfaut, nous utilisons le pourcentage derreur moyenne abso-
lue mobile (ou Year to Date Mean Absolute Percent Error, YTD en anglais). Cest une
moyenne mobile sur les 12 derniers mois ou les 4 dernires semaines, etc., selon les
besoins.
Les mesures de performance du modle, comparent les rsultats du modle utilis
avec les rsultats dune prvision nave. La prvision nave est le rel du mois pass, par
exemple, utilis comme prvision pour le mois daprs. Si le modle adopt ne donne pas
de meilleures performances que la prvision nave, il est strile. Lindice de Theil, 1966,
est la statistique qui rapporte les prvisions du modle adopt aux prvisions naves.
Si le rsultat est suprieur 1 alors le modle adopt est carter. Nous chercherons
le modle de prvision qui rapprochera lindice de Theil de 0. Pour simplier, la formule
suivante peut tre utilise :
SFTAB (Sales Forecasting Technique Acuracy Bentchmark) =
MAPE(modle)
MAPE(Nave)
Cest au prvisionniste, en concertation avec les utilisateurs, de dcider des mesures de
performance afcher.
La section 4.5 dcrit les mesures de performance retenues dans le systme de prvi-
sion dvelopp pour TFE.
2.4 Le processus collaboratif
Ce qui est nomm collaboratif , en informatique, est un principe qui offre aux sys-
tmes dinformations, ou plus globalement aux architectures, la capacit de dialoguer
ensemble en temps rel, et ce, sur la base dun rfrentiel dchange commun, ex-
plique Lon de SAHB, Directeur Gnral dAgrostar. Rassembler les hommes pour quils
92
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
changent leurs connaissances mtiers pour le bien de la prvision est un processus
collaboratif. Les processus collaboratifs servent mettre en regard les connaissances
dtenues divers endroits dune organisation pour assurer que toutes les donnes clefs
vont bien tre prises en compte dans la dcision nale
18
. Seiersen, 2006 (105), dnit
le processus collaboratif dans le contexte des prvisions de vente comme une runion
mensuelle structure, pour arriver une prvision de consensus tenant compte de toutes
les perspectives, ainsi quun plan dopration pour servir les ventes .
Pour ce faire, les systmes doivent tre capables dune part de recevoir un certain
nombre de donnes, de les intgrer et dautre part, dmettre des donnes qui seront
intgres dans le systme du partenaire. Cela suppose un travail pralable dit collabo-
ratif et un travail dintgration en interne chez chaque partenaire, au sein de sa chane
logistique et au sein de son systme dinformation, ainsi quun travail dintgration externe
avec les partenaires amont et aval des chanes logistiques et des systmes dinforma-
tion
19
.
Cest en 1998, aux tats-Unis, que pour la premire fois un consortium de fournisseurs
et dtaillants (VICS : Voluntary Interindustry Commerce Standart Association) publie un
guide pour la prvision et la planication collaborative (CPFR : Collaborative planning
forecasting et replenishment). Depuis McCarthy et Golicic, 2002 (83), recensent deux
approches de la prvision collaborative vue par la littrature :
la prvision collaborative intra-entreprise : Diehn (2000/2001) (45), Lapide (1999)
(73), Reese (2000/2001) (102), Wilson (2001) (121)
la prvision collaborative inter-entreprise : Alkerman (2000) (4), Andraski (1999)
(5), Barratt et Oliveira (2001) (13), Ireland et Bruce (2000) (67), VICS (1999) (11)
La prvision collaborative intra-entreprise est le processus de prvision sur lequel in-
sistent de nombreux auteurs pour conjuguer la puissance de loutil informatique et lexp-
rience des hommes, an daboutir aux prvisions les plus exactes possible (voir section
2.2.5). Ce processus se droule au sein dune mme entreprise. Elle doit tre capable
de matriser la communication entre les managers et le systme. Elle doit avoir rod les
techniques de prvision et ses mesures de performance. Ainsi, une entreprise doit ma-
triser ces 4 composantes dans son systme de prvision avant de prtendre faire de la
prvision collaborative.
La prvision collaborative inter-entreprise est une extension de la prvision collaborative
intra-entreprise. Elle inclut, en plus, les partenaires externes face face ou par le biais
de linformatique, Burgin et al., 2000 (23).
Pour dmontrer les avantages dune prvision collaborative inter-entreprises, citons lexemple
donn par Mentzer et Moon, 2005 (85). La gure 2.5 dsigne une chane logistique dont
les acteurs ne communiquent pas leurs prvisions.
18. Supply Chain Magazine, n17, Septembre 2007
19. Lon de Sahb, La traabilit, Pratique logistique, Grs dOr 2005
93
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Consommateur
nal
Distributeur Grossiste Industriel Fournisseur
Stock de sret
Ventes prvues :
1000
Unit de fabrication
1000 1, 1 = 1100
Unit de fabrication
1100 1, 1 = 1210
Unit de fabrication
1210 1, 1 = 1331
Unit de fabrication
1310 1, 1 = 1464
6 6 6 6
10% 10% 10% 10%
Figure 2.5 Chane logistique dont le stock de sret cumul est de 110,5%
Le distributeur se donne une marge de 10% pour le consommateur nal, mais ne la
communique pas au grossiste. Du coup le grossiste se donne une marge de 10% sur
la commande du distributeur (1100 1.1) pour faire face limprvu. Lindustriel fait de
mme sur la commande du grossiste et ainsi de suite. Au total la marge de 10%, soit
100 units de plus, qui tait destine remdier une erreur de prvision des ventes au
niveau du consommateur nal se transforme en (100 +210 +331 +464) = 1105 units de
surproduction soit une erreur de 110,5%.
Avec une relation de communications entre tous les acteurs, il est possible de baisser
cette erreur (100 + 100 + 100 + 100) 1000 = 40%. Cest--dire que chaque acteur de
la chane communique la marge calcule lchelon prcdent (dans cet exemple, 100
chez le distributeur) et nen ajoute pas inutilement.
Pour atteindre ce niveau de conance entre les partenaires, pour quils changent de
linformation et tablissent des processus communs, le CPFR, prsent par le VICS,
recommande la feuille de route suivante :
dveloppement et approbation des objectifs,
rdaction dun plan commun pour aboutir aux objectifs,
cration dune prvision commune,
identication les exceptions,
attribution des exceptions tous,
cration et remplissage de la commande.
Il est noter que ce ne sont que des outils et quaucune prvision ne sera able si les
partenaires nont pas forg des liens forts et durables entre eux. Cest laspect le plus
difcile : passer de ladversaire traditionnel partenaire ayant le mme objectif, la sa-
tisfaction du consommateur nal. Le point commun dans les entreprises qui russissent
la prvision collaborative, expliquent McCarthy et Golicic, 2002 (83), est la relation de
long terme qui existe entre elles. Mentzer et al. ,2000 (91), relate qu la question pose
aux entrepreneurs quel est le facteur de succs dune prvision collaborative? , ils r-
pondent que les partenaires doivent travailler comme une seule entit pour des objectifs
communs. La prvision nest quun aspect de cette chane logistique collaborative.
94
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Concrtement, dans les faits, Smros, 2003 (107), souligne un manque de demande de
prvision au niveau des entreprises europennes. Cest une des raisons pour lesquelles
lamlioration promise des performances de la chane logistique, par la prvision collabo-
rative (CPFR : Collaborative Planning Forecasting and Replenishment), a t plus lente
quattendu. Dautre part, Zhao et al., 2002 (123), montrent que la valeur de linformation
partage est signicativement inuence par le modle de la demande, le modle de
prvision utilis et la capacit des fournisseurs satisfaire la demande. Les acteurs ont,
pour des raisons tangibles, ou non, de grandes craintes partager des informations telles
que le niveau de leur stock, les commandes futures, les temps dapprovisionnement, etc.
qui sont ncessaires aux prvisions collaboratives. Linuence des facteurs environne-
mentaux (contexte de concurrence, de ngociation des prix, . . .) ne prsage pas une
prvision collaborative objective. Trop souvent, les partenaires ne se connaissent pas
assez. Il faut informer, motiver, convaincre les partenaires des avantages que les deux
partis peuvent obtenir par le biais de la prvision collaborative. Il faut encourager les
partenaires communiquer les informations ncessaires pour augmenter la abilit des
prvisions. Pour aider les partenaires et leur apprendre comment amliorer leurs propres
prvisions, il est ncessaire de mettre en place un consultant en prvision.
95
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Chapitre 3
Analyse de lexistant avant le projet de
recherche Horizons
Imaginez la gestion dun rseau de messagerie, sans quivalence en France, com-
pos de plus 70 plateformes et 1.900 vhicules, pour satisfaire chaque jour 15.000 clients
en moins de 24 heures. Le rseau TFE compte 100.000 destinataires rguliers par mois.
Tous les jours, des milliers darticles changent de main ; entre une plateforme et ses
clients, des centaines de camions arrivent et repartent avec un chargement diffrent. Les
plates-formes sont toutes sous temprature dirige.
Pour matriser les ux physiques et informatiques qui dcoulent de la gestion dun tel
rseau, lentreprise a besoin dun systme dinformation (SI). TFE utilise un entrept
de donnes dans lequel sont collectes toutes les informations provenant des solutions
informatiques mtiers (Transport, Logistique, . . .). Les informations ainsi rcoltes per-
mettent lentreprise dassurer la gestion de ses activits. Fabbe-Costes, 1999 (49),
explique que le SI intervient tous les stades du processus dcisionnel : la prvision
et la planication dactivit, le dclenchement de la circulation, le suivi et le pilotage des
mouvements, le contrle et lvaluation des oprations et de lorganisation. Jusqu pr-
sent, le systme dinformation ne pouvait donner quune vision a postriori des donnes,
constatant un tat de fait . Pour aller plus loin, le systme de prvision implanter, va
fournir les moyens danticiper lactivit future. Justement, pour ne plus subir, mais antici-
per son activit, TFE souhaite approfondir son savoir-faire en matire de prvision et de
planication. Le transporteur cherche par ce moyen :
comprendre la demande et lanticiper pour amliorer sa prestation au client ;
optimiser les ux de marchandises, comprendre comment chaque ux de marchan-
dises (expdition, livraison, ramasse) contribue aux rsultats an didentier et de
corriger aisment les problmes lis aux litiges ;
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
optimiser la gestion des vnements ponctuels (jours fris, promotion, . . .) et pr-
voir avec prcision limpact an dy faire face avec srnit ;
grer des exceptions ou mettre en place des alertes proactives permettant de trans-
former rapidement un problme potentiel en opportunit ;
anticiper de manire prcise les uctuations de lactivit et ainsi augmenter sa s-
rnit face ces uctuations ;
Bncier dun retour sur investissement rapide. Les diteurs de logiciels pro-
mettent que les projets de prvision de la demande se concrtisent par un retour
sur investissement de plusieurs dizaines de milliers deuros et sont rentabiliss en
moins de 12 mois aprs leur mise en uvre.
La prvision de lactivit dans les sites de transport TFE ne date pas daujourdhui. Avant
le projet de recherche Horizons , la responsabilit de la prvision dactivit tait don-
ne aux agences. Ainsi, certains sites de transport utilisent dj des tableurs pour faire de
la prvision sur leurs propres donnes (voir section 3.2) et non sur des donnes centra-
lises (voir section 3.1). Le souci est que cette organisation sassimile une approche
indpendante (voir section 2.3.2), avec les inconvnients quelle renferme. Lobjectif de
ce chapitre est danalyser lexistant chez TFE dans loptique de ne pas rpter les mmes
erreurs et surtout dutiliser ce qui fonctionne.
3.1 La structure de linformation chez TFE et son interro-
gation
La section 3.1.1 rvle linteraction entre les bases de donnes mtiers et lentre-
pt de donnes. Elle dcrit la source des donnes et la faon dont elles sont rcoltes.
La section 3.1.2 dcrit les procdures dextraction et leurs rgles de calcul pour alimen-
ter lhistorique et extrapoler les donnes prvisionnelles. La section 3.1.4 dcrit la partie
de lentrept de donnes utiles pour lextraction des donnes et leur transformation pour
aboutir aux sries chronologiques dcrivant lactivit des sites de transport.
3.1.1 Interaction entre le systme dinformation et le systme de prvi-
sion
Lentrept de donnes rassemble les donnes provenant de diverses applications
mtiers. Il fournit une vision transversale travers plusieurs mtiers de lentreprise. La
97
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
gure 3.1 indique les sources dalimentation de lentrept de donnes. Ce sont des bases
de donnes Oracle ddies aux activits transversales de lentreprise (Transport, Lo-
gistique, Contrle de gestion et Ressources Humaines, Direction Technique Vhicules,
Direction des Achats). Les bases de donnes sont issues des applications TMS (Trans-
port Management System), WMS (Warehouse Management System), SAP (Systems,
Applications, and Products for data processing), GTA (Gestion des Temps et Activit).
Lentrept de donnes enregistre lhistorique des transactions menes par ces bases de
donnes. Les chanes de chargement sont quotidiennes, hebdomadaires, mensuelles et
trimestrielles. Seiersen, 1998 (104), signale que lentrept de donnes peut tre inter-
rog par une palette doutils daide la dcision, comprenant des outils de prvision,
de simulation, ainsi que des outils data mining, de reporting ou encore des algorithmes
de recherche oprationnelle . Ces outils sont prsents sur la couche infrieure de la
gure 3.1.
Figure 3.1 Architecture du Systme dInformation chez STEF-TFE
La plate-forme dcisionnelle dveloppe par Agrostar se nomme Infomanager. Cette
plate-forme est dveloppe sous Cognos V7 et C8. Lobjectif dInfomanager est de
fournir au groupe STEF-TFE un systme dinformation dcisionnel permettant :
laccs direct aux indicateurs cls de performance par domaine fonctionnel,
une navigation naturelle vers les rapports,
98
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Figure 3.2 Architecture du Rseau Informatique chez STEF-TFE
lutilisation doutils de requtage, danalyse ou danticipation collaboratifs,
la mise en place dalertes et la dtection derreurs dans les donnes du rfrentiel.
Infomanager est un outil disposition de lensemble des services et mtiers du groupe.
Citons le CGO (Contrle de Gestion Oprationnel), la DHR (Direction Ressources Hu-
maine), la DEX (Direction dExploitation), la DTV (Direction Technique Vhicules), la DC
(Direction Commerciale), ADV (Administrateur Des Ventes), les Directeurs de site, les
Directeurs Rgion, les services Oprationnels (Quai, Exploitation, SAV).
Parmi cet ensemble doutils de prsentation de linformation, daide la dcision, dana-
lyse des donnes en aval de lentrept de donnes (ou Infocentre, voir gure 3.1), notons
que Fabbe-Costes, 1999 (49), retient la prvision comme module essentiel. Le sys-
tme de prvision installer chez le transporteur a pour vocation danticiper lactivit des
agences de transport. Historiquement, lactivit est mesure par le poids des marchan-
dises transportes et par le nombre de lettres de voiture signes (voir section 1.2.1).
Branche, 2006 (20), signale que ce sont deux indicateurs essentiels. Ils conditionnent
une partie des moyens matriels mobiliss . La prestation de transport est encore sou-
vent facture au poids, sinon la palette. Une semi-remorque pleine contient 33 palettes
Europe pour un poids de 25 tonnes.
Linformation requise pour construire lhistorique des sries chronologiques prvoir pro-
vient de la base de donnes du TMS (Transport Management System). Le TMS est
lensemble des solutions informatiques ddi la gestion du transport des marchan-
dises. Avant 2006, le rseau informatique du transporteur tait constitu dune multitude
99
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
de serveurs rgionaux relis un serveur central appel HP 3000 . Les postes in-
formatiques rgionaux se connectaient au serveur rgional. Lavantage tant que quand
le serveur central tombait en panne, les serveurs rgionaux et par consquent les ux
dinformations continuaient fonctionner. Linconvnient majeur tait la rplication des
donnes ncessaires pour partager linformation. Pour remdier sa vtust et dans un
souci de modernisation, le transporteur change en 2007/2008 de rseau informatique.
Il passe GTI (Gestion du Transport Intgr). Cest une base de donnes unique (voir
gure 3.2) qui permet un partage de linformation en temps rel. Lorsque quun camion
prend son dpart Limoges, par exemple, lensemble du rseau du transporteur est au
courant.
Le rseau du transporteur tant par nature multi-acteurs et multi-sites, le SIC (Sys-
tme dInformation et de Communication) a pour principale mission dassurer la coh-
rence de ces ensembles complexes doprations que le transporteur cherche synchro-
niser explique Fabbe-Costes, 1999 (49). Le SIC au niveau transport est le TMS. Il
a pour mission de raliser le couplage des ux dinformation (technique, administratif,
stratgique), avec des ux physiques (lot, emballage, marchandise) avec des actions
(manutention, transport) et les acteurs (chauffeurs, manutentionnaire) qui les ralisent
(49). Il contient des modules de planication et dorganisation du transport. Ces modules
permettent de planier les voyages, dallouer les ressources (vhicules, chauffeurs) aux
voyages, dorganiser et grer les transports (ramasses, livraisons, expditions) et la ges-
tion du groupage de marchandises. Lensemble des informations saisies dans ces mo-
dules est enregistr dans la base de donnes GTI et historis dans lInfocentre. Ainsi, le
transporteur rpond la volont davoir une traabilit totale des processus logistiques
(voir section 1.1.1.1). Il est en mesure de proposer ses clients, un suivi informatique des
expditions (SIE) et damener des preuves de bonne ralisation de la prestation (49).
Pour apprhender lorganisation des tables dans cette base, il faut avant tout comprendre
la segmentation des ux de marchandises indique Seiersen, 1998 (104).
3.1.2 Segmentation des ux de marchandises
Pour quun transport existe, il faut quun donneur dordres fasse appel un transpor-
teur en lui envoyant une lettre de voiture (ou bon de commande). Le donneur dordres
est aussi, dans la plupart des cas, le tiers factur. La lettre de voiture comporte, au mini-
mum, un client expditeur chez lequel le transporteur vient ramasser la marchandise et
un client destinataire, chez lequel le transporteur vient livrer la marchandise. Nous dis-
tinguons dores et dj les ux amont, des usines aux entrepts, et les ux aval des
entrepts aux destinataires naux souligne Artous, 2006 (10). Seront aussi indiqus
100
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
sur la lettre de voiture, un certain nombre dindicateurs caractrisant la marchandise
transporter (nom, poids, nombre de colis, nombre de palettes . . .). Lensemble de ces
informations permet de crer une position . Cest la traduction informatique de la lettre
de voiture. Chaque position est enregistre dans la table POS (voir gure 3.5). Cette
table comporte plus de 55 millions denregistrements. Un enregistrement quivaut une
position. Deux millions de nouvelles positions sont crs tous les mois.
A partir du lieu de chargement de la marchandise chez le client expditeur, et du lieu de
dchargement chez le client destinataire, les solutions TMS avec laide des exploitants,
dnissent des voyages que vont emprunter les marchandises. Le but tant, bien en-
tendu, doptimiser le cot du transport. Les voyages sont enregistrs dans la table VOY
(voir gure 3.5). La table VOYAGE comprend 5 millions denregistrements. Un voyage est
dcompos en bordereaux. Les bordereaux regroupent des segments.
Ainsi, une position va effectuer un ensemble de voyages. Pour la suivre gographique-
ment et en temps rel tout le long de son transport, la position est dcoupe en segments.
Lintitul des segments dpend de certaines caractristiques du lieu de chargement de
la marchandise et de son lieu de dchargement (voir gure 3.4). Le dcoupage des po-
sitions par segments est disponible dans la table SEG (voir gure 3.5). Elle compte 68
millions denregistrements. Un segment a une date de chargement et une date de d-
chargement qui sont issues du PTO (Plan de Transport Oprationnel). Le PTO est une
moulinette segments. Grce lui, chaque segment de position trouve automatique-
ment sa place dans le bon voyage plani explique Branche, 2006 (20).
Sur le terrain (gure 3.3), le lieu et la date de chargement et de dchargement du seg-
ment sont saisis manuellement ou laide dun scanner optique permettant de lire des
codes barres. De cette faon, le systme dinformation compare le plani avec le ra-
lis. La gure 3.4 afche une prsentation gnrale des segments dentres et de sorties
existants. Deux cas sont possibles, soit la marchandise, en provenance de lexpditeur,
est amene quai dune agence TFE pour tre conditionne et repartir vers une nouvelle
destination, soit lexpditeur affrte un camion complet pour transporter la marchandise
de son lieu de chargement vers le destinataire nal. Cest du transport de lot.
Un segment est identi par un vnement. Certains se retrouvent en entre et en sortie
du quai de lagence. Cest le cas dvnements EX.
EX : Lvnement associ au segment est dit dexpdition. Lorsque la marchandise
est transporte entre deux agences du rseau TFE, il peut tre en sortie comme
en entre de quai (agence).
Parmi les vnements dentre, nous comptons
ED : lorsque quune agence B est mandate par une agence A pour ramasser la
marchandise chez un expditeur appartenant la zone de chalandise de lagence
A, lvnement associ au segment entre lexpditeur et lagence B est appel
enlvement dgroupeur .
101
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
EN : lorsque la marchandise est ramasse chez lexpditeur, par les vhicules de
lagence TFE, lvnement associ au segment est dit enlvement .
AQ : lorsque cest lexpditeur qui se charge de transporter la marchandise au quai
de lagence TFE, lvnement associ au segment est dit amen quai .
RP : lorsque le destinataire de la marchandise na pas t trouv ou lorsquil a
refus la marchandise, celle-ci est renvoye lexpditeur. Lvnement associ
ce segment est appel reprise .
RE : Pour faciliter le transport des marchandises, elles sont poses sur des pa-
lettes, dans des rolls ou des bacs. Ces emballages appartiennent lexpditeur
et doivent lui tre renvoys aprs livraison de la marchandise chez le destinataire.
Lvnement associ au segment de retour est remise emballage .
Parmi les vnements de sortie, se trouvent les :
LI : lorsquune agence TFE soccupe de transporter la marchandise entre une
agence de transport et son destinataire nal, lvnement associ au segment est
appel Livraison .
PQ : lorsque le destinataire nal vient prendre la marchandise au quai de lagence
TFE, lvnement associ au segment est appel Prise quai .
Lorsque la marchandise est transporte entre lexpditeur et le destinataire nal sans
quelle ne subisse de dchargement / chargement intermdiaire, lvnement associ au
segment est dit Livraison Directe (LD).
Figure 3.3 Traduction des ux physiques en ux informatiques
102
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Figure 3.4 Le dcoupage de lactivit transport en segments
Les segments de positions voyageant ensemble et qui rpondent au mme critre duni-
cit (mme catgorie de froid, mme lieu de chargement, mme date) sont regroups
dans un bordereau. Pour simplier, un camion transporte des bordereaux. Les borde-
reaux sont saisis dans la table BORDEREAU (voir gure 3.5). Elle compte 12 millions
denregistrements.
A partir des diffrents vnements, une typologie des ux de sortie est dnie (voir an-
nexes - Indicateurs journaliers). Le logisticien des ux distingue lactivit dexpdition et
lactivit de distribution. Lexpdition est lensemble des marchandises qui ont pour des-
tination un lieu de dchargement hors de la zone de chalandise du lieu de chargement.
La direction dexploitation du transporteur, cherche typer ses transports de marchan-
dises sur une maille de suivi assez ne, pour prendre en compte les spcicits des 70
agences du rseau et pour que le pilotage des ux de marchandises rete au mieux
la ralit du terrain. Ainsi, les expditions regroupent 16 catgories indivisibles. Elles
peuvent tre agrges pour former de nouveaux indicateurs. Cest le cas des indicateurs
prvoir.
Pour une agence donne, le poids des marchandises passes quai et qui partent en
103
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
expdition est donn par la formule suivante,
Tonnage expdi avec passage quai = TDE + TEX + TEXTT + TLMHgr
+TLHgr + TLHct + TLMHct (3.1)
Avec les catgories de poids indivisibles suivantes :
Tonnage Expdi par Dgroupeur (TDE) =
Somme des poids des positions expdies pour livraison par un dgroupeur local
Hors zone.
Tonnage Expdi Traction (TEX) =
Somme des poids des positions du primtre venant des EX.
Tonnage Expdi Transit (TEXTT) =
Somme des poids des positions TT du primtre venant des EX.
Tonnage Livraisons bordereaux Manuels Hors zone Groupage (TLMHgr) =
Somme des poids des positions bordereaux manuels et dont le destinataire ne fait
pas partie de la zone de livraison de lagence (e-plan) et dont le voyage a un centre
de cot 89xx.
Tonnage Livraisons Hors zone Groupage (TLHgr) =
Somme des poids des positions sur une tourne LD appartenant un voyage dont
le centre de prot commence par 89.
Tonnage Livraisons Hors zone CT (TLHct) =
Somme des poids des positions sur une tourne LD appartenant un voyage dont
le centre de prot commence par 88.
Tonnage Livraisons bordereaux Manuels Hors zone CT (TLMHct) =
Somme des poids des positions bordereaux manuels dont le destinataire ne fait
pas partie de la zone de livraison de lagence (e-plan) et dont le voyage a un centre
de cot 88xx.
De la mme faon que pour lexpdition, les ux de marchandises en distributions sont
regroups pour former une typologie. Lindicateur prvoir est le poids des marchandises
passes quai et qui partent en distribution. Cet indicateur est obtenu par la formule
suivante :
Tonnage distribu avec passage quai = TDL + TLL + TPQ + TLMLocal (3.2)
Avec les catgories de poids indivisibles suivantes :
Tonnage Livraisons par dgroupeur (TDL) =
Somme des poids des positions expdies pour livraisons par un dgroupeur local.
Tonnage Livraisons Locales (TLL) =
Somme des poids des positions bordereaux LI sur une tourne LI.
104
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Tonnage Pris Quai (TPQ) =
Somme des poids des positions avec un segment de sortie PQ.
Tonnage Livraisons bordereaux Manuels Locales (TLM Local) =
Somme des poids des positions bordereaux manuels et dont le destinataire fait
partie de la zone de livraison de lagence (e-plan).
La squence classique des cots dans un rseau est : enlvement, passage quai,
traction, tri et passage quai, traction, passage quai et livraison (voir gure 3.4). Lenl-
vement, et la livraison, ainsi que les cots de passage quai, constituent lessentiel des
cots explique Branche, 2006 (20).
Le quai fonctionne jour et nuit. Sa mission est de rceptionner, contrler, zoner, stocker,
prparer les commandes et charger la marchandise dans les dlais prvus en respec-
tant lintgrit de la marchandise et les rgles dhygine et de scurit. Lquipe de jour
est charge de lexpdition alors que celle de nuit prend en charge les colis pour la dis-
tribution. Anticiper le poids des marchandises, le nombre de positions passes quai,
en expdition et en distribution, permet de fournir une donne essentielle pour planier,
contrler les cots matriels et humains engendrs par ces marchandises. Mais la typo-
logie des ux de marchandises nexiste pas en tant que telle dans la base de donnes
GTI. Elle est le rsultat dun processus de croisement de donnes issues de la base de
donnes GTI. Ce rsultat est stock dans lInfocentre (voir section 4.2).
3.1.3 Source des heures productives sur le quai
Les heures productives quai sont les heures travailles par le personnel employ sur
le quai. Le personnel badge une premire fois en arrivant, et une seconde fois en quittant
le travail. Ainsi, les heures sont comptabilises et une productivit quai peut tre dduite.
Lindice de productivit quai est le ratio Tonnes / Heures.
Par le biais dun progiciel de gestion de ressources humaines, appel eTemptation, la
badgeuse envoie les temps dans la base de donnes GTA (Gestion de Temps et Acti-
vit). eTemptation est loutil RH du groupe STEF-TFE. Il permet de grer les calendriers,
de construire des plannings, dadministrer les employs et leurs contrats, daffecter des
badges et de recueillir les temps badgs, etc. Les heures badges sur le quai sont affec-
tes des centres de cots. Ces derniers permettent didentier les heures travailles
pour lactivit expdition et celles travailles pour lactivit distribution. Une grande partie
de lexpdition est ralise par lquipe de jour entre 13h et 21h. Alors que la distribu-
tion est ralise par lquipe de nuit entre 22h et 6h. Cette corrlation entre expdition
/ distribution et activit quai jour / nuit permet de rapprocher lindice de productivit en
expdition la productivit du quai jour et lindice de productivit en distribution la pro-
ductivit du quai nuit. Par contre, les indices de productivit ne sont pas comparables.
105
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Lactivit du quai jour est avant tout destine massier les ux. Le quai reoit les colis
enlevs lors des tournes de ramasses et procde des oprations de groupage avant
expdition vers les sites de messagerie du rseau. Lactivit du quai jour consiste ven-
tiler les colis reus la nuit, en provenance du rseau et destination de la livraison des
GMS jusquaux boucheries de proximit, en passant par la restauration rapide ou la
restauration collective explique Serge Capitaine, Dg adjoint de TFE. Lactivit du quai
jour nest donc pas la mme que lactivit du quai nuit.
Lindice de productivit, mais aussi le poids et le nombre de positions passes quai,
ne sont pas des indicateurs pour comparer les agences de transport entre elles. Ils ne
visent pas ncessairement tablir un palmars, la typologie de chacun des sites pou-
vant donner des rsultats trs diffrents pour un mme indicateur. Un bon chiffre pour
un site ne lest pas obligatoirement pour le site voisin et inversement. Lanalyse la plus
pertinente consiste donc comparer une performance individuelle dans le temps. Ces
indicateurs doivent permettre davoir une vision de lexploitation et de faire des com-
paraisons site site. Cela doit encourager changer sur les meilleures pratiques
appliquer
1
.
3.1.4 Structure et agencement des donnes sources
Nous venons dindiquer que la source des donnes prvoir est extraite de la base
de donnes mtier appele GTI. Une partie du schma logique en modle relationnel
(ou schma conceptuel) est trace dans la gure 3.5. Il indique les tables utilises pour
typer les ux, et les relations entre ces tables.
Un plan de ramasses et de livraison (table LIVPLAN) est propos aux clients par lagence
de transport (table DOM_ACT). Le client envoie une lettre de voiture lagence. Le r-
cpiss est archiv (table FICH). La lettre de voiture est traduite informatiquement (table
POS). Elle indique un tiers expditeur et un tiers destinataire (table TIERS). Le PTO di-
vise la position en segments (table SEG). Les segments ayant le mme lieu et mme
date de chargement et de dchargement sont rangs dans un bordereau (table BORDE-
REAU). Le bordereau ralise un voyage (table VOY). Le voyage rassemble des tournes
planies par le PTO (table TOUR_PLAN). Le voyage est compos de points darrts
(table ARRET). Les tournes et les arrts desservent des tiers (table TIERS) et des d-
grouppeurs (table DEGR_PTO). Ces derniers font part dvnements (table EVT_SIE)
sil y a lieu. Un vnement peut tre un litige sur la marchandise, par exemple, dans ce
cas la marchandise nest pas accepte par le destinataire et un processus de ngociation
est entam entre les sites du transporteur et lexpditeur pour dterminer les responsabi-
1. Marc Vettard, Directeur dExploitation TFE, 2009
106
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
lits. Si lexpditeur est responsable, la marchandise se voit attribuer un nouveau numro
de position et repart vers ce dernier par le circuit de transport.
Figure 3.5 Une partie du modle relationnel de la base GTI
Un croisement des informations obtenues par les tables du schma logique (gure 3.5)
permet dextraire un historique des indicateurs dcrits dans la section 3.1.2. Le rsultat
quotidien des 16 indicateurs en expdition et des 12 indicateurs en distribution alimente
la table INDIC_AGE_Q dans lInfocentre.
3.2 Les modles de prvision utiliss chez TFE
Lide de se doter dun systme de prvision, chez TFE, nest pas nouvelle. Des
agences TFE ont rchi sur laction des facteurs temporels et conomiques. Elles ont
missionn leurs experts terrains pour quils se penchent sur le sujet et quils dveloppent
des outils de prvision spciques lagence. Ainsi, elles ont construit, chacune de leur
ct, un modle les caractrisant. Dans ce sens, elles ont suivi une approche indpen-
dante et non concentre ou mme consensuelle (voir section 2.3.2).
Avant le projet de recherche Horizons , une vingtaine dagences, sur les 70 du rseau
107
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
TFE, utilisaient lun ou lautre des trois outils prsents dans cette section. Leurs points
communs :
Ils sont crits pour prvoir lactivit des agences TFE, cest--dire les sries temporelles
suivantes :
poids total en kg des marchandises passes quai, sur une journe dactivit,
poids expdi en kg des marchandises passes quai, sur une journe dactivit,
poids distribu en kg des marchandises passes quai, sur une journe dactivit,
nombre de positions totales des marchandises passes quai, sur une journe
dactivit,
nombre de positions expdies des marchandises passes quai, sur une journe
dactivit,
nombre de positions distribues des marchandises passes quai, sur une journe
dactivit.
Lintervalle de temps entre deux observations dune chronique est le jour. Pour une ma-
jorit des agences de transport tudies, lhistorique des chroniques dbute le 1
er
janvier
2002. Les valeurs des sries chronologiques prvoir varient entre 0 kg et 3.200.000 kg.
Les algorithmes des modles statistiques dvelopps par les agences de transport ont
la particularit
dtre implants avec un tableur ;
de prvoir des valeurs mensuelles ou hebdomadaires quils distribuent sur les 6
jours ouvrs de la semaine ;
dtre spciques un ensemble dagences restreint, cause de paramtres xs
et non calculs ;
dobtenir une erreur en moyenne absolue variant autour de 5% et 10%.
Leur diffrence rside dans le choix du modle statistique :
deux dentre eux sappuient sur des modles extrapolatifs : lissage par moyenne
mobile et lissage exponentiel ;
le troisime sappuie sur un modle conomtrique, et donc sur des variables ex-
plicatives.
3.2.1 Notions autour des sries chronologiques
Avant dtudier les modles de prvision utiliss chez TFE, attardons-nous dnir
certaines notions lies lanalyse de sries chronologiques.
Une srie chronologique, aussi appele chronique ou srie temporelle, se dnit comme
108
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
une suite dobservations dune grandeur homogne, espaces dans le temps. Cest un
ensemble de couples dont la premire composante est le temps et la deuxime, la va-
leur qui y est associe. La srie temporelle est ordonne de faon chronologique. Le
pas entre deux valeurs successives nest pas ncessairement constant. Nous appelons
srie chronologique rgulire une srie dont les dates dobservation sont priodicit
constante. Pour tre prvisible, une chronique doit se composer dune superposition de
mouvements oscillatoires (priodiques) auxquels sajoutent une tendance et une erreur.
Lobjectif des mthodes de prvision est de dterminer la valeur quune chronique peut
prendre un horizon donn. Lhorizon de prvision (not h) varie de limmdiat au long
terme. Il ne peut pas tre infrieur lintervalle de temps scoulant entre deux observa-
tions successives. En revanche, il peut lui tre suprieur et nous parlerons dhorizon
long terme. La notion dhorizon est troitement lie lutilit que nous voulons donner
une prvision. Dans le milieu conomique, un horizon stratgique concerne le long terme
(>12 mois), le niveau tactique concerne le moyen terme (entre 2 semaines 6 mois) et le
niveau oprationnel concerne le court terme et les vnements journaliers (voir section
1.2.4).
Les modles de prvision dune srie chronologique posent lhypothse forte que le
pass est garant de lavenir. Cela veut dire que le phnomne tudi continuera se
comporter comme il la fait dans le pass, explique Claude Olivier, 2002
2
. Comme dans
toute tude statistique, il faut donc passer par une phase exploratoire permettant de
comprendre et dapprcier les phnomnes temporels inuant sur la grandeur tudie.
Elle permettra de rpondre la rgle dor de toute prvision. G. Ansion, 1990 (6), nous
apprend que cette rgle repose sur la pondration des donnes du pass. Cest une per-
ception qualitative que nous avons sur la srie tudier. Suite lanalyse descriptive, il
faut pouvoir dcider de limportance que nous accordons aux donnes suivant leur ge
dobservation. Les phnomnes observs rcemment sont-ils plus signicatifs que ceux
constats dans un pass plus lointain ou vice versa ?
La saisonnalit est une variation de lactivit de lentreprise certaines priodes de
lanne (106). Cette variation se rpte tous les ans, la mme priode (voir section
2.2.3). La saisonnalit est souvent lie au type dactivit. Celle de TFE est conditionne,
entre autres, par les ftes de n danne. Tous les ans lactivit augmente considrable-
ment en dcembre pour rechuter en janvier.
La priode est la dure dune observation saisonnire. Il y a, par exemple, 52 varia-
tions saisonnires correspondant chacune une priode dune semaine.
2. Claude Olivier, Universit du Qubec, 2002
109
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Lhistorique ou ensemble dinformations sont les lments dont le prvisionniste dis-
pose an de raliser une prvision. Suivant la granularit de lhorizon de prvision (heure,
jour, mois, anne) et de la mthode de prvision utilise, lhistorique devra tre plus ou
moins long. Les mthodes endognes (dcomposition, lissage, Box & Jenkins) se nour-
rissent uniquement du pass de la variable prvoir. Alors que les mthodes exognes
utilisent galement les valeurs passes dautres variables.
3.2.2 Modle conomtrique de TFE
Le modle conomtrique a t dvelopp pour les agences de la rgion Bretagne
et Pays de la Loire. Le principe du modle est dexpliquer les variations des chroniques
prvoir par des variables conomiques troitement lies. Un exemple marquant est
la relation qui existe entre le poids mensuel des marchandises transportes par TFE et
lemploi salari du transport. Si lactivit du transport se porte bien, elle va augmenter sa
masse salariale, et vice versa.
Les variables conomiques qui dirigent lactivit de distribution sont diffrentes de celles
qui dirigent lactivit dexpdition. Le tonnage distribu rete lactivit des grandes et
moyennes surfaces, lchelle du dpartement et du niveau des importations en produit
frais et surgels. Alors que le tonnage expdi est relatif la sant des exportations na-
tionales de la production locale.
Nous lavons soulign, le niveau dinformation est important pour les modles cono-
mtriques. Ils ncessitent des informations prcises et reprsentatives du phnomne
observ. Certains indicateurs de conjoncture conomique se trouvent sur des sites pu-
blics (INSEE ou de la Banque de France).
Le prvisionniste a, ainsi, fait linventaire dun ensemble dindicateurs conomiques g-
nraux externes pour expliquer le poids mensuel des marchandises transportes par une
agence. A cet ensemble, il ajoute, dune part, des facteurs exognes internes lactivit
TFE. Ce sont des variables explicatives telles que la perte ou le gain dun portefeuille
client. Elles expliquent les ruptures de tendance. Dautre part, le prvisionniste complte
le modle par 12 variables binaires, en rfrence aux mois de lanne. Elles ont pour rle
dextraire la saisonnalit mensuelle de la chronique.
La prvision de la valeur mensuelle scrit par lquation de rgression linaire suivante :
Y
t
=
i=1:m
a
i
X
eco
i,t1
+
i=1:p
b
i
X
int
i,t1
+
i=1:12
c
i
X
mois
i,t
+ d +
t
(3.3)
Soit,
T est le nombre de valeurs mensuelles historises,
t = 1 : T est le temps en mois,
110
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Y
t
est la valeur de la chronique la date t,
a est le vecteur (1 m) des coefcients des variables conomiques externes,
b est le vecteur (1 p) des coefcients des variables conomiques internes,
c est le vecteur (1 12) des coefcients saisonniers mensuels,
X
eco
est une matrice (m T) des m variables conomiques externes,
X
eco
i,t1
est la valeur de la variable conomique i la date t 1,
X
int
est une matrice (p T) des p variables conomiques internes,
X
int
i,t1
est la valeur de la variable conomique interne i la date t 1,
X
mois
est une matrice (12 T) des variables binaires relatives aux 12 mois de lan-
ne,
X
mois
i,t
est la valeur de la i
me
variable la date t, de la matrice X
mois
,
d est une constante,
t
est un rsidu.
La premire somme de lquation 3.3 reprsente leffet des facteurs conomiques ex-
ternes lentreprise. La deuxime somme reprsente leffet des facteurs conomiques
internes lentreprise. La troisime somme reprsente la saisonnalit mensuelle. Ainsi,
la valeur de la chronique, la date t, est une fonction des indicateurs conomiques ex-
ternes la date t 1, des indicateurs conomiques internes la date t 1 et du coefcient
saisonnier mensuel la date t. Le dcalage temporel entre la valeur de la chronique la
date t et les valeurs des facteurs conomiques la date t 1 existent, car ces derniers
ne sont pas encore connus la date t. Par contre, le coefcient saisonnier la date t est
connu. Le prvisionniste estime que les valeurs des facteurs explicatifs en t 1 sont une
bonne approximation des valeurs la date t. Le dcalage ainsi cr permet de prvoir
la date t, la valeur inconnue de la chronique la date t + 1, alors que les valeurs des
facteurs economiques la date t + 1 sont inconnues.
Les paramtres du modle 3.3 sont estims par la mthode des moindres carrs. Ils
sont valids par le ratio de Student. Le ratio de Student est le rapport de lestimation
du coefcient de rgression ( a
i
) et de son cart type (
a
i
). Sous lhypothse de rsidus
gaussiens, ce ratio suit une loi de Student, ce qui permet de tester si le coefcient est
signicativement diffrent de 0 (voir cours dconomtrie de G. Chevillon (30)).
Lquation 3.3 rend une valeur mensuelle de la chronique prvoir. Ltape suivante
consiste ventiler cette prvision pour aboutir une valeur journalire. Pour ce faire, le
prvisionniste rpartit la valeur mensuelle de la chronique sur quatre semaines. Il calcule
donc pour chaque mois de lanne, quatre poids hebdomadaires. Dans un deuxime
temps, il rpartit la valeur hebdomadaire ainsi obtenue sur six jours de la semaine (du
111
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
lundi au samedi). Les poids sont dnis comme une moyenne des vnements passs.
i,m
est le poids moyen annuel de la semaine i dans le mois m.
i,m
=
1
N
t=1:N
y
i,m,t
y
m,t
(3.4)
i = 1,. . .,4 est le numro de semaine du mois,
m = 1,. . .,12 est le numro du mois de lanne,
N est le nombre dannes de lhistorique,
y
i,m,t
est la valeur de la chronique pour la semaine i, du mois m, de lanne t,
y
m,t
est la valeur de la chronique pour le mois m, de lanne t.
Lanalyse des poids des jours montre quils varient au cours des diffrents mois de lan-
ne. Pour cette raison, le prvisionniste calcule des poids jour pour chacun des 12 mois
de lanne.
j,m
est le poids moyen annuel du jour j dans le mois m.
j,m
=
1
N
t=1:N
y
j,m,t
y
m,t
(3.5)
j = {lundi, mardi, mercredi, jeudi, vendredi, samedi } est le jour de la semaine,
m = 1,. . .,12 est le numro du mois de lanne,
N est le nombre dannes de lhistorique,
y
j,m,t
est la valeur de la chronique pour le du jour j du mois m de lanne t,
y
m,t
est la valeur de la chronique pour le mois m de lanne t.
Ainsi, la valeur prvue pour le jour j de la semaine i du mois m scrit :
y
j,i,m
= y
m
i,m
j,m
(3.6)
avec,
y
m
est la prvision de la valeur de la chronique pour le mois m (voir formule 3.3),
i,m
est le poids de la semaine i dans le mois m (voir formule 3.4),
j,m
est le poids du jour j dans le mois m (voir formule 3.5).
Le schma de la gure 3.6 illustre la dcomposition de la chronique tel que nous venons
de la formuler.
Les jours fris ont aussi une forte inuence sur lactivit dune agence TFE (voir section
4.3 et 4.4.6.1). Le prvisionniste a dnombr 10 jours fris (lundi de Pques, jeudi de
lAscension, Pentecte, 14 juillet, 15 aot, 1
er
novembre, 11 novembre, 1
er
mai, 8 mai,
112
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Figure 3.6 Reprsentation de la tendance, la saisonnalit et leet dune variable explicative
nol). Sachant que leffet dun 25 dcembre nest pas comparable celui dun jeudi de
lAscension, il les traite indpendamment. Il considre, par ailleurs, quils nont un effet
que sur la semaine laquelle ils appartiennent. Comme pour les jours normaux , il
calcule des poids hebdomadaires et journaliers pour les fris.
i, f
est le poids moyen annuel de la semaine i comportant le fri f dans le mois m.
i, f
=
1
N
t=1:N
y
i, f ,t
y
m, f ,t
(3.7)
i = 1,. . .,4 est le numro de semaine du mois jour fri,
f = 1,. . .,10 est le numro du jour fri,
m = 1,. . .,12 est le numro du mois jour fri,
N est le nombre dannes de lhistorique,
y
i, f ,t
est la valeur de la chronique pour la semaine i, comportant le fri f , de lanne
t,
y
m, f ,t
est la valeur de la chronique pour le mois m, comportant le fri f , de lanne
t.
Le prvisionniste pose lhypothse que la perte dactivit du jour fri est rattrape par
les autres jours de la semaine. Il en rsulte une nouvelle rpartition de la valeur hebdo-
madaire sur les 5 jours restants de la semaine. Selon le jour chm de la semaine, cette
113
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
rpartition ne sera pas la mme.
j,i, f
est le poids moyen annuel du jour j dans la semaine i comportant le fri f dans le
mois m.
j,i, f
=
1
N
t=1:N
y
j,i,m, f ,t
y
m, f ,i,t
(3.8)
j = {lundi, mardi, mercredi, jeudi, vendredi, samedi } est le jour de la semaine,
i = 1,. . .,4 est le numro de semaine comportant le jour fri dans le mois m,
f = 1,. . .,10 est le numro du jour fri,
m = 1,. . .,12 est numro du mois jour fri,
N est le nombre dannes de lhistorique,
y
j,i,m, f ,t
est la valeur de la chronique pour le jour j, de la semaine i, du mois m,
comportant le fri f , de lanne t,
y
i,m, f ,t
est la valeur de la chronique pour la semaine i, du mois m, comportant le fri
f , de lanne t.
Le modle conomtrique scrit :
Si la valeur journalire prvoir, y
j,i,m
, nest pas un jour fri et nest pas incluse dans
une semaine jour fri alors :
y
j,i,m
= y
m
i,m
j,i,m
(3.9)
Si la valeur journalire prvoir, y
j,i,m
, est incluse dans une semaine jour fri alors :
y
j,i,m
= y
m
i, f
j,i, f
(3.10)
Si la valeur prvoir, y
j,i,m
, est celle dun jour fri alors :
y
j,i,m
= 0 (3.11)
Pour rsumer, le concepteur de ce modle combine variables externes et internes len-
treprise. Les premires sont des indicateurs conomiques gnraux pour caractriser la
tendance de la srie chronologique prvoir, les secondes sont destines matriser des
uctuations inhrentes lactivit dune agence TFE. Lquation de cette tendance per-
met destimer une valeur mensuelle un horizon h. Cette valeur est ventile sur quatre
semaines par pondration par rapport la moyenne des poids des semaines du mme
mois des annes prcdentes. De la mme manire, il ventile les quatre valeurs qui en
dcoulent en 24 (4 6) valeurs journalires. Pour prendre en compte leffet des jours
fris, il spare les semaines impactes de celles qui ne le sont pas, et les tudie spa-
rment.
114
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Avantages Inconvnients
la prise en compte de variables in-
ternes pour expliquer les ruptures
de tendance,
le manque de variables internes pour expliquer
des vnements exceptionnels au niveau de la
semaine ou, plus bas, du jour,
le fait dapprhender lactivit de
TFE par des facteurs externes
faible variance,
les variables internes comme externes sont dif-
frentes suivant lagence TFE pour laquelle le
modle est tabli, (le poids mensuel transport
par lagence de Nantes est corrl lemploi
salari du transport du dpartement Loire-
Atlantique et non au niveau national), ce qui
implique une importante recherche dinforma-
tions parfois payantes et des modles de prvi-
sion dirents par rgion,
lanticipation de lactivit long
terme en surveillant les indicateurs
conomiques externes.
le processus de ventilation conduit ne pas va-
loriser les valeurs les plus rcentes, de la chro-
nique prvoir.
Table 3.1 Avantages et inconvnients du modle conomtrique de TFE
3.2.3 Modle endogne de TFE - lissage par moyennes mobiles
Un deuxime modle dvelopp chez TFE sinspire des techniques descriptives simples
(75). Il a t pens pour prvoir lactivit des agences de la rgion Nord-Ouest. Le mo-
dle statistique dcompose la chronique en une somme de la tendance, dun cycle et
dune saisonnalit. La prvision de la valeur hebdomadaire scrit selon le schma addi-
tif suivant :
Y
t
= T
t
+ C
t
+ S
t
+
t
(3.12)
Ainsi, lunit de temps de la chronique est la semaine. La valeur hebdomadaire prvue,
y
t
, est ensuite ventile sur 6 jours ouvrables.
3.2.3.1 Prvision de la chronique valeurs hebdomadaires
Soit y lhistorique, depuis 2002, des valeurs de la chronique hebdomadaire prvoir.
Le prvisionniste pose lhypothse dune saisonnalit de 52 semaines, ce qui lamne
calculer 52 coefcients saisonniers. Ils sont dtermins par la moyenne des diffrences
entre les moyennes mobiles et les valeurs relles de la chronique prvoir. Les tapes
du calcul de la prvision dune valeur hebdomadaire de la chronique sont les suivantes :
115
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
La moyenne mobile est une estimation de la tendance. Diffrentes techniques de
calcul sont envisageables selon ce que nous cherchons montrer. Par exemple,
une moyenne glissante sur les 52 dernires priodes lisse la srie en effaant leffet
de la saisonnalit.
MM
s
=
1
52
s
i=(s52)
y
i
(3.13)
y
i
est la valeur relle de la chronique la semaine i.
Pour effacer leffet que peut avoir une semaine sur la suivante, le prvisionniste ajoute
une moyenne mobile de deux priodes.
MMC
s1
=
MM
s1
+ MM
s
2
(3.14)
Les coefcients saisonniers permettent destimer la saisonnalit sur lanne, de
la chronique prvoir. Dans le cas dun schma additif (voir section 2.3.3), si le
coefcient saisonnier dune semaine s est suprieur 0 alors la valeur moyenne de
la chronique pour la semaine s est suprieure la valeur moyenne des valeurs de
la chronique comprises dans lintervalle [s 52; s + 52]. Inversement si la valeur du
coefcient saisonnier dune semaine s est ngatif, cest quen moyenne la valeur de
la semaine s est infrieur la moyenne de lensemble des valeurs de la chronique
comprises dans lintervalle [s 52; s + 52]. Les tapes du calcul sont :
lcart entre la srie observe et la moyenne mobile :
e
i
= y
i
MMC
i
(3.15)
i est un indice pour parcourir toute les valeurs de la chronique prvoir.
la moyenne des carts relatifs la mme semaine :
e
s
=
1
N
N
t=1
e
s,t
(3.16)
s est lindice des semaines s = 1,. . .,52, t est le numro de lanne dans lhistorique de la
chronique et N est le nombre dannes de ce mme historique.
le calcul de la somme des moyennes des carts :
S
s
= e
s
S
52
(3.17)
le calcul des coefcients saisonniers, en vertu du principe de conservation
des aires, la somme des uctuations saisonnires (coefcients saisonniers)
est nulle sur une anne. Ce qui veut dire que le prvisionniste normalise des
carts moyens :
116
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
S =
52
s=1
e
s
(3.18)
La tendance correspond la srie des moyennes mobiles.
T
i
= MMC
i
(3.19)
Le cycle est une saisonnalit dont la priodicit dpasse lanne. Il est obtenu par
la diffrence entre la tendance et la moyenne mobile.
C
i
= MMC
i
T
i
(3.20)
La prvision dune valeur hebdomadaire de la chronique est le rsultat de la com-
binaison entre la saisonnalit, la tendance et le cycle.
y
n+1
= S
s
+ T
n+1
+ C
n2
(3.21)
Soit y
n
la dernire valeur connue de la chronique et y
n+1
la valeur prvoir. y
n+1
est une
prvision de y
n+1
. S
n+1
correspond au coefcient saisonnier de la semaine relative n+1,
T
n+1
est lextrapolation de la tendance T
n+1
= T
n
+ (T
n
T
n1
). C
n2
est la dernire valeur
connue du cycle. Le dcalage de 2 units de temps est celui retrouv pendant le calcul
de la moyenne mobile additionn celui de lhorizon de prvision (h = 1).
3.2.3.2 Redistribution sur 6 jours
La valeur prdite dune semaine est ventile sur les 6 jours ouvrables (du lundi au sa-
medi). Les coefcients de pondration sont estims en fonction des vnements passs.
La mthodologie utilise se rsume en 5 tapes :
Etape 1
Connaissant la valeur relle quotidienne, le prvisionniste calcul le ratio entre cette der-
nire et celle de la semaine associe. y
a,s
est la valeur relle que prend la chronique,
hebdomadaire, la semaine s de lanne a. y
j
a,s
est la valeur relle que prend la chronique,
journalire, le jour j de la semaine s de lanne a.
y
a,s
= y
lundi
a,s
+ + y
samedi
a,s
(3.22)
s = {1, . . . , 52} est le numro de la semaine dans lanne a, a = {2002, . . . , 2007}.
R
j
a,s
est le poids de la valeur prise par la chronique, le jour j de la semaine s de lan-
ne a, dans la semaine s de lanne a.
R
j
a,s
=
y
j
a,s
y
a,s
(3.23)
j = {lundi, . . . , samedi} est le jour de la semaine.
117
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Etape 2
Pour chaque anne de lhistorique, le prvisionniste mesure une moyenne trimestrielle
des quotients calculs ltape 1. Il distingue les semaines normales (voir tableau
3.2) des semaines encadrant ou incluant un jour fri (voir tableau 3.3).
R
j
a,t
est le poids moyen dans le trimestre t de lanne a du jour j dans une semaine
normale .
R
j
a,t
=
1
3 4
34
s=1
R
j
a,s
(3.24)
Dans un trimestre t, t = {1, . . . , 4}, le prvisionniste compte 3 4 semaines normales
et 6 jours dans une semaine, j = {lundi, . . . , samedi}.
Le tableau 3.2 illustre un exemple des poids calculs avec la formule 3.24.
Lundi Mardi Mercredi Jeudi Vendredi Samedi
2003 Trim 4 17,21% 19,48% 18,75% 20,46% 17,56% 6,54%
2004 Trim 4 17,62% 18,51% 18,11% 19,11% 17,84% 8,81%
2005 Trim 1 18,84% 18,08% 19,24% 17,19% 18,18% 8,46%
2005 Trim 2 17,69% 17,89% 19,68% 17,53% 18,49% 8,72%
2005 Trim 3 17,06% 17,67% 19,62% 17,73% 18,57% 9,35%
2005 Trim 4 17,86% 18,17% 19,02% 17,69% 18,44% 8,82%
2006 Trim 1 17,88% 17,41% 19,81% 16,82% 19,09% 8,99%
2006 Trim 2 17,87% 16,84% 19,49% 16,99% 19,69% 9,12%
2006 Trim 3 17,71% 17,40% 19,19% 17,73% 18,61% 9,36%
2006 Trim 4 18,04% 17,11% 19,29% 17,35% 19,17% 9,04%
Table 3.2 Exemple des poids jours calculs par trimestre
Les poids des jours dans les semaines jours fris sont calculs non plus au trimestre,
mais sur tout lhistorique.
RF
j
f
=
y
n+1
= y
n+1
CY
n+1
+ VE
n
(3.26)
119
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
y
n+1
est la valeur corrige de la prvision obtenue par la formule 3.21.
La ventilation de la valeur prvu
y
n+1
sur les 6 jours de la semaine, est :
Dans le cas dune semaine normale,
y
j,n+1
=
y
n+1
R
j
a,t
(3.27)
Dans le cas dune semaine incluant un jour fri, le jour f ,
y
j,n+1
=
y
n+1
RF
j
f
(3.28)
y
j,n+1
est la prvision du jour j de la semaine n + 1,
y
n+1
est la prvision de la semaine n + 1,
R
j
a,t
est le poids moyen dans le trimestre t de lanne a du jour j dans une semaine n +1.
RF
j
f
est le poids du jour j dans la semaine n + 1, qui a comme fri le jour f .
Les avantages et inconvnients de ce modle sont :
Avantages Inconvnients
facilit de la comprhension de
lactivit dune plate-forme,
non prise en compte de leet du jour fri sui-
vant que cest un lundi de Pentecte ou un Nol.
mise en vidence des priodes cri-
tiques et diciles prvoir,
le bruit du modle pointe lin-
uence des phnomnes extrieurs.
Table 3.4 Avantages et inconvnients du modle endogne de TFE - lissage par moyennes
mobiles
3.2.4 Modle endogne de TFE - mthode de Holt-Winters
Ce modle a t pens et dvelopp pour les agences de la rgion Sud-Ouest.
Comme pour le modle prcdent, lunit de temps de la srie chronologique est la
semaine. Le prvisionniste fait lhypothse dune saisonnalit de 52 semaines. La prvi-
sion journalire dcoule de la prvision hebdomadaire par lutilisation de coefcients de
rpartition.
A partir de la srie hebdomadaire, le prvisionniste utilise les formules de lissage expo-
nentiel proposes par Holt-Winters (63; 122). Il dcide dutiliser un schma additif. En
120
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
effet, de manire gnrale sur les agences tudies, lamplitude entre les poids mini-
mums (le samedi) et les poids maximaux ne varie pas avec le temps.
La mthode de Holt-Winters amliore la prvision par lissage exponentiel. Cest une
technique dite autoprojective . Le principe est de privilgier les observations les plus
rcentes par lutilisation de coefcients de pondration. Dune manire rcursive, les for-
mules de lissage sont mises jour et permettent dobtenir une prvision. Dans le cas du
lissage exponentiel simple la formule de lissage a pour but destimer la tendance sur les n
dernires observations. Suivant limportance donne aux observations les plus rcentes
par rapport aux plus anciennes, elles se voient affecter des poids. A lestimation de la
tendance, Holt-Winters introduit des coefcients pour modliser la saisonnalit.
Dans le cas dun schma additif avec saisonnalit, les formules de lissage scrivent :
Le lissage de la moyenne,
a1
s,a
= ((y
s,a
VC
s,a
) S
s,a1
) + (1 )(a1
s1,a
+ a2
s1,a
) (3.29)
Le lissage de la tendance,
a2
s,a
= (a1
s,a
a1
s1,a
) + (1 )a2
s1,a
(3.30)
Le lissage de la saisonnalit,
S
s,a
= ((y
s,a
VC
s,a
) a1
s,a
) + (1 )S
s,a1
(3.31)
avec
y
s,a
est la valeur prise par la chronique la semaine s de lanne a,
y
s,a
est lestimation de la valeur prise par la chronique la semaine s de lanne a,
y
a
est la moyenne des valeurs hebdomadaires prises par la chronique lanne a,
VC
s,a
est la variable de correction de la semaine s de lanne a,
Pe est la priode (ici 52 semaines ou une anne)
h est lhorizon de prvision en nombre de semaines (infrieur un an),
, , : les constantes de lissage.
Le choix des paramtres de lissage est arbitraire. Le paramtre conditionne les rsul-
tats de prvision. Si nous voulons une prvision ractive, cest--dire qui accorde une
plus grande importance au pass rcent, nous choisirons un paramtre , proche de 1.
Les paramtres et ont la mme proprit. Le prvisionniste de TFE a choisi doc-
troyer de limportance aux donnes lointaines ( proche de 0), dtre plus ractif sur le
coefcient de lissage de la tendance ( proche de 0.4) et sur celui du coefcient de sai-
sonnalit ( = 0.2).
121
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Linitialisation des valeurs initiales permet de dbuter le calcul rcursif partir de la
deuxime anne.
a1
s=1,a=2
= y
a=1
(3.32)
a2
s=1,a=2
= 0 (3.33)
S
s=1,a=2
= y
s=1,a=2
y
a=1
(3.34)
La prvision partir de la semaine s pour un horizon h scrit :
y
s+h,a
= a1
s+h,a1
+ h a2
s+h,a1
+ S
s+h,a1
+ VC
s+h,a
(3.35)
Ayant obtenu une prvision la semaine, y
s+h,a
, le prvisionniste cherche des coefcients
journaliers de rpartition.
j
=
n
i=1
y
j,i
n
i=1
y
i
(3.36)
n est le nombre de valeurs de la chronique journalire. Rappelons que pour lune ou
lautre des six sries temporelles dcrivant lactivit des agences de transport TFE(voir
section 3.2), n est approximativement gale 6 jours 52 semaines 7 ans dhistorique,
soit 2.184 valeurs.
j
est poids du jour j, ( j = {lundi, . . . , samedi}) dans la semaine. Il est
gal la somme des valeurs prises par la chronique du jour j rapporte la somme des
valeurs de la chronique journalire. Ne sont pris en compte que les valeurs des semaines
sans jours fris.
Les poids des jours des semaines jours fris sont calculs de la mme faon, mais
en ne prenant en compte que les semaines ayant comme jour fri celui tudi. Ainsi, le
prvisionniste aboutit au tableau 3.5.
Fri Lundi Mardi Mercredi Jeudi Vendredi Samedi
Aucun 17,23% 21,05% 19,34% 19,17% 16,79% 6,42%
Lundi 0,00% 23,29% 24,54% 23,16% 19,72% 9,29%
Mardi 20,40% 0,00% 25,52% 24,54% 20,15% 9,39%
Mercredi 23,80% 26,00% 0,00% 21,31% 18,02% 10,88%
Jeudi 22,08% 26,87% 24,74% 0,00% 17,92% 8,39%
Vendredi 19,95% 24,78% 26,35% 21,02% 0,00% 7,89%
Samedi 19,72% 21,42% 21,35% 18,49% 19,02% 0,00%
Table 3.5 Coecients journaliers du modle endogne de TFE - mthode de Holt-Winters
122
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
La ventilation de la prvision hebdomadaire sur les 6 jours ouvrs de la semaine devient :
y
j,s+h,a
= y
s+h,a
j
(3.37)
y
j,s+h,a
est la prvision du jour j de la semaine s + h de lanne a. Cest le rsultat dune
ventilation de la prvision hebdomasaire, y
s+h,a
(3.35), par le poids,
j
(3.36).
Les avantages et inconvnients de ce modle sont :
Avantages Inconvnients
une grande facilit de mise en
uvre due des calculs simples,
non prise en compte de leet du jour fri sui-
vant que cest un lundi de Pentecte ou un Nol,
une ractivit aux vnements r-
cents si 1,
le choix arbitraire des coecients nest pas fa-
cile et inuence fortement les rsultats,
une facilit dimplmentation sur
tableur.
non prise en compte de leet des vnements
extrieurs,
systme ragit avec un temps de retard une
modication de la chronique ( course pour-
suite entre ralisation et prvision quand
1) (24).
Table 3.6 Avantages et inconvnients du modle endogne de TFE - mthode de Holt-
Winters
3.2.5 Outil informatique utilis
Ces modles ont t ajust et implant avec laide dun tableur. Or le tableur est peu
adapt aux tches de prvision en raison de ses limites,
dautomatisation des traitements,
de mise jour des donnes,
de changement de scnario,
de contrles des donnes,
de rapidit.
Ainsi, les modles statistiques nont pas pu tre gnraliss et utiliss sur un serveur
pour dployer les rsultats sur lensemble des agences. Daprs une tude de mode-
lEdition SA ralise auprs de 41 grosses et moyennes entreprises, 64% utilisent un
123
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
tableur pour leurs prvisions et seulement 11% utilisent des outils de simulation spciali-
ss (voir section 2.3.4.3). Pourtant, les prises de dcisions pourraient tre sensiblement
amliores par ces derniers. Cest le choix fait par le projet de recherche Horizons . Il
a permis dhomogniser la dnition du calcul de lhistorique des chroniques prvoir,
de centraliser les traitements sur un serveur et de diffuser linformation prvisionnelle sur
lensemble du rseau.
124
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Chapitre 4
Le systme de prvision Horizons :
Conception, dveloppement et mise en
uvre
Le challenge du projet Horizons est de proposer un modle statistique de prvision
de lactivit du quai adapt toutes les agences TFE, et dimplmenter ce modle au
travers dune application informatise pour lintgrer dans la chane oprationnelle. Cest
un pas vers une approche concentre, cest--dire que les prvisions dactivit seront
centralises dans un seul dpartement. Pour rduire les cots de licences, les outils
informatiques utiliss doivent tre open source. Il faut aussi convaincre lensemble des
dirigeants du bien-fond du projet. Il faut gagner la conance des hommes et des femmes
du terrain pour quils utilisent le systme de prvision propos.
4.1 Nouvelle organisation de la prvision chez TFE
La section 3.2 rappelle quavant le projet Horizons, lorganisation de la prvision dac-
tivit sest faite suivant une approche indpendante et non concentre (voir section 2.3.2).
Pour harmoniser les procdures, TFE a choisi de crer une cellule de prvision centra-
lise au sige. Ce choix cherche rpondre aux prconisations mentionnes dans la
section 2.3.2. Lavantage de la centralisation est de matriser les effectifs, de limiter les
achats de licences logiciels, dharmoniser lextraction des donnes (voir section 4.2), de
grer une seule application (voir section 4.7) et de diffuser par client lger le rsultat
des recherches (voir section 4.7.3). Un systme de prvision ainsi centralis autorise
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
une interaction avec le systme dinformation, une comparaison des rsultats entre sites,
laccs rapide linformation et sa correction, si ncessaire, en une seule fois. Pour tre
au cur du systme dinformation, la cellule de prvision est place physiquement ct
du service dinformation dcisionnel. Le service dinformation dcisionnel propose, cre
et diffuse les indicateurs pertinents, permettant aux quipes managriales et opration-
nelles de prendre les bonnes dcisions et ainsi, de piloter leur activit sereinement. Ce
service est le plus mme de fournir, en toute impartialit, linformation dont la cellule de
prvision a besoin. Le service dinformation dcisionnel fournit la cellule de prvision
un accs sans limites lentrept de donnes et aux outils permettant de linterroger (voir
section 3.1.1). La cellule de prvision a pour mission :
dextraire les donnes historiques dcrivant lactivit prvoir,
de chercher un modle mathmatique de prvision unique, compatible lactivit
des 70 sites de transport,
de restituer de faon comprhensible les rsultats prvisionnels,
dautomatiser les procdures (extraction, transformation, prvision, indicateur de
qualit, restitution),
de mettre jour quotidiennement les donnes,
de former les managers lutilisation du systme de prvision.
Ces missions sont dveloppes dans les sections suivantes.
4.2 Harmonisation et centralisation de linformation
La procdure duniformisation des donnes est dveloppe suivant la dnition don-
ne la valeur prvoir. Rappelons quun objectif du projet de recherche Horizons
est de prvoir les chroniques suivantes (voir section 1.2.4) :
le nombre quotidien de positions et le poids des marchandises passes quai,
le nombre quotidien de positions et le poids des marchandises passes quai et
destination dune tourne de distribution (livraison),
le nombre quotidien de positions et le poids des marchandises passes quai et
destination dune tourne dexpdition.
Pour rpondre aux attentes de planication des ressources, il faut aussi prvoir :
le nombre total dheures productives quotidiennes sur le quai,
le nombre dheures productives quotidiennes sur le quai pour traiter les marchan-
dises destines la distribution,
126
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
le nombre dheures productives quotidiennes sur le quai pour traiter les marchan-
dises destines lexpdition.
Ces 9 sries chronologiques sont communes aux 70 agences de transport du groupe
STEF-TFE. Le modle statistique de prvision se focalise sur les 6 premires chroniques.
Ce qui signie que le modle statistique doit convenir la prvision de 420 (6 70) chro-
niques au niveau du groupe. La prvision des trois dernires chroniques, relatives aux
heures productives par agence, est dduite de la prvision du poids quotidien des mar-
chandises passes quai.
Les valeurs prises par ces 9 sries chronologiques ont une dnition qui a volu entre le
dbut du projet et sa mise en production. Jusquen Janvier 2008, le transporteur navait
pas de dnition commune pour lensemble des agences de ce qutaient le poids en
distribution et celui en expdition. Les agences avaient toutes des procdures dextrac-
tion du poids et du nombre de positions en expdition et en distribution diffrentes. Il tait
ainsi impossible de comparer des agences entre elles. Il semblait galement impossible
dinventorier les diffrentes rgles dextraction et de les dvelopper toutes pour coller aux
besoins spciques de chacune des agences.
Au cours de lanne 2007 se dveloppe au sein du transporteur, une politique dharmo-
nisation des outils et des processus mtiers. Entre 2007 et 2009, toutes les agences du
transporteur migrent leur TMS de HP vers GTI (voir section 3.1.1). Ce nouveau TMS im-
pose tous de travailler de faon uniforme. La Direction dExploitation (DEX) pose alors
en Janvier 2008 une dnition commune des indicateurs en expdition et en distribution
(voir section 3.1.2). Les indicateurs sont calculs quotidiennement et ont pour vocation
danalyser lexploitation de faon quotidienne et mensuelle. Le systme de prvision peut
alors devenir un outil mtier lenvergure du groupe. Non seulement il prvoit une partie
des indicateurs dnis par la DEX, mais il permet galement danalyser leur volution
travers le temps et de comparer leur performance selon les agences. Il faut tout de mme
garder lesprit que les agences de transport du groupe STEF-TFE ne sont pas toutes
comparables, leur taille et leur activit varient. Par contre lvolution dans le temps des
indicateurs est comparable entre agences.
Nous avons soulign que la base de donnes GTI est alimente depuis 2007. Les don-
nes davant 2007 sont rcolter dans la base de donnes HP3000. Les tables issues
de la base de donnes GTI et celles issues de HP3000 ne sont pas identiques.Cest
pourquoi les procdures dextraction et de transformation des donnes, pour coller d-
nition des indicateurs prvoir, donne par la DEX, sont diffrentes selon les bases de
donnes sources (HP3000 ou GTI).
Dans le but de centraliser linformation, les tables recueillant linformation ncessaire la
prvision des indicateurs dactivit sont stockes dans lentrept de donnes du groupe
127
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
STEF-TFE. Pour accueillir lhistorique des donnes prvoir, trois nouvelles tables sont
cres dans linfocentre. La table HORIZONS (voir table 4.1)contient un enregistrement
quotidien par site de transport. Ne sont prsents que les sites pour lesquels il a t pos-
sible dextraire un historique dau moins trois ans. Nanmoins, la premire date de la
table est le 1
er
Janvier 2000, car certaines agences cumulent des donnes depuis cette
date. Les donnes historises sont le poids et le nombre de positions en expdition et en
distribution passes quai. La somme des deux donne le total du poids ou du nombre
de positions passes quai. La table HORIZONS ajoute chacune de ces informations
deux informations supplmentaires : la prvision et la correction de la prvision, apporte
par lutilisateur, le cas chant. Enn, elle historise le motif de la correction apporte (voir
section 4.7.3).
La table AGE_HORIZONS (voir table 4.1) contient un enregistrement par agence. Elle
permet dobtenir, partir de son code, le libell dune agence en toutes lettres. Elle
conserve, pour chacune des variables prvoir, les coefcients pondrateurs utiliss
dans le modle mathmatique de prvision, pour combiner les prvisions issues des dif-
frentes mthodes (voir section 4.4.11). Elle recueille galement un champ permettant
dactiver, ou non, lagence pour quelle soit visible sur linterface web.
La table HQUAI_HORIZONS (voir table 4.1) rassemble les informations sur les heures
productives du quai. Elle est construite de la mme faon que la table HORIZONS mais
dans le but de rpondre la prvision du nombre dheures productives et du taux de
productivit (voir section 3.1.3).
4.3 Modles de prvision proposs en analyse statistique
De nombreuses mthodes statistiques de prvision ont t tudies avant de trou-
ver celle qui convenait le mieux. Pour tre dans la continuit de ce que lentreprise de
transport avait dj ralis en la matire, il va de soi que les modles de la section 3.2
ont servi de base pour chercher ne garder que les avantages et tenter dliminer les
inconvnients. Rappelons que ces modles utilisent les techniques de :
dcomposition de la srie chronologique en tendance, saisonnalit, erreur,
lissage exponentiel,
moyenne mobile.
Ce sont les mthodes les plus rpandues dans les ouvrages statistiques. Elles sont ga-
lement mentionnes par G. Mlard (90). Il propose un tour dhorizon des mthodes sta-
tistiques utilises par les entreprises dans le but de prvoir les ventes, le rendement
dun investissement, la pntration dun march ou leffet du passage aux 35 heures ,
court et moyen terme. Il rappelle les mthodes endognes et exognes, quil appelle
128
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
HORIZONS
DDATE
AGENCE
ANNEE
MOIS
JDUMOIS
JDESEM
SDEANNEE
EXPPDS_PAST
EXPPDS_REEL
EXPPDS_PREV
EXPPDS_CORR
DISTPDS_PAST
DISTPDS_REEL
DISTPDS_PREV
DISTPDS_CORR
TOTPDS_PAST
TOTPDS_REEL
TOTPDS_PREV
TOTPDS_CORR
EXPNBPOS_PAST
EXPNBPOS_REEL
EXPNBPOS_PREV
EXPNBPOS_CORR
DISTNBPOS_PAST
DISTNBPOS_REEL
DISTNBPOS_PREV
DISTNBPOS_CORR
TOTNBPOS_PAST
TOTNBPOS_REEL
TOTNBPOS_PREV
TOTNBPOS_CORR
MOTIF_CORR
AGE_HORIZONS
AGENCE
COEFFDISTPDS
COEFFEXPPDS
COEFFDISTNBPOS
COEFFEXPNBPOS
COEFFTOTPDS
COEFFTOTNBPOS
OK
DESCRIPTION
CNUIPDS_CHG
CJOUPDS_CHG
CTOTPDS_CHG
CJOUNBPOS_CHG
CNUINBPOS_CHG
CTOTNBPOS_CHG
CNUIPDS_DECHG
CJOUPDS_DECHG
CTOTPDS_DECHG
CJOUNBPOS_DECHG
CNUINBPOS_DECHG
CTOTNBPOS_DECHG
HQUAI_HORIZONS
DDATE
AGENCE
ANNEE
MOIS
JDUMOIS
JDESEM
SDEANNEE
H_QUAIDIST
NBMAT_QUAIDIST
H_QUAIEXPE
NBMAT_QUAIEXPE
TXH_PRODDIST
TXH_PRODEXPE
H_QUAIDIST_PLAN
H_QUAIEXPE_PLAN
TXM_PRODDIST
TXM_PRODEXPE
NBMAT_QUAIDIST_PLAN
NBMAT_QUAIEXPE_PLAN
PREV_TX_PRODDIST
PREV_NBMATDIST
PREV_TX_PRODEXPE
PREV_NBMATEXPE
H_QUAITOT
NBMAT_QUAITOT
TXH_PRODTOT
H_QUAITOT_PLAN
TXM_PRODTOT
NBMAT_QUAITOT_PLAN
PREV_TX_PRODTOT
PREV_NBMATTOT
Table 4.1 Tables cres dans lInfocentre pour le besoin du projet Horizons
mthodes extrapolatives et mthodes explicatives . Comme mthodes les plus fr-
quemment utilises, il cite le lissage exponentiel, la moyenne mobile dordre k, le modle
de Brown et Holt-Winters, la rgression linaire multiple, la mthode de Box et Jenkins
(ARIMA) et lanalyse spectrale.
129
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Avant de commenter certaines de ces mthodes, rappelons brivement la problma-
tique. Lentreprise de transport souhaite trouver un modle de prvision horizon de
45 jours pour six sries temporelles : poids et nombre de lettres de voiture en expdi-
tion, distribution et total passs quai. Nous constaterons par la suite que la chronique
du nombre de lettres de voiture journalier suit approximativement la mme saisonnalit
que celle du poids transport. Lentreprise de transport cherche se doter dun outil de
prvision unique sadaptant toutes les agences de son rseau, et qui soit complte-
ment automatis. Le modle doit fournir des rsultats dans un temps dexcution jug
raisonnable. Lcart type des erreurs de prvision ne doit pas dpasser 10% de la valeur
prdite. Lentreprise ne souhaite pas investir dans lachat de donnes externes pouvant
servir de facteurs explicatifs de lactivit. Il est prouv que les jours fris ont une in-
uence dterministe et quantiable sur lactivit. Les sries chronologiques discrtes
prvoir ont au moins 3 ans dhistorique. Lunit dobservation est la journe.
Suite ces contraintes, le modle exogne seul tait exclu. Les facteurs susceptibles
dexpliquer lactivit dune agence du Nord de la France sont diffrents de ceux qui ex-
pliquent lactivit dune agence situe dans louest ou le sud. Il y aurait donc fallu crire
plusieurs modles statistiques de prvision. Dautre part, ces facteurs sont lis soit aux
clients (promotion des ventes), soit lactivit conomique du march (indicateurs IN-
SEE). Dans un cas comme dans lautre, les donnes sont onreuses et le risque quelles
ne soient pas mises jour temps les rend inutilisables.
Ayant, peu de chose prs, comme unique information lhistorique de la chronique
prvoir, il est lgitime de vouloir se retourner vers les modles Auto-Regressive - In-
tegrated - Moving Average ARIMA (21). Les mthodes pour utiliser ces modles (AR,
MA, ARMA, ARIMA, SARIMA) ont t dveloppes par Box et Jenkins, en 1976. Les mo-
dles sont appels autorgressifs car ils cherchent dterminer une valeur de la srie,
en fonction dune combinaison linaire des valeurs qui la prcdent. Le cours (35), crit
par J.J. Daudin, C. Duby, S. Robin et P. Trcourt, explique que pour appliquer les proces-
sus AR et MA il faut que la srie chronologique soit stationnaire. Une suite de variables
alatoires est stationnaire quand leurs moyennes et leurs covariances sont constantes
dans le temps.
Soit un processus temporel valeurs relles et en temps discret Z
1
, Z
2
, . . . , Z
t
. Il est
dit stationnaire de second ordre si
E(Z
i
) = i = 1 . . . t
Var(Z
i
) =
2
i = 1 . . . t
Cov(Z
i
, Z
ik
) = f (k) i = 1 . . . t et k = 1 . . . t
130
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
La tendance et la saisonnalit sont des facteurs de non stationnarit. Un processus din-
tgration permet dliminer la tendance par diffrentiation. La saisonnalit, quant elle,
peut tre limine par diffrenciation saisonnire (116).
Bien que ces modles soient frquemment utiliss pour prvoir des sries conomiques
(99; 24; 117), ils ont dans notre cas prcis deux inconvnients. Le premier est que les
modles de la classe ARIMA ne prennent pas en compte leffet dvnements calen-
daires : les jours fris, les vacances, les ftes. Ces vnements affectent environ 1/4
des semaines et provoquent une forte variation de lactivit des agences de transport. Le
deuxime inconvnient est que les paramtres (p,d,q)(P,D,Q) des modles de la classe
SARIMA sont gnralement dterminer manuellement. Les algorithmes capables de
les dterminer automatiquement sont lents et coteux en ressources machine. Ils doivent
comparer un grand nombre de combinaisons de modles possibles entre p, d, q, P, D
et Q pour minimiser les trois critres de performances qui sont : le critre dinformation
dAkaike (1974), de Schwarz (1978) et dHannan-Quinn (1979). Chacun de ces critres
est fond dune part sur une mesure de vraisemblance et dautre part sur une mesure
de pnalit, cette dernire tant une fonction croissante avec le nombre de paramtres
estimer. Il nexiste pas de modle optimal. Un modle est optimal seulement relativement
au critre que lon a utilis pour le slectionner, (33).
Pour rsoudre le premier inconvnient, des chercheurs comme Ferrara, Gueguan, Ind-
jehagopian, Mustafa, Chen, Vidakovic et Mavris (50; 66; 95; 28) utilisent les modles de
la classe ARIMAX. Cest une gnralisation du modle ARIMA dans lequel une variable
externe est incorpore (eXternal inputs). Ainsi la prvision de la chronique ne dpend
pas uniquement de son historique. Aussi appele analyse dintervention , cette tho-
rie a fait lobjet dune grande activit de recherche. Box et Tio (1975) sont lorigine de la
thorie, mais par la suite dautres auteurs sy sont intresss : Granger (1980), Brokwell
et Davis (1987), Chang et al. (1988), Box, Jenkins et Reinsel (1994).
Il est intressant de constater quune entreprise de transport de voyageurs (la RATP) bute
sur les mmes problmatiques quune entreprise de transport sous temprature dirige.
Ferrara et Guegan (50) expliquent comment ils construisent un modle ARMAX pour pr-
voir le trac et le nombre de titres de transport vendus. Lapproche de Box et Jenkins
(1970) utilise simplement linformation quantitative contenue dans les donnes, alors que
lanalyse dintervention (ARIMAX) permet dajouter de manire additive une information
de type qualitative, par le biais de variables binaires exognes . Une Entreprise dlec-
tricit au Etats-Unis fait galement face aux mmes problmes (22). Comme dans le
cas de lactivit du transporteur, la consommation dlectricit montre une double sai-
sonnalit. La saisonnalit hebdomadaire, la saisonnalit journalire et la tendance sont
limines par diffrenciation. Comme pour lactivit du transport sous temprature diri-
ge, la consommation dlectricit subit une forte variation lors des jours fris. Lanalyse
dintervention permet alors de prendre en compte, dans lapproche de Box et Jenkins,
une information qualitative par le biais de variables binaires exognes (50). Lavantage
131
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
de lanalyse dintervention par rapport un modle conomtrique, est quelle modlise
de manire continue et non ponctuelle leffet de lintervention (exp : jours fris) sur les
valeurs environnantes.
Une approche similaire mais toutefois diffrente, pour prvoir la consommation dlec-
tricit, est propose par M. Martin (82). Ses travaux suggrent de partir dun modle
SARIMA, den dduire un modle dtat saisonnier pour le ltrer laide de ltres
de Kalman embots. Par la suite, il utilise les modles dintervention pour modliser les
effets des vnements exceptionnels qui perturbent les valeurs de srie chronologique
prvoir. Mentionnons sur ce sujet les travaux plus rcents de Lemoine et Pelgrin (76),
ainsi que larticle (124) dcrivant une manire de mettre en pratique ces mthodes
laide de logiciel statistique.
Bien que ces techniques soient trs prometteuses dans les cas de lanalyse dune chro-
nique dcrivant lactivit dune agence de transport particulire, nous ne les avons pas
retenues. La raison qui prvaut est quil semble difcile dautomatiser le calcul des para-
mtres dun modle SARIMA(X) pour rpondre aux particularits des quelque 342 sries
chronologiques prvoir. Bien que ces chroniques se ressemblent du point de vue de
la saisonnalit, des diffrences subsistent. Dautre part, dans le cadre de lactivit du
transporteur, nous avons remarqu que les diffrentes diffrenciations ne permettaient
pas de rendre les sries chronologiques systmatiquement stationnaires. Or, cest une
hypothse fondamentale dans les modles AR et MA.
Pour prvoir un grand nombre de sries chronologiques, Morineau et al. (92) proposent
de commencer par les classer laide dune analyse par correspondance. A laide dune
analyse par composantes principales sur la matrice de covariance de chaque classe, ils
extraient autant de nouvelles chroniques. Ces dernires sont prvues par les modles de
la classe SARIMA. Sur ce sujet, D. Ladiray a publi un article en 2006 (72) pour faire le
point sur les mthodes utilises dans le but de combiner lanalyse des donnes et lana-
lyse des sries temporelles. Mais ces techniques semblent plus adaptes la prvision
dun trs grand nombre de sries temporelles comme, par exemple, la vente de milliers
de rfrences produits dans un Hypermarch. Elles permettent galement de prvoir la
vente darticles nouveaux pour lesquels il nexiste pas dhistorique. Il est alors possible
de les affecter une classe de produits et dutiliser la chronique associe cette classe.
Pour tenter de mesurer leffet des jours fris sur lactivit, une mthode non para-
mtrique a retenu notre attention. Elle est propose par Poggi (99). La consommation
dlectricit en France est, lpoque, en 1994, prvue par des modles de la famille
SARIMA. Poggi remarque que ces modles ne sont pas adapts pour prvoir leffet des
jours fris sur la consommation lectrique. Il propose un modle non paramtrique.
Lide est de construire une fentre dobservation de taille dtermine, et centre au-
132
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
tour de la dernire valeur connue de la chronique. Cest la fentre tmoin. Il analyse la
chronique observe dans la fentre tmoin pour la comparer aux priodes prcdentes,
suivant un indice de similarit. La prvision est dduite des observations de la fentre
retenue (celle au plus fort indice de similarit avec la fentre tmoin). Cette mthode
a lavantage de prvoir des sries temporelles diverses, laide dun seul et mme outil
lmentaire. Linconvnient est quelle est gourmande en ressource informatique puisquil
faut constamment parcourir la chronique pour la comparer la fentre tmoin.
4.4 Modle statistique de prvision proposs par Hori-
zons
Mettre en uvre la prvision des indicateurs dactivit des agences de transport TFE
savre difcile. Ces indicateurs sont, en effet, le rsultat dvnements chronologiques
qui concernent non seulement des facteurs ayant un comportement dterministe (jours,
congs scolaires, zone gographique) mais aussi des facteurs stochastiques (mto,
jours fris, jours de grve, impact de lactualit sur le consommateur : grippe aviaire et
vache folle, march conomique). La prvision demande ainsi de faire appel des m-
thodes de modlisation statistiques et probabilistes. Les mthodes endognes utilisent
lhistorique des donnes de la variable prvoir. Les mthodes exognes utilisent des
donnes corrles celles que lon sefforce prvoir (18).
La problmatique pose par TFE tant de prdire lactivit des ns oprationnelles (ho-
rizons de prvision trs courts termes), il semble logique de privilgier les mthodes
quantitatives. Elles ont galement le mrite de pouvoir tre programmes informatique-
ment et ainsi tre automatisables.
Supposons que lactivit dune agence TFE est dtermine par trois composantes, une
composante dterministe (saisonnalit, jour fri) dont les valeurs futures sont connues,
une composante stochastique (grve, perte dun portefeuille client) dont les valeurs fu-
tures sont inconnues, et une composante non observe (liquidation judiciaire du principal
concurrent - Nexia) dont les valeurs passes, prsentes et venir sont inconnues (29).
Le modle propos extrait de la chronique la composante dterministe avant dappliquer
un modle autoprojectif pour caractriser la composante stochastique. Lcart entre
le modle et les observations rsulte de la composante non observe ou dune compo-
sante mal estime. Ce modle trouve sa valeur ajoute dans le fait quil sadapte aux
spcicits de chaque agence. Il est implment pour tre excut sans intervention hu-
maine. Comme les modles prcdents, il sappuie sur des algorithmes mathmatiques
avancs, ayant pour principe dextrapoler les vnements passs sur le futur. Pour ne
133
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
pas perdre linformation du pass infrieur une semaine, lalgorithme de prvision ne
va pas chercher ventiler les prvisions hebdomadaires en prvisions journalires. Au
contraire, il sappuie sur la donne journalire, car cest linformation la plus ne prsente
dans le systme dinformation de lentreprise.
Lalgorithme de prvision prsent a fait lobjet dune publication (37) et a t prsent
dans des congrs (38; 39; 40; 42; 43).
4.4.1 Historique
Lhistorique dune srie temporelle est lensemble des valeurs de la srie temporelle,
incluses dans un intervalle de temps et utilises pour gnrer une prvision. La premire
valeur prvue dune srie temporelle fait gnralement suite la dernire valeur de lhis-
torique de cette mme srie temporelle. Rappelons quun modle de prvision cherche
dcrire certaines rgularits dans lhistorique pour les extrapoler et ainsi proposer une
prvision de la chronique.
Luniformisation les donnes en provenance des bases de donnes HP3000 et GTI (voir
section 4.2), suivant les dnitions des indicateurs prvoir (voir section 3.1.2), a permit
de cr les historiques ncessaires la prvision des indicateurs dactivit.
Lalgorithme de prvision, dvelopp dans le cadre de cette thse, prvoit trois sries
temporelles lies par une relation linaire. Prenons lexemple des trois chroniques sui-
vantes,
poids quotidien, en kg, total, des marchandises passes quai,
le poids quotidien, en kg, en expdition, des marchandises passes quai,
le poids quotidien, en kg, en distribution, des marchandises passes quai.
La premire srie temporelle, appele par abus de langage, poids total, est le rsultat
de la somme des deux autres. Il en va de mme quand il sagit de prvoir le nombre de
positions quotidien pass quai dune agence de transport. Par la suite, pour dsigner
les 6 chroniques, nous parlerons de poids ou nombre de positions, total, en expdition,
en distribution. Lalgorithme de prvision prvoit les valeurs des trois sries (total, ex-
pdition, distribution) individuellement et les redresse de sorte garder la contrainte de
linarit.
Les rsultats observs montrent quun historique de 5 ans dobservations permet dan-
ticiper correctement les variations des indicateurs dactivit des agences de transport.
Aussi, lalgorithme de prvision propos fonctionne avec un minimum de trois ans dhis-
torique.
134
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
4.4.2 Nettoyage des donnes
Les valeurs numriques qui constituent lhistorique des trois sries temporelles (poids
ou nombre de positions, au total, en expdition, en distribution), donnes en paramtre
dentre de lalgorithme, sont souvent entaches de valeurs dites extrmes ou man-
quantes. Les valeurs extrmes peuvent tre, ou non, rellement observes. Lorsquelles
ne le sont pas, cest quelles sont issues dune erreur de saisie ou dune erreur de trai-
tement de linformation. Dans tous les cas de gure, elles ont un impact nfaste sur le
calcul des prvisions. Cest pourquoi il est ncessaire de parcourir les valeurs de lhisto-
rique pour les corriger le cas chant et, ainsi, aboutir une srie temporelle rgulire
et corrige des valeurs extrmes.
Nettoyer les donnes, signie trier les donnes dans le temps, vrier quil ne manque
pas de jours, vrier que les dimanches sont effacs et corriger les donnes extrmes
(voir 3 prochaines section 4.4.2.1,4.4.2.2,4.4.2.3).
4.4.2.1 Rendre la srie rgulire
Dans le cas prsent, pour tre traite, une srie temporelle doit tre rgulire. Cest-
-dire quentre deux valeurs il existe toujours le mme intervalle de temps. Lintervalle
de temps entre deux valeurs conscutives des sries temporelles tudies est le jour.
Par contre, les dimanches ne sont pas compris. Ainsi, la semaine comprend 6 jours ou-
vrables. Autrement dit, la valeur qui suit celle dun samedi doit imprativement tre celle
dun lundi. Une anne comprend au minimum 312 jours ouvrs, (52 semaines fois 6 jours
ouvrs) et au maximum 318 jours ouvrs (53 semaines fois 6 jours ouvrs).
Lalgorithme programm avec le logiciel R (voir section 4.7.1), parcourt lhistorique des
sries temporelles fournies en paramtre dentre. Lorsquune date est manquante, lal-
gorithme linsre et lui attribue, dans un premier temps, une valeur nulle. Lorsquune date
correspond un dimanche, la valeur associe est supprime. Suite ce traitement, les
sries temporelles sont rgulires.
4.4.2.2 Correction des valeurs nulles
Mis part les jours fris, nous posons lhypothse quil nexiste pas dactivit nulle,
aussi bien pour les sries temporelles dcrivant les indicateurs en distribution que pour
celles en expdition. Dautre part, les valeurs observes montrent que lactivit des
agences de transport est fortement lie au jour de la semaine (lundi, mardi, etc). Cest
135
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
pourquoi, quand une valeur est nulle, et quelle ne correspond pas un jour fri, la
moyenne des valeurs observes pour le jour de la semaine, le mois et lanne en ques-
tion, lui est attribue. Pour ne pas fausser les rsultats, la moyenne ne prend pas en
compte les valeurs nulles. Ainsi, il arrive que cette moyenne ne puisse pas tre calcu-
le par manque de donnes. Dans ce cas, nous remplaons la moyenne du jour de la
semaine dans le mois et lanne, par la moyenne du jour de la semaine dans lanne.
Une autre solution aurait t dattribuer la valeur nulle, la valeur prvue par le modle
statistique de prvision. Cette solution na pas t choisie, car les valeurs nulles en dbut
dhistorique (infrieur 3 ans) nauraient pas pu tre corriges par manque dhistorique.
4.4.2.3 Recherche et correction des valeurs extrmes
Une valeur est aberrante quand elle scarte anormalement des valeurs moyennes de
la chronique. Il est difcile de savoir si la valeur atypique sest ralise ou si elle provient
dune erreur de saisie. Si la valeur sest effectivement ralise, nous devrions pouvoir
lexpliquer et insrer une composante dterministe dans le modle de prvision. Dans ce
cas, lidal serait de faire appel au jugement dun expert mtier pour identier les causes
de chacune des valeurs extrmes retenues. Mais face au nombre important de sries et
de dates lointaines dans le pass, la tche semble ardue. Mme lexpert ne se souvient
pas prcisment de ce qui est arriv un certain lundi 3 janvier dil y a 3 ans par exemple.
Cest pourquoi, nous faisons appel des mthodes statistiques pour dterminer quune
valeur est aberrante et la remplacer par une estimation plus raliste, lexception prs
des valeurs relatives un jour fri. Ces valeurs pourraient tre dsignes comme ex-
trmes car lactivit y est trs faible. Or, la faiblesse de lactivit sexplique justement
par le jour fri. Nous tudions les jours fris et leurs effets sur les jours voisins dans
la section 4.4.6.1. En attendant, pour que ces valeurs ne soient pas dtectes comme
extrmes, nous les modions par la moyenne du jour de la semaine et de lanne en
question. Aprs le traitement statistique, consistant rechercher les valeurs extrmes,
nous leur rattribuons leurs vraies valeurs.
Pour dtecter les valeurs extrmes, nous crons un intervalle de valeurs admissibles.
Toute valeur non comprise dans lintervalle sera dsigne comme aberrante. Cet inter-
valle se dnit pour un mois de lanne. Ainsi si nous sommes face un historique dune
longueur de trois ans, nous construisons 12 3 intervalles.
Construction de lintervalle dadmissibilit . Il dcoule dun outil de statistique descrip-
tive appel la bote moustache (ou boxplot en anglais). Cest une invention de TUKEY
(1977) pour reprsenter schmatiquement une distribution. Loutil dnit un intervalle de
valeurs comprises entre une extrmit infrieure et extrmit suprieure. Les valeurs
sont alors dnies comme atypiques lorsquelles sont situes au-del de ces frontires
136
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
(74).
Lintervalle dadmissibilit scrit :
[Q1 1, 5(Q3 Q1); Q3 + 1, 5(Q3 Q1)] (4.1)
Q1 et Q3 sont les valeurs du premier et du troisime quartile. 25% des valeurs de la
distribution sont infrieurs Q1 et 25% sont suprieurs Q3. (Q3 Q1) est lcart inter-
quartile (InterQuartile Range). Il est utilis comme indicateur de dispersion. Il correspond
50% des observations situes dans la partie centrale de la distribution.
Toute observation non comprise dans lintervalle est corrige par la valeur que prend
lextrmit la plus proche de lintervalle dadmissibilit .
Lalgorithme met en uvre cette mthode pour corriger les valeurs extrmes des deux
premires sries temporelles fournies en paramtres dentre. Suite cela, il rednit la
troisime srie temporelle comme la somme des deux premires.
Remarquons que ce processus de nettoyage des donnes donne des rsultats raison-
nables quand, dans un mme mois, un trop grand nombre de termes de la srie nest pas
nul. Dans le cas contraire, les valeurs nulles, dsignes comme extrmes, se verront at-
tribuer toute la mme valeur moyenne. Dautre part, le processus nefface pas les sauts
que prennent les valeurs dune anne sur lautre. Pour illustrer ces deux phnomnes
voqus, tudions la gure 4.1.
Figure 4.1 Serie chronologique du poids quotidien, en kg, total, des marchandises passes
quai avant et aprs nettoyage des valeurs extrmes
La gure 4.1 a pour but de montrer un cas extrme. Mais ces cas se rptent assez
frquemment pour tre souligns. La gure 4.1 montre les valeurs prises par une srie
temporelle, entre le 1
er
Janvier 2003 et le 31 Dcembre 2007, avant et aprs le processus
de nettoyage des donnes. Nous observons un palier entre la n de lanne 2003 et le
dbut de lanne 2004. Il peut tre d diverses causes, par exemple, une erreur dans
le traitement informatique des donnes. Rappelons que la source des donnes nest pas
137
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
la mme entre les donnes avant et aprs adoption du nouveau TMS (voir section 3.1.4).
Les procdures de transformation des donnes, selon leur base de donnes dorigine,
sont diffrentes. Mais elles sont penss de sorte quelles dnissent la mme grandeur
(voir section 3.1.2). Le palier observ peut galement tre d une hausse avre de
lactivit. Cette hausse fait suite larrive dun nouveau portefeuille client, ou mme dun
march. La hausse dactivit peut aussi tre due un regroupement dagences de trans-
port. Par exemple, les agences Mldo et TFE Vannes se sont regroupes pour nen
former plus quune. Dans tous les cas de gure, ce palier risque de fausser les calculs
de prvision. Cest pourquoi, quand lalgorithme dtecte un palier important, il efface de
lhistorique des valeurs observes antrieurement la date du palier.
Prcisons que la gure 4.1 reprsente les valeurs prises par la srie temporelle poids
quotidien, en kg, total, des marchandises passes quai dune agence de transport
TFE . Ces valeurs sont gales la somme des valeurs prises par la srie poids quoti-
dien, en kg, des marchandises passes quai dune agence de transport TFE et partant
en expdition et des valeurs prises par la srie poids quotidien, en kg, des marchan-
dises passes quai dune agence de transport TFE et partant en distribution . Par
abus de langage, nous appellons les sries respectivement, poids total , poids en
expdition , poids en distribution . La gure 4.1 montre que, suite au processus de
nettoyage des donnes, la srie poids total fait apparatre des valeurs extrmes d-
but de lanne 2004. Ce ntait pas lobjectif recherch. Ces valeurs sexpliquent par le
phnomne suivant. Dbut de lanne 2004, la srie temporelle poids en distribution
montrait des valeurs trs fortes alors que la srie temporelle poids en expdition mon-
trait des valeurs nulles aux mmes dates. Suite au processus de nettoyage des donnes,
ces dernires ont t redresses. Or, aprs le nettoyage des donnes des sries poids
en expdition et poids en distribution , la srie poids total est recalcule pour
quelle soit gale la somme des deux premires. Cest ainsi que des valeurs extrmes
sont apparues dans la srie temporelle poids total .
La gure 4.1 montre galement que les valeurs nulles dun grand nombre de termes de
la srie temporelle, observes n 2003 et n 2007, ont toutes t corriges par la mme
valeur. Cest parce quen Novembre 2003 et en Dcembre 2007, il manquait un grand
nombre dobservations, quelles ont t estimes par la valeur moyenne des observa-
tions de lanne. Par exemple, une valeur nulle, observe un lundi du mois de Dcembre
2007, est corrige par la moyenne des valeurs observes les lundis de lanne 2007. Si
les valeurs observes les lundis de novembre 2007 navaient pas manqu, nous aurions
retenu comme correction, leur moyenne.
Les tapes dextraction, duniformisation et le nettoyage des donnes ont permis dabou-
tissent ldice et la consolidation dun historique des sries temporelles prvoir.
Un historique propre tablit les fondations permettant dexcuter une suite de procdures
pour parvenir des prvisions.
138
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
4.4.3 Schma de dcomposition
Pour prvoir les sries temporelles dcrivant lactivit des agences de transport, nous
choisissons, dans un premier temps, de les dcrire par les composantes qui les consti-
tuent. Chaque srie temporelle tudie peut tre dcrite par la somme ou le produit de
trois composantes : la tendance, la saisonnalit et le bruit. Comme il a t expliqu dans
la section 2.3.3, il faut choisir entre un schma de dcomposition additif ou multiplicatif.
Une mthode pour dterminer le schma garder est celle de la bande . Elle consiste
tracer deux droites des MCO, passant respectivement par les maxima et les minima de
chaque priode de la chronique. Si les droites sont parallles, il faut dcider dun schma
additif, sinon dun schma multiplicatif. Le rsultat de lapplication de cette mthode sur
les sries temporelles tudies est systmatiquement le choix dun schma multiplicatif.
La raison en est simple. Lactivit des agences de transport a fortement progress au
cours du temps. Cette progression est plus accentue du lundi au vendredi que le sa-
medi. En dautres termes, lactivit au cours du temps du samedi progresse moins vite
que celle des autres jours de la semaine. Cet cart cr laccroissement de lamplitude
entre la droite passant par les minima et la droite passant par les maxima de chaque
priode de la chronique.
Citons R. Bourbonnais et JC. Usunier (18) qui font remarquer que le schma de dcom-
position multiplicatif est actuellement le plus utilis en conomie. Ils ajoutent : le schma
multiplicatif est commode puisque le logarithme de la chronique conduit au schma
additif .
Ainsi, nous posons lhypothse que les sries temporelles tudies peuvent tre dcom-
poses sur le schma multiplicatif. Pour tudier les composantes du schma, indpen-
damment les unes des autres, nous nous ramenons un schma additif, par le passage
au logarithme.
Soit Y
t
une srie temporelle, sa dcomposition, suivant le schma multiplicatif, est :
Y
t
= T
t
S
t
R
t
(4.2)
avec
T
t
la valeur de la tendance la date t,
S
t
la valeur de la saisonnalit la date t,
R
t
la valeur du rsidu la date t.
Le passage au schma additif se fait par la formule suivante,
Z
t
= ln(Y
t
) = ln(T
t
) + ln(S
t
) + ln(R
t
) (4.3)
Les sections 4.4.4 et 4.4.5 expliquent comment la tendance et la saisonnalit des s-
ries tudier sont estimes. Nous utilisons deux mthodes pour le faire. La premire
139
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
consiste dabord dduire la tendance, pour ensuite dduire la saisonnalit, par la m-
thode des moyennes mobiles. La deuxime mthode est celle propose par Buy-Ballot
(1847). Suite lapplication des deux mthodes, nous obtenons deux sries pour re-
prsenter le bruit. Dans la section 4.4.6, nous dduisons, des deux sries, leffet des
vnements calendaires. Dans la section 4.4.9, nous dtaillons le calcul dune prvision
pour chacune des deux sries. Nous ajoutons aux valeurs prvues leffet des vne-
ments calendaires, la saisonnalit et la tendance. Nous obtenons ainsi deux propositions
de prvision que nous combinons avec la condition de minimiser la variance de lerreur
entre la valeur relle et la prvision.
4.4.4 Dcomposition dune chronique : mthode n1
4.4.4.1 Traitement de la tendance
Plusieurs raisons nous font prfrer une modlisation de la tendance par une fonc-
tion linaire. Dune part comme le font remarquer juste titre B. Burtschy et C. Me-
nendian (24), dans le milieu conomique les tendances sont progressives. Dautre part,
nous avons mentionn dans la section 2.3.3 quil tait risqu dutiliser les fonctions non
linaires. Et surtout, lobservation des valeurs dcrivant lactivit des agences de trans-
port TFE dans le temps se prte une modlisation de la tendance, par une fonction
linaire. Pour exemple, la gure 4.2 montre le logarithme du poids quotidien de toutes
les marchandises passes quai dune certaine agence TFE, entre 2002 et 2009. Le
nuage de points indique, quen dbut danne, les poids sont moins importants quen n
danne. Une explication possible est la baisse de consommation des mnages en pro-
duits alimentaires aprs les ftes de n danne. Michel Vat (115), propose dapprocher
la tendance dune telle suite dobservations par une fonction linaire par morceaux de
priodicit annuelle.
Ainsi, nous posons lhypothse que la tendance des sries temporelles tudier peut
tre dcrite par la combinaison linaire dune tendance intra-annuelle et dune tendance
inter-annuelle. La tendance intra-annuelle est comprise entre janvier et dcembre. La
tendance inter-annuelle est comprise entre la premire date et la dernire date de lhis-
torique tudi.
Lquation de la tendance est une fonction du temps, elle scrit :
f (t) = T
t
= t + An(t) + (4.4)
avec t, le temps, et An(t) lanne correspondante au temps t, , et sont les inconnues
estimer. Lalgorithme, programm sous R, utilise la mthode de dcomposition QR (57).
140
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Figure 4.2 Tendance par palier
Le terme An(t) permet de crer le palier entre deux annes conscutives. Toujours pour
tre plus proche des donnes observes, nous aurions pu choisir un palier diffrent pour
chaque anne comprise dans lhistorique. Mais, dans ce cas, quels paliers choisir dans
une perspective de prvision des annes futures ? La mthode retenue a le mrite de
crer un palier moyen. Il saccrot trs lgrement avec les annes, mais limpact sur les
donnes dduites de leur tendance reste ngligeable. La mthode retenue conduit aussi
un modle parcimonieux.
Nous venons de lvoquer, ltape suivante est de retrancher cette tendance la chro-
nique. Suite cette opration, nous obtenons une nouvelle chronique dont les valeurs
varient autour dune moyenne proche de zro. La nouvelle chronique compte donc des
valeurs ngatives. Or les valeurs ngatives nappartiennent pas lensemble de d-
nitions de la fonction logarithme. Rappelons que cette dernire permet de passer dun
schma multiplicatif un schma additif (voir formule 4.3). Pour redresser les valeurs
ngatives, nous soustrayons aux valeurs de la nouvelle chronique, sa valeur minimale. Il
en rsulte une chronique appele z
t
dont lquation scrit :
Z
t
= Z
t
T
t
min(Z
t
T
t
) (4.5)
141
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
4.4.4.2 Les composantes saisonnires
Pour se rendre compte de la saisonnalit de lactivit des agences de transport, il faut
superposer sur un mme graphique les variations des activits annuelles. Pour exemple,
la gure 4.3 superpose le poids hebdomadaire pass quai dune certaine agence TFE
entre 2001 et 2007.
Figure 4.3 Poids hebdomadaire en tonne pass quai entre 2001 et 2007
Nous nous intressons directement la saisonnalit hebdomadaire, et non mensuelle,
car nous cherchons prvoir le jour. Lavantage de la semaine par rapport au mois est
quelle contient toujours 6 jours ouvrables. Alors que le nombre de jours ouvrables, par
mois, peut varier. Par contre, le graphique de la gure 4.3 pointe le problme des num-
ros de semaines 1 et 52. Elles ne comptent pas 6 jours ouvrables et cest pourquoi le
poids est plus faible. Elles devront tre redresses.
Les valeurs prises par les indicateurs poids et nombre de positions passes quai dune
agence TFE, admettent une double saisonnalit. La saisonnalit hebdomadaire com-
porte 53 coefcients (semaine 0 semaine 52) et la saisonnalit journalire en comporte
318 (53 sem. 6 jours).
La saisonnalit hebdomadaire est due des priodes dactivit uctuante. Ces priodes
142
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
peuvent durer plus dune semaine, mais comme elles sont parfois mitoyennes sur deux
mois conscutifs, cest une raison de plus pour ne pas retenir la saisonnalit mensuelle.
Ces uctuations dactivit sont causes par des vnements extrieurs tels que la mto,
les vacances scolaires, les priodes de fte. Ces vnements, et notamment un certain
nombre de jours fris, varient de numro de semaine dune anne lautre. Cest ce qui
explique les pics dactivit dcals sur le graphique de la gure 4.3.
Figure 4.4 Superposition des poids quotidiens, en tonne, pass quai, entre 1999 et 2007,
dune agence
Comme latteste la gure 4.4, la saisonnalit journalire est trs marque. Elle est due
une rpartition de lactivit sur les 6 jours ouvrs de la semaine. Cette rpartition dpend
de lagence en question. Par contre, le point commun entre toutes les agences est une
trs faible activit le samedi. Elles cherchent, dans la mesure du possible ventiler les
transports sur le reste des jours de la semaine.
Certains facteurs sont intgrs explicitement dans la saisonnalit. Nous pensons aux
vacances scolaires, aux promotions qui se rptent la mme priode chaque anne.
Cest la raison pour laquelle nous ne nous attardons pas les analyser.
Pour dnir les coefcients saisonniers hebdomadaires, il faut partir dune chronique dont
143
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
le laps de temps entre deux observations est la semaine. Pour le systme de numrota-
tion des semaines nous nous sommes inspirs de la norme ISO 8601. Nous dnissons
la rgle comme suit :
la semaine commence le lundi,
les jours de chaque semaine sont numrots de 1 pour le lundi 6 pour le samedi,
la semaine 1 est celle qui contient le premier lundi de lanne (cest contraire
la norme ISO qui dit que la semaine 1 est celle qui contient le premier jeudi de
lanne).
Il sen suit que si le 1
er
janvier ne tombe pas un lundi, ce jour et les suivants, jusquau
prochain lundi, appartiennent la semaine 0, qui, avec la dernire semaine de lanne
(52) sont les seules susceptibles de ne pas compter 6 jours ouvrables.
Lalgorithme programm sous R corrige la valeur des semaines 0 et 52. Si elles com-
portent moins de 6 jours et si le nombre de jours est suprieur 3, sans compter le
samedi (valeur faible), la valeur hebdomadaire est pondre par
nombre de jours ouvrables (6)
nombre de jours de la semaine corriger
(4.6)
Sinon, elle prend comme valeur 0, 9 fois la valeur de la semaine suivante (semaine 1) ou
prcdente (semaine 51).
4.4.4.3 Mthode de dcomposition saisonnire par moyennes mobiles
Aprs avoir limin la tendance, nous cherchons estimer des coefcients saison-
niers des chroniques. La mthode des moyennes mobiles est une technique souvent
utilise pour lisser les valeurs prises par une srie chronologique. Cette mthode permet
ainsi deffacer les uctuations saisonnires. Des moyennes mobiles dordre 12 sont, par
exemple, calcules pour liminer la saisonnalit mensuelle dune srie temporelle, dont
lunit de temps entre deux valeurs est le mois. Comme il a t expliqu dans la section
3.2.3.1, les coefcients saisonniers sont calculs par la moyenne des diffrences (ou des
rapports) entre les moyennes mobiles et les valeurs prises par la srie temporelle.
Dans le cas des chroniques dcrivant lactivit des agences de transport, nous commen-
ons par calculer des moyennes mobiles dordre 53 pour effacer la saisonnalit hebdo-
madaire. La srie des moyennes mobiles scrit :
MM
t
=
1
53
t+26
t26
z
t
(4.7)
Imaginons que la srie temporelle z
t
contienne une valeur pour chaque semaine com-
prise entre le 1
er
Janvier 2002 et le 31 Dcembre 2008. Cet intervalle de temps com-
prend 371 (7 53) semaines. Le calcul des moyennes mobiles nest possible qu partir
144
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
de la 27
e
semaine de la srie temporelle, et jusqu la semaine 345 (371 26). Il y a donc
une perte dinformation. Or, nous souhaitons obtenir 371 moyennes mobiles et non 318
(371 53) pour les soustraire aux 371 valeurs de la chronique dorigine. Pour ce faire,
nous ajoutons des valeurs en tte et en queue de la srie des moyennes mobiles. Les
26 premires valeurs adjointes sont celles de lanne suivante la mme poque, soit,
dans notre exemple, les semaines 1 26 de lanne 2003. Les 26 dernires sont celles
de lanne prcdente la mme poque, soit, dans notre exemple, les semaines 27
53 de lanne 2007.
Suite cet exercice, dans le cas dun schma additif, nous pouvons calculer lcart entre
les valeurs observes et les moyennes mobiles. Dans le cas dun schma multiplicatif
nous calculons le rapport entre les valeurs observes et les moyennes mobiles. Pour les
53 numros de semaines, une moyenne des carts, ou rapports, est calcule. Les 53
coefcients, ainsi obtenus, sont normaliss pour aboutir aux 53 coefcients saisonniers
nots S
i
, (i = 0, . . . , 52).
A ce stade, nous avons calcul 53 coefcients saisonniers. Or, la srie tudier est une
srie temporelle dont le pas de temps entre deux valeurs est le jour, et non la semaine.
Pour extraire la saisonnalit hebdomadaire de la srie journalire, nous commenons
par calculer des poids journaliers moyens, pour rpartir le coefcient saisonnier hebdo-
madaire sur les 6 jours ouvrables de la semaine. Lquation scrit :
p
j
=
T
t=1
z
j,t
T
t=1
z
t
(4.8)
p
j
est la somme de toutes les observations du jour j divise par la somme des observa-
tions.
Dans le cas de lexemple cit plus haut, p
( j=lundi)
est la somme des valeurs observes
tous les lundis compris entre le 1
er
Janvier 2002 et le 31 Dcembre 2008, divise par la
somme de toutes les valeurs observes durant cette mme priode.
Pour dduire la saisonnalit hebdomadaire de la srie journalire, nous utilisons la for-
mule suivante :
z
a,i, j
= z
a,i, j
(S
i
p
j
) (4.9)
avec a lindice de lanne, i celui de la semaine et j du jour.
Aprs avoir retir leffet de la saisonnalit hebdomadaire, il reste estimer leffet de la
saisonnalit journalire, pour le retirer son tour. La mme mthodologie est utilise.
A partir de la srie temporelle z
a,i, j
, les 318 (53 6) coefcients saisonniers journaliers
sont calculs. La srie temporelle ln(R
(1)
a,i, j
) obtenue par la formule 4.10, est dpourvue de
tendance, de saisonnalit hebdomadaire et journalire (voir equation 4.3).
145
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
ln(R
(1)
a,i, j
) = z
a,i, j
S
i, j
(4.10)
S
i, j
, est le coefcient saisonnier du jour j de la semaine i.
Le graphique de la gure 4.5 illustre un exemple de variation des coefcients saison-
niers dun schma multiplicatif.
Figure 4.5 Reprsentation graphique de la saisonnalit
Les coefcients saisonniers montrent lcart de la valeur moyenne constate par rapport
la moyenne annuelle reprsente par laxe y = 0. Un coefcient de 0.5 signie que
lactivit est 1.5 fois suprieure lactivit moyenne annuelle. A la lecture des coefcients
hebdomadaires, nous constatons que lactivit est :
plus faible que lactivit moyenne annuelle, les semaines 2 9,
moyenne, les semaines 10 14,
au-dessus de la moyenne annuelle, les semaines 19 et 52.
4.4.5 Dcomposition dune chronique : mthode n2
4.4.5.1 Mthode de dcomposition linaire - formules de Buys-Ballot
En matire de prvision des ventes, la mthode idale nexiste pas. Partant du prin-
cipe que deux valent mieux quune, pourquoi ne pas utiliser une deuxime technique et
ne garder que le meilleur des deux. La deuxime technique choisie est celle propose
par Buys-Ballot (25). Cest une dessaisonalisation par rgression linaire.
146
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Soit le processus suivant,
Z
t
= at + b +
1
S
(1)
t
+
2
S
(2)
t
+
3
S
(3)
t
+
4
S
(4)
t
+
5
S
(5)
t
+
6
S
(6)
t
+ ln(R
t
) (4.11)
La chronique z
t
se dcompose en une tendance, une suite de composantes saisonnires
S
j
t
et dun rsidu ln(R
t
). Les p composantes saisonnires sont des variables binaires pour
p saisons, dans lanne. La variable binaire est gale 1 lorsque la donne se rapporte
la saison envisage et 0 partout ailleurs.
Reprenons notre exemple. Lhistorique de la chronique prvoir comprend une valeur
pour chaque jour compris entre le 1
er
Janvier 2002 et le 31 Dcembre 2008. Le premier
janvier 2002 tant un mardi, nous commencerons lhistorique au 7 Janvier 2002 pour le
premier jour, soit un lundi. Le modle scrit,
_
_
7641
7815
7812
7774
6430
3527
7133
.
.
.
z
t
_
_
= b
_
_
1
1
1
1
1
1
1
.
.
.
1
_
_
+ a
_
_
1
2
3
4
5
6
7
.
.
.
t
_
_
+
1
_
_
1
0
0
0
0
0
1
.
.
.
S
1
t
_
_
+ +
6
_
_
0
0
0
0
0
1
0
.
.
.
S
6
t
_
_
+
1
_
_
1
1
1
1
1
1
0
.
.
.
S
7
t
_
_
+ +
53
_
_
0
0
0
0
0
0
0
.
.
.
S
59
t
_
_
+
_
_
ln(R
1
)
ln(R
2
)
ln(R
3
)
ln(R
4
)
ln(R
5
)
ln(R
6
)
ln(R
7
)
.
.
.
ln(R
t
)
_
_
(4.12)
Les paramtres reprsentent la saisonnalit journalire au sein dune semaine et les
paramtres , la saisonnalit hebdomadaire dans une anne.
Sous la forme matricielle nous obtenons,
_
_
7641
7815
7812
7774
6430
3527
7133
.
.
.
z
t
_
_
=
_
_
1 1 1 0 1 0 0
1 2 0 0 1 0 0
1 3 0 0 1 0 0
1 4 0 0 1 0 0
1 5 0 0 1 0 0
1 6 0 1 1 0 0
1 7 1 0 0 1 0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1 t S
1
t
S
6
t
S
7
t
S
8
t
S
59
t
_
_
_
_
b
a
1
.
.
.
1
.
.
.
53
_
_
+
_
_
ln(R
1
)
ln(R
2
)
ln(R
3
)
ln(R
4
)
ln(R
5
)
ln(R
6
)
ln(R
7
)
.
.
.
ln(R
t
)
_
_
(4.13)
soit,
Z = X + ln(R) (4.14)
Le paramtre ( =
_
b, a,
1
, . . . ,
6
,
1
, . . . ,
53
_
X)
1
X
Z.
Dautre part, nous voulons que la somme des uctuations saisonnires soit nulle sur
147
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
lanne, nous imposons alors la contrainte :
6
i=1
i
+
53
i=1
i
= 0
Le problme destimation par moindres carrs devient,
_
_
min
,,
T
t=1
_
_
z
t
1
2
t
6
j=1
S
j
t
j
53
j=1
S
t
j
j
_
_
2
sous contrainte
6
j=1
j
+
53
j=1
j
= 0
(4.15)
Ainsi, pour chacune des 53 semaines et chacun des 6 jours travaills de la semaine,
nous obtenons des coefcients saisonniers.
La prvision la date t et horizons t + h scrit,
z
t
= at + b +
6
j=1
j
S
j
t
+
53
j=1
j
S
j
t
(4.16)
La srie corrige de sa tendance et des variations saisonnires (CVS) scrit,
ln(R
(2)
t
) = z
t
z
t
(4.17)
Suite aux deux mthodes de dcomposition, nous obtenons deux sries ln(R
(1)
t
) et ln(R
(2)
t
)
(voir quation 4.10 et 4.17). Ces sries contiennent encore de linformation dterministe,
que nous pouvons caractriser. Cette information dcrit leffet des vnements calen-
daires sur lactivit des agences de transport. Nous dtaillons la mthode destimation
dans la section 4.4.6.
Notons au pralable que dautres mthodes de lissage existent.
4.4.5.2 Autres mthodes de lissage
Les coefcients saisonniers sont obtenus en calculant la moyenne des rapports entre
la srie lisse et la srie relle, sur les diffrentes priodes. Aprs normalisation, nous
obtenons les coefcients saisonniers. La littrature propose dautres mthodes de lis-
sage, comme EVF, LOESS et ltrage par rgression.
La mthode EVF (Eigen Vector Filtrering ou Filtrage par les vecteurs propres) (65) , d-
compose le signal en composantes orthogonales. Elle dbute par lcriture dune matrice
de r sries dcales dun multiple de , partir de lhistorique de n observations x
i
. est
148
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
le dcalage temporel, r est le dcalage maximum entre les deux sries extrmes.
X =
_
_
x
(r1)(+1)
x
(2+1)
x
(+1)
x
1
x
(r1)(+2)
x
(2+2)
x
(+2)
x
2
x
(r1)(+3)
x
(2+3)
x
(+3)
x
3
x
(r1)(+4)
x
(2+4)
x
(+4)
x
4
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
x
n
x
n(r3)
x
n(r2)
x
n(r1)
_
_
(4.18)
Une analyse en composantes principales (ACP) est ralise sur la matrice de covariance
entre les r descripteurs de X, ce qui permet dextraire les valeurs propres et les vecteurs
propres V. Les valeurs propres expliquent la part de variance associe aux lments de
la dcomposition. Le premier vecteur propre, associ la premire valeur propre, est
assimil la tendance de la srie temporelle. En multipliant le premier vecteur propre
par sa composante nous obtenons une estimation de la chronique.
La difcult de cette mthode est le choix du dcalage maximum entre les 2 sries ex-
trmes. Soit t = (r 1) le dcalage entre 2 sries successives, si t est trop petit,
la srie prdite partir du premier axe factoriel suivra, peu de chose prs, la courbe
originale. Si le dcalage est trop grand, elle va sajuster une droite de tendance.
La mthode LOESS, est une rgression polynomiale sur les k plus proches voisins. Nous
considrons les k voisins gauche et droite dune observation. Nous effectuons une
rgression par MCO dun polynme dordres 1 ou 2 pour rcuprer la valeur prdite au
temps t. Quand lordre du polynme est 0, nous nous ramenons une dcomposition par
moyenne mobile. Le paramtre contrler dans cette mthode est le nombre de voisins
k. Comme pour les moyennes mobiles, nous pouvons considrer une fentre gale une
semaine, et donc prendre 6 termes conscutifs.
Le ltrage par rgression consiste ajuster une sinusodale sur la chronique. Le rap-
port des donnes la fonction nous amne aux coefcients saisonniers.
Remarquons que chacune de ces mthodes ncessite de xer un paramtre. Pour abou-
tir une dcomposition optimale, nous pourrions proposer de choisir les paramtres des
diffrentes mthodes de sorte que le coefcient de variation de la srie corrige des va-
riations saisonnires et de sa tendance, soit minimal. Le coefcient de variation est le
rapport entre lcart-type et la moyenne. Il exprime la dispersion de la chronique autour
de sa moyenne. Plus celle-ci est faible, plus la prvision sera prcise. Pour estimer les
paramtres des mthodes de lissage sous la contrainte voque, nous pourrions utiliser
les mthodes doptimisation vues dans la section 4.4.9.
Lusage de cette procdure montre que la saisonnalit des sries tudies est bien
dordre 6. Par contre, lalgorithme consistant tester les ordres de 2 318 (6 53),
149
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
pour en dnir loptimal, est trop coteux en temps dexcution.
La comparaison des diffrentes mthodes sur un chantillon dagences rvle que la
mthode des moyennes mobiles est retenue 9 fois sur 10. Dautre part, des procdures
de dtermination de la saisonnalit plus appropries existent : analyse spectrale, test
de priodicit de Whittaker Robinson. Par contre, elles ncessitent une intervention hu-
maine pour linterprtation, alors que nous cherchons, ici, automatiser compltement
la procdure de modlisation.
4.4.6 Evnements calendaires
La mthode qui suit est applique sur les deux sries corriges des valeurs extrmes,
de la tendance et des variations saisonnires obtenues par moyenne mobile et par la
mthode de Buys-Ballot.
4.4.6.1 Caractriser limpact des jours fris (97)
La perte dun jour dactivit provoque la rcupration de cette activit sur les jours voi-
sins. Par exemple, un jeudi fri peut conduire une augmentation de lactivit le lundi,
par anticipation, ou le vendredi, par retard. Souvent un jour fri a des consquences
prvisibles sur une priode de 8 jours (J 4,. . ., J,. . .,J + 4). Les consquences sont
diffrentes selon le type du jour fri, le jour de la semaine dans lequel il apparat, et
lagence en question.
La rcupration de la perte dun jour de travail sera variable selon que ce jour est un
lundi ou un samedi. Si cest un samedi, il y a peu dactivit rattraper, alors que le lundi
est une journe charge. Si le jour fri tombe un vendredi, les grandes et moyennes
surfaces anticipent et demandent que la livraison soit double le jeudi. Les livraisons ex-
plosent le jeudi, et les expditions gonent le mercredi pour des livraisons en A pour B.
Si le jour fri tombe un lundi, les grandes et moyennes surfaces anticipent un peu sur
le vendredi prcdent et rcuprent surtout le mardi. Si le fri est un jeudi, il y de fortes
chances que lactivit du vendredi soit rduite, car les salaris font le pont. Le mercredi
sera dautant plus charg.
Un jour fri est souvent synonyme de fte, ce qui engendre une augmentation de la
consommation des mnages. Par effet de boule de neige, lactivit du transporteur se
renforce. Mais cette hausse est variable selon quil sagit de la Toussaint ou de Nol.
150
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Les agences ne sont pas gales face la hausse dactivit engendre par un jour fri.
Lagence de Bretanor, par exemple, est situe ct dune usine Cte-dOr . Lusine
approvisionne tous les magasins de France en chocolat de Pques. Cet approvision-
nement commence des mois avant lvnement et monopolise une grande partie des
ressources de lagence TFE. Dautres nont pas ce client et subissent moins de pous-
ses. Ou elles les subissent dautres moments. Canal froid Nantes, par exemple,
transporte le muguet du 1er avril sur lHexagone. La hausse dactivit nest, alors, pas
rpartie sur les mois qui prcdent, mais sur la semaine qui prcde. Le rush est alors
dautant plus violent.
Parfois, le 4
e
jour suivant un fri est aussi le 2
e
jour prcdent un autre fri. Cest
ce qui arrive en mai, entre la fte du Travail (1
er
mai) et la victoire 1945 (8 mai). Dans ce
cas, il est difcile de sparer leffet des deux jours fris.
Pour tenter de sparer ces quatre phnomnes engendrs par la survenance dun jour
fri nous retenons, pour chacun deux, les informations suivantes :
jour de la semaine (lundi,. . ., samedi) du fri,
jour de la semaine des 4 jours prcdents le fri,
jour de la semaine des 4 jours suivants le fri,
nom du jour fri.
La table 4.2 montre la matrice (T 12) laquelle nous aboutissons.
1 colonne pour le temps en dates,
10 colonnes pour le nom des jours fris (lundi de Pques, jeudi de lAscension,
Pentecte, 14 juillet, 15 aot, 1
er
novembre, 11 novembre, 1
er
mai, 8 mai, nol),
1 variable code entre 4 et 4 pour indiquer lloignement du jour impact au jour
fri,
T lignes pour le nombre denregistrement de lhistorique.
Cette matrice (table 4.2) est convertie en tableau disjonctif complet pour servir de va-
riables binaires an dajuster un modle de rgression sur la srie dsaisonnalise. La
matrice binaire est appele (X
1
).
4.4.6.2 Lanne comme variable calendaire
Le modle de tendance attribue la mme pente chaque anne pour modliser lallure
que prend lactivit sur une longue priode (plus dun an). Pour faire varier la pente en
151
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Dates Lundi de Pques Fte du Travail . . . pos
Vendredi prcdent un samedi 1er mai -1
Samedi 1er mai
Lundi suivant un samedi 1er mai +1
. . . . . . . . .
04/04/2007 Mercredi prcdent -4
05/04/2007 Jeudi prcdent -3
06/04/2007 Vendredi prcdent -2
07/04/2007 Samedi prcdent -1
08/04/2007 Lundi de Pques
09/04/2007 Mardi suivant +1
10/04/2007 Mercredi suivant +2
11/04/2007 Jeudi suivant +3
12/04/2007 Vendredi suivant +4
. . . . . . . . .
28/04/2007 Jeudi prcdent un mardi 1er mai -4
29/04/2007 Vendredi prcdent un mardi 1er mai -3
30/04/2007 Samedi prcdent un mardi 1er mai -2
01/05/2007 Lundi prcdent un mardi 1er mai -1
02/05/2007 Mardi 1er mai
03/05/2007 Mercredi suivant un mardi 1er mai +1
. . . . . . . . . . . . . . .
Table 4.2 Matrice des vnements calendaires - Un champ date, un champ pour chaque
vnement calendaire analys, un champ pour la distante entre lenregistrement et le jour
fri.
fonction des annes comprises dans lhistorique de la srie chronologique, nous construi-
sons une matrice binaire, avec comme intitul des colonnes, les annes de lhistorique.
Cette matrice est appele (X
2
). Elle est concatne la matrice (X
1
) pour tre utilise
dans le modle de rgression linaire, et ainsi liminer la tendance annuelle. Nous nous
heurtons alors au mme problme que celui voqu lors de la dtermination du modle
de la tendance. Comment, lorsque quon se place en anne A pour prvoir les valeurs de
lanne A + 1, dterminer la pente pour lanne A + 1. Pour y remdier, nous tablissons
la rgle suivante.
Lorsque nous cherchons prvoir des valeurs de janvier A + 1, la pente retenue est
t + An(t) + dans lquation 4.4 ou at + b dans lquation 4.16. Aprs janvier, nous
considrons avoir assez dobservations ( 24 jours dobservations) pour estimer une
pente de lanne A + 1. Au fur et mesure que nous avanons dans lanne A + 1, la
152
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
pente se modiera en fonction des nouvelles observations enregistres.
4.4.6.3 Le modle de rgression des vnements calendaires
Nous utilisons les sries temporelles obtenues aprs dduction de la tendance et de
la saisonnalit suivant les mthodes de dcomposition de la section 4.4.4 et de la section
4.4.5. Les quations de rgression scrivent :
ln(R
(1)
t
) =
1
X
(EC)
t
+ b
1
+ U
1
t
(4.19)
ln(R
(2)
t
) =
2
X
(EC)
t
+ b
2
+ U
2
t
(4.20)
X
(EC)
est la matrice des vnements calendaires. Elle contient cte cte les tableaux
disjonctifs X
1
et X
2
voqus respectivement dans la section 4.4.6.1 et la section 4.4.6.2.
Les paramtres
1
,
2
, b
1
et b
2
sont estims par la mthode QR (57). U
1
t
et U
2
t
sont les
composantes stochastiques des sries ln(R
(1)
t
) et ln(R
(2)
t
). Nous posons lhypothse que
les sries U
1
t
et U
2
t
sont stationnaires, car elles sont issues de la srie chronologique
Z
t
, de lquation 4.3, dont nous avons dduit la tendance, la saisonnalit et leffet des
vnements calendaires.
4.4.7 Cycle
Les ouvrages dcrivant les sries chronologiques mentionnent souvent le cycle comme
composante de la srie. Le cycle est un phnomne itratif de longue dure qui varie au-
tour de la tendance long terme et qui est li la conjoncture conomique (prosprit,
crise, dpression, reprise). Les chroniques tudies ne comportent pas de cycles en
tant que tels, car le phnomne de croissance ou de dcroissance ne se rpte pas sur
une priode constante. Il se peut aussi que les historiques des chroniques tudies ne
soient pas assez long pour reprer un cycle. Larticle de Jean-Marie Dufour (47) voque
des cycles de 7 ans dans le loyer dun terrain. Ce cycle a t trouv par William Petty
(1623-1687). William Stanley Jevons (1984) identie un cycle de onze ans, dans lactivit
commerciale.
4.4.8 Modle complet
Comme il a t dit dans la section 4.4.3, nous posons lhypothse que le schma des
sries temporelles tudies est multiplicatif. Dans la mesure o les valeurs prises par
153
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
les chroniques tudies sont positives, il est ais de passer du schma multiplicatif un
schma additif par passage au logarithme.
Notons,
t, lindice de temps, il correspond une anne a, une semaine i, et un jour j,
Y
t
, la chronique corrige des valeurs extrmes,
T
t
, la tendance, S
t
, la composante priodique, R
t
, les rsidus.
Alors,
ln(Y
t
) = ln(T
t
) + ln(S
t
) + ln(R
t
) (4.21)
Et en utilisant la mthode prconise dans la section 4.4.4, les composantes se dve-
loppent sous la forme suivante :
ln(T
t
) = t + An(t) +
1
+ min(t + An(t) +
1
) (4.22)
ln(S
t
) = S
1
i
p
j
+ S
2
i, j
(4.23)
ln(R
t
) =
1
X
(EC)
t
+ b
1
+ U
1
t
(4.24)
En utilisant la mthode prconise dans la section 4.4.5, les composantes se dve-
loppent sous la forme suivante :
ln(T
t
) = at + b (4.25)
ln(S
t
) =
6
j=1
j
S
j
t
+
53
j=1
j
S
j
t
(4.26)
ln(R
t
) =
2
X
(EC)
t
+ b
2
+ U
2
t
(4.27)
Nous avons montr que les sries temporelles dcrivant lactivit des agences de trans-
port peuvent tre dcomposes suivant au moins, deux mthodes. La dcomposition
nous permet de retirer de la srie des valeurs observes, les composantes dterministes.
Suite cette action, il reste une srie de valeurs alatoires ou, du moins, inexpliques.
Selon la mthode de dcomposition utilise, les sries des valeurs inexpliques (U
1
t
, U
2
t
)
diffrent. La section 4.4.9 montre comment modliser les sries des valeurs inexpliques
dans le but de les extrapoler.
4.4.9 Prvision
Les procdures prcdentes nous ont permis de sparer la tendance, la composante
saisonnire et les vnements prvisibles, des rsidus.
Suite la gnration des graphiques prsentant les corrlogrammes
1
de la srie des
1. Mesure lassociation entre une variable est ses valeurs dcales de k priodes.
154
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
rsidus, il est noter quil reste, selon les cas, une relation de cause effet entre lobser-
vation une date t et les observations prcdentes (t 1, t 2, t 3, t 4, t 5, t 6).
Pour prvoir une telle srie, nous avons le choix entre un lissage exponentiel simple,
un lissage exponentiel de Holt-Winters et un lissage autorgressif moyenne mobile.
Ces derniers permettent dexprimer la valeur dune srie temporelle linstant prsent
par une somme pondre de ses valeurs passes et dun bruit blanc. Les auteurs Box et
Jenkins ont fortement contribu dvelopper ces modles dans les annes 1970 pour
dnir les modles ARMA. Par contre, ces modles ncessitent lintervention dun expert
sachant interprter les corrlogrammes, ou lutilisation dalgorithme coteux de ressource
informatique, pour identier les paramtres p et q des proprits autorgressives et de
moyenne mobile. Cest pourquoi nous prfrons les modles exponentiels qui ont lavan-
tage dtre automatisables. Bien quelle est sense ne plus exister dans le rsidu, dans
certains cas seulement, une saisonnalit journalire persiste. Nous favorisons donc le
lissage de Holt-Winters (voir section 3.2.4) car il intgre un paramtre de saisonnalit.
4.4.9.1 Recherche des paramtres optimaux dun lissage de Holt-Winters
Rappelons les quations du lissage de Holt-Winters pour une chronique x
t
quel-
conque (voir section 3.2.4).
Lissage de la moyenne :
a1
t
= (x
t
S
tPe
) + (1 )(a1
t1
+ a2
t1
) (4.28)
Le lissage de la tendance,
a2
t
= (a1
t
a1
t1
) + (1 )a2
t1
(4.29)
Le lissage de la saisonnalit,
S
t
= x
t
a1
t
+ (1 )S
tPe
(4.30)
Pe dsigne la priode. Notons U
1
t
et U
2
t
, les sries temporelles des valeurs inexpliques
obtenues suite la dduction des composantes dterministes, suivant les deux m-
thodes de dcomposition proposes. Le rsultat des autocorrlogrammes des sries U
1
t
et U
2
t
nous apprend quil reste gnralement une corrlation entre lobservation la date
t et celles aux dates t 1 et t 6. Nous pouvons en conclure que la composante p-
riodique dordre 6 na pas t sufsamment bien estime. Cest pourquoi nous gardons
le paramtre du modle de Holt-Winters, pour lisser la saisonnalit. Par contre, nous
annulons le paramtre , car nous posons lhypothse que la tendance des sries U
1
t
et
U
2
t
est nulle.
155
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Pour parvenir un lissage de Holt-Winter optimum, nous choisissons les paramtres et
pour minimiser lerreur quadratique entre les chroniques U
1
t
, U
2
t
et leurs estimations :
U
1
t
,
U
1
t
.
Les traitements suivants sappliquent aux deux sries U
1
t
, U
2
t
. Mais pour ne pas rpter
inutilement les quations, nous utilisons le caractre U
t
pour dsigner lune ou lautre des
sries U
1
t
et U
2
t
.
Rappelons que la prvision des valeurs futures scrit, en remplaant la srie x
t
par
la srie U
t
, (voir section 3.2.4) :
U
t+h
= a1
t
+ h a2
t
+ S
tPe+h
si 1 h Pe (4.31)
U
t+h
= a1
t
+ h a2
t
+ S
tPe+2h
si Pe + 1 h 2Pe (4.32)
Par optimisation, nous cherchons trouver les valeurs des paramtres et qui mi-
nimisent la fonction cot. Dans notre cas, la fonction cot est la somme des erreurs
quadratiques :
f (U,
U) = min
_
_
T
t=7
(U
t
U
t
)
2
_
_
(4.33)
avec T le nombre dobservations de lhistorique.
La procdure de minimisation se fait par lalgorithme L-BFGS-B (1997). Il adapte la
mthode doptimisation Quasi-Newton aux sries de grandes tailles et en ajoutant des
contraintes dencadrement bound constraints . Les contraintes sont que et soient
compris entre 0 et 1. En partant dune valeur initiale, lalgorithme itratif parcourt les
points de lespace des solutions, selon une mthode de gradient, dni par les contraintes,
jusqu trouver les valeurs qui rpondent au critre impos. Le critre tant de trouver le
minimum de la fonction cot. Pour une documentation plus complte sur les mthodes
numriques utilises pour rsoudre des systmes dquations (voir (69)).
Lestimation des paramtres et , permet dutiliser lalgorithme de Holt-Winters pour
prvoir les valeurs futures des sries temporelles U
1
t
et U
2
t
. Pour ce faire, les valeurs
initiales a1
0
et S
0
sont initialises respectivement avec lordonne lorigine de la droite
de tendance, MM
6
(U
t
) = At + B (MM
6
dsigne la moyenne mobile centre dordre 6)
et aux coefcients saisonniers, suite la dcomposition par moyennes mobiles.
4.4.10 Recomposition de la prvision
Suite lextrapolation de la srie U
t
, il reste recomposer la srie prdite. Pour ce
faire, les valeurs prdites par la mthode de Holt-Winters sont additionnes aux compo-
santes dterministes que nous avions soustraites prcdemment.
156
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Soit,
U
t+h
= a1
t
+ h a2
t
+ S
tPe+h
si 1 h Pe (4.34)
U
t+h
= a1
t
+ h a2
t
+ S
tPe+2h
si Pe + 1 h 2Pe (4.35)
la prvision du jour t + h, calcule le jour t, donne par Holt-Winters.
Nous y ajoutons,
limpact des vnements calendaires (X
(EC)
t+h
+ b).
Selon la premire mthode de dcomposition, nous ajoutons aussi,
les coefcients saisonniers journaliers t + h : S
2
i, j
,
les coefcients saisonniers hebdomadaires t + h : S
1
i
p
j
,
la tendance t + h : (t + h) + An(t + h) +
1
+ min((t + h) + An(t + h) +
1
),
ou selon la deuxime mthode de dcomposition, nous ajoutons
la tendance t + h : a(t + h) + b
les coefcients saisonniers t + h :
6
j=1
j
S
j
t+h
+
53
j=1
j
S
j
t+h
.
La recomposition amne la srie des valeurs prdites ln(Y
t+h
). En appliquant la fonction
exponentielle, nous obtenons la prvision de la srie des valeurs observes :
Y
t+h
= exp(ln(Y
t+h
)) (4.36)
4.4.11 Combinaison des prvisions
Du fait des deux procdures de dcomposition, nous obtenons deux rsultats de pr-
vision. Les erreurs de prvision obtenues par les deux mthodes ne permettent pas de
conclure la supriorit de lune sur lautre. Cest pourquoi nous combinons les rsultats.
Lobjectif est de minimiser la variance des erreurs de prvision. La mthode choisie a t
propose par R. Bourbonnais et JC Usunier dans leur ouvrage Prvision des ventes,
thorie et pratique (18).
Lerreur de prvision est la diffrence entre la valeur observe et sa prvision.
EP
t+h
= y
t+h
y
t+h
(4.37)
La prvision combine (PC) est une moyenne pondre des deux prvisions individuelles
P1 et P2,
PC = kP1 + (1 k)P2, k est le coefcient pondrateur, 0 < k < 1. (4.38)
157
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Lerreur de prvision combine,
EPC = kEP1 + (1 k)EP2 (4.39)
La variance de lerreur de prvision,
V(EPC) = k
2
V(EP1) + (1 k)
2
V(EP2) + 2k(1 k)Cov(EP1, EP2) (4.40)
Nous cherchons k qui minimise V(EPC), en annulant la drive, la solution est :
k =
V(EP2) Cov(EP1, EP2)
V(EP1) + V(EP2) 2Cov(EP1, EP2)
(4.41)
Si les erreurs de prvision sont corrles alors, Cov(EP1, EP2) = 0
Si k > 1 ou k < 0
alors, si V(EPC, k = 0) > V(EPC, k = 1)
alors, k = 1
sinon k = 0
Dans la pratique, avant chaque prvision une date t, nous recalculons les coefcients
k sur un historique dune anne prcdant la date t. Lhistorique comprend les donnes
observes et prvues.
Clive Granger (58) dmontre galement que la variance de lerreur de prvision com-
bine est infrieure aux variances respectives des deux erreurs issues de P1 et P2.
Par ailleurs, les prvisions combines devraient tre plus robustes, puisquelles ne d-
pendent pas fortement de la spcication dun seul modle ajoutent T.J. Jordan et M.R.
Savioz (112).
Notons quil existe dautres mthodes de combinaison de prvision issues de modles
diffrents. F. Li et G. Tkacz (113) comparent des mthodes de combinaison linaire et
non linaire. Ils distinguent le cas o les erreurs de prvision des diffrents modles sont
corrles, du cas o elles ne le sont pas.
Mentionnons aussi les mthodes ensemblistes de prvision utilises plus particulire-
ment en mtorologies. La mthode appele Ensemble Transform Kalman Filter (15)
analyse la covariance des erreurs de prvision.
4.4.12 Redressement des prvisions
Les chroniques du poids ou du nombre de positions quotidiens passs quai, en ex-
pdition, en distribution et au total, sont prvues sparment. Or lobservation la date
t de la chronique total doit tre gale la somme de lobservation de la chronique
158
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
expditions la date t et de lobservation de la chronique distributions la date
t. Pour rpondre cette contrainte, il faut redresser les valeurs prvues. Nous posons
lhypothse que lerreur de prvision de la somme est moins leve que les erreurs cu-
mules des prvisions des sries temporelles expditions et distributions . Ainsi,
nous choisissons de garder inchange la prvision de la srie temporelle total des mar-
chandises passes quai , pour corriger les deux autres.
Rappelons que les sries temporelles prvoir sont :
poids total en kg des marchandises passes quai, sur une journe dactivit,
poids expdi en kg des marchandises passes quai, sur une journe dactivit,
poids distribu en kg des marchandises passes quai, sur une journe dactivit,
nombre de positions totales des marchandises passes quai, sur une journe
dactivit,
nombre de positions expdies des marchandises passes quai, sur une journe
dactivit,
nombre de positions distribues des marchandises passes quai, sur une journe
dactivit.
La procdure dajustement est la suivante. Soit,
exp
t+h
lindicateur prvu en expditions avant redressement pour la date t + h,
dis
t+h
lindicateur prvu en distributions avant redressement pour la date t + h,
tot
t+h
lindicateur prvu au total avant redressement pour la date t + h,
exp
t+h
lindicateur prvu en expditions aprs redressement pour la date t + h,
dis
t+h
lindicateur prvu en distributions aprs redressement pour la date t + h,
tot
t+h
lindicateur prvu au total aprs redressement pour la date t + h,
Alors,
exp
t+h
= tot
t+h
exp
t+h
exp
t+h
+ dis
t+h
(4.42)
dis
t+h
= tot
t+h
dis
t+h
exp
t+h
+ dis
t+h
(4.43)
tot
t+h
= tot
t+h
(4.44)
Cette mthode lavantage de conserver les proportions prvues entre la valeur de
lindicateur en expdition et sa valeur en distribution.
4.4.13 Contrle de la qualit dajustement par le test du bruit blanc
Une manire de vrier que linformation dterministe contenue dans la chronique
dorigine a bien t extraite consiste tester lindpendance des rsidus. Le test choisi
159
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
est celui de Ljung et Box.
Lhistorique des sries temporelles tudies est divis en un chantillon dapprentissage
et un chantillon test (voir section 4.5.1). Lchantillon dapprentissage permet destimer
les paramtres du modle. Lchantillon test permet de comparer la valeur rellement
observe avec la valeur prdite. Les rsidus sont donc calculs en comparant la valeur
observe (y
t
) dans lchantillon test et la valeur prdite ( y
t
) pour la mme date.
t
= y
t
y
t
(4.45)
(4.46)
Le test de Ljung permet de tester si une variable suit un bruit blanc. Un bruit blanc est la
ralisation dun processus alatoire stationaire.
Ainsi, u
t
est un bruit blanc si pour tout t T : E[u
t
] = 0, E[u
2
t
] =
2
, avec u
t
et u
th
indpendants si h 0, t et (t h) T
2
.
Lhypothse nulle du test de Ljung est H0 : la srie suit un bruit blanc, autrement dit
les coefcients dautocorrlation sont nuls.
La statistique Q = T(T + 2)
h
=1
1
T t
() =
1
T
T
t=+1
(
t
)(
t
)
1
T
T
t=1
(
t
)
2
=
cov(
t
,
t
)
var(
t
)
(4.47)
est la fonction dautocorrlation dordre . En dautres termes, cest la moyenne des cor-
rlations entre
t
et
t
pour t = {1, . . . , T }. La valeur de Q dpend du nombre de
retard sur lequel elle est calcule (36). Nous pensons que dans le cas de lactivit
dune agence TFE, un retard suprieur 6 jours nest plus signicatif. Cest--dire que le
rsultat dun lundi peut dpendre des 6 jours de la semaine prcdente et donc du lundi
prcdent. Au del et aprs dessaisonalisation, cela na plus de sens.
Si Q >
2
,0.95
, H0, lhypothse que la srie est un bruit blanc, est rejete au risque 5%.
Le test manque de puissance. Supposons quon ait vraiment un processus bruit blanc
et admettons, en premire approximation, que les statistiques de test soient mutuelle-
ment indpendantes. La probabilit de rejeter au moins une hypothse H
est gale
2. Les Sries Temporelles, Emmanuel Csar & Bruno Richard, Universit de Versailles Saint-Quentin-en-
Yvelines, Module XML et Data Mining - Mars 2006
160
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
1(0.95)
et peut donc tre bien plus grande que 0.05. Dans notre cas, = 8, la probabi-
lit de dtecter de lautocorrlation qui nexiste pas est de lordre de 33%. A contrario, il
arrive que lhypothse de bruit blanc soit accepte alors quil y a de lautocorrlation pour
lun ou lautre retard. Pour bien faire, G. Mlard (89) conseille
deffectuer des tests individuels pour tous les retards de 1 ; la statistique de test
est
T
() N(0, 1),
deffectuer le test global et de considrer son rsultat en mme temps que le
nombre de rejets lors de tests individuels.
Dans le cadre de la prvision dactivit des agences de transport, le test du bruit blanc
est un moyen de contrler que le modle de prvision utilis, a retir toute linformation
dterministe des sries chronologiques tudies. Cest un indicateur pour apprcier la
justesse du modle de prvision. Dautres indicateurs de performance des propositions
de prvision seront abords dans la section 4.5.
4.4.14 Avantages et inconvnients
Les avantages et inconvnients de ce modle sont :
Avantages Inconvnients
prend en compte les spcicits
dun jour fri,
reste rigide dans lattribution des priodes de
saisonnalit (journalire et hebdomadaire),
corrige lhistorique de sa tendance
annuelle et celle long terme,
mthode fruste qui considre que la saisonnalit
ne peut pas voluer,
automatise la recherche des coe-
cients optimaux,
ne prend pas en compte leet de facteurs ex-
ternes relatifs la conjoncture conomique,
ajuste les 3 chroniques pour rendre
des rsultats cohrents,
compte un nombre de paramtres estimer trop
important au regard de la taille de lhistorique
( 5 ans). Pour chacune des dcompositions il y
a 2 paramtres pour la tendance, 313 pour la sai-
sonnalit quotidienne, 53 pour lhebdomadaire,
20 pour les vnements calendaires et un der-
nier pour le lisage exponentiel.
explique au dcideur leet des pa-
ramtres sur la srie prvoir.
Table 4.3 Avantages et inconvnients du modle de prvision Horizons
161
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
4.5 Validation du modle mathmatique propos
4.5.1 Critres de comparaisons
Pour apprcier les prvisions, nous nous remettons des critres dvaluation. Ce
sont des statistiques permettant de mesurer la qualit dune prvision. Elles se basent
sur lcart la ralisation (la moyenne derreurs de prvision antrieures), et lincertitude
entourant le modle de prvision (la variance de lerreur). Pour ce faire, il faut constituer
une base danalyse. Comme lillustre le schma de la gure 4.6, la base danalyse spare
lhistorique des valeurs observes de la srie temporelle prdire, en deux chantillons.
Dans le cas de la description de lactivit des agences de transport, lobservation des
donnes est souvent effectue sur une dure de 5 ans (au mieux 7 ans). Les 12 mois
les plus rcents constituent lchantillon test, lequel servira de rfrence pour valuer la
qualit des prvisions. Les 48 mois prcdents constituent lchantillon dapprentissage
sur lequel est formul le modle pour estimer les observations de la priode rcente.
Figure 4.6 Dcoupage de lhistorique en chantillon dApprentissage et chantillon Test
Il est vident que les observations de lchantillon test ne doivent pas servir estimer
les paramtres du modle de prvision, sans quoi les valeurs prdites pourraient tre la
consquence, et non la cause, de la valeur du rsultat prvoir, explique Tuffry (114).
La performance du modle de prvision se mesure en comparant les valeurs prdites
par le modle pour les dates de lchantillon test ( y
t
), avec les valeurs observes ces
mmes dates ((y
t
). La comparaison de valeurs prdites et observes se fait par le biais
des indicateurs de mesure suivants :
ME (Erreur Moyenne) : cest la diffrence moyenne entre la valeur observe et sa
prvision. Cette mesure donne la tendance dun modle fournir des prvisions
suprieures ou infrieures aux ralisations.
ME =
1
T
T
t=1
(y
t
y
t
)
MAE (Erreur Moyenne Absolue) : cest la moyenne des diffrences absolues entre
la valeur observe et sa prvision. Cette mesure considre limportance plutt que
162
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
le sens des erreurs de prvision.
MAE =
1
T
T
t=1
|y
t
y
t
|
RMSE (Root Mean Square Error) : cest la racine de lerreur de prvision qua-
dratique moyenne. En levant au carr lerreur de prvision moyenne, les grosses
erreurs de prvision sont davantage pondres que les petites.
RMS E =
_
1
T
T
t=1
(y
t
y
t
)
2
BAR (Biais Absolu Relatif) : cest la moyenne absolue des erreurs rapporte la
moyenne absolue des valeurs relles. Une mthode de faible biais relatif sera dite
juste.
BAR = MAE/ y
DR (Dispersion Relative) : cest la dispersion de lerreur autour de la moyenne des
valeurs relles. Une mthode de faible dispersion relative sera dite prcise explique
R. Loutfoullah (78).
DR =
erreur
y
r
2
(coefcient de dtermination) : cest un indice statistique qui mesure la qualit
de lajustement linaire des estimations du modle. Il donne la proportion de la
variation des observations qui sexpliquent par les variations de la variable obtenue
par le modle. Un coefcient proche de 0 signie un mauvais ajustement, alors
quun coefcient proche de 1 montre un bon ajustement linaire entre le rel et la
prvision.
r
2
=
T
t=1
( y
t
y
t
)
2
T
t=1
(y
t
y
t
)
2
=
variance explique
variance totale
Pourcentage derreur absolue infrieure 5% et 10% : cet indicateur donne la
proportion derreurs absolues comprises entre 0 et 5% et la proportion derreurs
absolues dans lintervalle [0% 10%]. Lobjectif tant de se rapprocher des 100%
derreurs absolues inclues dans lintervalle [0% 5%].
- Erreur minimal et maximal : ces mesures donnent une ide de la dispersion des
erreurs. Notons que ces mesures peuvent tre dues des valeurs extrmes. Il faut
les manier avec prcaution.
Il est difcile pour lutilisateur des prvisions dutiliser lensemble de ces mesures pour se
faire une opinion sur la justesse des prvisions proposes. Dans la section 2.3.5, nous
avons soulign comment classier les mesures de performance selon le but recherch.
163
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Suite au choix des mesures de performance, la section 2.2.11, dnit lerreur acceptable.
Cest un juste milieu entre, le cot investir pour amliorer les performances prvision-
nelles, et limpact des dcisions prises sur la base dune prvision errone.
4.5.2 Exemple : Lagence de transport TFE Nantes
60% de lactivit de lagence de transport de Nantes se font en distribution, contre
40% en expdition. Limportance de la distribution vis--vis de lexpdition sexplique par
le fait que Nantes est une mtropole de 250.000 habitants. Lagence de Nantes est une
plate-forme toile pour les expditions en provenance de Bretagne, Loire Atlantique et
destination des rgions du Sud-Ouest. Entre janvier et mars, lactivit est stable au-
tour de 750 tonnes (du lundi au vendredi). Les jours fris davril et mai, provoquent de
brusques changements de rgime. Le poids des marchandises transportes peut passer
de moins de 10 tonnes le jour fri plus de 1.110 tonnes deux jours avant. Les samedis
et jours fris exclus, lactivit davril et mai frle les 1000 tonnes par jour. Juin est une
priode daccalmie. Avec une activit autour de 900 tonnes/jour et quelques jours fris,
juillet et aot sont des mois chargs. Septembre, octobre est une priode qui retrouve le
calme de dbut danne avec une moyenne infrieure 800 tonnes/jour. Enn, lactivit
progresse rgulirement tout le long de dcembre, pour atteindre un pic de 1.114 tonnes,
cinq jours avant Nol.
Les tableaux suivants comparent les rsultats de prvision un horizon dune semaine,
sur la priode du 1er Janvier au 31 Juillet 2007. Trois chroniques sont tudies : le poids
quotidien pass quai en expdition, en distribution et le total. Les modles sont vulgai-
rement appels TFE 2 pour dsigner celui illustr dans la section 3.2.3, TFE 3
dans la section 3.2.4 , et nouveau dans la section 4.4.
Moyenne des erreurs de prvision : ME
Modle Expdition Distribution Total
TFE 3 -11 -4 -7
TFE 2 -7 25 18
Nouveaux -11 1 -10
Table 4.4 Moyenne des erreur de prvision
Lerreur moyenne indique dans les tableaux 4.4,4.5 indiquent une sous- ou surestima-
tion des prvisions. Rappelons que lerreur de prvision scrit e
t
= y
t
y
t
. Le nou-
veau modle surestime en moyenne de 10 tonnes le poids quotidien total pass quai,
164
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Ecart-type des erreurs de prvision : VE
Modle Expdition Distribution Total
TFE 3 36 77 80
TFE 2 35 55 66
Nouveaux 23 54 60
Table 4.5 Ecart-type des erreur de prvision
Expdition Distribution
Modle RMSE BAR DR RMSE BAR DR
TFE 3 38T 11% 15% 76T 12% 17%
TFE 2 36T 12% 15% 60T 11% 12%
Nouveaux 25T 8% 10% 54T 9% 12%
Table 4.6 Indicateurs de performance
alors que le modle TFE 2 sous-estime le mme indicateur, de 18 tonnes. Une er-
reur moyenne nulle est un indicateur permettant de conclure un modle de prvision
quilibr. En effet, une erreur moyenne nulle signie que le modle de prvision sur-
estime autant quil sous-estime les valeurs rellement observes. Les tableaux 4.4,4.5
indiquent galement lcart-type des erreurs calcules. Lcart-type mesure la dispersion
des erreurs autour de leur moyenne. Ce qui signie que plus lcart-type est faible, plus
lintervalle de conance autour de la prvision est serr, et meilleure sera la conance
accorder la prvision. Ainsi, un modle de prvision doit chercher rendre lerreur
moyenne nulle et rduire cart-type des erreurs. Les tableaux 4.4,4.5 montrent que, se-
lon ces deux mesures, le nouveau modle de prvision remporte la victoire sur les deux
autres modles. Il ny a que lerreur moyenne obtenue par le modle de prvision TFE
2 , sur la prvision de la srie temporelle appele expdition , qui soit meilleure que
lerreur moyenne obtenue par le nouveau modle de prvision.
Les tableaux 4.6, 4.7 comparent les 3 modles suivant le biais absolu relatif et la dis-
persion relative. Ces indicateurs se rfrent la moyenne des valeurs observes. Le
nouveau modle se trompe en moyenne de 7% par rapport leur moyenne des valeurs
observes de la srie temporelle : poids total des marchandises passes quai .
Les erreurs varient de 9% autour de cette moyenne (estime 7%). Ces rsultats sont
meilleurs que ceux obtenus par les deux autres modles. Cependant, lobjectif dune er-
reur de prvision infrieure 5% nest pas atteint.
Les gures 4.7, 4.8 donnent un aperu dtaill des poids quotidiens passs au quai de
lagence de transport de Nantes. Ils afchent les valeurs quotidiennes observes, suivies
des estimations obtenues par les 3 modles.
165
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Total
Modle RMSE BAR DR
TFE 3 80T 9% 12%
TFE 2 68T 8% 10%
Nouveaux 61T 7% 9%
Table 4.7 Indicateurs de performance, suite
Expdition Distribution
Modle r
2
%EA <5% %EA <10% r
2
%EA <5% %EA <10%
TFE 3 0.87 29% 51% 0.75 35% 57%
TFE 2 0.86 21% 40% 0.82 27% 58%
Nouveaux 0.94 39% 62% 0.84 43% 69%
Table 4.8 Pourcentage de prvisions justes
Figure 4.7 Reprsentation graphique de la chronique des poids quotidiens passs quai
entre Janvier et Fvrier 2007
Observons que le modle TFE 2 ne considre plus le lundi de Pentecte comme
un jour fri. Or la ralit est diffrente. Suivant les politiques des agences et de leurs
clients, le lundi de Pentecte est chm, ou non.
Les courbes des gures 4.7,4.8 rvlent que la qualit des prvisions varie suivant la
bonne stabilit du comportement de lactivit. Une priode dactivit stable (janvier
mars), permet dextrapoler la chronique sans dgager derreurs importantes. Par contre,
les priodes de turbulence (avril, mai) posent encore des problmes. Il apparat que la
166
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Total
Modle r
2
%EA <5% %EA <10%
TFE 3 0.87 41% 67%
TFE 2 0.90 44% 69%
Nouveaux 0.92 52% 76%
Table 4.9 Pourcentage de prvisions justes, suite
Figure 4.8 Reprsentation graphique de la chronique des poids quotidiens passs quai
entre Avril et Mai 2007
mthode choisie pour mesurer leffet des jours fris sur lactivit nest pas la plus ad-
quate. Pour tre performante, la mthode ncessite plus de donnes historiques. Rap-
pelons quelle estime un coefcient de perte ou gain par MCO pour chacun des 5 jours
prcdents et suivants un fri. Cette estimation se base sur le jour de la semaine du
fri, or, en 7 ans, Nol a peu de chance de tomber plus de 2 fois un lundi, par exemple.
Le cycle permettant de retrouver un mme jour de la semaine pour un jour fri est de
28 ans. Cependant, un cycle de 11 ans, voire 7 ans, pourrait tre admissible. Le lecteur,
intress par la rpartition des jours fris, peut se rfrer la dnition donne sur le
site de Wikipdia (120). Ainsi pour calculer les pondrations, le processus se base sur
chantillon dau mieux 2 3 observations. Dautre part, ces observations sont loignes
dans le temps. Amliorer lanalyse des effets provoqus par les jours fris est un objectif
atteindre.
Ajoutons que les tests de normalit (Shapiro-Wilk, droite dHenry) et les tests dabsence
dautocorrlation (Ljung-Box) sont positifs sur la srie des erreurs du nouveau modle.
Daprs Kozicki et Tinsley (71), le non-rejet du test dabsence dautocorrlation est inter-
prt comme une indication que le modle dcrit bien la chronique.
167
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Enn, la comparaison des modles devrait se poursuivre suivant des critres non statis-
tiques comme la rapidit dexcution des algorithmes.
4.5.3 Etude des variations des erreurs de prvision sur une trentaine
dagences
Citons Mraud et Tymem (94) qui afrment quune mthode doit tre juge par les r-
sultats auxquels elle conduit quand elle est applique un nombre important de sries.
La section 2.3.5 nous apprend quun indicateur de performance est le pourcentage der-
reur (PE). Le graphique de la gure 4.9 rsume la distribution annuelle des PE quotidiens
commis sur la prvision du poids des marchandises passes quai dans 36 agences de
transport en 2009. Pour chacune des agences, les PE quotidiens sont partags en 4
parts gales. Le rectangle central comprend 50% des PE quotidiens. Il est partag en
deux par la mdiane de la srie. 25% des valeurs sont comprises entre les extrmits
du segment, en pointills, au-dessus du rectangle et 25% des valeurs sont comprises
entre les extrmits du segment au-dessous du rectangle. Notons que, pour lensemble
des agences reprsentes, la mdiane des pourcentages derreur quotidiens est proche
de 0. Dans la grande majorit des cas, 50% des pourcentages derreurs quotidiens sont
compris entre -10% et 10%. Lcart moyen entre lextrmit du segment suprieur et lex-
trmit du segment infrieur est de 45%. En moyenne, sur lanne 2009, le pourcentage
derreur fait sur la prvision du poids des marchandises passes quotidiennement quai
est de 2%. Lcart type de cette mme srie est de 17%.
Retenons que les carts entre la prvision, du poids quotidien des marchandises pas-
ses quai dans 36 agences de transport en 2009, et la ralisation se dispersent de
manire homogne autour dune moyenne proche de 0.
4.6 Choix et cartographie des outils informatiques
Comme le prconise lorganigramme de la gure 1.8 dans la section 1.2.3, les don-
nes ncessaires la prvision des indicateurs sont collectes et un modle statistique
de prvision est dni. Ltape suivante est linformatisation des traitements. Cest lobjet
des sections4.6 4.7
Nous lavons mentionn, les indicateurs prvoir nexistent pas tels quels dans les bases
168
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Figure 4.9 Dispersion des pourcentages derreur quotidien commis sur la prvision du poids
des marchandises passes quai dans 36 agences
de donnes mtiers . Il faut croiser des donnes provenant de diverses tables pour
aboutir aux indicateurs voulus. Les outils informatiques permettant dinterroger des tables
dans des bases de donnes, pour extraire de linformation, la manipuler an de lexploi-
ter dans une autre base de donnes, se nomment ETL (Extract Load Transform). Pour
traduire le modle mathmatique de prvision en programme informatique, il existe une
diversit de logiciels. Dans cette section, nous allons nous attarder argumenter le choix
des outils informatiques utiliss pour mettre en place le systme de prvision.
4.6.1 Outil ETL de Pentaho
tm
ETL est lacronyme pour Extract, Transform, Load. Ce sont des outils permettant de
passer les informations gnres dans les bases de donnes mtiers vers linfo-
centre. Les bases de donnes mtiers sont structures de telle sorte quelles r-
pondent aux besoins oprationnels (application mtiers). Alors que les tables et leurs
liaisons, dans linfocentre, sont agences de manire accueillir des informations de
base de donnes mtiers diverses, pour les regrouper, les ordonner, les croiser, les
synthtiser et les restituer suivant des axes danalyse. Franco et Lignerolles, 2000 (54),
crivent : Lacquisition de donnes se droule en trois phases : lextraction, la prpara-
169
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
tion, et le chargement .
Lextraction des donnes des bases mtiers , consiste collecter les donnes utiles.
Il est important de ne pas extraire de superu, ce qui a pour consquence de polluer
inutilement le lentrept de donnes et de ralentir les bases de donnes mtiers . Il est
galement important de contrler la qualit des donnes extraites. La qualit des don-
nes est un des piliers essentiels prendre en considration dans toute approche dun
systme dinformation. Enn, la performance des requtes dextraction est considrable-
ment importante. Dans le souci dviter la saturation du rseau, des entres / sorties de
donnes ou de lunit centrale, les requtes dextraction sont planies dans le temps
et insres dans une liste pour tre ordonnes. Une requte ne peut par exemple, tre
excute qu partir du moment o la requte prcdente dans la liste est termine. La
recherche de la performance en termes de rapidit dexcution se fait en utilisant les
caractristiques de la structure physique des bases des donnes (taille, index, partition-
nement) et les particularits du requteur (MySQL, SQL Serveur, Oracle PL/SQL).
La prparation des donnes tient respecter les dnitions des indicateurs que nous
cherchons historiser dans linfocentre. Cest la transformation des donnes mtiers en
donnes dcisionnelles (pilotage des achats et des ventes, reporting nancier, consolida-
tion budgtaire, marketing, . . .). Cette transformation peut savrer complexe et coteuse
en ressources machine. Cest pourquoi, comme lors de lextraction, il est essentiel de
chercher la performance des requtes de transformation. Plus dinformations sur le sujet
sont trouver dans larticle de Fresnais, 1999 (55). La transformation consiste gale-
ment analyser la qualit des donnes sources, vrier, liminer les doublons,
contrler la cohrence des donnes en les croisant, examiner les raisons des valeurs
manquantes, . . .
Le chargement des donnes transformes ncessite de sassurer que la structure de
ces donnes correspond celles des tables qui vont la recueillir (type, taille, unicit des
champs). Cest une phase dlicate et assez longue notamment en raison du volume des
donnes. Il faut sassurer des bonnes conditions de sa ralisation. Par exemple, nous
veillerons ne pas craser des donnes existantes, mais procder une mise jour
correcte de lhistorique dans linfocentre. Pour suivre le droulement des procdures in-
formatiques, il est vivement conseill de gnrer des chiers log ou dordonner des
insertions dans une table de la base de donnes pour suivre le chargement pas pas.
Un chier log est un chier texte regroupant lensemble des vnements survenus
lors du chargement des donnes. Le but tant de reprendre le chargement lendroit o
il sest arrt, si cela devait arriver.
Le processus dextraction de transformation et de chargement peut tre plani et ainsi
sexcuter rgulirement. Il est important de savoir que la ralisation de lETL consti-
tue 70% dun projet dcisionnel en moyenne. Et ce nest pas pour rien, ce systme est
complexe et ne doit rien laisser schapper, sous peine davoir une mauvaise information
170
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
dans lentrept, donc des donnes fausses, donc inutilisables
3
.
Le service dInformation Dcisionnel auquel est rattach le prvisionniste chez TFE uti-
lise lETL attach Pentaho
tm
. Pentaho
tm
est une solution dinformatique dcisionnelle
open source entirement dveloppe en Java. Pentaho
tm
utilise des outils et compo-
sants pour couvrir toute linformatique dcisionnelle dont la collecte et lintgration des
donnes qui se fait par lETL Kettle.
Figure 4.10 Kettle gre des ux ETL (gauche) par une interface graphique simple (droite)
Comme le montre la gure 4.10, Kettle permet lextraction, la transformation et le charge-
ment des donnes. Kettle propose une interface graphique conviviale mettant en avant
une bote outils complte, permettant dinterroger nimporte quelle source de don-
nes (bases de donnes, chiers plats, tableur, . . .), de les manipuler en appliquant des
rgles de transformation complexes, dafcher et dintgrer dans un nouvel environne-
ment. Kettle fonctionne sur des bases de donnes de production possdant des mil-
lions denregistrements
4
.
La gure 4.10 donne un exemple de linterface graphique. Kettle donne des utilitaires
nomms tapes, sous forme de drag and drop . Lexemple montre une tape dex-
traction des donnes par une requte SQL, la che verte indique vers quelle tape est
dirig le ux. Suite la premire tape, une succession de diffrentes tapes se suivent
(cration de ligne, script java, slection de valeurs) pour nir par une tape de charge-
ment (voir http ://www.pentaho.com/index.php).
Le systme de prvision intgre cet outil pour crer et mettre jour lhistorique des
donnes prvoir. Il sert galement lancer lexcutable du modle mathmatique de
prvision. Nous dcrivons en dtail les dveloppements dans la section 4.7.2.
3. Yazid Grim, conseiller dInformation Dcisionnel (2008)
4. www.pentaho.com
171
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
4.6.2 Logiciel de traitement statistique
Rappelons quune des conditions de dpart pour ce projet de mise en production
dun systme de prvision chez le transporteur TFE est dutiliser des logiciels libres. Les
logiciels libres sont dots de licences diverses (GNU/GPL). Gnralement, les logiciels
libres sont gratuits et permettent un accs au code source, mentionne Guay, 2002 (60).
Les logiciels libres publient rgulirement de nouvelles versions et regroupent un grand
nombre de dveloppeurs bnvoles travers le monde. Laccs au code source est gage
dhonntet scientique, argumentent les dfenseurs du logiciel libre. Il donne la possi-
bilit pour tous de vrier ce qui est rellement implment et de contrler les rsultats
publis.
Parmi les logiciels libres de traitement de donnes statistique (ou datamining), mention-
nons RAPIDMINER, WEKA, TANAGRA, R, ORANGE.
RAPIDMINER (ou YALE) est dvelopp par luniversit de Dortmund. Le logiciel a son
propre langage. Il propose une interface utilisateur graphique pour une exploitation sta-
tistique des donnes.
WEKA est dvelopp par luniversit de Waikato en Nouvelle-Zlande. Le logiciel est im-
plment en Java et propose une plate-forme de programmation visuelle.
TANAGRA est dvelopp par Ricco Rakotomalala, 2005 (101). Cest une plate-forme
destine lenseignement et la recherche. Il est implment en Delphi. Il propose une
plate-forme facile daccs.
ORANGE est dvelopp par luniversit de Lubiana en Slovnie. Le code source est
programm en C++. Il propose des mthodes dapprentissage automatique et de visua-
lisation.
R est un systme danalyse statistique et graphique cr en 1996 par Ross Ihaka et
Robert Gentleman. Le logiciel est gnralement prsent comme la copie du logiciel
commercial S-PLUS. Le code est principalement en C. R comporte de nombreuses fonc-
tions pour lanalyse statistique et graphique.
RAPIDMINER, WEKA, TANAGRA, ORANGE sont trs orients vers les processus dex-
ploration de donnes. Franco et Lignerolles, 2000 (54), rappellent que lobjectif du data-
mining est de tirer parti de linformation disponible pour constituer des modles, pour
dcouvrir des tendances ou pour anticiper lavenir . Les logiciels de data-mining vo-
qus permettent lutilisation des arbres de classication, des rseaux de neurones, la r-
gression logistique, la segmentation, les rgles dassociation, etc. Rpropose les concepts
de data-mining mais aussi une multitude dautres fonctions statistiques. En cela il est plus
gnraliste.
Quand sest pos le choix de loutil pour faire les premires explorations de donnes,
le modle de prvision mathmatique qui allait tre utilis par le systme de prvision
chez TFE ntait pas encore connu. Les techniques de fouilles de donnes exposes
ci-dessus semblaient dans un premier temps rpondre au besoin de prvision. Elles
172
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
permettent de classer les agences selon des critres communs, de dterminer une ty-
pologie, de construire des arbres de dcision permettant ainsi danticiper lactivit, de
lancer des ACP (Analyse en Composante Principale) et pour certains logiciels, dutiliser
des techniques de prvision. Morineau et al., 1994 (92), proposent cet enchanement de
techniques pour faire de lanalyse et de la modlisation des sries temporelles.
Le choix du logiciel sest fait selon des critres mis en avant dans la section 2.3.4 et des
souhaits formuls par le transporteur dans la section 1.2.4. Nous avons galement pris
en compte les avis rsultant des enqutes menes par Rakotomalala, 2005 (101) et Di-
rectMarketing.net
5
. Il en dcoule les lments suivants :
Linstallation du logiciel sur le poste de travail ou serveur doit pouvoir se faire sim-
plement. Elle ne doit pas ncessiter linstallation de serveur lourd au pralable. Cest le
cas des 5 logiciels test. Avec une petite nuance, WEKA ncessite linstallation des bi-
bliothques Java, ORANGE ncessite un interprteur Phyton et R exige un compilateur
C et un compilateur Fortran.
Les interfaces graphiques des logiciels RAPIDMINER, WEKA, TANAGRA et ORANGE
permettent une utilisation intuitive du systme, ds lors que lutilisateur a de solides
connaissances en data-mining. Ils proposent une panoplie doutils sous forme dicnes
glisser dans la fentre principale. Cest une interface drag & drop (en franais, glisser
- dposer). Dans ce type dinterfaces, lutilisateur saisit un objet, puis le dplace pour
lamener un autre endroit. En revanche R est un logiciel de programmation procdu-
rale, il noffre quun diteur de texte pour saisir les commandes.
Le mode client-serveur permet plusieurs utilisateurs dutiliser le logiciel install
sur un serveur. Les logiciels cits, lexception de R, sont tous mono-utilisateurs cest-
-dire quils ne fonctionnent pas en architecture client-serveur.
La possibilit dexcuter le programme en mode batch est primordiale. Un batch
est un chier texte dans lequel sont inscrites des commandes interprtes par le bash (ou
shell). Un bash est un interprteur de commande. Il joue le rle de jonction entre lutilisa-
teur et le systme dexploitation. Cest lavant-dernire couche du systme dexploitation.
Vient ensuite le noyau. Il existe une multitude dinterprteurs de commande sous Unix.
Citons le Bourne shell (sh), le plus ancien et le plus utilis, le Bourne Again Shell (Csh),
le Korn shell (ksh), Perl, Python etc. Les commandes du chier batch sont vries et
excutes lune la suite de lautre. Lune des commandes doit permettre dexcuter le
programme de prvision dvelopp sur lun des logiciels libres. En mode batch le pro-
gramme sexcute sans louverture de linterface graphique. Lavantage du mode batch
est de pouvoir lexcuter partir de diffrents environnements, comme Pentaho
tm
pour ce
5. http ://www.dmnews.net/freeware.php
173
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
qui concerne limplantation du systme de prvision chez TFE. Lensemble des logiciels
compars permet dtre excut en mode batch.
Nombreux sont les serveurs de production du groupe STEF-TFE qui tournent sous
Unix. Ils utilisent Bourne shell comme interprteur de commande. Les logiciels doivent
donc supporter les deux plateformes (UNIX et WINDOWS). Cest le cas des 5 logiciels
tests.
Lhistorique des donnes prvoir est entrepos dans des bases de donnes
Oracle. Les logiciels utiliss pour la prvision doivent donc permettre un accs et un
interfaage avec les SGBD (Systme de Gestion de Base de Donnes). Les logiciels
mentionns prsentent tous une interface avec SQL.
Lhistorique des donnes dune agence contient un enregistrement par jour de-
puis lanne 2000, soit environ 3650 enregistrements n 2009. Ce chiffre est multiplier
par le nombre dagences (70) pour aboutir au nombre denregistrements (255.500) conte-
nus dans la table de rfrences du systme de prvision. Le nombre denregistrements
augmente avec le temps, cest pourquoi les logiciels utiliss doivent permettre de traiter
un grand volume de donnes, en un laps de temps estim raisonnable. Rakotomalala,
2005 (101) compare les performances des logiciels TANAGRA, RAPIDMINER, WEKA,
ORANGE pour charger et traiter un tableau compos de 2 millions dobservations et 41
variables. Le systme de prvision mettre en place na pas besoin de lire des donnes
de cette ampleur, mais nous pouvons imaginer que le logiciel de traitement statistique
retenu serve dautres projets. Les rsultats des tests mens par Rakotomalala, 2005,
concluent que TANAGRA et ORANGE sont les seuls avoir pu charger et traiter le jeu
de donnes. Nous avons charg le mme jeu de donnes avec R et avons appliqu les
mmes traitements. Il savre que dans la version de base, R nest pas capable de traiter
ce jeu de donnes en un temps estim raisonnable. Mais daprs les dveloppements
des socits AT&T Labs, logi.cals et REvolution il semble que cela soit possible.
Les logiciels tests ne diffrent pas signicativement au regard de la qualit des
algorithmes. Les rsultats obtenus sont conformes aux attentes. Une tude de cas me-
ne par Rakotomalala (101) a compar les performances de mthodes de rgression
logistique des logiciels WEKA, TANAGRA, ORANGE, R, RAPIDMINER. Mise part RA-
PIDMINER qui fournit une qualit doptimisation trs en de des autres logiciels , il
en rsulte des rsultats lgrement dissemblables dun logiciel lautre. Ltude note que
R est au-dessus du lot en termes de temps de calcul.
Rappelons que nous souhaitons mener, laide de ces logiciels, des calculs de
prvision. Par le biais de la rgression, ils permettent tous de faire de la prvision co-
174
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
nomtrique. Ils permettent galement lanalyse des sries temporelles. RAPIDMINER
intgre des plugins pour traiter les sries temporelles. Il sera mme dexcuter le mo-
dle de prvision suggr par Liu et al., 2001 (77). Les auteurs cherchent automatiser
des procdures dextraction de connaissances et la fouille de donnes pour les appli-
quer simultanment sur grand nombre de sries temporelles. Les rsultats permettent le
paramtrage des mthodes de prvision de Box-Jenkins. Enn, R est un logiciel de sta-
tistique complet. Il propose des librairies incluant un grand nombre de mthodes statis-
tiques aussi bien pour la fouille de donnes que pour le traitement des sries temporelles
mentionnent Cryer et Chan, 2008 (34).
Un critre de choix est galement lexistence dun langage de programmation
volu. Celui-ci nexiste que dans R. Cest--dire quil est possible de programmer ses
propres fonctions ou de reprogrammer des fonctions existantes pour les adapter au
contexte. Dans la version de base, R dispose de la plupart des fonctionnalits utiles pour
la statistique. Les possibilits deviennent normes ds que nous utilisons les librairies
mises librement disposition de tous. Elles sont dveloppes par les utilisateurs et leur
code source en R est lisible. Ces librairies couvrent la statistique descriptive, unie et mul-
tivarie, lconomtrie, la nance, la biomtrie, la prvision, etc. Grce son langage de
programmation volu, R permet lenchanement programm de plusieurs algorithmes,
ce dont aura besoin le systme de prvision. La section 4.7.1 dcrit un enchanement
de prvisions suivant plusieurs mthodes et combinaisons dans loptique de rduire la
variance des erreurs.
Il ressort de cette comparaison que les logiciels ORANGE, WEKA, TANAGRA et RAPID-
MINER auraient t satisfaisants et surtout plus conviviaux et easy-to-use sil sagis-
sait de rechercher un modle de prvision pour une seule agence du rseau de transport
TFE. Or il est question dun modle mathmatique et de sa traduction algorithmique pour
une utilisation dans un processus industriel. Ceci ne semble possible quavec le langage
de programmation R. Dautre part, les techniques de prvision statistique endognes et
exognes implantes dans les diffrents logiciels ne convenaient pas pleinement aux s-
ries temporelles prvoir.
A lencontre des autres logiciels de data-mining tests, R ne peut pas tre utilis sans
exprience de programmation et, encore moins, sans notions statistiques. Citons les
propos de Christophe Pallier (chercheur au CNRS), Christophe Lalanne (chercheur
lINSERM) : R comprend de nombreuses commandes, il est illusoire denvisager utili-
ser ce logiciel sans lire un minimum de documentations. Notre exprience est que les
premires heures danalyse de donnes avec R ncessitent de frquents recours aux
documentations, mais lorsquon est devenu laise, alors il ny a pratiquement plus be-
soin de sy rfrer . Le web offre une multitude de documentations pour bien dbuter
avec R et notamment le site principal (www.r-project.org).
175
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
4.6.3 Reprsentation des rsultats
Le systme de prvision doit tre une application groupe. Cest--dire que toute per-
sonne du groupe STEF-TFE est susceptible de lutiliser. Pour des raisons de cot, de
disponibilit, de temps, de contrainte, de scurit, les entreprises, et mme les particu-
liers aujourdhui, ne veulent plus installer de logiciels sur leur poste de travail, ni mme de
stocker des chiers dessus. Cest pourquoi il est impos de dvelopper des applications
accessibles en ligne. Utiliser des applications en ligne prsente de multiples avantages.
Il sagit de pouvoir utiliser lapplication directement dans un navigateur et plus unique-
ment localement prcise David Bnard
6
. Il nest plus besoin dinstaller de logiciels,
lapplication est disponible partir de nimporte quel poste de travail connect au rseau
et les travaux raliss sont sauvegards sur un serveur scuris.
Linterface utilisateur, cre loccasion de la mise en place du systme de prvision, est
en elle-mme un projet de recherche pour le groupe STEF-TFE et sa branche informa-
tique AGROSTAR. Linterface utilisateur doit tre une application client-serveur mettant
en uvre les nouveauts quapporte le Web 2.0. Le Web 2.0 permet de crer des in-
terfaces donnant la possibilit aux internautes dinteragir la fois avec le contenu des
pages, mais aussi entre eux souligne Huyghe, 2009 (64).
Lapplication web du systme de prvision fait appel des langages de programmation
tels que MXML, HTLM, PHP, Javascript. La mise en place des effets visuels est dve-
loppe par une application internet riche (RIA, Rich Internet Application). AdobeFlex
Builder permet damliorer considrablement la consultation des donnes dans une in-
terface Web et de crer des graphiques adapts aux prises de dcisions. AdobeFlex
Builder est un environnement de dveloppement (IDE, Integrated Development Environ-
ment) fond sur Eclipse
7
. Il permet de dvelopper des applications utilisant les techno-
logies AdobeFlex, MXML, AdobeFlash player, ActionScript. Aprs avoir rdig son
programme, le dveloppeur le compile dans un chier (.swf) lisible par nimporte quel
serveur web. Le principe est simple dutilisation et universel. Par contre, il faut se former
aux langages cits.
Une page web est un simple chier contenant du texte format avec des balises HTML.
Les technologies CSS, PHP, Javascript sont interprtes et excutes directement par le
navigateur internet. Il na donc pas besoin de compiler les programmes. Dans le contexte
de linterface utilisateur du systme de prvision,
les codes HTML et CSS structurent et afchent les pages,
le Javascript permet une interaction entre lutilisateur et la page web,
le PHP autorise linteraction entre la page web, lutilisateur et les bases de donnes.
6. http ://www.infos-du-net.com/actualite/dossiers/56-applications-internet.html
7. http ://fr.wikipedia.org/wiki/Eclipse_(logiciel)
176
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Nous navons pas utilis dinterface graphique pour dvelopper sous ces technologies,
mais juste un diteur de texte.
4.6.4 Interfaage Kettle / R / site web
La cartographie des applications du systme de prvision tourne autour de lETL Ket-
tle, de loutil de dveloppement statistique R, des bases de donnes Oracle, de lentrept
de donnes et de linterface graphique en client lger. Ces applications ne sont pas ins-
talles sur les mmes serveurs, mais sont pourtant dpendants les unes des autres. La
gure 4.11 schmatise la cartographie des applications utilises pour mettre en place le
systme de prvision.
Figure 4.11 Cartographie des applications retenues dans le systme de prvision Hori-
zons
Lapplication dalimentation, de traitement et de chargement est hberge sur le serveur
ETLVIP02. Les tables lies au SP (Systme de prvision) sont conserves dans la base
de production de lquipe dcisionnelle (le DWH sur pkgwidprd.stef-tfe.fr). Les interfaces
dalimentation sont dveloppes sous Kettle (voir gure 4.11). Elles fonctionnent quo-
tidiennement ( 11h) pour mettre jour lhistorique des indicateurs prvoir et, plus
spciquement, les indicateurs de productivit de la veille. Les donnes mtiers peuvent
faire lobjet dune modication pendant trois semaines. Cest pourquoi une mise jour
hebdomadaire fonctionne tous les lundis, 15h00, pour prendre en compte les dernires
modications des bases de donnes mtiers sur 3 semaines glissantes. Tous les
177
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
lundis, 12h00, une application Kettle extrait, de la base de donnes, lhistorique des in-
dicateurs prvoir et des donnes de paramtrage pour les charger dans un chier texte,
par agence. Lapplication dveloppe sur R lit ces chiers et pour chacun deux cre un
nouveau chier texte avec les donnes prvisionnelles. Des chiers log sont galement
produits pour suivre le bon droulement des oprations. Les chiers texte produits par
R sont lus par une application Kettle et chargs dans les tables de lentrept dcision-
nel. Le site web cr est hberg sur un serveur ddi : Cognai01. Lutilisateur du site
doit sauthentier avec son compte LDAP (Lightweight Directory Access Protocol). Il peut
consulter, mais aussi saisir des donnes. Elles sont alors enregistres directement dans
les tables de linfocentre, ddies au systme de prvision.
Par le biais des chiers batch lensemble de ces processus sont lancs la suite les uns
des autres. Le Cron est le programmateur de tches dUnix/Linux. Il utilise les chiers
crontab pour dterminer la date et lheure auxquelles une tche va tre excute
8
.
Ainsi, le Cron permet dautomatiser priodiquement lexcution des batchs.
4.7 Dveloppement des modules du systme de prvision
Suite au choix et lassemblage des outils informatiques, il reste crire les pro-
grammes.
4.7.1 Rdaction du modle mathmatique en R
Nous nallons pas, dans cette section, donner un cours sur lutilisation du logiciel R
pour pouvoir lire le code qui a t crit. Par contre, il semble intressant de se pencher
sur ce que permettent les diffrentes fonctions dveloppes, et la faon dont elles sont
imbriques dans le programme principal. Les 22 fonctions crites sous R(voir gure 4.12)
peuvent tre utilises indpendamment les unes des autres, par contre elles sont toutes
utiles pour coller au modle mathmatique illustr en section 4.4. Elles sont regroups
dans un package. Un package en R, se prsente sous la forme dun chier compress
qui regroupe des fonctions (ou scripts), leur documentation et un jeu de donnes servant
illustrer lutilisation des fonctions. Lavantage dun package est quil est facile installer
sur tous les postes quips dune version de R.
8. http ://blog.fedora-fr.org/paquet-fedora-du-jour/post/Le-pourquoi-du-Mercredi :-Crontab
178
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Figure 4.12 Arbre du package R regroupant les fonctions de prvisions Horizons
Le programme principal (ForecastDay.r) est excut pour obtenir les prvisions des trois
sries chronologiques (TS 1, TS 2, TS 3) avec la contrainte que la somme des deux pre-
mires soit gale la troisime (TS 1 + TS 2 = TS 3). Il prend en argument dentre :
Le chemin du chier dentre contenant lhistorique des sries chronologiques. Le
chier texte doit comprendre un enregistrement par ligne. Les valeurs, (code de
lagence, date, TS 1, TS 2, TS 3) sont spares par un point virgule.
Le chemin du chier dentre contenant les coefcients de pondration pour les
deux mthodes de prvision. Il comporte le code de lagence, le coefcient de
TS 1, celui de TS 2 et de TS 3. Ces coefcients sont recalculs rgulirement. Ils
permettent de conjuguer les prvisions issues de deux mthodes diffrentes, en
minimisant la variance des erreurs de prvision (voir section 4.4.11).
Le chemin du chier de sortie.
Lhorizon de prvision en nombre de jours.
Le programme commence par vrier si les donnes dentre sont conformes aux at-
tentes. Y a-t-il bien trois sries chronologiques, trois coefcients, un chemin de sortie?
Les formats date et numrique sont-ils valides ?
Il sen suit un nettoyage des sries chronologiques (voir section 4.4.2). Les dimanches
179
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
sont supprims. Les dates de la chronique prvoir sont compares avec celles de la
suite ordonne de dates obtenues aprs excution de la fonction calendrier . Si des
dates manquent dans la chronique prvoir, elles sont ajoutes et une valeur thorique
leur est attribue. Les donnes atypiques sont localises pour tre corriges.
La premire date de prvision est celle qui suit la dernire date de la srie chronologique
fournie en paramtre dentre.
Les tapes suivantes vont se drouler pour chacune des trois sries temporelles.
Le programme vrie que la moyenne des 50 dernires valeurs soit suprieure
100. Cest pour viter quil ny ait trop de valeurs extrmes. Rappelons que nous
sommes dans un contexte de poids et nombre de positions. Il semble impossible
pour une agence TFE de raliser moins de 100 kg, ou mme 100 positions, la
journe, mme pour un samedi. Cette valeur a t xe de manire empirique,
suite plusieurs tests.
La condition prcdente russie, le programme excute alors les fonctions R prev.jours
et prev.jours.bb . La premire permet une prvision en utilisant la dcomposition
par moyenne mobile, alors que la deuxime fonction utilise la dcomposition de
Buys-Ballot (voir section 4.4.4 et 4.4.5).
Le programme attribue la prvision des jours fris, la moyenne des jours fris
contenus dans lhistorique.
Les prvisions issues des deux mthodes sont combines par la fonction com-
bin.prev . Elle prend en arguments dentre les prvisions issues des deux m-
thodes et le coefcient de pondration associ la srie chronologique (pass en
argument dentre du programme principal). Notons quaux prvisions sont asso-
cis les intervalles de conance et quils sont combins de la mme faon.
Ayant obtenu une prvision pour chacune des trois sries chronologiques, il reste ajus-
ter les prvisions pour quelles rpondent la contrainte TS 1 + TS 2 = TS 3. Cet ajuste-
ment se fait par la fonction ajuster.jour .
A chaque date prvisionnelle, le programme ajoute la valeur de la chronique observe
lanne prcdente, pour la mme semaine, et le mme jour de la semaine.
Lexcution du programme gnre un chier texte lendroit donn, en paramtre den-
tre (path). Ce chier texte contient le code de lagence, la date, la prvision des trois
chroniques (TS 1, TS 2, TS 3) et les valeurs en A 1. Notons quil ne mentionne pas
les intervalles de conance. Cest, qu lheure actuelle, ils ne sont pas valoriss. Nous
avons, toutefois, pens les calculer pour rpondre une demande future.
Nous avons prcdemment voqu deux fonctions ( prev.jours , prev.jours.bb ) sans
approfondir le raisonnement qui a permis leur criture. Elles prennent toutes deux comme
arguments dentre, une suite de dates ordonnes dans le temps, des valeurs asso-
cies, un horizon de prvision en jours et le type de modle (additif ou multiplicatif).
Elles rendent un tableau contenant les dates et les valeurs prvues avec lintervalle de
180
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
conance, ainsi que lerreur de prvision attendue.
Lerreur de prvision attendue est
_
CVS
/
CVS
_
/2 (18), avec CVS pour dsigner la srie
corrige des variations saisonnires.
Bourbonnais et Usunier, 2007 (18), montrent, par cette formule, que lerreur de prvision
attendue peut tre estime par la moiti de la variation de la srie CVS autour de sa
moyenne. Il sera difcile datteindre une erreur de prvision infrieure celle-ci.
La fonction prev.jours rend une prvision en utilisant la mthode des moyennes mo-
biles pour obtenir une saisonnalit. Elle procde dans lordre :
Extraction des annes partir des dates.
Excution de la fonction decomp.jours .
Dnir les jours fris entre la date de dbut et la date de n de la srie
chronologique, grce la fonction calendrier .
Attribuer une valeur moyenne aux jours fris, en fonction du jour de la se-
maine.
Si le modle choisi est additif, appliquer la fonction logarithmique sur la srie
chronologique.
Eliminer la tendance avec la fonction tend.an .
Pour viter les valeurs ngatives, soustraire de la srie chronologique sa va-
leur minimum.
Appliquer une dsaisonnalisation sur 52 semaines, avec laide de la fonc-
tion cvsMM.52sem. Cette fonction prend en compte que certaines annes
comptent 53 semaines alors que dautres nen comptent que 52. Elle corrige
les semaines extrmes. Elle rend ainsi la srie rgulire, suivant une saison-
nalit de 52 semaines. Elle lisse la srie en utilisant la moyenne ou la mdiane
mobile, selon le choix qui a t fait. Il en rsulte la srie corrige des varia-
tions saisonnires (CVS), des coefcients saisonniers, une tendance issue de
la moyenne, ou mdiane mobile, et des rsidus (voir section 4.4.4).
La deuxime dsaisonnalisation fonctionne de la mme faon. La fonction
cvsMM.312j rend la srie rgulire de 312 jours (364j - 52 dimanches).
Cette srie commence par un lundi pour nir par un samedi. Lalgorithme ap-
plique une dsaisonnalisation par moyenne ou mdiane mobile, suivant un
schma additif ou multiplicatif sur un pas de 312 jours.
Retourner dans un tableau, la srie chronologique entre en paramtre de
fonction et sa CVS ainsi que lensemble des donnes utiles pour recomposer
la srie chronologique.
liminer limpact des jours fris. Pour ce faire, utiliser la fonction impact.jf .
Elle construit un tableau avec un enregistrement par date contenue dans la srie
181
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
chronologique. Un enregistrement contient autant de champs que de jours fris
et ftes. Les champs sont renseigns de faon binaire selon que la date de len-
registrement est, oui ou non, le jour fri en question. Un autre champ indique la
distance de la date vis--vis dun fri. Cette distance va jusqu 6 jours avant ou
aprs le fri. Le tableau contient galement un champ indiquant le jour de la se-
maine de chacune des dates. Ces variables permettent dappliquer une rgression
linaire pour estimer leur impact sur la srie chronologique. Cet impact est limin,
par soustraction, dans le cas dun modle additif ou, par division, dans le cas dun
model multiplicatif.
Calculer lerreur de prvision attendue.
Calculer une prvision horizon h, donn en paramtre dentre de la fonction,
laide de la fonction HoltWinters. A la diffrence des autres fonctions cites, celle-ci
fait partie des fonctions prsentes dans la bibliothque R. En xant les paramtres
et 0, nous obtenons la fonction de prvision par lissage exponentiel simple.
Recomposer les valeurs prvisionnelles partir de la prvision obtenue par lissage
exponentiel simple. Cest--dire, quil faut ajouter ou multiplier selon le cas, les
diffrentes composantes retranches prcdemment (effet jour fri, saisonnalit,
tendance). Cette suite dinstructions sexcute avec la fonction recomp.jours .
Construire un tableau prvisionnel. Il comporte les dates prvoir, les champs,
anne, mois, jour du mois, jour de la semaine, fri, prvision et intervalle de
conance. Retourner ce tableau.
La fonction prev.jours , dcrite ci-dessus, contient des variantes. Elle peut, par exemple,
choisir la meilleure dcomposition entre moyenne mobile, mdiane mobile, evf, loess
(voir section 4.4.5.2). Mais des tests empiriques ont montr que le lissage par moyenne
mobile est la meilleure technique pour rvler la saisonnalit des sries chronologiques
prvoir (poids et nombre de positions quotidien dune agence TFE). Dautre part, en
termes de temps de calcul, tester les diffrentes possibilits savre trop long.
La fonction prev.jours.bb se comporte comme prev.jours , lexception de la m-
thode pour liminer la composante saisonnire. Elle utilise pour cela la fonction cvs-
Reg.buysball.312j . Cette fonction rend la srie chronologique rgulire sur un cycle
de 52 6 = 312 jours lanne. Elle fait appel la fonction buys.ballot pour calcu-
ler 52 coefcients saisonniers hebdomadaires et 6 coefcients saisonniers relatifs aux
jours de la semaine, suivant la mthode de Buys-Ballot. De retour dans la fonction cvs-
Reg.buysball.312j , les coefcients sont soustraits, ou diviss, selon que le schma est
additif ou multiplicatif. Le rsultat de la fonction est une srie chronologique corrige des
variations saisonnires.
Pour pouvoir tre transfrables du serveur de dveloppement au serveur de production,
les fonctions sont regroupes dans un package. Aprs une installation de R (Windows
ou Linux), le package est install de manire simple pour que les fonctions soient imm-
diatement utilisables. Le programme principal a t crit de telle sorte quil puisse tre
182
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
excut partir dun chier batch. Dans le chier batch sont enregistrs les paramtres
dentre et de sortie de la fonction prev.jour :
le chemin (ou path) du chier texte comprenant lhistorique des sries chronolo-
giques,
le chemin du chier comprenant les coefcients de pondration entre les prvisions
issues des deux modles,
lhorizon de prvision
les chemins des chiers de sorties
Par le biais du chier batch, les fonctions R vont tre excutes par lETL Open Source
Kettle.
4.7.2 Alimentation des tables sources (oracle) par Kettle
Kettle est loutil ETL de la solution open source de BI (Business Intelligence) Pentaho
tm
.
Pentaho
tm
est une solution dinformatique dcisionnelle entirement dveloppe en Java.
Cette solution a t choisie par Agrostar en 2007 pour remplacer le tout PL/SQL (voir
section
9
).
Comme pour la section prcdente, nous navons pas, ici, lintention de donner un cours
pratique sur lutilisation de Kettle. Mais il semble important dapprhender la dmarche
du dveloppement. Elle ncessite une rexion pour rpondre des problmes sous
contraintes tels que :
la cration dun historique entre 2000 et 2005 partir des donnes H3000, puis
entre 2006 et 2009 partir de GTI,
le calcul des prvisions 2007, 2008, 2009, pour permettre le calcul dindicateurs
sur la abilit du modle de prvision,
la mise jour rgulire des coefcients de pondration entre les deux mthodes
de prvision,
la mise jour hebdomadaire des prvisions quotidiennes, horizon de 9 semaines,
la mise jour quotidienne du rel de la veille,
linsertion dune nouvelle agence (cration historique, prvision 2007 2009, pr-
vision futures).
Les six problmes ont pour contrainte commune la rapidit dexcution, sachant que
pour certaines requtes, il sagit dinterroger des tables de plus de 6 millions denregis-
trements. Il sagit galement de coder les programmes de telle sorte quil soit possible
9. Procedural Language/SQL
183
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
de changer rapidement et simplement des paramtres communs (agences, dates, indi-
cateur prvoir). Lexcution de la mise jour des donnes relles et prvisionnelles doit
tre automatisable et sexcuter par un cron
10
. LETL Kettle joue un rle de pont entre les
bases de donnes mtiers , linfocentre, le moteur de prvision dvelopp sous R, les
messages mail vers ladministrateur et les utilisateurs.
Ltape 1 consiste extraire des bases HP3000 et GTI les donnes ncessaires pour
aboutir la dnition des indicateurs prvoir (poids et nombre de positions), comme
nous lavons expos dans la section 3.1. Le projet Horizons a permis de pousser le
transporteur poser une dnition commune au niveau de lensemble des agences pour
dcrire les indicateurs prvoir. Cette dnition a t traduite en requtes SQL, issues
de la BD HP3000, et en requtes SQL, issues de la BD GTI. Les deux bases ne com-
portent pas les mmes tables et encore moins les mmes champs. Un gros travail a t
ralis avec les personnes de la Dex, et celles des agences pilotes, pour contrler la
vracit des donnes extraites. Les indicateurs ainsi extraits sont injects dans la table
HORIZONS de lInfocentre. Cette table comporte pour chaque agence et pour chaque
jour entre 2002 et aujourdhui, le poids et le nombre de positions passes quai, en
expdition et en distribution.
Ltape 2 consiste calculer des prvisions sur les annes passes an dobtenir des
statistiques sur la qualit des prvisions. Considrons que nous voulions calculer les
prvisions de lanne 2008. Lalgorithme commence par extraire lhistorique des sries
chronologiques prvoir entre 2002 et 2007. Il excute le programme de prvision, d-
velopp sous R, pour enregistrer les prvisions de la semaine 1 en 2008, dans la table
HORIZONS. La boucle suivante ajoute lhistorique le ralis de la semaine 1, pour
prvoir la semaine 2, et ainsi de suite jusqu atteindre la semaine 52. Cette tape doit
calculer, pour 70 agences de transport, les prvisions des deux annes antrieures
lanne en cours.
Les tapes 1 et 2 sont des procdures qui durent plusieurs jours en temps de traite-
ment. Pour donner un ordre de grandeur, il faut calculer 6 indicateurs quotidiens pour 70
agences sur 7 annes, soit 917.280 donnes. Cest une charge de travail non ngligeable
pour des serveurs qui ont aussi dautres procdures faire tourner. Cest pourquoi il est
impratif que le mcanisme fonctionne pour ne pas avoir le relancer de multiples
reprises.
Ltape 3 est la mise jour des coefcients de pondration se fait une fois par an. Cette
frquence est empirique. Elle ne rsulte pas dun calcul savant mais dune gestion quoti-
dienne des donnes. Une mise jour hebdomadaire des coefcients de pondration ne
montre pas une variation signicative de leurs valeurs. Cest le cumul dau moins 12 mois
de donnes qui est susceptible de les faire changer. Le programme dvelopp sous R
calcule les prvisions des deux annes qui prcdent la date en cours, en utilisant les
10. nom donn au programme qui permet, sur les systmes Unix, dexcuter automatiquement des com-
mandes un cycle de dates spcies lavance
184
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
deux mthodes de prvision, et suivant le principe dcrit dans ltape 2. A partir des
erreurs de prvision issues des deux mthodes, le programme utilise lquation dcrite
dans la section 4.4.11, pour mesurer les coefcients de pondration. Ils permettent de
combiner les deux mthodes de prvision.
Ltape 4, consiste mettre jour, tous les matins 11h, les indicateurs raliss la veille.
Ltape 5, est une mise jour des prvisions. Elle se dclenche tous les lundis 15h00
pour calculer de nouvelles prvisions journalires horizons de 6 semaines en prenant
en compte les derniers rsultats raliss (voir tape 4).
Pour donner au lecteur un aperu des fonctionnalits de lETL Kettle les tapes 4 et 5
sont dcrites dun point de vue technique.
Dabord, Kettle donne la possibilit de crer deux types de processus :
Les transformations sont une suite de traitements effectus sur les champs et les
observations des donnes extraites dune ou plusieurs BD. Les traitements sont
des oprations de tri, de ltre, de conversion de donnes, etc.
Les tches, permettent dexcuter une suite de transformations et de tches. Ainsi
une tche peut en excuter une autre. Elle autorise lenvoi de mails, limportation de
donnes ou le lancement de programmes externes par lintermdiaire dexcution
de commandes shell. Lexcution de chaque tape peut tre contrle, suivant le
rsultat des tapes prcdentes.
La gure 4.13 illustre la tche Kettle qui ralise ltape 4. Elle montre une succession de
transformations (carrs verts) et de tches (carrs orange). Les deux premires trans-
formations affectent un nom, une description et la date laquelle sexcute la tche. Les
trois dernires transformations crent un message dalerte pour avertir du bon ou du
mauvais droulement de la tche ainsi que lheure laquelle elle sest termine. Ces in-
formations sont stockes dans une table de suivi des ux Kettle et ont pour but de tracer
la tche ds lors que le cron lexcute.
La gure 4.14 illustre la tche Kettle qui ralise ltape 5. Cette tche, appele hor_maj_hebdo ,
excute une transformation nomme maj_horizons_from_indic_age . Elle cre 14 en-
registrements relatifs aux 14 dates prcdant la date en cours. Les enregistrements cor-
respondant aux dimanches sont supprims. Pour chacune des agences du groupe, et
chacune des 14 dates, une requte SQL extraite dune table appele indic_age , les
indicateurs ncessaires (voir 3.1.2) pour aboutir au poids et au nombre de positions pas-
ses quai, en expdition et distribution. La donne ainsi obtenue est insre dans la
table HORIZONS de linfocentre. Relevons que la table indic_age est elle-mme mise
jour quotidiennement et que le traitement que nous dcrivons est lanc aprs la n
de cette tape. Cette condition est prise en compte dans le cron qui lance la tche
hor_maj_reel_quotidien .
185
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Suite lexcution de la tche hor_maj_hebdo_sie , la transformation hor_alim_hquai_distri
Figure 4.13 Impression cran dune tche Kettle de mise jour quotidienne des indicateurs
se charge (voir gure 4.15). Elle rcupre les 14 dates prcdant la date en cours
et les codes de lensemble des agences du groupe. Pour chacune, elle fait tourner
une requte SQL pour extraire les heures productives du quai. Les heures produc-
tives en distribution correspondent lactivit nuit et sont badges dans la nuit du jour
J 1, 22h30 J, 7h00. Nafchant pas lactivit du dimanche dans le reporting nal, les
heures du dimanche en distribution sont ajoutes aux heures du lundi. La transformation
hor_alim_hquai_distri se termine en alimentant la table heure_quai des valeurs
calculs.
La transformation hor_alim_hquai_expe fonctionne de la mme faon que la trans-
formation hor_alim_hquai_distri . Mais les heures productives en expdition collent
lactivit jour, et sont badges le jour J, 7h00 22h30. Lactivit dexpdition du dimanche
est compte le samedi.
4.7.3 Interface graphique : partie merge de liceberg
Linterface graphique dveloppe en client lger a pour but de restituer les rsultats
prvisionnels de manire claire et utile. Lobjectif est de faire de cette application un outil
186
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Figure 4.14 Impression cran dune transformation Kettle dextraction des donnes et de
leur transformation pour chargement
daide la dcision. La solution propose apporte un volet scientique au travers de la
statistique, pour anticiper la demande. Plus quun outil de prvision, loutil permet ga-
lement danalyser lactivit dune agence en naviguant dans le temps. Ces options gra-
phiques permettent de visualiser en un clin il les donnes atypiques, les baisses et les
hausses dactivit. Les tableaux de contrle ont vocation dentrer dans le dtail. Des ta-
bleaux de bord renseignent sur la justesse des prvisions passes. La page planication
offre une visualisation graphique et des lments de planication, dont une proposition
dheures productives quotidiennes, horizon de 5 semaines. Linterface graphique du
systme de prvision fournit une solution complte, puissante et facile interprter pour
anticiper et planier lactivit dune agence de transport TFE. Loutil Horizons , doit
rendre le travail de planication plus simple, plus rapide et plus able.
Le dveloppement de linterface graphique est ralis en HTML, PHP et Adobe Flex.
Linterface doit tre capable dafcher dans un dlai acceptable pour lutilisateur, des
informations extraites de tables Oraclepesant parfois plus de 6 millions denregistre-
ments. A limage de la gure 4.16, linterface graphique Horizons sest inspire de
celle de Goggle Analytics. La page daccueil prsente loutil de prvision Horizons .
Un texte reprend lobjectif de loutil et les informations que lutilisateur va trouver, en en-
trant. Des liens hypertextes conduisent des pages daide et de prsentation du projet.
Ces pages rpondent aux questions suivantes : Quelle est la gense du projet ? Quelles
187
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Figure 4.15 Impression cran de la tranformation Kettle dextraction des donnes et de leur
transformation pour chargement
Figure 4.16 Page daccueil du site web Horizons
sont les principales proprits des prvisions ? Quelles mthodes mathmatiques et al-
gorithmiques ont t utilises ? Quels sont les outils informatiques utiliss ? Quelle est
188
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
la source des donnes ? Quelles sont les agences pilotes ? Pour accder aux donnes
relles et prvisionnelles, lutilisateur doit sidentier. Il saisi son login et son mot de
passe de lActive Directory (AD). Cest un service compos dun annuaire qui recense
lensemble des collaborateurs du groupe STEF-TFE. Le service AD vrie la prsence
de lutilisateur dans lannuaire du groupe, et lauthentie.
Aprs authentication, le modle de page est dcoup en 3 parties (voir gure 4.17).
Figure 4.17 Propositions de prvision journalire sur le site web Horizons
Une colonne gauche prsente les menus de navigation. Une partie graphique, en tte
de page, permet dobtenir une vision densemble rapide et synthtique des donnes d-
tailles au-dessous. La partie prsentant les donnes dtailles est encastre droite
du menu de navigation et en dessous de lencadr graphique.
Les pages propositions de prvision (tonnage pass quai, en expdition, distribution,
nombre de positions passes quai, en expdition, en distribution) comportent, dans
lencadr graphique, des courbes reprsentant la donne relle, prvisionnelle et corri-
ge. Grce aux outils dAdobe ex builder, le graphique est anim. Lorsque lutilisateur
sapproche dun point (intersection entre jours, en abscisse, et valeur de la donne, en
ordonne) laide du curseur de la souris, une bote rectangulaire safche pour indi-
quer le dtail relatif ce point (date, donne relle, prvision, correction, diffrence entre
prvision et donne relle, diffrence en pourcentage par rapport au rel) (voir gure
4.17). Cette bote apparat en rouge lorsque lerreur de prvision est suprieure 10%,
en vert dans dautres cas. Les donnes dtailles sont ranges dans des tableaux. Un
tableau est compos de 6 colonnes (les jours de la semaine du lundi au samedi) et de
4 lignes (donne en A 1, donne ralise, donne prvue, donne corrige). Lutilisa-
189
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
teur a le choix de visionner entre 2, 5 et 10 semaines de donnes. Les 10 semaines lui
donnent une tendance long terme de son activit. Les 5 semaines permettent de vi-
sualiser les erreurs de prvision des deux dernires semaines et danticiper lactivit des
3 prochaines, par exemple. Lafchage de deux semaines est utile pour communiquer
autour des prvisions. Le graphique et les deux tableaux prennent une page dimpres-
sion. Il est conseill dimprimer les rsultats de la semaine prcdente et les prvisions
de la semaine venir. Le rapport, ainsi afch la vue de tous, se veut transparent sur
les erreurs de prvision passes, mais motive aussi les quipes en leur communiquant
lactivit quelles ont soutenue. Connaissant le rythme de la semaine prcdente, la
vue du rapport prvisionnel, elles estiment le rythme auquel elles doivent sattendre, la
semaine en cours.
Les tableaux des donnes dtailles fournissent, pour chaque jour de la semaine, le r-
sultat de lanne prcdente la mme poque (semaine, jour). Ce chiffre est essentiel.
Cest un rfrent pour valider la prvision. En effet, le moteur de calcul reste mcanique,
il peut senrayer. Cest pourquoi lutilisateur doit valider les prvisions (voir section 4.8).
Le rsultat en A1 est un rfrent qui le lui permet. Cet indicateur permet galement de
se positionner par rapport lanne prcdente. Lactivit est-elle en baisse, stable ou en
hausse ?
La deuxime information des tableaux est la prvision. La troisime ligne fournit le ra-
lis. Tous les jours, le rel de la veille est disponible. Il est ainsi automatiquement com-
par au prvisionnel et contribue aux statistiques de conance (voir section 2.3.5). La
quatrime ligne afche la valeur corrige et valide par le manager.
Toujours dans un souci de transparence, linterface graphique de loutil Horizons
donne un ensemble de statistiques pour dcrire la performance des prvisions passes.
Les prvisions comportent toujours des incertitudes et des imprcisions. Il importe den
valuer lordre de grandeur et de le communiquer aux utilisateurs , (17). Les pages web
indicateur de conance fournissent un diagnostic pour lvaluation des prvisions du
poids et du nombre de positions passes quai, en expdition ou en distribution. Ce
diagnostic est possible pour nimporte quel intervalle de temps et pour toute priode
entre le 1er Janvier 2007 et aujourdhui. Il sagit, par des moyens graphiques (histo-
gramme des erreurs), de visualiser rapidement les jours pour lesquels le modle est le
plus performant. Pour un non-statisticien, la variance des erreurs est plus accessible par
lhistogramme que par la donne brute. Des statistiques numriques (moyennes, cart-
type, pourcentage de prvision juste) attestent les performances de la prvision (voir
gure 4.18).
Rappelons que le modle mathmatique a t conu pour sadapter lactivit de plus
de 70 agences de transports. Ces agences ont chacune leur spcicit. Il est raisonnable
de penser que le modle ne les prend pas toutes en compte. Cest pourquoi il sera plus
efcace pour les unes et moins pour les autres. Le diagnostic des performances est cr
cet effet. Il cherche rendre les indicateurs statistiques comprhensibles et faciles
190
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Figure 4.18 Indicateurs de conance aux prvisions sur le site web Horizons
interprter. Suite cette consultation, le manager est mme de se faire une opinion
approfondie sur la conance quil peut accorder aux prvisions proposes.
Linterface graphique de loutil Horizons propose une fentre de prvision collabora-
tive (voir gure 4.19). Elle permet de dajuster ou de valider chacune des prvisions pro-
poses horizon dune semaine. A chaque ajustement, un motif doit tre apport. Ainsi,
avec le temps, TFE recueille des informations cruciales pour dcrire les raisons des pics
dactivits. Les motifs dajustement sont choisir dans une liste : gain portefeuille, perte
portefeuille, vnement commercial, fri, dbut du mois, n du mois, opration saison-
nire, prvision Horizons , facteur mto, autres. Cette liste a t discute avec les
quipes du terrain. Toutefois, elle nest pas exhaustive et peut sallonger. Aprs six mois
un an de rcolte dinformations, le prvisionniste pourra amliorer ses prvisions. En
effet, sachant qu la mme poque, un an auparavant, une promotion tait traite, le
systme devra envoyer une alerte pour demander si cette promotion se rptera et, le
cas chant, il faudra la prendre en compte dans le calcul des prvisions.
Un ajustement sur la proposition de prvision nombre de position ou poids total pass
quai, se rpercute 50% sur la prvision donne en expdition et 50% sur celle en
distribution. Alors que si lajustement est fait sur la proposition de prvision en expdition
191
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Figure 4.19 Interface pour ajuster les propositions de prvision sur le site web Horizons
ou en distribution, la diffrence entre lajustement et la proposition de prvision est rper-
cute sur la prvision de lindicateur total pass quai. Ds quun ajustement est saisi, il
apparat dans la partie graphique et lensemble des utilisateurs peut le consulter.
Loutil veut tre une bauche de la planication. Cest pourquoi il intgre un volet taux
de productivit . Ces pages fournissent, sur le mme modle que la prvision des poids,
le ralis et la prvision des heures productives et le taux de productivit. Le taux de pro-
ductivit est le ratio entre le poids et le nombre dheures productives. Cest un indicateur
de productivit pour les responsables de site.
Aprs une premire prsentation de linterface chez les agences pilotes, il est apparu
que lergonomie du site ntait pas remettre en question, bien au contraire, elle semble
rjouir un grand nombre dutilisateur. Par contre, une question surgit systmatiquement :
quelle est la source des donnes. Tant que les utilisateurs ne comprennent pas la faon
dont t calcule la donne, et comment la rattacher la multitude dindicateurs dj en
place dans le systme dinformation, ils nutiliseront pas loutil de prvision. En effet, pour
que loutil soit accept, il est crucial que les donnes afches soient ables, homognes
et dune qualit matrise. Il ne suft pas davoir accs une prvision, linterprtation et
lutilisation de la prvision dpendent de la qualit de linformation rapportent Forslund et
Jonsson, 2007 (53).
Deux nouvelles pages ont t cres pour amener lutilisateur accepter la donne pr-
sente. Une page daide apporte la dnition de la donne, sa rgle de calcul et ses
sources. Le dnominateur commun de toutes les donnes du transporteur est la po-
sition. Cest pourquoi, une autre page donne, pour chacune des agences, et pour les 7
192
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
jours passs, lensemble des positions prises en compte dans les indicateurs fournis. Les
informations lies la position et son type sont afches. En expdition loutil recense
les positions types TDE, TEX, TEXTT, TLMHgr, TLHgr, TLHct, TLMHct. En distribution,
il liste les positions marques TDL, TLL, TPQ, TLMLocal. Cest une information qui est
trs apprcie par les utilisateurs, car inexistante ailleurs, dans le systme dinformation.
Linformation lie la position est mieux matrise par les agents du terrain que le typage
de la position. Les noms des expditeurs, des destinataires sont des informations lies
la position. A partir de ces informations, le chef de quai sait tout de suite si la position est
bien passe son quai, quelle heure elle est passe, sa provenance et sa destination.
A partir de l il acceptera plus facilement la donne fournie puisquil pourra lapproximer
mentalement.
4.8 Mode demploi du systme de prvision Horizons
Les prvisions sont utilises des ns diffrentes. Nous lavons mentionn dans la
section 2.1.4 et section 2.2.1, les chefs de services cherchent en dduire un planning
de leurs effectifs, les chefs dagences laborent le budget et xent des objectifs, les com-
merciaux relancent les clients. Suivant lutilit que lutilisateur a des prvisions il va les
lire diffremment. Il va prfrer la prvision mensuelle, moyen terme, au dtriment de
la prvision journalire, court terme, ou vice versa. Cest pourquoi lapplication Ho-
rizons propose dafcher les prvisions aussi bien 2 semaines, qu 5 semaines et
10 semaines. La version Horizons v2.0 propose des prvisions mensuelles horizon
de 24 mois. Nous rappelons lutilisateur que lincertitude augmente avec lhorizon des
prvisions.
La abilit des prvisions dpend aussi de la abilit des donnes dentre. Des erreurs
de saisie sur le poids des positions peuvent accentuer les erreurs de prvision. Enn, la
qualit des prvisions dpend de la volatilit des donnes autour de leur moyenne. Ds
lors, les prvisions chiffres ne doivent pas tre prises pour argent comptant. Elles sont
un support pour tre dbattues et corriges lors de runions regroupant le comit de
validations. Il a pour objectif de consolider les prvisions au niveau de lagence. Comme
le rappelle Fildes et al. (51), la prvision statistique, en milieu oprationnel, doit tre cor-
rige et conrme par des experts mtiers.
La gure 4.20 montre le droulement des oprations. Cest un ensemble dtapes n-
cessaires la fabrication dune prvision juste et accepte par lensemble des acteurs.
Lhistorique des sries prvoir est extrait des bases de donnes. Le moteur de calcul
des prvisions sappuie sur lhypothse que lactivit des agences de transport, ainsi que
leur environnement, sont stables. Autrement dit, lavenir toutes les chances de se d-
rouler comme le pass, en prenant en compte une volution progressive du phnomne
193
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Figure 4.20 Process dutilisation du systme de prvision Horizons
tudi. Lalgorithme de prvision ne tient compte ni des modications structurelles in-
ternes aux agences et au groupe, ni des changements conjoncturels du march li
au transport, explique Bortolotti (17). G. Chevillon (29), ajoute que les mthodes de
prvision ne sont malheureusement pas parfaites et nont pas vocation devenir de
purs exercices mathmatiques sans contenu conomique . Pour pallier labsence des
donnes qualitatives, il est conseill aux agences de transport de mettre lordre du
jour des runions hebdomadaires, la prvision dactivit. Dhabitude ces runions heb-
domadaires sont organises pour traiter des problmes passs, prsents et venir. Les
responsables de services sont prsents. Ils viennent du service commerce, du service
de la direction, du service quai et du service de lexploitation. Personne ne peut pr-
tendre mieux connatre lactivit de lagence de transport que chacun des responsables
de services. Franco et Lignerolles, 2000 (54), prcisent bien que les utilisateurs des pr-
visions doivent connatre le contenu informel disponible, matriser la valeur smantique
des donnes, la culture de lentreprise et avoir une forte connaissance de lenvironne-
ment, notamment en terme dhistorique dactions et dvnements relatifs au contexte
de lentreprise. Ce recul et cette matrise du contexte sont des prrequis pour viter au
194
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
mieux de perdre du temps sur certaines dcouvertes videntes ou de tirer des fausses
conclusions danalyse de donnes bruites . Pour faire court, les experts mtiers uti-
lisent leurs capacits de jugement pour valider la faisabilit des prvisions proposes.
Lapplication Horizons leur fournit, en plus, un ensemble dindicateurs leur permettant
une prise de dcision rchie. Ces indicateurs sont :
la donne ralise en A 1,
lanalyse du comportement du modle sur la base des statistiques de abilit,
la donne prvisionnelle et son intervalle de conance,
des indicateurs de mesures permettant de juger de la pertinence des prvisions.
Pour les utiliser bon escient, les experts mtiers doivent tre forms la lecture de ces
rsultats. Par la suite, ces indicateurs croiss avec lchange dinformations qualitatives
en provenance des diffrents services de lagence de transport, doivent permettre de
sapprocher au plus prs de la valeur relle future. Pass leurs dbats, les responsables
de service valident ou ajustent la donne prvisionnelle. Pour la valider, ils slectionnent
prvision Horizons dans la liste des motifs dajustement, sinon, ils choisissent un autre
motif dajustement.
Dautre part, comme pour lhorizon de prvision, lerreur de prvision nest pas perue
de la mme manire par lensemble des utilisateurs de prvision (voir section 2.2.11).
Dabord pour le prvisionniste, une erreur de +5% est identique une erreur de -5%.
Elle est centre en 0 et cest ce qui limporte. Par contre, lexploitant accordera davan-
tage dimportance lune ou lautre, suivant les moyens humains et matriels dont il
dispose pour faire face lactivit prvue. Une erreur positive (la prvision est suprieure
au ralis) cote de largent lagence car elle aura plani trop de personnel, par contre
elle aura su rpondre lactivit. Cest essentiel pour son image de marque. Une erreur
infrieure zro contraint lagence repousser lactivit du jour au lendemain, par faute
de moyens. Elle aura plani trop peu de main duvre pour faire face lactivit relle.
Ensuite, il est conseill aux agences de transport de xer leur tolrance, face la moyenne
des erreurs absolues, par rapport au ralis (MAPE : Mean absolute percentage Error),
en fonction de ce que cela reprsente en heures productives. Par exemple, si une erreur
de prvision de 10% reprsente moins de 8 heures productives, elle est acceptable car
elle na pas amen le charg de planication embaucher une personne de plus ou de
moins pour la priode considre.
Il est galement rappel aux agences de transport, quune prvision peut tre vue de
diffrentes manires,
est-ce un objectif atteindre ?
est-ce un chiffre qui devra tre atteint quoi quil arrive ?
est-ce le chiffre qui devrait tre atteint si tout se passe sans imprvus ?
est-ce une tendance ?
195
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
En fonction de la rponse, la communication des prvisions se fait diffremment. Il est
prconis aux agences de transport de considrer la prvision fournie par loutil Ho-
rizons , avec son intervalle de conance, comme un chiffre qui va se raliser si tout
se passe comme prvu. Nanmoins, les responsables de lagence de transport peuvent
retoucher les prvisions proposes par le systme Horizons dans loptique de les uti-
liser comme un objectif atteindre.
Les responsables dagence de transport ont lhabitude de parler du taux de producti-
vit. Nous lavons mentionn dans la section 1.1.2.2.3, cest le ratio entre le poids des
marchandises passes quai et les heures productives sur le quai. Les responsables
dagence utilisent ce taux comme un indicateur de performance. Il leur permet de d-
terminer si les heures productives ont t utilises correctement. Il faut savoir quune
fois par semaine, les responsables de service achtent des heures productives en fonc-
tion de leurs besoins. Les besoins varient selon la charge de travail due aux uctuations
dactivit. Cette charge de travail compte en heures productives est ralise par des in-
trimaires. Lheure dintrim cote trs cher lagence. Cest pourquoi les responsables
dagence souhaitent, par la maitrise des prvisions dactivit, planier, au plus juste, le
nombre dheures productives et donc le nombre dintrimaires.
Comme pour les poids de marchandises, nous distinguons le taux de productivit en ex-
pdition de celui en distribution. Rappelons que, schmatiquement, lactivit dexpdition
correspond lactivit du quai jour, et que lactivit de distribution correspond lactivit
du quai de nuit. Ainsi, en anticipant les heures productives, le systme de prvision Ho-
rizons donne la possibilit de planier lquipe de jour et lquipe de nuit. La prvision
des heures productives est le rsultat du ratio entre le poids prvu du jour J et la mdiane
des six derniers taux de productivit pour le jour de la semaine du jour J. Cest--dire que
si le jour J prvu est un lundi, le taux de productivit prvu est la mdiane du taux de
productivit ralis les six lundis prcdents le jour J. Dans ce sens, la prvision des
heures productives dcoule de la prvision des poids. Nous navons pas, ici, construit
un modle de prvision spcique qui prenne en compte les diffrentes composantes de
la srie chronologique prvoir. Nanmoins les rsultats prvisionnels se rapprochent
fortement des rsultats raliss. Les responsables dagences surveillent de prs les taux
de productivit et aiment les rappeler quand bon leur semble.
Aprs avoir t discute et valide par les diffrentes parties, la prvision dactivit (poids,
nombre de positions et taux de productivit) doit tre publie au niveau de lagence de
transport. Pour communiquer sur la prvision et motiver les quipes, le module Hori-
zons permet dafcher sur une mme page, pour la semaine en cours et la semaine
venir, le graphique et les tableaux de bord, de la prvision et de lactivit ralise. En
imprimant cette page et en la diffusant dans lagence de transport, les employs peuvent
comparer le ralis et la prvision des derniers jours. Ainsi dans un premier temps, les
196
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
employs comparent lactivit afche et la charge de travail quils ont ralises. Dans
un deuxime temps, ils visionnent la prvision des jours venir et se font, ainsi, une
ide prcise de la charge de travail qui leur est demande. Dautre part, les salaris sont
satisfaits quand ils voient que lactivit ralise a atteint ou surpass la prvision et le
sont moins dans le cas contraire. Cet afchage de lactivit passe et des prvisions a
notamment pour but dimpliquer un peu plus les salaris la bonne marche de lagence.
Non seulement loutil Horizons donne les prvisions de lactivit, mais il donne aussi la
possibilit, a posteriori, danalyser lactivit en naviguant dans le temps. Lutilisateur peut
exporter les tableaux hebdomadaires dans un intervalle de temps donn et les analyser
par le biais dun tableur. La partie graphique permet galement lutilisateur didentier
rapidement les grosses erreurs de saisie sur le poids des positions. Cest le cas lorsque
la courbe des poids forme un pic limage de la gure 4.21.
Figure 4.21 Valeur extrme identi rapidement grce linterface web Horizons
4.9 Retour sur investissement
La section 2.1.4 donne des pistes sur la faon destimer le retour sur investissement,
suite la mise en place dun systme de prvision. Nous avons vu que le montant in-
197
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
vesti est souvent facilement identiable. En revanche, largent gagn lest moins. Nous
voulons montrer que non seulement le systme de prvision Horizons est un outil
complet qui a t industrialis au niveau dun groupe denvergure internationale, mais
que, par ailleurs, le groupe retire de substantiels bnces lutiliser.
Depuis le 1
er
Janvier 2009, le systme de prvision Horizons est en production dans
les agences de transport TFE. Lanne 2009 doit permettre de communiquer autour du
produit, de former les futurs utilisateurs, de capitaliser lexprience et dadapter le pro-
duit suivant les usages qui en sont faits. La communication a pour but de convaincre
les responsables dagences de lintrt quil y a utiliser lapplication. Mme si ce nest
pas la seule raison dutiliser les prvisions, la communication insiste sur lanticipation de
lactivit pour amliorer la planication des ressources humaines sur le quai. Cette pers-
pective, nous amne une possible premire valuation du gain apport par le systme
de prvision. Sans compter la convivialit de linterface, laccs rapide une information
juste, et mise jour quotidienne, nous pouvons nous attendre raisonnablement ce que
la prvision dactivit face gagner 24 heures de production par mois. Cela quivaut en
moyenne moins dune heure par jour (24 heures / 26 jours ouvrs par mois). Au ni-
veau groupe, ce bnce monte 1.680 heures mensuelles (70 agences 24 heures).
Sur la base dun smic horaire, le gain atteint 14.817e par mois (8, 82e 1680 heures) ou
177.811e par an, sans compter les charges patronales.
Avant la mise en place du systme de prvision Horizons , les diffrentes rgions du
groupe (Bretagne Pays de la Loire, Sud-ouest, Nord-Ouest, Rhne-Alpes, Sud-est, Est)
possdaient chacune leur propre systme de prvision. Pour tre maintenu jour, les
systmes dvelopps sur tableur avaient besoin au minimum dune demi-journe par se-
maine du temps de travail dun contrleur de gestion. Sur une base annuelle de 28 ke, le
gain pour le groupe monte 16.800e par an (25ke / 10 temps 6 rgions), sans compter
les charges.
Le gain se retrouve galement dans le confort dutilisation. La partie graphique de lap-
plication permet, rapidement, de constater des anomalies dans les indicateurs afchs.
Cette facilit dusage autorise dtre trs ractif et de corriger rapidement la source de
lerreur constate visuellement.
Lafchage de lactivit passe et prvue (voir section 4.7.3), doit motiver les quipes. Le
but recherch est un gain de productivit. Il semble nanmoins que lafchage aux yeux
de tous soit utiliser avec modration. Se rendant compte de lactivit produite, lem-
ploy aurait tendance rclamer une hausse de salaire, nous a rvl un responsable
dquipe.
Un moyen destimer le retour sur investissement est de laisser la parole aux utilisateurs.
Lydie Hoarau, responsable des ressources humaines chez TFE Bourge, utilise rguli-
rement lapplication. Elle avance que les prvisions des indicateurs poids et nombre de
positions passes quai, sont pertinentes. Les prvisions des indicateurs en expdition
198
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
sont moins justes, car il y a moins dactivit. Cela engendre un historique des donnes
volatiles. Lydie comprend la cause de lerreur et corrige en consquence les prvisions
en expdition. Elle ajoute utiliser les prvisions dactivit pour estimer la productivit de
la semaine suivante.
Julien Vidal, chef de quai chez TFE Lille, utilise loutil Horizons rgulirement. A partir
des prvisions journalires sur un horizon de deux mois, il affecte un effectif quai journa-
lier. Leffectif est calcul en fonction de la prvision des poids et dune productivit avise.
Il estime que les prvisions sont justes 95%, en moyenne, sur la semaine. Cependant,
il pense que 5% derreur cest encore beaucoup, au vu des tonnages hebdomadaires
que cela reprsente. 5% derreur quivalent 2 ou 3 personnes la semaine.
Thierry Jaffredou, contrleur de gestion chez TFE Rennes exploite, les prvisions four-
nies par Horizons pour planier les quipes du quai. Il dit retrouver des donnes
cohrentes quil est capable de croiser avec des informations de sources diffrentes.
Comme il est prconis par la mthodologie, Thierry Jaffredou runit les chefs de ser-
vice une fois par semaine, pour croiser les informations qualitatives quils ont du terrain,
dans le but dafner les prvisions proposes par loutil Horizons . T. Jaffredou est par-
venu convaincre le chef de quai de lagence dutiliser loutil de prvision. Dautre part,
il travaille en troite collaboration avec le prvisionniste pour lui suggrer des volutions
de loutil.
Il ressort des discussions avec les utilisateurs un rel engouement pour la prvision
dactivit. Ils sont persuads que cest un moyen damliorer la productivit et, plus g-
nralement, la logistique. Ils sont les premiers en redemander. Ils sont nombreux
penser que le mtier volue. Avant lactivit se rpartissait quitablement sur une jour-
ne de travail. Lexpdition se faisait pendant la journe, tandis que la distribution se
faisait la nuit. Aujourdhui la logistique se recentre sur des plages horaires plus troites.
Lactivit demande plus de exibilit. Mais pour dcider des plages horaires de travail, les
dcideurs ont besoin de prvision dactivit par crneaux horaire. Cette demande de pr-
vision manant du terrain est un signe positif qui nous semble important dinsrer dans
les critres de retour sur investissement. Cest le signe que les prvisions sont devenues
indispensables pour le pilotage de lactivit.
Nous avons vu quun critre du retour sur investissement est le besoin quont les agences
de transport en donnes prvisionnelles. Un moyen de calculer ce besoin est de comp-
ter le nombre de connexions mensuelles au site Horizons . Aujourdhui, il est denviron
350 connexions mensuelles. Bien entendu, un mme utilisateur nest compt quune fois
par jour. Une trentaine de personnes se connectent plus dune fois par semaine. Ce qui
est le signe que ces personnes suivent avec intrt les prvisions et lvolution de leur
activit relle.
Nous venons de montrer que le retour sur investissement ne se calculait pas uniquement
en termes de gain nancier. Une partie du gain est du temps gagn, que nous pour-
199
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
rions chercher convertir en argent, une autre partie est laccroissement de la ractivit,
une autre est la prise de conscience, par les managers, de limportance des donnes
prvisionnelles, etc. Le groupe STEF-TFE a pris conscience des enjeux et cest pour-
quoi il met les moyens pour inciter toutes les agences de transport du groupe utiliser
bon escient le systme de prvision Horizons . Le soutien des instances dirigeantes
a galement permis de sortir une version 2.0 du produit. Elle fournit des prvisions
moyen terme, cest--dire des prvisions dactivit mensuelle horizon de 24 mois. Ces
prvisions ont pour vocation daider xer les budgets.
4.10 Industrialisation : Prvision moyen terme
La version 2.0 du systme de prvision Horizons propose des prvisions dactivit
moyen terme. Elle nest en service que depuis Octobre 2009. Les indicateurs poids
des marchandises et nombre de positions passes quai mensuellement sont prvus
horizon n 2010. Dbut 2010, lhorizon de prvision passera n 2011 et ainsi de suite.
Ces prvisions mensuelles serviront, entre autres, tablir les budgets. Comme pour les
prvisions court terme, des statistiques sont fournies pour permettre lutilisateur de se
faire sa propre opinion sur la conance apporter aux prvisions proposes. De manire
gnrale, tout ce qui se trouvait dans Horizons V1.0 pour les prvisions journalires,
se retrouve dupliqu dans Horizons V2.0 pour les donnes mensuelles.
Horizons V2.0 est la preuve quil est possible, en moins de 6 mois, de rdiger un mo-
dle mathmatique de prvision, de le programmer informatiquement, dinstaurer la com-
munication entre applications et, enn, de proposer par une interface graphique convi-
viale une information passe et prvisionnelle juste et mise jour quotidiennement. Cest
le travail effectu sur Horizons V1.0 qui a permis didentier, de dnir les tapes et
de normaliser le processus de mise en production dun systme de prvision. La version
Horizons V2.0 est prsente dans le rapport de stage de M. Jaimes (68). M. Jaimes
reprend la mthodologie, les processus de dveloppement, les mthodes analytiques et
les recommandations dcrits dans cette thse pour dvelopper un systme de prvision
amliores, qui anticipe mensuellement lactivit des agences de transport du groupe
STEF-TFE. Ainsi, cette thse aura aussi permis de dcrire, dune manire dtaille et
pratique une mthode de mise place dun systme de prvision dans son complet. La
mthode a fait ses preuves dans le domaine du transport, au sein du groupe STEF-TFE.
Elle attend dtre applique chez les clients du groupe et notamment chez les industriels
de lagroalimentaire.
200
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Chapitre 5
Simulation des ux de marchandises sur
un quai de messagerie
La comprhension et la modlisation dun quai de messagerie sont un domaine peu
explor. Lobjectif de ce chapitre est de contribuer de manire signicative son explora-
tion. Nous avons prcdemment dcrit les ux physiques et informatiques occasionns
par le transport dune marchandise. Ces informations nous permettront de prescrire les
entres et sorties du modle de quai de messagerie
Disposer dun tel modle implment dans un code de calcul efcace permettra desti-
mer le temps de traitement de la marchandise sur un quai. Cela permettra galement de
prvoir les ressources matrielles et humaines ncessaires pour le passage quai des
marchandises. Enn, cela ouvrira la possibilit doptimiser les processus industriels en
jeu sur les quais.
Nous construisons un modle exible permettant de simuler les ux de marchandises,
aussi bien sur un petit quai que sur un quai de grande taille, partir des donnes qui sont
notre disposition. Dans un premier temps, nous dcomposons le quai en plusieurs com-
partiments. Lhypothse est de considrer que la marchandise associe une position
donne passe par chacun des compartiments du quai. Le passage dun compartiment
un autre est dcrit par un ux, lui-mme modlis par une fonction de transfert. Les fonc-
tions de transfert interviennent dans un systme dquations diffrentielles ordinaires d-
crivant lvolution de la masse de marchandises dans chacun des compartiments. Deux
modles simulant les ux sont dvelopps. Le premier, appel modle n , modlise
les ux lchelle de la position. Le deuxime modle, appel modle agrg , mod-
lise les ux lchelle dun ensemble de positions.
Ces deux modles sont implments dans lenvironnement R, puis tests sur des cas
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
trs simples. Leur capacit se comporter conformment au fonctionnement rel dun
quai est exhibe. En revanche les tests mettent en vidence que pour tre utilis de faon
oprationnelle il est indispensable de les implmenter avec une mthodologie de calcul
scientique, ce qui est hors de porte de cette thse.
Enn, en vue de leur implmentation, un modle permettant dinterconnecter plusieurs
quais est construit. Des exemples de formulations de questions industrielles en termes
doptimisation de problmes induisant ces modles sont dcrits de manire relativement
dtaille comme perspectives.
5.1 Modle n
Nous modlisons lactivit du quai par un modle cinq compartiments et 4 fonctions
de transfert.
In Ulo Res Loa Out
- - - - - -
In
In
Ulo
Res
Loa
Out
Figure 5.1 Dcomposition du quai en 5 compartiments
La gure 5.1 illustre la faon dont le quai est dcoup en 5 aires. La premire, appe-
le aire dentre (ou In), nappartient pas physiquement au quai. Elle reprsente la
place sur laquelle les chauffeurs garent leur camion, pour faire dcharger la marchandise.
Avant le dchargement, un certain nombre doprations sont ncessaires (bon de livrai-
son, . . .). Ensuite, les marchandises sont dcharges dans laire de dchargement
(ou Unlo) pour tre conditionnes. Si elles ne sont pas planies pour repartir sous les
24 heures, elles sont transfres dans une rserve ou dans une aire de stockage. Nous
appelons ces deux endroit, aire de rsidence (ou Res). Aprs leur attente dans laire
de rsidence, les marchandises passent dans laire de chargement (ou Loa). Cette
aire permet aux manutentionnaires de bien ranger les palettes de marchandises devant
les portes de sortie o sont stationns les camions pour le chargement. La remorque du
202
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
camion dans laquelle se fait le chargement constitue l aire de sortie (ou Out).
La vitesse de transfert de la marchandise dune aire une autre dpend de lembal-
lage de la marchandise et du nombre de personnes affectes cette tche. De mme,
dautres aspects importants sont considrer. Par exemple, le schma de dcomposition
du quai en compartiments ne prend pas en compte toutes les situations. Les marchan-
dises peuvent tre directement transfres de laire de dchargement vers laire de char-
gement sans passer par laire de rsidence. Dautre part, les grands quais, bncient
de personnel ddi. Il existe les rceptionnistes, les prparateurs, les chargeurs. Alors
que le personnel des petits quais est souvent plus polyvalent.
Le modle dvelopp cherche prendre en compte toutes ces particularits. Il doit tre
valide sur une chelle de temps de quelques minutes. En effet, les applications pour les-
quelles nous projetons de lutiliser ncessitent des modles temps discrets utilisant des
pas de temps variant entre une valeur t
min
, de 15 minutes environ et une valeur t
max
de lordre de 3 heures. A partir de ces considrations, nous construisons un modle qui
utilise des quations ordinaires diffrentielles.
Pour A {In, Ulo, Res, Loa, Out}, p est une position parmi un ensemble Pos et t R,
nous dnissons S
A,(p)
(t) comme la masse de marchandises rattaches la position p
et prsente dans laire A, la date t. Pour tre plus exact, cest la moyenne de cette
masse sur un intervalle de longueur t
min
, centr autour de t. Nous dnissons gale-
ment,
In,(p)
(t) comme le ux de masse de marchandises associes la position p et qui
entre dans laire dentre, la date t. (Concrtement, ce ux est induit par les camions
qui se garent pour dchargement.) Sa dnition prcise consiste dire que la masse de
marchandises associes la position p qui entre dans laire dentre entre la date t et
t + t avec t > t
min
est
_
t+t
t
In,(p)
(s)ds. (5.1)
De la mme faon, nous dnissons
Out,(p)
(t) comme le ux de la masse des marchan-
dises attaches la position p qui quittent laire de sortie. Posons S
A
(t) =
pPos
S
A,(p)
(t),
la masse totale de marchandises prsentes sur laire A la date t. Ainsi, par le biais
de fonctions de transfert, il est possible de dnir les ux de masse de marchandises
circulant entre les aires. Dnissons la fonction de transfert
In,(p)
(t) comme le ux de
la masse de marchandises attaches la position p et qui circule entre laire dentre
et laire de dchargement, la date t. De la mme manire
Ulo,(p)
(t) est la fonction de
transfert entre laire de rsidence et laire de chargement, de mme que
Loa,(p)
(t) est la
fonction de transfert entre laire de chargement et laire de sortie. Il est raisonnable de
poser :
_
In,(p)
(t) =
In
((p, t), S
Ulo
(t), n
In,(p)
(t))(S
In,(p)
(t)),
o (S ) = 1 si S > 0 et 0 si S 0.
(5.2)
203
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Lquation 5.2 met en avant que
In,(p)
(t) est une fonction de la position. La faon dont
In
dpend de p doit prendre en compte lemballage des marchandises de la position p et,
certainement, dautres critres relatifs la position p. Certains emballages sont, tout sim-
plement, plus rapide dplacer que dautres. (p, t) reprsente les informations lies
la position p la date t.
In
est galement une fonction de S
Ulo
ce qui permet de prendre
en compte que S
Ulo
peut tre surcharg.
In
dpend aussi du nombre demploys (ou
heures productives) n
In,(p)
(t) ddi au transfert. La fonction (S
In,(p)
(t)) interrompt le trans-
fert quand il ne reste plus de marchandises lies la position p dans laire dentre. De
la mme faon, nous posons :
Ulo,(p)
(t) =
Ulo
((p, t), S
Res
(t), n
Ulo
(t))(S
Ulo,(p)
(t)), (5.3)
Res,(p)
(t) =
Res
((p, t), , S
Loa
(t), n
Res
(t))(S
Res,(p)
(t)), (5.4)
Loa,(p)
(t) =
Loa
((p, t), S
Out
(t), n
Loa
(t))(S
Loa,(p)
(t)). (5.5)
Ayant dni ces quantits et fonctions de transfert, nous pouvons crire les quations
diffrentielles ordinaires modlisant le transfert de la masse de marchandises dune po-
sition p travers les compartiments du quai :
dS
In,(p)
dt
=
In,(p)
In,(p)
, (5.6)
dS
Ulo,(p)
dt
=
In,(p)
Ulo,(p)
, (5.7)
dS
Res,(p)
dt
=
Ulo,(p)
Res,(p)
, (5.8)
dS
Loa,(p)
dt
=
Res,(p)
Loa,(p)
, (5.9)
dS
Out,(p)
dt
=
Loa,(p)
Out,(p)
. (5.10)
La variation de la masse de marchandises prsentes dans chacune des aires du quai est
le rsultat de la diffrence entre les ux dentres et de sorties de ces mmes aires.
Ds que le modle est formul, il faut montrer quil est bien adapt pour des quais de
grande taille. Pour ce faire, nous construisons des fonctions
A
et
A
adaptes. Nous
devons galement dmontrer que le modle est assez exible pour fonctionner avec des
quais de taille rduite. Cest pourquoi nous prsenterons les notions de chevauchement
daires et dheures productives adapts n
A
(t). Linformation lie la position scrit :
(p, t) = (p, m(p), N
p
(p, t), T
In
(p), T
Out
(p), Pub(p)). (5.11)
m(p) est la masse de marchandises lies la position p. N
p
(p, t) est le nombre dem-
ballages (palettes, rolls, bacs) lis la position p. Le nombre demballages dpend de
la date t. En effet les marchandises dune position peuvent reprsenter par exemple 10
204
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
palettes lors de lenlvement et seulement 9 lors de la livraison. Entre deux, elles auront
t gerbes, ou les colis auront t reconditionns pour gagner de la place. T
In
(p) est la
date laquelle le camion contenant la position p est prt tre dcharg. T
Out
(p) est la
date laquelle le camion contenant la position p est prts quitter le quai. Pub(p) est
la liste des positions dcharger du camion avant daccder la position p. Pour les
grands quais choisir la fonction de transfert
In
suivante :
In
((p, t), S
Ulo
(t), n
In,(p)
(t)) =
1
In
m(p)
N
p
(p, t)
n
In,(p)
(t)(S
Ulo
max
S
Ulo
(t)), (5.12)
semble pertinent.
Dans 5.12,
In
est le temps quil faut pour transfrer un emballage de laire dentre vers
laire de dchargement. S
Ulo
max
est la capacit maximale de laire de dchargement.
m(p)
N
p
(p,t)
est la masse moyenne par emballage de la position p. Lquation 5.12 traduit le fait que
la masse par emballage qui transfre de laire dentre vers laire de dchargement, est
proportionnelle la masse prsente sur chaque emballage et la force de travail affec-
te la tche de dchargement de la position p. La masse par emballage, qui transfre
de laire dentre vers laire de dchargement, est aussi inversement proportionnelle au
temps quil faut pour dcharger un emballage. Le facteur (S
Ulo
max
S
Ulo
) permet de stopper
le transfert quand S
Ulo
max
est atteint. Notez quil est possible daffecter + S
Ulo
max
si laire
de dchargement nest jamais sature. La force de travail, n
In,(p)
(t), alloue au dcharge-
ment de la position p peut tre dnie suivant un indice de priorit que nous souhaitons
accorder la position p, pondr par ce que reprsente la masse de marchandises de la
position p parmi lensemble de la masse dcharger, et en fonction aussi des indices de
priorit, accords aux autres positions. Ce qui peut tre traduit par la formule suivante :
n
In,(p)
(t) =
_
t
tt
min
(p, s)S
In,(p)
(s)ds
_
t
tt
min
Pos
(p
, s)S
In,(p
)
(s)ds
n
In
(t), (5.13)
(p, t) [0, +] est lindice de priorit. Un indice lev permet daugmenter la force de
travail alloue au dchargement de la position p. (p, t) peut tre dni de diffrentes
manires. Une faon simple consiste poser :
(p, t) = (p) =
T
Out
(p) T
In
(p)
,
pour tout t [T
In
(p), T
Out
(p)] et pour une constante donne ,
(5.14)
Une deuxime proposition est de lier (p, t) la longueur dun intervalle de temps :
(p, t) = min(
1
+
2
T
Out
(p) t
;
3
),
pour tout t [T
In
(p), T
Out
(p)] et pour des constantes
1
,
2
,
3
xes.
(5.15)
205
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Cette procdure permet daugmenter lindice de priorit au fur et mesure que nous
nous approchons de la date prvue de dpart du quai. Enn, (p, t) peut tre considr
comme une fonction optimiser.
Dans tous les cas de gures lexpression 5.13 nous semble prfrable la suivante :
n
In,(p)
(t) =
(p, t)S
In,(p)
(t)
Pos
(p
, t)S
In,(p
)
(t)
n
In
(t). (5.16)
Cette dernire ne prend en effet pas en compte le temps ncessaire de la force de tra-
vail pour changer de poste ou simplement pour passer dune aire une autre. De plus,
utiliser la fonction 5.16 acclre le dbut de chargement et ralentit sa n. La fonction
accorde sans discernement une forte force de travail quand la masse de marchandises
est importante et une faible force de travail quand la masse de marchandises est faible.
La fonction 5.15 permet dattribuer une force de travail selon une masse moyenne, sur
un intervalle de temps de longueur t
min
. Ceci a lavantage de prendre en compte les
pauses prises par les employs ou les changements de poste.
Avant de dnir la fonction de transfert
A
pour A {Ulo, Res, Loa}, gnralisons la no-
tation.
Ulo
est pour le temps pass transfrer un emballage de laire de dchargement
vers laire de rsidence.
Res
est pour le temps pass transfrer un emballage de laire
de rsidence vers laire de chargement.
Loa
est pour le temps pass transfrer un em-
ballage de laire de chargement vers laire de sortie. En dsignant par S
A
max
la capacit
maximale de laire A, n
A
(t) et n
A,(p)
(t) sont lis par :
n
A,(p)
(t) =
_
t
tt
min
(p, s)S
A,(p)
(s)ds
_
t
tt
min
Pos
(p
, s)S
A,(p
)
(s)ds
n
A
(t), (5.17)
o n
A
(t) est la force de travail alloue laire A et n
A,(p)
(t) la force de travail alloue
laire A pour excuter une tche sur la position p. Ainsi, nous pouvons crire les galits
suivantes pour dnir
Ulo
et
Loa
Ulo
((p, t), S
Res
(t), n
Ulo,(p)
(t)) =
1
Ulo
m(p)
N
p
(p, t)
n
Ulo,(p)
(t)(S
Res
max
S
Res
(t)), (5.18)
Loa
((p, t), S
Out
(t), n
Loa,(p)
(t)) =
1
Loa
m(p)
N
p
(p, t)
n
Loa,(p)
(t)(S
Out
max
S
Out
(t)). (5.19)
La fonction
Res,(p)
dpend dune variable qui reprsente la date laquelle le transfert
des marchandises de la position p, entre laire de rsidence et laire de chargement
commence. Cette variable permet ainsi de prendre en compte le fait que la marchandise
peut rester un certain temps sur laire de rsidence. La dnition de
Res,(p)
est alors :
_
Res,(p)
((p, t), (p), S
Loa
(t), n
Res,(p)
(t)) =
1
Res
m(p)
N
p
(p,t)
n
Res,(p)
(t)(S
Loa
max
S
Loa
(t))
si t (p)
= 0 sinon.
(5.20)
206
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Le calcul de n
Res,(p)
ncessite une dnition de (p, t). Si avant darriver dans laire de
rsidence, (p, t) est dni par la fonction 5.14 il est ncessaire de la dnir de la manire
suivante :
(p, t) =
T
Out
(p) (p)
pour tout t [(p), T
out
(p)]. (5.21)
Dautre part, si la dnition 5.15 est choisie, la fonction prcdente reste valide.
Pour dnir (p) plusieurs choix peuvent tre faits. Prenons le plus simple :
(p) = T
Out
(p) , (5.22)
o la constante est un temps estim pour quune position p effectue le trajet entre
laire de rsidence et laire de chargement. Bien entendu, la constante ((p, t)) dpend
de (p, t). Lide qui se cache sous cette dpendance est que plus il y a demballages
associs la position p, plus le temps ((p, t)) est long. ((p, t)) peut galement tre
inconnu et, dans ce cas, tre dtermin par une procdure doptimisation.
Considrons
In,(p)
et
Out,(p)
. Dsignons
[t=T]
la masse de Dirac la date T et
t,T
(t) la
rgularisation suivante :
_
t,T
(t) = 0 si t < T t,
=
t T + t
t
2
si T t t < T,
=
t + T + t
t
2
si T t < T + t,
= 0 si t T + t.
(5.23)
Nous posons
Out,(p)
= m(p)
[t=T
Out
(p)]
. (5.24)
Ce qui signie que la masse totale associe la position p est transfre en dehors de
laire de sortie la date T
Out
(p) o
Out,(p)
= m(p)
t
min
4
,T
Out
(p)
(t), (5.25)
est la rgularisation de 5.24.
Pour
In,(p)
nous introduisons un temps
T(p). Il reprsente le temps pass dcharger
les positions Pub(p) avant daccder la position p, dans le camion. Nous dnissons
alors :
In,(p)
= m(p)
[
t=T
In
(p)+
T(p)
]
, (5.26)
ou
In,(p)
= m(p)
t
min
4
,T
In
(p)+
T(p)
(t). (5.27)
207
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Dans ces dnitions,
T(p) peut tre dclar comme :
T(p) =
In
Pub(p)
N
p
(p
, T
In
(p)), (5.28)
mais peut galement faire lobjet dun processus doptimisation, que nous soulignerons
plus tard.
Le modle qui vient dtre prsent est adapt des quais de grande taille. Pour des
quais de taille plus modeste ou des quais qui ne fonctionnent pas exactement comme
nous lavons dcrit ci-dessus, le modle peut tre adapt. Nous prsentons maintenant
des exemples de ces adaptations.
Premirement, la force de travail peut ne pas tre alloue une aire mais un ensemble
daires. Dans ce contexte, A reprsente un ensemble daires. Par exemple, A peut re-
prsenter {In, Ulo} ou {Res, Loa} ou {In, Ulo, Res, Loa}. Alors pour un A donn dans A
nous dnissons lheure productive adapte avec la formule suivante :
n
A,(p)
(t) =
_
t
tt
min
(p, s)S
A,(p)
(s)ds
_
t
tt
min
Pos
A
(p
, s)S
A
,(p
)
(s)ds
n
A
(t), (5.29)
o n
A
(t) est la force de travail alloue lensemble A, la date t. La formule 5.29 rem-
place la formule 5.17. Il est possible dutiliser la formule 5.17 pour un intervalle de temps
donn et la formule 5.29 pour un autre intervalle de temps dni.
Ensuite un quai peut ne pas comporter daire de rsidence. Alors nous utilisons ce que
nous avons prcdemment appel le chevauchement daires. Le chevauchement daires
consiste remplacer lquation 5.6 par :
S
Res,(p)
(t) = S
Ulo,(p)
(t) pour tout temps t. (5.30)
Il est possible de chevaucher plus de deux aires et que le chevauchement est compatible
avec la distribution de la force de travail dnie en 5.29 et 5.17
5.2 Modle agrg
Nous prsentons dans cette section un modle pour les ux de marchandises pas-
sant quai un niveau plus macroscopique. Typiquement le pas de temps minimum dun
modle temps discret dduit de ce modle agrg sera de lordre de 4t
min
1h.
En consquence, ce modle ncessite moins de variables, moins de dtails dans les
donnes et savre plus facile utiliser. Son principal dfaut est que ce modle nest pas
208
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
aussi prcis que celui dvelopp entre les quations 5.1 et 5.28, en particulier il regroupe
les positions pour en perdre le dtail.
Commenons par dnir la fonction
In
(t) qui donne pour une date t, le ux de la masse
de marchandises de laire dentre.
Out
(t) est le ux de la masse de marchandises qui
sort de laire de sorties la date t. La masse de marchandises prsentes sur une aire A
est :
S
A
(t) =
pPos
S
A,(p)
(t) pour A{In, Ulo, Res, Loa, Out}.
(5.31)
La somme prend en compte les positions p Pos dont la date de passage quai est
comprise entre T
In
(p) et T
Out
(p) : T
In
(p) t T
Out
(p).
Nous dduisons des quations 5.1 5.28 le modle agrg . Les quations 5.12,
5.18, 5.19 et 5.20 utilisent la quantit :
1
A
m(p)
N
p
(p, t)
pour A{In, Ulo, Res, Loa, Out}. (5.32)
Celle-ci peut tre moyenne partir dun historique dobservations an dobtenir les co-
efcients moyens suivants :
A
pour A{In, Ulo, Res, Loa, Out}. (5.33)
Nous dnissons ensuite la fonction de transfert
In
(t). Elle reprsente le ux de masse
de marchandises qui passent de laire dentre vers laire de dchargement la date t.
In
(t) =
In
(S
Ulo
(t), n
In
(t))(S
In
(t)), (5.34)
avec
In
dni par
In
(S
Ulo
, n
In
) =
In
n
In
(S
Ulo
max
S
Ulo
). (5.35)
De la mme faon nous dnissons
Ulo
(t) =
Ulo
(S
Res
(t), n
Ulo
(t))(S
Ulo
(t)), (5.36)
Loa
(t) =
Loa
(S
Out
(t), n
Loa
(t))(S
Loa
(t)), (5.37)
avec
Ulo
(S
Res
, n
Ulo
) =
Ulo
n
Ulo
(S
Res
max
S
Res
), (5.38)
Loa
(S
Out
, n
Loa
) =
Loa
n
Loa
(S
Out
max
S
Out
). (5.39)
Nous avons vu que la marchandise pouvait tre stocke un certain temps (plus de 24h)
sur laire de rsidence. Cest pourquoi la fonction S
Res
Rem
donne, tout moment, la masse
de marchandises qui reste sur laire de rsidence. Ainsi
Res
(S
Loa
, n
Res
) =
Res
n
Res
(S
Loa
max
S
Loa
), (5.40)
209
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
et
Res
(t) est dnie par
Res
(t) =
Res
(S
Loa
(t), n
Res
(t))(S
Res
(t) S
Res
Rem
(t)). (5.41)
Le systme dquations diffrentielles constituant le modle agrg scrit :
dS
In
dt
=
In
In
, (5.42)
dS
Ulo
dt
=
In
Ulo
, (5.43)
dS
Res
dt
=
Ulo
Res
, (5.44)
dS
Loa
dt
=
Res
Loa
, (5.45)
dS
Out
dt
=
Loa
Out
. (5.46)
Le modle 5.31-5.42 est construit pour fonctionner sur des quais de grande taille.
Cependant pour des quais plus petits ou dans lesquels le personnel nest pas affect
une aire donne, il est possible de dvelopper une procdure de recouvrement daires
ou dheures productives adaptes.
5.3 Modle de lorganisation des quais en rseau
Dans lintention de construire un modle du rseau de transport, nous avons mont
des connexions entre le modle dcrit par les formules 5.1-5.28 et le modle dve-
lopp par les formules 5.31-5.42. Suite cela, considrons un rseau form de n quais,
{h
1
, . . . , h
n
} = H. Parmi ces quais, certains appartiennent au transporteur TFE, ils forment
le sous ensemble H
mod
, et dautres sont la proprit des confres, ils forment le sous
ensemble H
unm
. Ainsi H
mod
_
H
unm
= , H
mod
_
H
unm
= H. Nous connaissons le fonc-
tionnement des quais appartenant H
mod
et nous lavons modlis, par contre nous de
savons rien des autres quais. Nous posons aussi K
i, j
comme lensemble de voyages
possibles entre un quai ni et un quai n j. Notons que sil nexiste pas de voyage entre
ni et n j alors K
i, j
= . Dans le cas contraire, il semble raisonnable dcrire
K
i, j
= {k
1
i, j
, k
2
i, j
, . . . , k
l
i, j
, . . . , k
L
i, j
i, j
}, (5.47)
k
l
i, j
est le voyage nomm l entre le quai ni et le quai n j. Les voyages k
l
i, j
durent un
temps T
l
i, j
. Cest le temps ncessaire effectuer le voyage. L
i, j
est le nombre de voyages
possibles entre le quai ni et le quai n j.
210
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
La masse de marchandises rattaches la position p, et en transfert dans laire dentre
du quai i, est dcrite par la fonction
In,(p)
i
(voir formule 5.1). Dans loptique de dcrire
la provenance de cette marchandise, nous introduisons R
,(p)
i
(t). R
,(p)
i
(t) est la masse
de marchandises rattaches la position p, qui entre dans laire dentre du quai ni
suite une ramasse chez lexpditeur . De la mme faon, B
,(p)
i
(t) est la masse de
marchandises rattaches la position p directement amene par lexpditeur dans
laire dentre du quai ni. Enn F
j,(p)
i
(t) est la masse de marchandises rattaches la
position p, en provenance du quai n j et qui entre dans laire dentre du quai ni. Ainsi,
In,(p)
i
(t) =
i
R
,(p)
i
(t) +
i
B
,(p)
i
(t) +
n
j=1
F
j,(p)
i
(t), (5.48)
i
est lensemble des expditeurs clients de lagence de transport n i. En sortie de
quai, nous introduisons les quantits suivantes : D
,(p)
i
(t) est la masse de marchandises
attaches la position p, qui quitte le quai ni pour tre livre chez le destinataire .
P
,(p)
i
(t) est la masse de marchandises attaches la position p, qui est prise par le
destinataire , au quai ni. E
j,(p)
i
(t) est la masse de marchandises attaches la position
p, qui quitte le quai ni, pour tre dcharge au quai n j. Ainsi,
Out,(p)
i
(t) =
A
i
D
,(p)
i
(t) +
A
i
P
,(p)
i
(t) +
n
j=1
E
j,(p)
i
(t). (5.49)
A
i
est lensemble des confrres travaillant avec lagence du quai ni.
Remarquons que les marchandises qui quittent le quai ni pour le quai n j, une date
t, sont les mmes marchandises qui arrivent au quai n j, en provenance du quai ni,
une date t + T
l
i, j
. Ainsi nous connectons le modle 5.1-5.28 du quai ni avec celui du
quai n j.
F
j,(p)
i
(t) =
L
i, j
l=1
a(k
l
i, j,p
)E
i,(p)
j
(t T
l
i, j
) (5.50)
a(k
l
i, j, p
) est la proportion de la masse de marchandises attaches la position p, trans-
porte dans le voyage k
l
i, j
, allant du quai ni vers le quai n j. En particulier,
L
i, j
l=1
a(k
l
i, j,p
) = 1 pour tout p Pos. (5.51)
Pour connecter les diffrentes instances des modles 5.31-5.42 indexes par i = 1, . . . , n
nous procdons de la manire suivante :
R
i
(t) =
pPos
R
,(p)
i
(t) , D
i
(t) =
pPos
D
,(p)
i
(t),
B
i
(t) =
pPos
B
,(p)
i
(t) , P
i
(t) =
pPos
P
,(p)
i
(t),
F
j
i
(t) =
pPos
F
j,(p)
i
(t) , E
j
i
(t) =
pPos
E
j,(p)
i
(t),
(5.52)
211
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
et
In
i
(t) =
i
R
i
(t) +
i
B
i
(t) +
n
j=1
F
j
i
(t),
Out
i
(t) =
A
i
D
i
(t) +
A
i
P
i
(t) +
n
j=1
E
j
i
(t),
(5.53)
et
F
j
i
(t) =
L
i, j
l=1
a(k
l
i, j
)E
i
j
(t T
l
i, j
), (5.54)
avec a(k
l
i, j
), qui satisfait
L
i, j
l=1
a(k
l
i, j
) = 1, (5.55)
est la proportion de masse de marchandises entre le quai ni et n j, qui prend le voyage
k
l
i, j
. a peut-tre dduit aprs observation du terrain ou dun ensemble denregistrements
dans la base de donnes.
Il est galement possible de moyenner les formules 5.50 et 5.54
_
t
t
F
j,(p)
i
(s)ds =
L
i, j
l=1
a(k
l
i, j
)
_
tT
l
i, j
+t
tT
l
i, j
E
i,(p)
j
(s)ds,
_
t
t
F
j
i
(s)ds =
L
i, j
l=1
a(k
l
i, j
)
_
tT
l
i, j
+t
tT
l
i, j
E
i
j
(s)ds.
(5.56)
5.4 Tests de validation
Cette section tient montrer la faisabilit de lutilisation des modles n et agrg
dans le but doptimiser des aspects de fonctionnement dun quai de messagerie. Le pre-
mier aspect est la dtermination de la quantit de main duvre ncessaire pour faire
face lactivit tout en la rpartissant subtilement dans les diffrentes aires du quai d-
nies dans le modle agrg . Une seconde utilisation est faite pour dterminer la
quantit de main duvre par position, et ceci, en optimisant lindice de priorit (p, t) de
lquation 5.14. Le troisime exemple dutilisation amne une solution pour xer (p), la
date laquelle la position p sort de laire de rsidence pour laire de sortie.
212
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
5.4.1 Rsultats obtenus par le modle n
Le modle dcrit dans la section 5.1 a t programm dans lenvironnement R.
An de dmontrer les performances du modle, nous simulons lactivit dun quai partir
dun exemple simple. Nous faisons entrer deux positions une heure dintervalle. Elles
restent quai pendant dix heures. Nous voulons observer comment leur masse remplit
les diffrentes zones du quai au cours de ces dix heures.
Pour ce faire, le modle dcrit ci-dessus, ncessite de xer des paramtres pour dcrire
les positions, la main duvre disponible sur le quai, et la taille du quai. Quatre mises
en situation vont permettre de comprendre comment se comporte le modle suivant les
paramtres que nous faisons varier. La premire mise en situation positionne les pa-
ramtres comme indiqu dans les tableaux suivants. Deux positions de 5 tonnes et 20
palettes chacune arrivent quai, respectivement 1h et 2h. Elles sont programmes
pour un dpart 11h et 12h. Leurs paramtres pour dterminer lindice de priorit via
la formule 5.14 sont identiques. Les positions peuvent tre dcharges en mme temps.
Les diffrentes aires du quai sont assez grandes pour entreposer la somme des masses
des deux positions. La quantit de main duvre est quitablement rpartie sur chaque
poste. Le temps de transfert dun emballage (palette) dune zone une autre est estim
une minute. Pour estimer le temps de transfert des positions de la zone de rsidence
vers la zone de sortie, nous excutons le modle une premire fois pour visualiser le
temps ncessaire au dchargement. Ce temps est alors affect au paramtre .
N position : p Masse en
tonnes :
m(p)
Nombre de
palettes :
N
p
Positions
devant :
Pub(p)
Date de
dchar-
gement :
T
In
(p)
Date de
dpart :
T
Out
(p)
0R4080329341 5 20 Null 1 10
0R4080328864 5 20 Null 2 11
Table 5.1 Paramtres de position
La gure 5.2 montre le rsultat obtenu par lexcution du modle avec les paramtres
ci-dessus.
Le premier graphique de la gure 5.2 montre lvolution de la somme des masses des
marchandises contenues dans les deux positions, sur chacune des aires. Il montre ga-
lement lvolution de la masse totale entrepose dans le quai.
Le deuxime et troisime graphique de la gure 5.2, montrent lvolution de la masse
dans chacune des aires, pour chacune des positions.
La courbe In reprsente lvolution de la masse de marchandises prsentes dans
213
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Temps de transfert de la
position p entre la zone
de rsidence et la zone
de sortie :
Paramtre 1 de
lindice de prio-
rit :
1
Paramtre 2 de
lindice de prio-
rit :
2
Paramtre 3 de
lindice de prio-
rit :
3
8 1 1 5
8 1 1 5
Table 5.2 Paramtres de position, suite
Poids max en
zone dentre,
en tonnes :
S
In
max
Poids max
en zone de
dchargement,
en tonnes :
S
Ulo
max
Poids max
en zone de
rsidence, en
tonnes : S
Res
max
Poids max
en zone de
chargement,
en tonnes :
S
Loa
max
Poids max en
zone de sor-
tie, en tonnes :
S
Out
max
20 20 20 20 20
Table 5.3 Paramtres de quai
laire dentre. La courbe Ulo reprsente lvolution de la masse de marchandises
contenues dans laire de dchargement. La courbe Res reprsente lvolution de la
masse de marchandises contenues dans laire de rsidence. La courbe Loa repr-
sente lvolution de la masse de marchandises contenues dans laire de chargement.
La courbe Out reprsente lvolution de la masse de marchandises contenues dans
laire de sortie. Alors que les aires de dchargement, de rsidence et de chargement sont
des aires physiquement matrialises sur un quai de messagerie, laire dentre, comme
laire de sortie, reprsentent la somme des aires contenues dans les remorques qui se
mettent quai, pour tre dcharges ou charges. Rappelons quun camion contient les
marchandises dun ensemble de positions. Le camion et sa remorque se placent quai
pour tre dchargs une heure dnie. Aprs avoir t manutentionne et dplace de
laire de dchargement vers laire de rsidence, puis de laire de rsidence vers laire de
chargement, la marchandise dune mme position est charge dans un camion pour un
dpart une heure planie. Cest la date de dpart ou la date laquelle la marchandise
quitte laire de sortie.
La courbe In du premier graphique de la gure 5.2, montre que la date de dbut
de dchargement de la position n0R4080329341 est 1h00. Le deuxime graphique
montre que son dchargement se poursuit jusqu, approximativement, 7h30. Ce mme
graphique montre galement quil y a un ralentissement du transfert de la masse de la
position n0R4080329341 de laire dentre vers laire de dchargement. Cest simple-
ment la consquence de lentre de la deuxime position sur le quai. Lvolution de la
rpartition de la masse sur le quai de la deuxime position (n0R4080328864) est vue
214
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Temps pour
transfrer un
emballage de la
zone dentre
vers la zone de
dchargement
en fractions
dheures :
In
Temps pour
transfrer un em-
ballage de la zone
de dchargement,
vers la zone de
rsidence en frac-
tions dheures :
Ulo
Temps pour
transfrer un
emballage de la
zone de rsidence
vers la zone
de chargement,
en fractions
dheures :
Res
Temps pour
transfrer un em-
ballage de la zone
de chargement
vers la zone de
sortie en fractions
dheures :
Loa
1/60 1/60 1/60 1/60
Table 5.4 Paramtres dquipe de quai
Main duvre
disponible pour
le dchargement :
n
In
Main duvre
disponible pour
le transfert
vers la zone de
rsidence : n
Ulo
Main duvre
disponible pour
le transfert
vers la zone de
chargement : n
Res
Main duvre
disponible pour
le chargement :
n
Loa
0, 1 0, 1 0, 1 0, 1
Table 5.5 Paramtres dquipe de quai, suite
sur le troisime graphique de la gure 5.2. La deuxime position se prsente pour d-
chargement 2h et quitte laire de sortie 11h00.
Rappelons que la main duvre disponible pour le dchargement est quivalente la
main duvre disponible pour le transfert des marchandises de laire de dchargement
vers laire de rsidence. Ainsi, aussitt que la marchandise est dcharge, elle est trans-
fre en zone de rsidence. Cest pourquoi, comme le montrent les trois graphiques de
la gure 5.2, la zone de dchargement naccumule pas de stock. Pendant que laire den-
tre se vide, les aires de rsidence et de sortie se remplissent (voir courbe Res et
Out ). La zone de sortie se remplit partir de 02h00, car nous avons x le paramtre
8 heures. La zone de chargement ne se remplit pas. La raison de cela est que les
marchandises sorties de la zone de rsidence sont transfres immdiatement dans la
zone de sortie. La position n0R4080329341 part, comme convenu, 10h00 et la position
n0R4080328864 part 11h00. Pendant que les marchandises passent en zone de sor-
tie, les zones dentre et de rsidence se vident. La courbe Tot permet de visualiser
la masse de marchandises prsentes chaque instant sur le quai.
La deuxime mise en situation reprend les mmes paramtres que la prcdente ceci
prs quelle rduit la main duvre disponible pour le transfert des marchandises de laire
de dchargement vers laire de rsidence. Cette main duvre passe de 0, 1 0, 08. La
215
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
t
min
1/4
Table 5.6 Paramtres du modle
Figure 5.3 illustre le rsultat obtenu.
Comme prcdemment, la courbe In afche deux pics correspondant larrive des
positions dans laire dentre. La chute de la courbe entre 1h00 et 2h00 et ensuite entre
2h00 et 7h00 correspond au temps de dchargement des camions. Lquipe pour trans-
frer la marchandise dcharge entre laire de dchargement et laire de rsidence tant
moins grande que lquipe de dchargement, les marchandises saccumulent progressi-
vement sur laire de dchargement (voir courbe Ulo ). Cest aussi pourquoi laire de
rsidence se charge moins que dans la situation prcdente. Remarquons galement
que la courbe Res dcline partir de 3h00. Cest d au fait que la marchandise trans-
fre dans laire de rsidence est aussitt transfre dans laire de chargement pour
tre dplace dans laire de sortie. La courbe Out possde une rupture de pente
3h00. Cest lheure laquelle la deuxime position commence tre charge dans les
camions. La courbe Out atteint le palier de 10 tonnes 9h00. Cest le signe que les
marchandises des deux positions sont charges et prtes quitter laire de sortie. A
10h00 la courbe Out connat sa premire chute, pour indiquer le dpart de la position
n0R4080329341. Aprs quoi, pendant 1 heure, la courbe stagne 5 tonnes et chute
11h00 pour atteindre 0 tonne. La position n0R4080328864 est partie.
De la mme faon, lorsque nous diminuons la main duvre disponible pour charger la
marchandise (voir le paramtre n
Loa
), un stock se forme sur laire de chargement et ainsi
la courbe Loa devient positive.
Une troisime mise en situation xe les paramtres tels que nous lavons fait pour la
premire simulation, considre que laire de rsidence nest pas assez grande pour ac-
cueillir plus dune tonne de marchandises (S
Res
max
= 1). Le rsultat illustr par la gure 5.4,
indique que cette contrainte a pour effet de stocker le surplus de marchandises dans
laire de dchargement. La gure 5.4 montre parfaitement que laire de rsidence (voir
courbe Res ) commence se remplir 1h00, avec larrive de la premire position.
A 1h30, elle atteint sa capacit maximum xe une tonne. Au mme moment, laire de
dchargement commence stocker de la marchandise. La rupture de pente de la courbe
Ulo 2h00 indique que la marchandise provient de la premire et deuxime position.
Comme attendu, laire de dchargement se vide avant laire de rsidence.
La dernire mise en situation, considre que 6h30 pour dcharger deux positions de 5
tonnes cest long. 6h30 cest le temps pendant lequel la courbe In reste positive, cest-
-dire entre 1h00 et 7h30. La premire ide qui vient lesprit pour diminuer le temps de
216
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
dchargement est daugmenter la main duvre ddie au dchargement. Nous xons
tous les paramtres tels quils taient dans la premire mise en situation et nous passons
la valeur du paramtre n
In
de 0, 1 0, 5.
La courbe In de la gure 5.5 indique que les positions ont t dcharges bien plus ra-
pidement que dans la premire mise en situation. Elles ont, toutes deux, t dcharges
en moins dune heure. Par contre, nous navons pas augment la main duvre pour
transfrer les marchandises de laire de dchargement vers laire de rsidence. Cest
pourquoi nous constatons que la courbe Ulo prend de lampleur, cest--dire que les
marchandises rsident plus longtemps sur laire de dchargement. Encore une fois, laire
de dchargement se vide bien avant laire de rsidence, ce qui indique que les marchan-
dises sont constamment en mouvement. Dautre part, la somme des masses sur le quai
est de 5 tonnes entre 1h00 et 2h00, et entre 10h00 et 11h00. Elle est de 10 tonnes entre
2h00 et 10h00. Cette courbe est un indicateur de la validit du modle.
Ces 4 mises en situation montrent que, sur ces cas simples, le modle se comporte
conformment un quai de messagerie. Elles montrent galement que le modle, tel
quil a t programm, permet de simuler beaucoup de mises en situation. Le modle
indique, par des valeurs aberrantes (ngative par exemple) quune mise en situation sou-
haite peut ne pas tre ralisable. Par exemple, la gure 5.6 montre le rsultat lorsque
nous reprenons la premire mise en situation et que nous voulons faire sortir la premire
position 6h00. Le modle nous indique, par la prsence de valeurs ngatives sur laire
de sortie, que cet objectif nest pas ralisable avec les moyens mis en uvre. Il faudrait
pour cela augmenter la capacit de main duvre ddie cette position dans les diff-
rentes aires du quai. Nous pouvons suivre position par position, la rpartition des poids
sur le quai, il est alors ais de cibler un dysfonctionnement.
Comme il vient dtre montr, le modle programm sur le logiciel R fonctionne. Par
contre, R ne permet pas de le faire fonctionner avec un grand nombre de positions. Les
exemples ci-dessus montrent la gestion de deux positions sur le quai. Pour ce faire, notre
portable, quip dun processeur duo de 1, 8 GHz et 2, 5 Go de RAM a ncessit un peu
moins de 5 minutes. Sachant quune agence de transport gre quotidiennement entre
1.000 et 2.000 positions, il faudrait notre ordinateur, certes peu puissant, plus de 3 jours
et demi pour simuler une mise en situation relle. Nous pensons quune solution, pour
augmenter signicativement les performances dexcution, est de programmer le modle
mathmatique sur un langage compil tel que C++. Une autre solution est dagrger le
modle. Les rsultats issus de simulations du modle agrg sont prsents dans la
section suivante (section 5.4.2).
217
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
5.4.2 Rsultats obtenus par le modle agrg
Comme le modle n , le modle agrg a t dvelopp dans lenvironnement
R. Le but nest pas de le programmer pour en faire une application industrielle, mais de
dmontrer la crdibilit du modle mathmatique. Nous cherchons galement montrer
que les temps de rponse du modle agrg sont plus rapides que ceux du modle
n . Pour tmoigner de la ressemblance des rsultats obtenus par les deux modles,
nous excutons le modle agrg , avec des paramtres identiques ceux des mises
en situation exposes ci-dessus (section 5.4.1), et dautres qui sont le rsultat de lagr-
gation des paramtres du modle n . Enn, nous superposons les courbes obtenues
par les deux modles.
Le modle agrg ncessite moins de paramtres que le modle n . Il ne dtaille
pas, position par position, la rpartition des marchandises sur le quai. Pour coller la
premire mise en situation voque dans la section 5.4.1, le modle agrg nces-
site les paramtres suivants.
N position Masse en
tonnes : m(p)
Date de d-
chargement :
T
In
(p)
Date de dpart
T
Out
(p)
Temps de
transfert de
la position p
entre la zone
de rsidence
et la zone de
sortie :
0R4080329341 5 1 10 8
0R4080328864 5 2 11 8
Table 5.7 Paramtres de position
Poids max en
zone dentre,
en tonnes :
S
In
max
Poids max
en zone de
dchargement,
en tonnes :
S
Ulo
max
Poids max
en zone de
rsidence, en
tonnes : S
Res
max
Poids max
en zone de
chargement,
en tonnes :
S
Loa
max
Poids max en
zone de sor-
tie, en tonnes :
S
Out
max
20 20 20 20 20
Table 5.8 Paramtres de quai
La gure 5.7 superpose les rsultats obtenus par les deux modles tudis. Elle permet
218
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Cot humain ho-
raire moyen pour
transfrer une
unit de masse
entre laire den-
tre et laire de
dchargement :
In
Cot humain
horaire moyen
pour transfrer
une unit de
masse entre laire
de dcharge-
ment et laire de
rsidence :
Ulo
Cot humain ho-
raire moyen pour
transfrer une
unit de masse
entre laire de
rsidence et laire
de chargement :
Res
Cot humain
horaire moyen
pour transfrer
une unit de
masse entre laire
de chargement et
laire de sortie :
Out
15 15 15 15
Table 5.9 Paramtres de quai, suite
Main duvre
disponible pour
le dchargement :
n
In
Main duvre
disponible pour
le transfert
vers la zone de
rsidence : n
Ulo
Main duvre
disponible pour
le transfert
vers la zone de
chargement : n
Res
Main duvre
disponible pour
le chargement :
n
Loa
0, 1 0, 1 0, 1 0, 1
Table 5.10 Paramtres dquipe de quai
t
min
1/4
Table 5.11 Paramtres du modle
de constater que les deux modles vident laire dentre la mme vitesse. Le transfert
de la marchandise de laire de dchargement vers laire de rsidence se droule ga-
lement de la mme faon selon les deux modles. Les deux modles commencent le
chargement la mme heure. Par contre, le modle n charge laire de sortie un peu
plus lentement que le modle agrg . Cest pourquoi laire de rsidence se remplit
moins avec le modle agrg . Ce phnomne peut provenir de la fonction n
A,(p)
(t)
5.17 qui nexiste pas pour le modle agrg . Comme prvu, laire de sortie se vide
10h00 puis 11h00. Matriellement, cest lheure de dpart des camions.
Sous les mmes conditions, le temps dexcution de la premire mise en situation avec
le modle n a t de 4 : 47 mn alors que lexcution du modle agrg na
ncessit que 1 : 37 mn, soit trois fois moins de temps.
219
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
5.5 Perspectives
Les tests ci-dessus dmontrent la abilit de lutilisation des modles n et agrg
pour dcrire, comprendre et optimiser les processus industriels. Ils ont aussi mis en vi-
dence les difcults lies cette utilisation. Dun point de vue informatique, si nous sou-
haitons monter en charge, cest--dire, simuler lvolution des masses de marchandises
sur un quai de messagerie, avec plus de 1000 positions et plus de 700 tonnes de mar-
chandises, il faut traduire le modle laide dun langage de programmation compil.
Dautre part, il sest avr que le choix des valeurs donner aux paramtres est dli-
cat. Le modle n demande ce que nous xons 24 paramtres. Le dploiement
industriel dun modle de ce type ncessite une tude prcise pour xer la valeur de ces
paramtres pour chacun des quais du transporteur.
Parmi les perspectives il est intressant de noter comment les questions industrielles
peuvent se poser en termes doptimisation dune quantit lie au modle n ou
agrg . Les sections suivantes montrent comment utiliser les modles n et
agrg dans le but doptimiser des aspects de fonctionnement dun quai de messa-
gerie. Le premier aspect est la dtermination de la quantit de main duvre ncessaire
pour faire face lactivit tout en la rpartissant subtilement dans les diffrentes aires du
quai dnies dans le modle agrg . Une seconde utilisation est faite pour dterminer
la quantit de main duvre par position, et ceci, en optimisant lindice de priorit (p, t)
de lquation 5.14. Le troisime exemple dutilisation amne une solution pour xer le
temps quune position p met pour passer de laire de rsidence laire de sortie.
Avec laide dune expertise terrain, nous pourrions envisager de traduire en termes de
cots le passage quai des marchandises. Il ne sagirait plus doptimiser les ressources
et le temps, mais des cots.
5.5.1 Calcul de la quantit de main duvre
Nous utilisons le modle 5.31-5.42. Les ux dentres et de sorties de quai sont res-
pectivement
In
(t) et
Out
(t). Les ux de marchandises qui transitent entre les diffrentes
aires de quai sont
In
,
Res
et
Loa
. Leurs dnitions sont donnes par les quations 5.34-
5.41. Nous considrons ici que les quantits de force de travail n
In
(t), n
Ulo
(t), n
Res
(t) et
n
Loa
(t) sont inconnues. Nous cherchons les dterminer. Nous savons qu une date t
i
,
les quantits de masses de marchandises S
In
(t
i
), S
Res
(t
i
), S
Loa
(t
i
) et S
Out
(t
i
) sont connues.
Nous cherchons dnir la quantit de main duvre ncessaire,n, n
In
, n
Res
, n
Loa
et n
Out
,
pour traiter lactivit dans lintervalle de temps
_
t
i
, t
f
_
.
220
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Nous savons que,
n
In
(t) + n
Ulo
(t) + n
Res
(t) + n
Loa
(t) = n(t) t
_
t
i
, t
f
_
, (5.57)
et la question ci-dessus, pose en termes doptimisation, revient minimiser
_
t
f
t
i
n(t)ds, (5.58)
sous la contrainte,
dS
Out
dt
=
Loa
Out
0. (5.59)
Dautres contraintes peuvent tre ajoutes. Par exemple pour imposer une stabilit des
quantits de main duvre alloues nous imposons,
dn
A
dt
(t)
n
max
, t
_
t
i
, t
f
_
, (5.60)
o
1
n
A
(t) + 1
dn
A
dt
(t)
n
max
, t
_
t
i
, t
f
_
. (5.61)
Pour une constante n
max
. De plus, nous pouvons imposer n dtre constant sur les
intervalles [t
i
, t
1
], [t
1
, t
2
], . . .,
_
t
k
, t
f
_
.
5.5.2 Allocation de la main duvre chaque position
Nous travaillons ici avec le modle n 5.6-5.11. Pour chacune des positions p qui
passent quai entre une date t
i
et t
f
, nous connaissons la masse S
A,(p)
(t
i
) sur les diff-
rentes aires A {In, Ulo, Res, Loa, Out}. Nous considrons que les quantits n
In
(t), n
Ulo
(t)
et n
Res
(t), n
Loa
(t) sont donnes pour tout t
_
t
i
, t
f
_
. Elles ont, par exemple, t calcules
par la procdure dcrite en 5.5.1. Nous considrons aussi comme connues les quantits
Out,(p)
(t) relatives chaque position p. Celles-ci peuvent tre dtermines par les for-
mules 5.24 ou 5.25. Pour ce qui concerne
In,(p)
(t), la quantit est donne par la formule
5.26, dans laquelle
T(p) est une inconnue dterminer. Les ux de marchandises sur
le quai sont donns par les formules 5.2-5.6,5.12,5.13,5.16-5.18 o (p) = ((p, t)) est
pos et n
A,(p)
est obtenu par 5.13 et 5.17, pour A {In, Ulo, Res, Loa, Out}. (p, t) est une
fonction inconnue dterminer. Enn, la question de lallocation de la main duvre aux
positions consiste chercher
T(p) et (p, t) tel que
p/S
A,(p)
(t)>0
n
A,(p)
(t) n
A
(t) pour A {In, Ulo, Res, Loa, Out}, (5.62)
221
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
(p, t) = 0 pour tout t
_
T
In
(p), T
in
(p) +
T(p)
_
, (5.63)
o
T(p) =
In
Pub(p)
N
p
(p
, T
In
(p))
n
In,(p
)
(t)
, (5.64)
et
dS
Out,(p)
dt
(t) =
Loa,(p)
(t)
Out,(p)
(t) 0 pour tout t
_
t
i
, t
f
_
, (5.65)
minimisent
_
t
f
t
i
p/S
A,(p)
(t)>0
A{In,Ulo,Res,Loa,Out}
dn
A,(p)
dt
(t)
dt. (5.66)
La contrainte 5.62 indique que la somme des quantits de force de travail par position
n
A,(p)
(t) ne peut pas dpasser la quantit de force de travail globale n
A
(t).
T(p) est le
temps ncessaire dcharger les marchandises du camion avant datteindre celles de
la position p. La formule 5.64 dnie le temps
T(p). La formule 5.63 indique que lindice
de priorit de la position p est nul tant que la marchandise nest pas atteignable dans le
camion. La contrainte 5.65 indique que le ux de sorties de quai dune position p, une
date t, ne peut pas dpasser ce qui est charg de cette mme position dans les camions,
la date t.
La formule 5.66 permet de minimiser le temps ncessaire la force de travail pour passer
dune position une autre.
5.5.3 Optimiser le temps (p)
Le dernier problme doptimisation consiste calculer la valeur de (p). Cest la date
laquelle la position p sort de laire de rsidence pour laire de sortie. Nous considrons
que le nombre de palettes N
p
(p, t) de la position p reste constant entre (p) et T
out
(p).
(p) est dni par 5.22 avec un paramtre dpendant de p et x par :
(p) = ((p, t)) = aN
p
(p, T
out
(p)) + b, (5.67)
pour deux constantes a et b. Le problme de minimisation pour dterminer a et b consiste
considrer le modle 5.6-5.10 dans lintervalle de temps
_
t
i
, t
f
_
avec les valeurs connues
S
A,(p)
(t
i
) pour chaque position p passe quai entre t
i
et t
f
et A {In, Res, Loa, Out}. Nous
connaissons galement
In,(p)
et
Out,(p)
pour tout t [t
i
, t
f
]. Les ux internes au quai sont
donns par 5.18-5.20, 5.24-5.27. Les valeurs de a et b doivent minimiser
p/T
In
(p)>t
i
et T
Out
(p)<t
f
| (p)|, (5.68)
222
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
sous les contraintes
a 0, b 0 et (5.69)
dS
Out,(p)
dt
(t) =
Loa,(p)
(t)
Out,(p)
(t) 0 pour tout t
_
t
i
, t
f
_
. (5.70)
223
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Figure 5.2 Rpartition de la masse des marchandises sur les direntes zones du quai, suivie
du dtail pour chaque position
224
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Figure 5.3 Rpartition de la masse des marchandises sur les direntes zones du quai, avec
n
Res
= 0, 08
225
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Figure 5.4 Rpartition de la masse des marchandises sur les direntes zones du quai, avec
S
Res
max
= 1
226
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Figure 5.5 Rpartition de la masse des marchandises sur les direntes zones du quai, avec
n
In
= 0, 5
Figure 5.6 Incohrence dans la rpartition de la masse des marchandises sur les direntes
zones du quai
227
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Figure 5.7 Superposition des rsultats du modle n avec ceux du modle agrg
228
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Conclusion
Rappelons que cette thse a t ralise dans un cadre industriel et en rponse des
besoins prcis. A lorigine, il sagissait de concevoir une solution permettant danticiper
trs court terme le poids, le nombre de positions et lquivalent en palettes au sol, des
marchandises transportes par les agences dun transporteur sous temprature dirige.
Nous avons montr dans le chapitre 1 que malgr des avis divergents, des souhaits dif-
cilement ralisables et des dnitions htrognes, le travail effectu a su synthtiser et
recentrer le besoin des sites de transport du groupe STEF-TFE en information prvision-
nelle. Pour fournir un systme de prvision oprationnel, une documentation approfondie
de lexistant dans le monde industriel et acadmique a t ncessaire. Cest lobjet du
chapitre 2.
Le bilan de lexistant prsent dans le chapitre 3 a t un lment moteur la dnition
prcise des besoins de prvision, la normalisation des indicateurs, la rdaction dun
cahier des charges et llaboration des recommandations.
Au de l du contexte prcis dict par le groupe STEF-TFE, nous nous sommes effor-
cs de gnraliser la mthodologie produite. Cette mthodologie est documente dans
le chapitre 4. Elle est utilisable dans divers secteurs industriels et notamment ceux appar-
tenant la chane logistique. Bien entendu, le modle mathmatique de prvision sera
adapter, mais lanalyse de lenvironnement, les choix dans lorganisation, la gestion de
projet, le dveloppement informatique, lindustrialisation, la formation du personnel et la
communication sont exportables.
La volont dinterconnecter les sites de transport pour amliorer les prvisions a conduit
tudier le fonctionnement des quais de messagerie. La comprhension et la matrise
des ux de marchandises entre le dchargement et le chargement quai, ont conduit
leurs modlisations. Elle a t documente dans le chapitre 5. Notre travail a montr que
cette modlisation permet de simuler le fonctionnement dun quai et de poser certains
problmes industriels en termes de question doptimisation utilisant le modle. La mod-
lisation qui a t faite du quai est indite. Un article est en cours de formalisation pour
tre soumis dans une revue internationale.
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Les perspectives dtude sur le thme de la prvision sont nombreuses. A commen-
cer par prvoir de nouveaux indicateurs, comme cela a dj t fait avec la mthodologie
propose (68). Aprs un an de recueil des donnes qualitatives, lors des ajustements de
prvision (voir 4.4.12), il est envisageable de les utiliser pour amliorer les prvisions.
Rappelons quil sagit dexpliquer quotidiennement le pourquoi des variations dactivit.
En posant lhypothse que ces variations sont rptitives, le systme de prvision pourra
dclencher une alerte et ainsi avertir, par avance, les utilisateurs de leurs apparitions.
Un domaine qui dans cette thse, pour des raisons de prescriptions initiales, na pas
t assez largement investi est la recherche de facteurs explicatifs. Rappelons quil tait
essentiel daboutir un modle mathmatique de prvision commun toutes les agences
de transport. Rappelons aussi que les agences ont une activit qui diffre selon leur po-
sition gographique et cest pourquoi il semblait difcile de trouver des facteurs explicatifs
communs. Cependant, il en existe certainement.
Nous avons mentionn quun point faible du modle est le nombre trop important de
paramtres. Une faon de rduire le nombre de paramtres est destimer la saisonnalit
par une transforme de Fourier et de classier des vnements calendaires en fonction
de leurs effets. Il est galement envisag dutiliser la corrlation qui peut exister entre
les sries temporelles des 70 agences pour amliorer la modlisation. Les corrlations
proviennent du fait que les agences forment un rseau et sexpdient de la marchandise
entre elles.
Par ailleurs, il reste implmenter le modle de lorganisation des quais en rseau (voir
section 5.3). Ce modle permettra dinvestir dans la recherche des interactions entre
agences de transport.
La modlisation des ux de marchandises traversant le quai en quations mathma-
tiques a permis de poser les bases dun sujet de recherche. Cette tude a rvl de
formidables possibilits pour loptimisation de lorganisation dun quai et a donn des
rponses des problmatiques industrielles. Ltude a aussi point les difcults, notam-
ment celle du grand nombre de paramtres matriser. Les algorithmes de rsolution
dquations diffrentielles ordinaires et doptimisation sont gourmands en ressources in-
formatiques. Le nombre important de positions insrer dans le modle ralentit aussi les
traitements dexcution. Nous avons en outre mentionn que le dploiement industriel
dun modle de ce type ncessite une tude prcise pour xer la valeur de ces para-
mtres pour chacun des quais du transporteur.
Ces deux derniers points ne pourront tre abords de manire efcace quen utilisant
une mthodologie de calcul scientique.
230
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Bibliographie
[1] Conception dun quai de chargement. catalogue, Schiltz, 2005.
[2] Comment agir sur la demande? Rapport technique, eco-
nokoi.org, http://www.econokoi.org/IMG/article_PDF/
marketing-comment-agir-sur-la-demande.pdf, 2006.
[3] Bovas. Abraham et Johannes Ledolter : Statistical Methods for Forecasting. Wiley-
Interscience, 1983.
[4] Kenneth B. Ackerman : CPFR - How it could change the warehouse. Warehousing
Forum, 15(10):12, 2000.
[5] J.C. Andraski : Supply chain collaboration. http://www.foodlogistics.com/
collaboration.html, 1999.
[6] G. Ansion : Les mthodes de prvisions en conomie. Armand Colin, 1990.
[7] J.Scott Armstrong : Principles of Forecasting : A Handbook for Researchers and
Practitioners. Springer, 2001.
[8] J.Scott Armstrong et Roderick J. Brodie : Forecasting for Marketing. International
Thompson Business Press, pages 92119, 1999.
[9] J.Scott Armstrong et Fred Collopy : Integration of Statistical Methods and Judgment
for Time Series Forecasting : Principles from Empirical Research. International
Journal of Forecasting, 18:159161, 1998.
[10] Antoine Artous : Massiciation, groupage et ux tendus : les nouvelles lois du
mtier. Lofciel des Transporteurs, 2355 supplment(Avril):29, 2006.
[11] Voluntary Interindustry Commerce Standards Association : Collaborative planning,
forecasting, and replenishment. http://www.cpfr.org, 1998.
[12] Soane Ayadi : Le Supply Chain Management : Vers une optimisation globale des
ux. Working paper, Universit Catholique de Lyon, 2005.
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
[13] M. Barratt et A. Oliveria : Exploring the experience of collaborative planning ini-
tiatives. Intenational Journal of Physical Distribution & Logistics Management,
31:26689, 2001.
[14] Paul Beynon-Davies : Systmes dinformation - Conception et mise en oeuvre. AF-
NOR, 1989.
[15] Craig H. Bishop, Brian J. Etherton et Majumdar Sharanya J. : Adaptive sampling
with the ensemble transform Kalman lter. Part I : Theoretical aspects. Monthly
weather review, 129(3):420436, 2001.
[16] Barry W. Boehm : A spiral model of software development. Computer, 21(5):6172,
1988.
[17] Renato Bortolotti : Analyse du systme de prvision des effectifs dlves dans
lenseignement secondaire postobligatoire. Note dinformation, Service de la re-
cherche en ducation, Genve, 2005.
[18] Rgis. Bourbonnais et Jean Claude Usunier : Prvision des ventes, thorie et pra-
tique. Economica, 2007.
[19] George Box et Gwilym Jenkins : Time series analysis : Forecasting and control. San
Francisco : Holden-Day Inc, 1970.
[20] Franois Branche : Transport de messagerie. Revue technique de lingnieur,
dossier nAG8151 V2, 2006.
[21] J. Peter Brockwell et A. Davis Richard : Introduction to Time Series and Forecas-
ting. Springer, 1996.
[22] S.R. Brubacher et G. Tunnicliffe : Interpolating Time Series with Application to the
Estimation Holiday Effects on Electricity Demand. Applied Statistics, 25(6):107
116, 1976.
[23] S W Burgin, S L Golicic et T M MCarthy : Leveraging Collaborative Forecasting
to Optimize Suplly Chain Performance. Council of Logistics Management, pages
243251, 2000.
[24] B. Burtschy et C. Menendian : A propos de prvision court terme de la production
industrielle. Revue De Statistique Applique, 28(2):524, 1980.
[25] Christoph Heinrich Diedrich Buys-Ballot : Les changements priodiques de tem-
perature. Utrecht, 1847.
232
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
[26] Valentina Carbone : Le rle des prestataires logistiques en europe - Intgration des
chanes et alliances logistiques. Thse, Ecole Nationale des Ponts et Chausses,
2004.
[27] Chris Chatfield : Time-Series Forcasting. Chapman & Hall/CRC, 2000.
[28] Hongmei Chen, Brani Vidakovic et Dimitri Mavris : Multiscale Forecasting Method
using ARMAX Models. Paper, Georgia Institute of Technologie.
[29] Guillaume Chevillon : Analyse conomtrique et comprhension des erreurs de
prvision. Revue de lOFCE, 95:327356, 2005.
[30] Guillaume Chevillon : Economtrie. Document de travail, OFCE & Univ of Oxford,
2005.
[31] Geoffroy Cluzel : Rentabilit dun systme dinformation. Approche thorique. Re-
vue technique de lingnieur, dossier nAG5310, 2006.
[32] CNRS : Conduite de projet - Systmes dinformation. http://www.dsi.cnrs.fr/
conduite-projet/, 2009.
[33] Gilbert Colletaz : Les Critres de slection. Cours, Universit dOrlans, Master
ESA, 2007.
[34] D. Jonathan. Cryer et Kung-Sik Chan : Time Series Analysis with applications in R.
Springer, 2008.
[35] J.J. Daudin, C. Duby, S. Robin et P. Tr ecourt : Analyse de Sries Chronolo-
giques. Cours, INA-PG, Mathmatiques, http://www.agroparistech.fr/IMG/
pdf/Polychro.pdf, 1996.
[36] J.-C. David, M. et Michaud : La prvision : approche empirique dune mthode
statistique. Masson, 1989.
[37] Wilfried Despagne : Etude prliminaire un modle de prvision court terme de
lactivit dun transporteur sous temprature dirige. Modulad, 39:95106, 2008.
[38] Wilfried Despagne : Etude prliminaire un modle de prvision court terme de
lactivit dun transporteur sous temprature dirige. In MAJECSTIC, Session :
Modlisation, Marseille, France, 2008.
[39] Wilfried Despagne : Prvision court terme de lactivit des 57 plates-formes du
transporteur sous temprature dirige TFE. In EGC, Session : Fouille de donnes
temporelles, Sophia Antipolis , France, 2008.
233
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
[40] Wilfried Despagne : Short-term forecast for logistic activities. In Information System
& Data Analysis, Vannes, France, 2008.
[41] Wilfried Despagne : A Forecasting Support System Dedicated to Temperature-
Controlled Goods Hauling. Springer, Computational Statistics, Soumis:, 2009.
[42] Wilfried Despagne : A Forecasting System Developed under R, Dedicated to
Temperature-Controlled Goods Hauling. In useR! Session : Focus Forecasting
in Practice, book of abstracts p 50, Rennes, France, 2009.
[43] Wilfried Despagne : A Forecasting System Developed under R, Dedicated to
Temperature-Controlled Goods Hauling. In DSC 2009, Session 7b, book of abs-
tracts p 30, Copenhague, Danemark, 2009.
[44] Hubert dHondt : ERP et Planication, convictions et retours dexp-
rience. http://www.journaldunet.com/solutions/printer/031106_chro_
dhondt.shtml, 2007.
[45] D. Diehn : Seven steps to build a successful collaborative forecasting process. The
Journal of Business Forecasting Methods & Systems, 19:23,289, 2000/2001.
[46] Danile Dufour, Jean-Guy et Patier : Du transport de marchandises en ville la
logistique urbaine. Revue technique de lingnieur, dossier nAG8210, 2006.
[47] Jean-Marie Dufour : Histoire de lanalyse des sries chronologiques. http://
www.euroestech.net/resources/tsa_history.pdf, 2003.
[48] Daniel Eilstein et al. : Sries temporelles et modles de rgression.
Rapport, Institut de veille sanitaire - Dpartement sant environnement,
http://fulltext.bdsp.ehesp.fr/Invs/Rapports/2005/rapport_series_
temporelles.pdf?8WW88-3X698-WJ944-J94WM-8XXG4, 2005.
[49] Nathalie Fabbe-Costes : Systme dinformation logistique et transport. Revue tech-
nique de lingnieur, dossier nAG8030 V2, 1999.
[50] Laurent Ferrara et Dominique Gueguan : Analyse dintervention et prvisions. Pro-
blmatique et application des donnes RATP. Revue de Statistique Applique,
48(2):5572, 2000.
[51] Robert Fildes, Paul Goodwin et Michael Lawrence : The design feature of forecasting
support systems and their effectiveness. Decision Support Systems, 42:351361,
2006.
[52] Jean-Paul Fitoussi : Dbat sur les prvisions. Revue de lOFCE, 63:8492, 1997.
234
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
[53] Helena Forslund et Patrik Jonsson : The impact of information quality on supply
chain performance. International Journal of Operations & Production Management,
27:90107, 2007.
[54] Jean-Michel Franco et Sandrine Lignerolles : Piloter lentreprise grce au data
warehouse. Eyrolles, 2000.
[55] Placide Fresnais : Mthode daccs et performances. In Ecole Modulad - SFdS,
Port-aux-Rocs, Le Croisic, 1999.
[56] Andr Gac : Logistique intgre : le froid - Action du froid sur les denres pris-
sables. Revue technique de lingnieur, dossier nA9065, 2001.
[57] Bernadette Govaerts : Calcul Statistique sur Ordinateur. http://www.stat.ucl.
ac.be/cours/stat2430/documents/c5reglin.pdf, 2007.
[58] C.W.J. Granger : Forecasting economic time series. Academic Press, 1986.
[59] Amara Graps : An Introduction to Wavelets. IEEE Computational Sciences and
Engineering, 2(2):5061, 1995.
[60] Pierre-Julien Guay : Introduction aux licences de logiciels libres GNU/GPL. Rapport
technique, NTIC.org, http://ntic.org,lePortaildesTIC, 2002. Direction du
soutien aux tablissements du ministre de lEducation du Qubec.
[61] Olaf Helmer et Norman Dalkey : An Experimental Application of the Delphi Method
to the Use of Experts. Management Science, 9(3):458467, 1963.
[62] Franois Hetman : Le langage de la prvision. Futuribles S.E.DE.I.S, 1969.
[63] Charles C. Holt : Forecasting seasonals and trends by exponentially weighted
moving averages. International Journal of Forecasting, 20(1):510, 1957.
[64] Franois-Bernard Huyghe : Web 2.0 : inuence, outils et rseaux. Revue Interna-
tionale dIntelligence Economique, page Srie Publications Numriques, 2009.
[65] F. Ibanez et M. Etienne : Le ltrage des sries chronologiques par lanalyse en
composantes principales de processus. Journal de Recherche Ocanographique,
16:2733, 1992.
[66] J.P. Indjehagopian : Analyse des effets dintervention sur les prvisions issues de
modles ARIMA. Revue De Statistique Applique, 29(4):530, 1981.
[67] R. Ireland et R. Bruce : CPFR : only the beginning of collaboration. Supply Chain
Management Review, pages 808, 2000.
235
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
[68] Maria Jaimes : Dveloppement dun modle de prvisions mensuelles qui anticipe
lactivit des agences de transport de STEF-TFE. Stage, STEF-TFE, 2009.
[69] Franck Jedrzejewski : Introduction aux mthodes numriques. Springer, 2005.
[70] P.G.W. Keen et M.S. Scott Morton : Decision Support Systems : An Organizational
Perspective. Addison Wesley, Reading, OrgPersp, 1978.
[71] Sharon Kozicki et P. A. Tinsley : Vector rational error correction. Working Paper
98-03, Federal Reserve Bank of Kansas City, 1998.
[72] Dominique Ladiray : Economtrie, prvision et analyse des donnes. Revue Mo-
dulad, (35):624, 2006.
[73] L. Lapide : New developments in business forecasting. The Journal of Business
Forecasting Methods & Systems, 18:245, 1999.
[74] Monique Le Guen : La bote moustaches de TUKEY un outil pour initier la
Statistique. SFDS, 4:13, 2001.
[75] Sbastien Lechevalier : Une introduction lconomtrie des sries temporelle. La
revue des sciences conomiques et sociales, (13):4551, 1998.
[76] Matthieu Lemoine et Florian Pelgrin : Introduction aux modles espace-tat et au
ltre de Kalman. Revue de lOFCE, 86:203229, 2003.
[77] Lon-Mu Liu, Siddhartha Bhattacharyya, Stanley L. Sclove et Rong Chen : Data mining
on time series : an illustration using fast-food restaurant franchise data. Computa-
tional Statistics & Data Analysis, 37:455476, 2001.
[78] R. Loutfoullah : Mthodes dextrapolation court terme des chroniques passes.
Revue de Statistique Applique, 11(2):2138, 1963.
[79] Le magazine cetelem de la distribution : Surgel, les spcialistes tirent leur carte
du jeu ! http://www.dyn-com.com/dyncom104/marche.htm, 2006.
[80] Edward J. Marien : Demand Planning and Sales Forecasting : A Supply Chain
Essential. The Supply Chain Management Review, pages 7686, 2001.
[81] S. Markridakis, S.C. Wheelwright et R.J. Hyndman : Forecasting Methods and Appli-
cations, Third Edition. John Wiley & Sons, Inc., 1998.
[82] M. M. Martin : Filtrage de Kalman dune srie saisonnire, Application la prvision
de la consommation dlectricit. Revue De Statistique Applique, 47(4):6986,
1999.
236
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
[83] Terea M. McCarthy et Susan L. Golicic : Implementing collaborative forecasting to
improve supply chain performance. Intenational Journal of Physical Distribution &
Logistics Management, 32:431454, 2002.
[84] John Tom Mentzer et Roger Gomes : Further Extensions of Adaptive Extended
Exponential Smoothing and Comparison with the M-Competition. Journal of the
Academy of Marketing Science, 22:372382, 1994.
[85] John Tom Mentzer et A.M. Moon : Sales Forecasting Management - A demand
management approach. SAGE, 2005.
[86] John Tom Mentzer et Jon Schroeter : Integrating Logistics Forecasting Techniques,
Systems, and Administration : The Multiple Forecasting System. Journal of Busi-
ness Logistics, 15:205225, 1994.
[87] Sverine Meunier Martins : Approche stratgique pour la prvision de donnes
de gestion : Mthode cible intgrant des lments subjectifs et mathmatiques.
Thse, Ecole Polytechnique Fdrale de Lausanne, 2003.
[88] Minist` ere de lEcologie de lEnergie du D eveloppement durable et de lAm enagement du
t erittoire : Arrt du 29 aot 2008 portant agrment dun organisme pour dlivrer
aux oprateurs les attestations de capacit ... Journal ofciel de la rpublique
franaise, texte 2:sur 119, 2008.
[89] Guy M elard : Mthodes de prvisions court Terme. Editions Ellipses, 1990.
[90] Guy M elard : Initiation lanalyse des sries temporelles et la prvision. Modulad,
35:82129, 2006.
[91] A.M. Moon, John Tom Mentzer et E.D Thomas : Customer Demand Planning at
Lucent Technologie. Industrial Marketing Management, 29:1926, 2000.
[92] A Morineau, A-E Sammartino, M Gettler-Summa et C Pardoux : Ananlyse des donnes
et modlisation des sries temporelles. Revue de Statistique Applique, 42(4):61
81, 1994.
[93] Chantal Morley : Gestion dun projet systme dinformation ... InterEditions, 1999.
[94] J. M eraud et A. Tymen : Les variations saisonnires de lactivit conomique. Revue
de Statistique Applique, 42(4):1568, 1960.
[95] Akal Mustafa : Forecasting Turkeys tourism revenues by ARMAX model. Energy
Policy, 25:565580, 2004.
[96] Seetharama L. Narasimhan, Dennis W. McLeavy et Peter Billington : Production
Planning and Inventory Control. Prentice-Hall, 1995.
237
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
[97] OECD : Feature Article : Seasonal Adjustment. Rapport technique, OECD
- Main Economic Indicators, http://www.oecd.org/dataoecd/48/0/2073999.
pdf, 1999.
[98] Laure Pichot : Stratgie de dploiment doutils de pilotage de chaines logistiques :
Apport de la classication. Thse, Institut National des Sciences Appliques de
Lyon, 2006.
[99] J.M. Poggi : Prvision non paramtrique de la consommation lectrique. Revue de
Statistique Applique, 42(4):8398, 1994.
[100] Grard Poumeyrol : La logistique des produits temprature dirige. Revue Gn-
rale du Froid, 81:5960, 1991.
[101] Ricco Rakotomalala : TANAGRA : un logiciel gratuit pour lenseignement et la re-
cherche. in Actes de EGC2005, RNTI-E-3, 2:697702, 2005.
[102] S. Resse : The human aspects of collaborative forecasting. The Journal of Business
Forecasting Methods & Systems, 19:39, 2000/2001.
[103] S.P. Schnaars : An evaluation of rules for selecting an extrapolation model on yearly
sales forecasts. Interfaces, 16:1001007, 2006.
[104] Nicholas Seiersen : Systmes dinformation en logistique. Revue technique de
lingnieur, dossier nA9050, 1998.
[105] Nicholas Seiersen : Systmes dinformation logistique. Revue technique de ling-
nieur, dossier nAG5300, 2006.
[106] SETRA/CSTR : Pourquoi faut-il dsaisonnaliser ? Note dinformation, Ministre
de lEcologie, de lEnergie, du Dveloppement Durable et de lAmnagement du
Territoire, 2001.
[107] J. Sm aros : Collaborative forecasting : a selection of practical approaches. Interna-
tional Journal of Logistics, 6:245258, 2003.
[108] Valentina Stan : Une tude comparative de logiciels de prvision automatique de
sries chronologiques. Modulad, 33:108128, 2005.
[109] Tarkan Tan : Using Imperfect Advance Demand Information in Forecasting. Journal
of Management Mathematics, 19:163173, 2007.
[110] Gerard J. Tellis : The Price Elasticity of Selective Demand. Journal of Marketing
Research, 25(4):331341, 1988.
238
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
[111] Charlotte Terrolle : Evolution des rapports entre industriels et grande distribution :
du partenariat la satisfaction clients, vers lmergence de nouvelles stratgies
dachat. Mmoire de n dtudes, Universit Paris I Panthon-Sorbonne, 2004.
[112] J. Jordan Thomas et R. Savioz Marcel : Faut-il combiner les prvisions de modles
VAR? Bulletin trimestriel, Banque Nationale Suisse, Zurich, 2003.
[113] Thomas Thron, Gabor Naghy et Niaz Wassan : Evaluating alternative supply chain
structures for perishable products. The international journal of logistics Manage-
ment, 18:364384, 2007.
[114] Stphane Tuff ery : Data mining et statistique dcisionnelle : lintelligence des don-
nes. Technip, Paris, 2007.
[115] Michel Vat e : Statistique Chronologique et Prvisions. Economica, 1993.
[116] M. C. Viano et A. Philippe : Cours de Sries Temporelles. Cours, Universit des
Sciences et Technologies de Lille, 2004.
[117] S Volkan et A. Serta c : ARIMA forecasting of primary energy demand by fuel in
Turkey. Energy Policy, 35:17011708, 2007.
[118] William Wu-Shyong Wei : Time series analysis : univariate and multivariate me-
thods. Addison-Wesley publ, 1994.
[119] Handik Widiarta, S. Viswanathan et Rajesh Piplani : Forecasting aggregate demand :
Ananalytical evaluation of top-down versus bottom-up forecasting in a production
planning framework. International Journal of Production Economics, 118:8794,
2009.
[120] Wikip edia : Ftes et jours fris en France. http://fr.wikipedia.org/wiki/F%
C3%AAtes_et_jours_f%C3%A9ri%C3%A9s_en_France, 2009.
[121] N. Wilson : Game plan for a successful collaborative forecasting process. The
Journal of Business Forecasting Methods & Systems, 20:36, 2001.
[122] P. R. Winters : Forecasting sales by exponentially weighted moving averages.
Management Science, 6:324342, 1960.
[123] Xiande Zhao, Jinxing Xie et Janny Leung : The impact of forecasting model selec-
tion on the value of information sharing in a supply chain. European Journal of
Operational Research, 142:321344, 2002.
[124] Eric Zivot, Jiahui Wang et Siem Jan Koopman : State Space Modeling in Macroe-
conomics and Finance Using SsfPack for S+FinMetrics. Paper, University of Wa-
shington, http://faculty.washington.edu/ezivot/statespacesurvey.pdf,
2003.
239
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
Glossaire
agence Centre TFE regroupant des activits commerciales et logistiques (transport et/ou
prestation) servant de plate-forme de transit, de ramasse et de livraison pour la
marchandise.. 2, 12, 19, 20, 22, 2630, 3537, 41, 42, 44, 63, 66, 69, 71, 97, 125,
211
bordereau Groupe de positions regroupes linitiative du transporteur. Nous distin-
guons plusieurs types de bordereaux : de groupage, de ramasses, de livraison,
etc... (cf. dnitions).. 101, 103, 106
exploitation Dune faon gnrale, les diffrents services dexploitation ont en charge
lorganisation des transports. Ces diffrentes exploitations sont identies au 2
me
niveau de la structure de lapplication GTI dune agence par une codication issue
dune table.. 32, 103, 194
expditeur Tiers qui expdie la marchandise un destinataire. Cest souvent galement
le donneur dordre et le lieu de chargement.. 8, 21, 23, 29, 32, 35, 37, 100102,
106, 193, 211
expdition Remise dune marchandise par un expditeur un transporteur pour ache-
minement jusquau destinataire mentionn sur la lettre de voiture, quelque soit le
mode utilis (direct ou messagerie). Attention : ce terme ne sapplique pas au
transporteur. Celui-ci ne fait pas de lexpdition mais de la r-expdition de mar-
chandises quil a enleves ou qui lui sont cones.. 6, 8, 20, 22, 2729, 32, 33,
3537, 42, 68, 96, 107, 110, 126
groupage Regroupement de marchandises destines plusieurs clients et remis une
mme agence de dgroupage.. 2, 8, 17, 106
lettre de voiture Document daccompagnement de la marchandise matrialisant le contrat
de transport (rcpiss, CMR, ...). 25, 28, 100, 106
livraison Transport et mise disposition de la marchandise auprs du destinataire (re-
connu sur la lettre de voiture) sur le lieu de dchargement (destinataire, interm-
diaire, plate-forme, ...).. 7, 8, 12, 17, 22, 25, 27, 29, 42, 96, 126, 205
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
lot complet Terme usuel qui dsigne le transport dun lot en direct depuis le lieu de char-
gement jusquau lieu de dchargement et justiant lusage dun vhicule exclusif..
2, 8
messagerie Ensemble des oprations (ramasse, passage quai, traction, passage
quai, livraison) permettant lacheminement des marchandises travers le rseau
de plates-formes.. 2, 12, 17, 19, 96, 106
ordre de transport Demande de transport effectue par un donneur dordre. Synonyme :
position.. 36
position Traduction informatique de lenvoi dun expditeur un destinataire (expditeur,
nombre de colis, poids, destinataire, localit du destinataire).. 25, 28, 30, 32, 33,
101, 126, 200, 201, 212, 214
quai Partie dune plate-forme ou dun entrept, ou dune usine, servant dcharger,
trier et recharger la marchandise. Quai est souvent utilis dans le sens de plate-
forme.. 8, 9, 22, 23, 28, 33, 44, 46, 68, 101, 125, 127, 128, 134, 138, 142, 159, 164,
165, 184186, 190, 194, 196, 198, 199, 201, 208, 210
ramasse Opration de transport consistant prendre en charge la marchandise chez un
expditeur pour lacheminer jusquau quai de lagence. Nous considrons pour une
ramasse la quantit globale de marchandises prendre en charge, et non le dtail
de chaque position constituant la ramasse. Une ramasses gnre automatique-
ment, ds son affectation un voyage, un point darrt de type Chargement et
un point darrt de type Dchargement lagence.. 6, 8, 12, 20, 24, 25, 2729,
32, 33, 42, 96
rgulire Une srie temporelle est dite rgulire temps discret lorsque les valeurs sont
observes suivant un pas de temps rgulier.. 135, 181, 182
segment Partie de parcours dune position sur un voyage entre 1 point de chargement et
un point de dchargement. Il existe 3 types de segment : - segment LD (livraison di-
recte) = parcours depuis le lieu de chargement jusquau lieu de dchargement nal,
- segment EN (enlvement) = parcours depuis le lieu de chargement jusquau lieu
de passage quai, - segment LI (Livraison) = parcours depuis le lieu de passage
quai jusquau lieu de dchargement nal.. 33, 35, 68
srie temporelle Une srie temporelle ou encore chronique (TS : time series en anglais)
est une suite dobservations ordonnes dans le temps.. 79, 82, 83, 108, 134
tourne Sous-ensemble des points livrer ou ramasser (habituellement par le mme
voyage) - distinguer du voyage qui peut regrouper plusieurs tournes.. 20, 25, 27,
30, 32, 33, 36, 104, 126
241
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0
voyage Le voyage est le parcours de la marchandise entre au minimum 2 points dar-
rts. Il peut galement tre constitu dune succession de point darrt. Un voyage
dExpdition comprend souvent un aller et un retour. Un voyage de Distribution (ou
mixte Distribution/Ramasses) comprend souvent une boucle depuis le quai de
lagence jusquau retour au quai de lagence. Un voyage dAffrtement comprend
souvent un aller simple (ou retour simple). Le voyage est distinguer de la Mission
du chauffeur. Le voyage peut comprendre une ou plusieurs tournes.. 22, 100, 101,
104, 106, 211, 212
242
t
e
l
-
0
0
4
8
7
3
2
7
,
v
e
r
s
i
o
n
1
-
2
8
M
a
y
2
0
1
0