Donat

Modlisation de la abilit
et de la maintenance
par modles graphiques probabilistes
Application la prvention des ruptures de rails
THSE DE DOCTORAT
Prsente et soutenue publiquement le 30 novembre 2009
pour lobtention du grade de
Docteur de lInstitut National des Sciences Appliques de Rouen
(spcialit informatique)
par
Roland DONAT
Jury :
Alexandre Aussem Professeur des Universits, UCBL Lyon 1 (Rapporteur)
Christophe Berenguer Professeur des Universits, UTT (Rapporteur)
Gilles Celeux Directeur de Recherche, INRIA
Sandrine Bondeux Responsable de Recherche, RATP
Laurent Bouillaut Charg de Recherche, INRETS
Philippe Leray Professeur des Universits, Polytech Nantes (Directeur de thse)
Patrice Aknin Directeur de Recherche, INRETS (Directeur de thse)
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
2
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Remerciements
Je tiens tout dabord exprimer ma profonde gratitude M. Patrice Aknin, Directeur
de Recherche INRETS, qui a su me faire conance et me laisser la libert ncessaire
laccomplissement de mes travaux, tout en y gardant un il critique et avis. Nos changes
continuels et son aide prcieuse au quotidien furent, sans nul doute, autant de cls essen-
tielles la russite de ce travail.
De mme, je voudrais remercier chaleureusement M. Philippe Leray, Professeur Po-
lytech Nantes, pour toutes les fructueuses discussions que nous avons pues avoir. Je tiens
galement le remercier pour sa ractivit, sa disponibilit, son hospitalit et pour la
conance quil a su me tmoigner.
Mes vifs remerciements vont galement Mme Sandrine Bondeux, Responsable de
Recherche du service SLI, qui a eu la lourde tche dassurer mon encadrement industriel.
Son implication et lintrt quelle a port ce projet ont jou un rle majeur dans son
bon droulement. Je remercie galement ses prdcesseurs Mme Claire Mielnik et M.
Didier Levy qui ont initi ces travaux et qui mont soutenu durant les premiers temps
de la thse. Un bon travail de modlisation statistique sous-entend en gnral des bases de
donnes de qualit. Un grand merci donc M. Jean-Franois Le Bihan, Responsable
Politiques et Mthodes de Maintenance du service SLI, qui sest eorc de faire ressortir
ce quil a de mieux dans les donnes de Retour dEXprience relatif la maintenance des
rails. Merci enn M. Michel Jouve, Responsable du service SLI, de mavoir accueilli
au sein de son quipe.
Merci M. Laurent Bouillaut, Charg de Recherche INRETS, de mavoir toujours
encourag et appuy dans les orientations que je souhaitais donner mon travail.
Je remercie mes rapporteurs M. Christophe Brenguer, Professeur lUTT, et M.
Alexandre Aussem, Professeur lUCBL Lyon I, pour la rapidit avec laquelle ils ont lu
mon manuscrit et lattention quils ont port mon travail. Merci galement M. Gilles
Celeux, Directeur de Recherche INRIA, qui a accept dexaminer mon travail.
Ma gratitude va galement Mme Sophie Mercier, Professeur lUniversit de Pau, M.
Michel Roussignol, Professeur mrite lUniversit Paris-Est, Mme Anne Barros,
Matre de confrences lUTT et M. Antoine Grall, Professeur lUTT pour leurs
invitations au GT abilit et domaines connexes, ainsi que pour leur soutien et lintrt
quils ont port mes travaux.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
4
An de mener bien ces travaux de thse, jai partag mon temps entre le Laboratoire des
Technologies Nouvelles (LTN) de lINRETS et lunit Voie de la RATP. Jai eu la chance
dy trouver deux ambiances chaleureuses dans lesquelles jai eu loccasion de rencontrer de
nombreuses personnalits que je ne suis pas prs doublier.
En eet, jai une pense mue pour lensemble du personnel du LTN qui ma accompagn
tout au long de cette thse. Je pense en particulier mes partenaires des premiers instants
tienne Cme, Frdric Badel et Alexandra Dbiolles, ou encore Latifa Oukhel-
lou, Allou Sam et Mounira Bouarroudj pour le climat convivial quils ont contribu
instaurer. Arriv plus rcemment, je tiens remercier Cyril Hory pour toutes ses cri-
tiques constructives et son excellent cari porc. Merci aux thsards plein davenir Zohra
Cher, Faicel Chamrouki et ma voisine de bureau Ines Ayadi, notamment pour les
sorties running. Merci enn Olivier Franois, mon autre voisin de bureau, et aux ptits
jeunes Rassa Onanena et Nicolas Cheifetz.
Je souhaite sincrement tout thsard CIFRE une intgration en entreprise aussi agrable
que fut la mienne. Cela, je le doit en grande partie mes amis et collgues du service des
plaintes qui mont hberg dans leur bureau. Un grand merci donc Patrick Routier,
guitariste de talent, sportif accompli et nouvelle star du poker ; Thierry Tournadre,
professionnel des mots-croiss dADN, as des nigmes et conteur ferroviaire hors pair ;
Christian Letertre, responsable conciliant, coach de bowling et prsent jeune retrait
panoui. Je remercie galement Philippe Fray-Lacoste et les AJiTs, qui ont fait natre
en moi la passion de la course pied, ainsi que tous les gens que jai connus au cours de
ces trois annes pour leur sympathie et leur soutien.
Bien que je ne puisse crire quils aient directement contribu enrichir ma production
scientique, il mest impossible doublier mes amis du SPJE (Aur, Bangy, Blez, Bobo,
Dups, EFB, Jack, Marco, Rmard, Tichon et Vinz) que je remercie pour tous les mo-
ments highly provocative que nous avons partags. Merci galement mes amis sportifs de
lUSMT basket pour leurs encouragements et Dorothe Delaunay, Anne Corrges
et Claire Faure pour lintrt quelles ont tmoign mes travaux de thse.
Je ne saurais clore ces pages sans remercier mes amis denfance Fabien et Lionel, qui me
soutiennent depuis toujours, et bien sr, ceux sans qui je ne serais rien : mes Parents
en premier lieu, puis ma Sur, mes Nices, mon Neveu, Arlette et Serge qui mont
support, encourag et permis den arriver l o je suis.
Je conclurai en remerciant de tout cur Anne-Ccile, ma jolie statisticienne accroc au
shopping, pour mavoir support au quotidien, malgr mes longs ttes--ttes avec VAIO,
mon sympathique ordinateur portable. Ses encouragements, qui se traduisaient rgulire-
ment sous la forme de concerts karaoks privs, furent sans aucun doute autant de stimu-
lants pour la cration scientique. Merci enn pour le temps pass relire attentivement
mon manuscrit, ses critiques constructives ont contribu redonner un peu de lgret
mes propos qui ont parfois tendance sgarer au milieu de lourdeurs inutiles.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Table des matières
Table des matires 5
Introduction gnrale 9
1 Modles graphiques probabilistes 13
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.2 Potentiel et loi de probabilit conditionnelle . . . . . . . . . . . . . . . . . . 15
1.2.1 Potentiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.2.2 Loi de probabilit conditionnelle . . . . . . . . . . . . . . . . . . . . 20
1.2.3 Notion dutilit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.3 Modles graphiques probabilistes . . . . . . . . . . . . . . . . . . . . . . . . 24
1.3.1 Dnition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.3.2 Factorisation de la loi jointe . . . . . . . . . . . . . . . . . . . . . . . 27
1.3.3 Apprentissage des lois de probabilit conditionnelles . . . . . . . . . 28
1.3.4 Infrence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
1.4 Modles graphiques probabilistes markoviens . . . . . . . . . . . . . . . . . 38
1.4.1 Dnition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
1.4.2 Apprentissage des LPC . . . . . . . . . . . . . . . . . . . . . . . . . 43
1.4.3 Infrence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
1.5 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
2 Modles Graphiques de Dure 51
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
2.2 Description graphique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
2.3 Description probabiliste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
6 TABLE DES MATIRES
2.3.1 Distribution initiale des tats du systme . . . . . . . . . . . . . . . 56
2.3.2 Distribution initiale des temps de sjour . . . . . . . . . . . . . . . . 56
2.3.3 Politique daction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.3.4 Modle de transition des tats du systme . . . . . . . . . . . . . . . 59
2.3.5 Modle de transition du temps de sjour . . . . . . . . . . . . . . . . 62
2.3.6 Remarques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
2.4 Apprentissage des LPC et simulation de trajectoire . . . . . . . . . . . . . . 67
2.4.1 Donnes attendues . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
2.4.2 Estimation du maximum de vraisemblance . . . . . . . . . . . . . . . 68
2.4.3 Simulation de trajectoires . . . . . . . . . . . . . . . . . . . . . . . . 69
2.5 Infrence probabiliste exacte . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
2.5.1 Probabilit dune trajectoire . . . . . . . . . . . . . . . . . . . . . . . 71
2.5.2 Calcul naf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
2.5.3 Calcul ad hoc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
2.6 Application ltude de la abilit . . . . . . . . . . . . . . . . . . . . . . . 77
2.6.1 MGD et mesures de abilit . . . . . . . . . . . . . . . . . . . . . . . 77
2.6.2 Illustration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
2.7 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
3 Modlisation de la maintenance 87
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
3.1.1 Approche gnrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
3.1.2 tat de lart . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
3.1.3 Objectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
3.2 Modle VirMaLab . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
3.2.1 Description qualitative . . . . . . . . . . . . . . . . . . . . . . . . . . 90
3.2.2 Description probabiliste . . . . . . . . . . . . . . . . . . . . . . . . . 92
3.2.3 Caractrisation paramtrique . . . . . . . . . . . . . . . . . . . . . . 97
3.2.4 Complexit spatiale . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
3.3 Calculs dutilit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
3.3.1 Construction dune fonction dutilit . . . . . . . . . . . . . . . . . . 100
3.3.2 valuation dune fonction dutilit . . . . . . . . . . . . . . . . . . . 102
3.3.3 Complexit algorithmique . . . . . . . . . . . . . . . . . . . . . . . . 105
3.3.4 Exemple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
3.4 Politiques de maintenance . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
TABLE DES MATIRES 7
3.4.1 Maintenance corrective . . . . . . . . . . . . . . . . . . . . . . . . . . 116
3.4.2 Maintenance prventive . . . . . . . . . . . . . . . . . . . . . . . . . 117
3.5 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
4 Application la prvention des ruptures de rails 125
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
4.1.1 Contexte de ltude . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
4.1.2 Dfauts de fatigue et ruptures . . . . . . . . . . . . . . . . . . . . . . 127
4.1.3 Droulement de ltude . . . . . . . . . . . . . . . . . . . . . . . . . 128
4.2 Reprsentation de la voie ferre . . . . . . . . . . . . . . . . . . . . . . . . . 128
4.3 Dgradation dun coupon lmentaire . . . . . . . . . . . . . . . . . . . . . . 129
4.3.1 Gnralits . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
4.3.2 Modlisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
4.3.3 Cot associ lindisponibilit de la voie . . . . . . . . . . . . . . . . 136
4.3.4 Apprentissage des lois de temps de sjour . . . . . . . . . . . . . . . 136
4.4 Mthodes de diagnostic . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
4.4.1 Diagnostic ultrasonore . . . . . . . . . . . . . . . . . . . . . . . . . . 141
4.4.2 Diagnostic par signalisation . . . . . . . . . . . . . . . . . . . . . . . 143
4.4.3 Politique de diagnostic . . . . . . . . . . . . . . . . . . . . . . . . . . 144
4.4.4 Cots associs aux diagnostics . . . . . . . . . . . . . . . . . . . . . 145
4.5 Actions de maintenance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
4.5.1 Description qualitative . . . . . . . . . . . . . . . . . . . . . . . . . . 145
4.5.2 Politique daction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
4.5.3 Cots associs aux actions de maintenance . . . . . . . . . . . . . . . 148
4.5.4 Consquences sur le coupon lmentaire . . . . . . . . . . . . . . . . 148
4.6 Outil dvelopp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
4.6.1 Description . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
4.6.2 Rsultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
4.7 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
Conclusions gnrales et perspectives 163
Rfrences 172
Liste des gures 174
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
8 TABLE DES MATIRES
Liste des tableaux 176
A Notations 177
B lments sur la thorie des graphes orients 181
C lments sur la thorie des probabilits 183
C.1 Rappels de probabilits . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183
C.2 Indpendance conditionnelle . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
D Apprentissage partir de donnes incompltes 189
D.1 Problmatique et notations . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
D.2 Mthode EM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
D.3 Applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194
D.3.1 Exemple simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194
D.3.2 Estimation dune loi de dure . . . . . . . . . . . . . . . . . . . . . . 195
E Dmonstrations 197
E.1 Dmonstrations du chapitre 1 . . . . . . . . . . . . . . . . . . . . . . . . . . 197
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Introduction generale
Contexte
Depuis la seconde moiti du XX
e
sicle, les activits lies la sret de fonctionnement
prennent une place de plus en plus essentielle dans lindustrie. Cette tendance est dautant
plus marque que le domaine concern est associ la ralisation dune tche critique. Tout
incident rappelle aux industriels la ncessit de prendre les mesures permettant dassurer
le maintien du systme considr un niveau de fonctionnement satisfaisant et les mesures
en question dnissent ainsi la stratgie (ou politique) de maintenance du systme. Dans le
cas des systmes critiques, les industriels ont longtemps privilgi des stratgies de main-
tenance de type systmatique avec une frquence dinterventions importante, de manire
se prmunir contre toutes dfaillances graves. Dun point de vue conomique, de telles
stratgies entranent des cots dentretien extrmement importants, sans quils soient pour
autant indispensables compte tenu de la ralit technique. En consquence et du fait dune
forte concurrence conjugue des conjonctures conomiques diciles, les industriels ont
t amens aner leur politique de maintenance de faon en rduire les cots tout en
conservant une qualit de service leve.
Ceci explique les nombreuses tudes rcentes tant acadmiques quindustrielles portant sur
la abilit des systmes et loptimisation de leur maintenance. Le concept de maintenance
prvisionnelle a ainsi peu peu vu le jour. Lintrt de cette dmarche est aujourdhui
reconnu par la trs grande majorit des industriels. Toutefois, cette reconnaissance reste
encore bien souvent thorique, du fait des dicults pratiques sous-jacentes lapplication
de cette mthode. Raliser une tude de maintenance prvisionnelle ncessite pralablement
la modlisation du systme considr, ce qui savre dlicat ds que le systme devient com-
plexe. La premire tape consiste exploiter les donnes de Retour dEXprience (REX) et
les connaissances dexperts an destimer les paramtres du modle de dgradation du sys-
tme retenu. Le modle de dgradation est ensuite enrichi en tenant compte des oprations
de maintenance. Ds lors que le systme et sa maintenance sont correctement formaliss,
toute politique peut tre value selon un ou plusieurs critres donns.
Ces travaux de thse ont pour objectif llaboration dun modle de maintenance visant
amliorer la programmation des oprations dentretien de la voie du rseau RATP (Rgie
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Autonome des Transports Parisiens). Cette tude sintresse en particulier la dynamique
dvolution des dfauts de fatigue des rails, ces derniers pouvant entraner des ruptures et
occasionner des perturbations du service voyageur. Cette problmatique se dcompose en
trois tapes :
(i) Modlisation de la dynamique de dgradation des rails.
(ii) Formalisation des oprations de maintenance associes au traitement des dfauts de
fatigue.
(iii) Intgration dun modle conomique an dvaluer une politique de maintenance don-
ne (cots de rparation, de surveillance de la voie, dindisponibilit).
Ces travaux se sont drouls lINRETS et la RATP dans le cadre du projet de recherche
europen UrbanTrack
1
dont lobjectif principal est la conception dune voie ferre urbaine
innovante et sre sur son cycle de vie.
Dmarche
Nous nous sommes orients vers une approche utilisant les Modles Graphiques Probabi-
listes (MGP). Ces derniers reposent sur la thorie des graphes et la thorie des probabilits.
Ils permettent de reprsenter intuitivement et parcimonieusement des systmes dont ltat
volue de manire non dterministe. Une description de ces objets mathmatiques ainsi
que des outils danalyses associs est prsente dans le chapitre 1.
Avant de modliser et dvaluer les performances dune stratgie de maintenance, il est
ncessaire de disposer dun modle de dgradation du systme tudi. Nous introduisons
dans le chapitre 2 un MGP particulier, appel Modle Graphique de Dure (MGD), ayant
pour objectif damliorer la reprsentation dun systme dynamique dans le cadre de ces
outils graphiques (Donat et al. 2007) (Donat et al. 2008) (Donat et al. 2008). Cette approche
vise adapter le concept des modles semi-markoviens au formalisme des MGP. Dans ce
chapitre, nous prsentons en particulier :
les proprits probabilistes des MGD (Donat et al. 2008) ;
un algorithme dinfrence adapt spciquement ce modle ainsi que sa complexit
spatiale et algorithmique (Donat et al. 2010) ;
une comparaison empirique entre MGD et lapproche classique reposant sur lutilisation
de chanes de Markov (Donat et al. 2009) (Bouillaut et al. 2009).
Dans le chapitre 3, nous proposons un modle graphique de maintenance reposant sur la
abilit. Nous supposons tout dabord lexistence dun MGP reprsentant la dgradation
du systme considr, par exemple laide de chanes de Markov ou de MGD. Ensuite, la
politique de surveillance et de maintenance doit tre formalise. Le modle VirMaLab,
initi lINRETS et enrichi pour les besoins de ltude, a t utilis du fait de sa exibilit
et de son caractre gnrique. Celui-ci permet en eet de prendre en compte :
un nombre quelconque dappareils de diagnostic indpendants ayant chacun leurs carac-
tristiques propres ;
1
http://www.urbantrack.eu/ (IP-FP6)
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
la possibilit dactiver priodiquement un ou plusieurs appareils de diagnostic ;
une politique daction de maintenance dpendant des informations issues des diagnostics.
De nombreuses politiques de maintenance peuvent tre reprsentes partir de ce mo-
dle, depuis les politiques de maintenance de type curatif, jusquaux politiques prventives
conditionnelles qui dclenchent une opration de maintenance ds quun certain seuil de
dgradation est dtect laide des outils de diagnostic. Cette approche ore galement
la possibilit dintgrer toute sorte de considrations conomiques sous forme dutilits,
permettant ainsi la comparaison de direntes politiques de maintenance.
Pour nir, nous appliquons notre mthodologie dans le chapitre 4 au cas particulier de
la maintenance de linfrastructure ferroviaire dans le cadre dune tude de prvention des
ruptures de rail sur le rseau Rseau Express Rgional (RER) de la RATP. Une tude va-
luant limpact de direntes politiques de maintenance des rails selon dirents contextes
ferroviaires est prsente. Nous dtaillons en particulier lintrt de lajustement du cycle
dauscultation prventif des rails et de leur priode de renouvellement de la voie de sorte
amliorer lutilit de la politique de maintenance ainsi dnie.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Chapitre 1
Modèles graphiques probabilistes
Sommaire
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.2 Potentiel et loi de probabilite conditionnelle . . . . . . . . . . . 15
1.2.1 Potentiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.2.2 Loi de probabilite conditionnelle . . . . . . . . . . . . . . . . . . 20
1.2.3 Notion dutilite . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.3 Modèles graphiques probabilistes . . . . . . . . . . . . . . . . . . 24
1.3.1 Denition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.3.2 Factorisation de la loi jointe . . . . . . . . . . . . . . . . . . . . . 27
1.3.3 Apprentissage des lois de probabilite conditionnelles . . . . . . . 28
1.3.4 Inference . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
1.4 Modèles graphiques probabilistes markoviens . . . . . . . . . . 38
1.4.1 Denition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
1.4.2 Apprentissage des LPC . . . . . . . . . . . . . . . . . . . . . . . 43
1.4.3 Inference . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
1.5 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
14 Chapitre 1. Modles graphiques probabilistes
1.1 Introduction
Ce chapitre a pour objectif de prsenter le formalisme principal de modlisation utilis au
cours de cette thse, savoir les modles graphiques probabilistes orients. Notons que
dans la littrature, il est courant de faire rfrence ces derniers sous direntes appel-
lations (ex : rseaux probabilistes, rseaux de croyances), la plus connue tant : rseaux
baysiens. Dans le but de faciliter la lecture, nous nous permettons dans ce document de
raccourcir la dnomination "modles graphiques probabilistes orients" en "modles gra-
phiques probabilistes" voire mme en "modles graphiques" lorsque le contexte ne porte
pas confusion, bien que ces trois expressions naient pas le mme degr de gnralit.
En outre, les abrviations MGP pour Modle Graphique Probabiliste et RB pour Rseaux
Baysiens sont utiliss pour dsigner les mmes objets.
Ces objets mathmatiques, dont le formalisme repose sur la thorie des graphes (Gross and
Yellen 2004) et la thorie des probabilits (Rao and Swift 2006), permettent de reprsenter
de faon intuitive et parcimonieuse la distribution jointe de plusieurs variables alatoires.
En eet, la thorie des graphes fournit les outils appropris pour dcrire graphiquement
les relations de dpendance entre les variables. La thorie des probabilits apporte, quant
elle, un formalisme permettant de quantier ces relations en associant chaque variable
une loi de probabilit conditionnelle.
Par ailleurs, de nombreux outils gnriques ont t dvelopps, utilisant comme support
les modles graphiques probabilistes. Par exemple, il est possible de raliser ecacement
des raisonnements probabilistes, lobjectif tant souvent de mettre jour les connaissances
sur certaines variables alors que dautres sont observes. Cette tche porte le nom de
calcul dinfrence probabiliste. Citons par exemple ce sujet les travaux de Pearl (1988),
Lauritzen and Spiegelhalter (1988), Huang and Darwiche (1996) ou plus rcemment Jordan
et al. (1999). Il est galement possible dapprendre les paramtres dun modle graphique
probabiliste (structure graphique du modle et lois de probabilit) partir de donnes
compltes ou incompltes, ou encore partir davis dexperts (Jordan 1999), (Neapolitan
2003). Prcisons enn quun ouvrage en franais, crit par Nam et al. (2007), reprend
lensemble des notions prcdentes.
Ce chapitre se compose de trois parties principales. La partie 1.2 introduit les objets de
base que sont les potentiels et les lois de probabilit conditionnelles dans le cadre des
rseaux baysiens. La partie 1.3 aborde le formalisme des modles graphiques probabilistes
en prsentant quelques proprits fondamentales illustres par un exemple. Des lments
sur lapprentissage des paramtres du modle et sur linfrence probabiliste sont galement
donns. La partie 1.4 sintresse enn lextension markovienne des modles graphiques
probabilistes. Ces modles, adapts la reprsentation des phnomnes dynamiques, sont
au cur des travaux prsents dans le reste de ce document.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
1.2 Potentiel et loi de probabilit conditionnelle 15
1.2 Potentiel et loi de probabilit conditionnelle
Les paragraphes suivants ont pour vocation dintroduire la notion de potentiel, ainsi que
les principales oprations qui lui sont associes (Castillo et al. 1996), (Cowell et al. 1999).
Les potentiels occupent une place essentielle dans le formalisme des rseaux baysiens, en
particulier pour ce qui est des mcanismes dinfrence probabiliste qui sont voqus dans la
partie 1.3.4. Nous nous intressons ensuite aux lois de probabilit conditionnelles, lments
de base de la composante probabiliste des rseaux baysiens.
Les dnitions et les propositions prsentes dans la suite ne dirent pas fondamenta-
lement de ce quil est possible de lire dans la littrature. Nanmoins, certaines notations
sont introduites de manire se placer dans un cadre de travail uni. En particulier, bien
que dirente des prsentations classiques issues de la thorie des probabilit, la notion de
probabilit conditionnelle est aborde ici sous langle des potentiels.
1.2.1 Potentiel
Dnitions et notations
Un potentiel est une application de plusieurs variables valeurs dans un ensemble quel-
conque et muni doprations particulires. Cet objet mathmatique gnralise, entre autre,
la notion de matrice en permettant la reprsentation de tableaux multidimensionnels.
Dnition 1.1 (Potentiel)
Soit X = A
1
, . . . , A
D
une famille ordonne de D ensembles quelconques A
1
, . . . , A
D
. Soit
galement un ensemble supplmentaire E. est un potentiel dni sur le domaine X et
valeurs dans E, not E
X
, si est une application dnie par
:
_
A
1
. . . A
D
E
(x
1
, . . . , x
D
) (x
1
, . . . , x
D
)
.
E
X
dsigne lensemble des potentiels dnis sur le domaine X valeurs dans E.
Notations 1.1 (Vocabulaire et notations sur les potentiels)
Soit un potentiel E
X
, avec X = A
1
, . . . , A
D
. Le vocabulaire et les notations suivantes
sont alors utiliss :
Dom() dsigne le domaine du potentiel , cest--dire ici Dom() = X ;
X
D
d=1
A
d
= A
1
. . .A
D
reprsente le produit cartsien des ensembles appartenant
la famille X ;
tout lment de X
est appel conguration du domaine X ;

une conguration x X
est alors un D-uplet (x

1
, . . . , x
D
) tel que
(x) = (x
1
, . . . , x
D
) E;
notons la distinction entre lensemble A
d
et le domaine A
d
, et remarquons alors que
A
d
= A
d
;
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
si tous les ensembles A
d
X sont discrets (dnombrables) et nis, alors X et sont
qualis respectivement de domaine et potentiel discret et ni ;
les potentiels discrets et nis sont reprsentables sous forme de table (cf. exemple 1.1).
Dans la suite de ce document, nous nous limitons aux potentiels valeurs relles, autrement
dit avec E R. Par consquent, sil ny a pas dambigut, le qualicatif rel est omis.
Voici prsent un exemple illustrant les notions prcdemment introduites.
Exemple 1.1
Soit un potentiel R
{X,Y,Z}
o A = x
1
, x
2
, = y
1
, y
2
and Z = z
1
, z
2
. A,
et Z sont des ensembles discrets et nis, aussi en est il de mme pour . Dautre part,
Dom() = A, , Z et donc Dom()
= A Z est lensemble des congurations de ce

domaine. Dnir revient associer chacune des huit congurations (x, y, z) Dom()
,
un rel (x, y, z). Considrons par exemple les valeurs suivantes :
A Z
x
1
y
1
z
1
0.50
x
2
y
1
z
1
1.00
x
1
y
2
z
1
0.75
x
2
y
2
z
1
2.00
x
1
y
1
z
2
0.00
x
2
y
1
z
2
0.25
x
1
y
2
z
2
3.00
x
2
y
2
z
2
1.00
La table prcdente donne une reprsentation unidimensionnelle du potentiel . Ce dernier
tant dni sur trois dimensions, une reprsentation sous forme de table multidimension-
nelle peut ventuellement tre utilise. Cela donne ici :
(:, :, z
1
) =
_
0.5 0.75
1 2
_
, (:, :, z
2
) =
_
0 3
0.25 1
_
,
o le symbole " :" dsigne tous les lments de la dimension correspondante. noter quen
pratique la premire reprsentation est souvent prfre pour des raisons de lisibilit.
Il est intressant de remarquer dans la dnition 1.1 le caractre ordonn des dimensions
dun potentiel. Dans lexemple 1.1, crire (y
1
, x
1
, z
1
) na pas de sens car, par dnition, la
premire dimension de est associe lensemble A et non . En revenant lexemple, le
domaine A, , Z est identique au domaine , A, Z une permutation prs. On parle
dans ce cas de domaines quivalents. Par consquent, lorsque deux potentiels possdent
le mme domaine et les mmes valeurs une permutation prs de leurs dimensions, ces
derniers sont dits quivalents. La dnition suivante pose formellement la relation dqui-
valence entre potentiels et lexemple 1.2 en donne une illustration.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Dnition 1.2 (quivalence entre deux potentiels)
Soient deux potentiels E
{X
d
}
1dD
et
{X
}
1d
. et
sont dits quivalents,

et nous notons
, si
(i) E = E
;
(ii) A
d
1dD
= A
1d
D
;
(iii) sil existe une permutation de lensemble 1, . . . , D telle que pour tout x
D
d=1
A
d
et tout x
D
d=1
A
(d)
, (x) =
(x
).
Exemple 1.2
Soient
1
,
2
,
3
R
{X,Y}
o A = x
1
, x
2
et = y
1
, y
2
. Ces trois potentiels sont dnis
comme suit :
A
1
x
1
y
1
1
x
2
y
1
2
x
1
y
2
3
x
2
y
2
4
A
2
y
1
x
1
1
y
2
x
1
3
y
1
x
2
2
y
2
x
2
4
A
3
x
1
y
1
1
x
2
y
1
4
x
1
y
2
3
x
2
y
2
2
Les trois potentiels sont dnis sur le mme domaine. Ils sont tous les trois valeurs dans
R et semblent possder les mmes valeurs. En fait daprs la dnition 1.2 en prenant la
permutation = 2, 1, il apparat que
1

2
. En revanche
3
nest pas quivalent aux
deux autres car
1
(x
2
, y
1
) ,=
3
(x
2
, y
1
).
Pour nir sur ces quelques gnralits, il est intressant de dnir les deux potentiels
remarquables suivants :
Dnition 1.3 (Potentiel nul et potentiel unitaire)
Soit un potentiel R
X
. Si pour toute conguration x X
,
(x) = 0, alors est appel potentiel nul sur X et on note = 0
X
;
(x) = 1, alors est appel potentiel unitaire sur X et on note = 1
X
.
Oprations arithmtiques
Nous abordons prsent la manipulation des potentiels. Il sagit de dtailler les opra-
tions lmentaires dont ils sont munis. Nous dbutons naturellement par la dnition de
laddition et celle de la multiplication entre deux potentiels.
Dnition 1.4 (Somme et produit entre potentiels)
Soient deux potentiels
1
R
X
et
2
R
Y
. On pose Z = X Y, X
= X Z et
Y
= Y Z. Alors,
la somme de
1
et
2
est un potentiel (
1
+
2
) R
XY
vriant pour toute conguration
(x
, z, y
) (X
Z Y
,
(
1
+
2
)(x
, z, y
) =
1
(x
, z) +
2
(z, y
);
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
le produit de
1
et
2
est un potentiel (
1

2
) R
XY
vriant pour toute conguration
(x
, z, y
) (X
Z Y
,
(
1

2
)(x
, z, y
) =
1
(x
, z)
2
(z, y
).
Une opration couramment utilise sur les potentiels consiste sommer des valeurs du
potentiel correspondant un sous-domaine donn.
Dnition 1.5 (Sommation/marginalisation)
Soit un potentiel R
X
. Le rsultat de la sommation de sur le domaine W, ou de
manire quivalente, de la marginalisation de sur le domaine X
= X W est un
potentiel, not (
_
W
) R
X
, vriant pour toute conguration x
,
(
_
W
)(x
) =
_
wW
(x
, w).
Si W est un domaine discret (resp. continu), le signe

_
W
dsigne une sommation (resp.
une intgration).
Les oprations prcdentes sont illustres dans lexemple 1.3.
Exemple 1.3
Reprenons le potentiel de lexemple 1.1 et posons galement =
{X}
, le potentiel
rsultant de la marginalisation de sur le domaine , Z. De mme, soit =
{X,Z}
le rsultat de la marginalisation de sur le domaine . Les potentiels et sont alors

donns par :
Z
y
1
z
1
(x
1
, y
1
, z
1
) +(x
2
, y
1
, z
1
) = 1.50
y
2
z
1
(x
1
, y
2
, z
1
) +(x
2
, y
2
, z
1
) = 2.75
y
1
z
2
(x
1
, y
1
, z
2
) +(x
2
, y
1
, z
2
) = 0.25
y
2
z
2
(x
1
, y
2
, z
2
) +(x
2
, y
2
, z
2
) = 2.00

y
1
(x
1
, y
1
, z
1
) +(x
2
, y
1
, z
1
) +(x
1
, y
1
, z
2
) +(x
2
, y
1
, z
2
) = 1.75
y
2
(x
1
, y
2
, z
1
) +(x
2
, y
2
, z
1
) +(x
1
, y
2
, z
2
) +(x
2
, y
2
, z
2
) = 0.75
.
Achevons cet exemple par le produit de et . Daprs la dnition 1.4, le rsultat est un
potentiel dont le domaine est , Z et vriant
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Z
y
1
z
1
(y
1
, z
1
)(y
1
) = 2.6250
y
2
z
1
(y
2
, z
1
)(y
2
) = 2.0625
y
1
z
2
(y
1
, z
2
)(y
1
) = 0.4375
y
2
z
2
(y
2
, z
2
)(y
2
) = 1.5000
.
Potentiels discrets et nis et complexit
Nous abordons prsent les notions de complexit spatiale et de complexit algorithmique
(Garey and Johnson 1979) associes la manipulation de potentiel. La complexit spa-
tiale dun potentiel dsigne la quantit despaces mmoires lmentaires ncessaire pour
reprsenter ce dernier sur une machine. La complexit algorithmique est associe la ma-
nipulation dun ou plusieurs potentiels, et dsigne le nombre doprations lmentaires
permettant de la mener bien.
Notons par ailleurs que lutilisation de structures de donnes particulires telles que les
matrices creuses ou les arbres dcisionnels (Komarek and Moore 2000) permettent dans
certains cas de diminuer les complexits. Toutefois, il est rare quune structure conduise
la fois une rduction de la complexit spatiale et algorithmique. En eet, une co-
nomie spatiale importante est souvent synonyme de structure complexe dans laquelle les
oprations arithmtiques lmentaires sont plus diciles raliser. Par consquent, nous
supposons dans la suite que le stockage des potentiels est ralis par lintermdiaire dune
table multidimensionnelle classique. Chaque conguration du potentiel occupe alors un es-
pace mmoire lmentaire. Prcisons que cette structure de donne basique est disponible
dans la plupart des langages de programmation et bncie en gnral de bonnes perfor-
mances arithmtiques. Dans le cadre discret et ni, nous pouvons noncer les rsultats
suivants :
Dnition 1.6 (Complexit spatiale)
Soit un potentiel discret et ni R
X
. La complexit spatiale du potentiel , note CS(),
est de lordre du nombre de congurations du domaine X. Autrement dit, CS() = O([X
[)
o [ [ dsigne le cardinal dun ensemble discret et ni.
Proposition 1.1 (Complexit algorithmique de la somme et du produit)
Soient deux potentiels discrets et nis
1
R
X
et
2
R
Y
. Posons
R
XY
le potentiel
rsultant de laddition ou de la multiplication de
1
et
2
. La complexit algorithmique
du calcul de
, note CA(
), est de lordre de sa complexit spatiale. Formellement,

CA(
) = CS(
) = O([(X Y)
[).
Proposition 1.2 (Complexit algorithmique de la marginalisation)
Soit un potentiel discret et ni R
X
. Posons
W
le potentiel rsultant de la
marginalisation de sur A
= X W. La complexit algorithmique du calcul de
est de
lordre de la complexit spatiale de . Formellement, CA(
) = CS() = O([X
[).
Les dmonstrations des deux propositions prcdentes sont donnes en annexe E.1. Toutes
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
deux reposent simplement sur le comptage des oprations arithmtiques lmentaires n-
cessaires aux calculs dune somme, dun produit et dune marginalisation dans lespace des
potentiels.
Exemple 1.4
Reprenons les exemples prcdents et valuons la complexit spatiale des potentiels utiliss
ainsi que la complexit algorithmique des oprations ralises.
1. Dans lexemple 1.1, le potentiel est dni sur huit congurations, do CS() = 8
espaces mmoires lmentaires.
2. Dans lexemple 1.2, CS(
1
) = CS(
2
) = CS(
3
) = 4 espaces mmoires lmentaires.
3. Dans lexemple 1.3, la marginalisation de sur , Z ncessite 2 2 (2 1) = 4
additions, do CA() = 4 oprations lmentaires. De la mme manire, CA() =
2 (4 1) = 6 et CA( ) = 2 2 = 4 oprations lmentaires.
1.2.2 Loi de probabilit conditionnelle
La dnition suivante propose une caractrisation des lois de probabilit conditionnelles
partir des potentiels.
Dnition 1.7 (Loi de probabilit conditionnelle)
Soient deux domaines disjoints X et Y et un potentiel p [0, 1]
XY
. On dit que p est
une Loi de Probabilit Conditionnelle (LPC) sur X conditionnellement Y si pour toute
conguration y Y
_
xX
p(y, x) = 1.
Les domaines Y et X sont alors appels respectivement domaine de conditionnement et
domaine normalis. Par ailleurs, il est courant de sparer les variables de conditionnement
des variables normalises en adoptant la notation p(x[y) pour dsigner p(y, x). Dautre
part, lensemble des LPC sur X conditionnellement Y est not L
X|Y
de sorte quici
p L
X|Y
. Enn lorsque Y = , les notations prcdentes sont simplies. On crit sim-
plement dans ce cas p L
X
.
La caractrisation prcdente des lois de probabilit conditionnelles reste cohrente avec
le formalisme mathmatique usuel issu de la thorie des probabilits (cf. annexe C). En
considrant par exemple deux vecteurs alatoires X = (X
1
, . . . , X
D
) et Y = (Y
1
, . . . , Y
D
)
valeurs respectivement dans les ensembles X = A
1
. . . A
D
et Y =
1
. . .
D
,
on note P(X[Y ) la loi du vecteur X conditionnellement au vecteur Y , ce qui implique
P(X[Y ) L
X|Y
. Cette notation a lavantage de faire apparatre clairement le domaine de
la LPC en crivant explicitement les variables alatoires. Son inconvnient rside dans la
longueur des critures rduisant ainsi la lisibilit des expressions.
De manire parfaitement quivalente il est possible dcrire que le vecteur X condition-
nellement au vecteur Y est distribu selon la loi p L
X|Y
. Ceci implique que pour tout
x X
et tout y Y
,
p(x[y) = P(X = x[Y = y).
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
On note alors X[Y p. Remarquons enn que p dsigne une densit ou une loi de
probabilit selon que X est un domaine continu ou discret.
Dautre part les LPC tant des potentiels particuliers, les dnitions, les notations, les
oprations et les notions de complexit introduites prcdemment sy appliquent directe-
ment. Une LPC est dite discrte et nie si cest le cas de son potentiel sous-jacent. Il est
galement possible deectuer une addition ou un produit entre une LPC et un potentiel.
Il est toutefois important de prciser que le rsultat de telles oprations est en gnral un
potentiel et non une LPC. De mme, on montre que la somme de deux LPC nest plus une
LPC, mais seulement un potentiel. Il y a nanmoins des cas o la sommation et le produit
restent stables. Ceci est lobjet des deux thormes suivants ainsi que de lexemple 1.5.
Thorme 1.1 (Stabilit par sommation)
Soient une LPC p L
X|Y
et le potentiel q =
_
W
p rsultant de la sommation de p sur le
domaine W. Si W X, alors q est une LPC de L
X
|Y
o X
= X W.
Thorme 1.2 (Stabilit par produit)
Soient deux LPC p L
X|Y
et q L
W|Z
. Si X et (WZ) sont disjoints, le produit (p q)
est alors une LPC appartenant L
XW|Y
Z
o Y
= Y W.
Les dmonstrations des deux thormes prcdents (cf. annexe E.1) rsultent dune appli-
cation des dnitions 1.4 et 1.5 dans le cas o les potentiels sous-jacents considrs ont des
domaines remarquables.
Exemple 1.5
Soient deux LPC discrtes et nies p L
{X}|{Y}
et q L
{Y}
, o A = x
1
, x
2
, x
3
et
= y
1
, y
2
, dnies comme suit :
p
X
x
1
x
2
x
3
y
1
0.25 0.5 0.25
y
2
0.8 0.1 0.1
q
Y
y
1
y
2
0.3 0.7
Le produit des deux potentiels associs aux LPC p et q donne le rsultat suivant :
(p q)
A
x
1
x
2
x
3
x
1
x
2
x
3
y
1
y
1
y
2
y
2
y
3
y
3
0.075 0.150 0.075 0.560 0.070 0.070
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
(p q) est un potentiel dni sur [0, 1]
{X,Y}
et somme 1 sur le domaine A, . Autrement
dit, (p q) L
{X,Y}
comme le prvoit le thorme 1.2. Par ailleurs, la sommation de (p q)
sur donne
yY
(p q)
A
x
1
x
2
x
3
0.635 0.220 0.145
Ce calcul est donc une application du thorme 1.1 et nous observons bien que

Y
(p q)
est une LPC appartenant L
{X}
.
Il est galement possible de modliser les phnomnes dterministes par lintermdiaire
dune LPC comme le montre la dnition suivante.
Dnition 1.8 (LPC dterministe)
Soit une LPC p L
X|Y
. La LPC p est dite dterministe si pour toute conguration y Y
,
il existe une unique conguration x X
telle que
p(x[y) = 1.
Exemple 1.6
Soient deux ensembles A = x
1
, x
2
, x
3
et = y
1
, y
2
. La LPC discrte et nie p
L
{X}|{Y}
donne dans la suite est un exemple de LPC dterministe :
p
X
x
1
x
2
x
3
y
1
1 0 0
y
2
0 0 1
Notons que loptimisation de la reprsentation et les oprations concernant les potentiels
et les LPC sont toujours un sujet dtudes actives (Cobb and Shenoy 2006), (Arias and
Dez 2007).
1.2.3 Notion dutilit
La notion dutilit est une gnralisation dans le formalisme des potentiels du concept
desprance mathmatique issu de la thorie des probabilit.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Dnition 1.9 (Potentiel dutilit)
Soient une LPC p L
X
et un potentiel u R
X
. Le rel dni par
U
p
=
_
xX
u(x)p(x),
est appel utilit de la LPC p associe au potentiel u. Le potentiel u est alors quali de
potentiel dutilit.
Daprs la dnition 1.9, tout potentiel u R
X
peut tre considr comme potentiel
dutilit et appliqu une LPC dni sur le domaine X. Dans le cas discret et ni, nous
adaptons une reprsentation particulire pour les potentiels dutilit an de les distinguer
des potentiels ordinaires. Dans la suite de ce document, un potentiel dutilit est reprsente
comme une LPC, except que la somme de ses valeurs nest pas gale 1 et que ces dernires
ne sont pas ncessairement comprises entre 0 et 1. Lexemple 1.7 illustre cette notation.
Exemple 1.7
Soit un potentiel R
{X,Y}
, avec A = x
1
, x
2
et = y
1
, y
2
, tel que :
A
x
1
x
2
x
1
x
2
y
1
y
1
y
2
y
2
2 5 10 0
.
Par consquent, Il est possible de se servir du potentiel dans tout calcul dutilit impli-
quant une LPC q L
{X,Y}
. Considrons par exemple la LPC suivante :
q
A
x
1
x
2
x
1
x
2
y
1
y
1
y
2
y
2
0.3 0.4 0.1 0.2
.
Lutilit de la LPC q associe est alors donne par :
U
q
= (x
1
, y
1
)q(x
1
, y
1
) +(x
2
, y
1
)q(x
2
, y
1
) +(x
1
, y
2
)q(x
1
, y
2
) +(x
2
, y
2
)q(x
2
, y
2
)
= 2 0.3 5 0.4 + 10 0.1 + 0 0.2
U
q
= 0.4 .
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
1.3 Modles graphiques probabilistes
Nous disposons prsent des outils mathmatiques ncessaires lintroduction des mo-
dles graphiques probabilistes. Des lments sur les questions dapprentissage statistique
et dinfrence probabiliste sont galement exposs dans les paragraphes suivants.
1.3.1 Dnition
Lobjectif principal des modles graphiques probabilistes consiste dnir de manire parci-
monieuse la loi jointe dun vecteur alatoire X = (X
1
, . . . , X
D
) en exploitant les relations
de dpendances parmi les variables X
1
, . . . , X
D
. Ces outils reposent sur les thories des
graphes et des probabilits. Un graphe orient sans circuit (cf. annexe B) est utilis pour
dcrire ces relations dans lequel chaque nud reprsente une variable alatoire et chaque
arc entre deux variables indique une relation de dpendance. Les proprits probabilistes
du modle sont dcrites localement par lintermdiaire des lois de probabilit de chaque
variable conditionnellement leurs variables parentes dans le graphe.
Dnition 1.10 (Modle graphique probabiliste/Rseau baysien)
Un modle graphique probabiliste (MGP) ou rseau baysien (RB), not M, est un couple
((, p
d
1dD
) o :
(i) ( = (X, /) est un graphe orient sans circuit. X = (X
1
, . . . , X
D
) reprsente la fois
les nuds du graphe et une suite de variables alatoires valeurs dans A
1
, . . . , A
D
respectivement. / est lensemble des arcs du graphe dcrivant les dpendances entre
les variables. Si X
i
X
j
/, alors un arc relie la variable X
i
la variable X
j
.
(ii) p
d
1dD
est un ensemble de LPC tel que chaque p
d
reprsente la distribution de
la variable X
d
conditionnellement ses variables parentes dans le graphe, notes
pa(X
d
). En gnralisant loprateur pa() aux domaines, le vecteur alatoire pa(X
d
)
est valeurs dans pa(A
d
)
et par consquent p
d
L
{X
d
}|pa(X
d
)
.
Il est courant de faire rfrence au graphe ( comme tant la partie qualitative ou graphique
du modle, et lensemble de LPC p
d
1dD
comme tant sa partie quantitative ou
probabiliste. Enn, M est dit discret et ni si toutes les LPC p
d
L
{X
d
}|pa(X
d
)
sont
discrtes et nies.
La dnition suivante prolonge la notion de complexit spatiale dans le cadre des rseaux
baysiens.
Dnition 1.11 (Complexit spatiale dun MGP)
Soit X = (X
1
, . . . , X
D
) un vecteur alatoire valeurs dans X
= A
1
. . . A
D
reprsent
par un MGP M = ((, p
d
1dD
). La complexit spatiale de M est dnie comme tant la
somme des complexits spatiales associes chacune des LPC p
d
, d = 1, . . . , D. Autrement
dit, CS(M) =
D
d=1
CS(p
d
).
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
1.3 Modles graphiques probabilistes 25
Le principe de la modlisation par rseaux baysiens ainsi que lensemble des notations
introduites dans les dnitions 1.10 et 1.11 sont illustrs dans lexemple 1.8 o il est question
de la maintenance dune machine de production.
Exemple 1.8 (Un systme de production simple)
Nous proposons dtudier ltat dune machine de production, suppose initialement neuve,
aprs quatre annes de fonctionnement. La machine en question produit des lots de pices
dont la qualit est vrie an dcarter dventuels lots non conformes. Notons que deux
cadences de production sont possibles (normale ou rapide) et quune politique de mainte-
nance prventive est applique, consistant un examen priodique de la machine.
Supposons prsent quil ait t demand aux responsables de la production danalyser
les liens entre ltat de la machine, la conformit des lots, la cadence de production et la
frquence de la maintenance. Pour ce faire, leur choix se porte sur une modlisation de
type probabiliste qui conduit lintroduction des quatre variables alatoires suivantes :
1. X : tat de la machine, valeurs dans A = ok, dgrad, panne ;
2. Z : cadence de fonctionnement, valeurs dans Z = normale, rapide ;
3. Y : qualit des lots, valeurs dans = conforme, non conforme ;
4. A : priode de la maintenance, valeurs dans / = 1 an, 2 ans.
Fig. 1.1 Rseau baysien reprsentant les liens de dpendance entre ltat de la
machine de production (X), sa cadence de fonctionnement (Z), la qualit des pices
produites (Y ) et sa frquence de maintenance (A).
Ayant rcemment entendu parler des rseaux baysiens, les responsables de la production
dcident dutiliser ces outils de faon reprsenter ce systme compos de quatre variables.
Daprs leurs expertises et le retour dexprience disponible, ils aboutissent la construc-
tion du modle graphique reprsent gure 1.1. Lensemble des arcs du graphe est donn
formellement par / = A X, Z X, X Y . Ces derniers possdent en outre les
signications suivantes :
la variable dtat de la machine (X) a deux parents pa(X) = (A, Z), autrement dit ltat
dpend la fois de la priode de maintenance (A) et de la cadence de production (Z) ;
la qualit des lots ne dpend que de ltat de la machine (pa(Y ) = X) ;
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
la priode de la maintenance et la cadence de production ne possdent pas de parent
(pa(A) = pa(Z) = ).
Une fois les relations de dpendance explicites dans le graphe, les responsables de la
production se sont attachs dcrire le comportement probabiliste du modle en spciant
les quatre LPC p
X
, p
Y
, p
A
et p
Z
associes respectivement aux variables X, Y , A et Z.
Supposons par exemple que le retour dexprience ait conduit aux valeurs numriques
suivantes :
p
X
X
A Z ok dgrad panne
1 an normale 0.90 0.07 0.03
2 ans normale 0.85 0.10 0.05
1 an rapide 0.80 0.16 0.04
2 ans rapide 0.72 0.20 0.08
p
Y
Y
X conforme non conforme
ok 0.99 0.01
dgrad 0.70 0.30
panne 0.00 1.00
p
A
A
1 an 2 ans
1.00 0.00
p
Z
Z
normale rapide
0.75 0.25
Lobservation de la LPC p
X
associe ltat de la machine indique que cette dernire se
trouve dans ltat ok avec une probabilit gale 0.9 lorsque la maintenance prventive
est eectue tous les ans et la cadence est normale. Cette probabilit chute 0.8 lorsque
la cadence est rapide. De mme, la LPC associe la qualit de production nous renseigne
quun lot est conforme avec une probabilit de 0.99 si la machine est dans ltat ok, seule-
ment de 0.7 si elle est dgrade et de 0 lorsquelle est en panne. Par ailleurs, les variables
sans parent reprsentent souvent les entres du systme. La loi de la variable A permet
ici de dnir la politique de maintenance du systme. Poser p
A
(1 an) = 1 signie que la
priode considre pour la maintenance est de 1 an. De la mme manire, la loi associe
la variable Z caractrise la politique de production. Une probabilit de 0.75 associe
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
la cadence normale exprime que 75% de lutilisation de la machine se fait cette cadence,
contre 25% en cadence rapide. Notons enn que ce MGP possde une complexit spatiale
slevant
CS(p
A
, p
Z
, p
X
, p
Y
) = CS(p
A
) +CS(p
Z
) +CS(p
X
) +CS(p
Y
) = 12 + 6 + 2 + 2 = 22
espaces mmoires lmentaires.
Jusqu prsent, nous navons fait usage des modles graphiques probabilistes qu des
ns de modlisation et de reprsentation de la connaissance. Or il est galement possible
de "poser des questions" au modle de faon dduire de nouvelles informations sur le
systme considr. Ainsi dans le cadre de lexemple prcdent, il serait possible dans un
premier temps de calculer la probabilit dun lot dfectueux dans le contexte prsent, puis
dobserver lvolution des probabilits lorsque la priode de maintenance passe deux ans.
Cette problmatique est lobjet de la section 1.3.4 dans laquelle nous dtaillons le problme
de linfrence dans les modles graphiques probabilistes.
1.3.2 Factorisation de la loi jointe
Il sagit ici de prsenter un des principaux rsultats associs la modlisation par r-
seaux baysiens, savoir le thorme de factorisation de la loi jointe. Ce dernier, galement
connu sous le nom de thorme de Markov direct, dcrit comment la loi jointe dun vecteur
alatoire, reprsente laide dun modle graphique probabiliste, peut scrire comme le
produit des LPC de chacune de ces variables. Ce rsultat repose sur une simplication du
thorme de Bayes gnralis (cf. thorme C.2, annexe C) partir des relations dind-
pendances conditionnelles induites par la structure graphique du modle (Pearl and Paz
1985), (Verma and Pearl 1988).
Thorme 1.3 (Factorisation de la loi jointe)
Soit X = (X
1
, . . . , X
D
= A
1
. . . A
D
reprsent
par un MGP M = ((, p
d
1dD
). On note p L
X
la loi (ou densit) jointe associe au
vecteur X. La loi p admet alors la factorisation suivante pour tout x = (x
1
, . . . , x
D
) X
,
p(x) = p(x
1
, . . . , x
D
) =
D
d=1
p
d
(x
d
[pa(x
d
)). (1.1)
On dit alors que la loi (ou densit) jointe p associe au vecteur alatoire X se factorise
dans M et on note X M.
Ce thorme justie le caractre concis de la modlisation partir de rseaux baysiens. Il
est en eet souvent beaucoup plus avantageux, en terme de complexit spatiale, de stocker
lensemble des LPC p
d
1dD
plutt que la loi jointe p directement. Ceci est dtaill dans
la remarque suivante pour le cas des MGP discrets et nis.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Remarque 1.1 (MGP discrets et nis et complexit spatiale)
Soit X = (X
d
)
1dD
un vecteur alatoire valeurs dans (A
d
)
D
d=1
reprsent par un MGP
M = ((, p
d
1dD
). La complexit spatiale associe M est donne par
CS(M) =
D
d=1
CS(p
d
) = c(
D
d=1
[A
d
[[pa(A
d
)
[),
alors que la complexit spatiale nave de la loi jointe p sous-jacente est gale
CS(p) = c
D
d=1
[A
d
[
o c dsigne le cot dun espace mmoire lmentaire. Considrons le cas o toutes les
variables prennent le mme nombre de valeurs K, autrement dit pour tout d, [A
d
[ = K.
Supposons galement que toutes les variables possdent L parents. Ceci implique CS(M) =
cDK
L+1
et CS(p) = cK
D
. La reprsentation par rseaux baysiens est plus avantageuse
que la loi jointe classique en terme de complexit spatiale si et seulement si
CS(M) CS(p) DK
LD+1
1.
La reprsentation dune loi de probabilit multivarie par un MGP est dautant plus in-
tressante que le nombre de parents est petit compar au nombre de variables et que ces
dernires prennent un grand nombre de valeurs.
1.3.3 Apprentissage des lois de probabilit conditionnelles
Problmatique et notations
Lobjectif de cette section est de dtailler lapprentissage des paramtres probabilistes dun
rseau baysien dont la structure graphique est connue. En reprenant les notations intro-
duites et en faisant explicitement apparatre les paramtres, le thorme de factorisation
(1.3) se rcrit comme suit :
p(x
1
, . . . , x
D
; ) =
D
d=1
p
d
(x
d
[pa(x
d
);
d
),
o chaque
d

d
reprsente les paramtres de la LPC p
d
et = (
1
, . . . ,
D
). La question
est donc de calculer une estimation de = (
1
, . . . ,
D
), note

= (
1
, . . . ,
D
), partir
dinformations contenues dans une base de donnes rpertoriant un certain nombre de
ralisations du processus tudi. Cette base est souvent qualie de base dexemples ou de
base de REX (Retour dEXprience) dans lindustrie.
Soit formellement le vecteur alatoire X = (X
1
, . . . , X
D
) dont la distribution se factorise
dans le MGP M = ((, p
d
1dD
). Considrons galement une base de donnes D
X
conte-
nant N exemples indpendants et identiquement distribus (i.i.d.) dans laquelle chaque
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
ligne reprsente une ralisation du processus X. Par consquent, il est possible dassimiler
D
X
la matrice de N lignes et D colonnes suivante :
D
X
=
_
_
x
1,1
. . . x
1,d
. . . x
1,D
.
.
.
.
.
.
.
.
.
x
n,1
. . . x
n,d
. . . x
n,D
.
.
.
.
.
.
.
.
.
x
N,1
. . . x
N,d
. . . x
N,D
_
_
(1.2)
o x
n,d
est la n-me observation de la variable X
d
. Notons fa(X
d
) les variables constituant
la famille de X
d
dans (, savoir X
d
elle-mme et ses parents, cest--dire
fa(X
d
) = (pa(X
d
), X
d
). Introduisons alors par analogie la notation D
fa(X
d
)
comme tant
la sous matrice de D
X
contenant les observations de X
d
et de ses parents.
Nous nous plaons ici dans un cadre o la base de donnes disponible est compltement ob-
serve, autrement dit celle-ci ne possde pas de donne manquante, ni mme partiellement
observe. Nous traitons dans un premier temps le cas o les LPC sont quelconques, puis
le cas o ces dernires sont discrtes et nies. Nous prsentons en particulier la dmarche
permettant de calculer les estimations issues de la mthode du maximum de vraisemblance.
Apprentissage dans le cas gnral
La mthode du maximum de vraisemblance (Fisher 1922) consiste dterminer le jeu de
paramtres not
qui maximise la vraisemblance, note L, des donnes observes D

X
. Par
dnition, cette dernire est dnie comme tant la probabilit dobserver D
X
, cest--dire :
L(; D
X
) = p(D
X
; )
=
N
n=1
p(x
n,1
, . . . , x
n,D
; ) (donnes i.i.d.)
=
N
n=1
D
d=1
p
n
(x
n,d
[pa(x
n,d
);
d
) (factorisation de la loi jointe dans M)
=
D
d=1
N
n=1
p
n
(x
n,d
[pa(x
n,d
);
d
)
. .
L(
d
;D
fa(X
d
)
)
L(; D
X
) =
D
d=1
L(
d
; D
fa(X
d
)
),
o L(
d
; D
fa(X
d
)
) correspond la vraisemblance locale des donnes observes relatives la
famille de la variable X
d
. En rgle gnrale, on utilise le logarithme de la vraisemblance,
ou log-vraisemblance note l, cette dernire permettant souvent de simplier les calculs.
Le rsultat du calcul prcdent se rcrit de la manire suivante :
l(; D
X
) = ln[L(; D
X
)] =
D
d=1
ln[L(
d
; D
fa(X
d
)
)] =
D
d=1
l(
d
; D
fa(X
d
)
). (1.3)
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Ainsi daprs lquation (1.3), la log-vraisemblance se dcompose en une somme de log-
vraisemblances locales. Par consquent, rechercher lestimation du jeu de paramtres

qui maximise l(; D

X
) revient calculer localement chaque estimation

n
maximisant
l(
d
; D
fa(X
d
)
). Do,
= (
1
, . . . ,
d
, . . . ,
D
), avec

d
= arg max
d
l(
d
; D
fa(X
d
)
), 1 d D. (1.4)
Dans certains cas particuliers, il est possible de dterminer lexpression analytique de ces
estimations. En revanche lorsque cela est impossible, il est ncessaire de recourir une
mthode doptimisation numrique (Panos and Mauricio 2002) an de rsoudre lquation
(1.4). Notons par ailleurs que les estimateurs de maximum de vraisemblance ont la par-
ticularit dtre asymptotiquement sans biais, de variance minimale et asymptotiquement
distribus selon une loi normale. Cette dernire proprit est particulirement utile car
elle permet la construction dintervalles de conance sur les estimations calcules (Keeping
1962).
Apprentissage dans le cas discret et ni
Dans le cadre des MGP discrets et nis, il est possible de poursuivre le calcul prcdent. D-
nir la d-me LPC, note p
d
L
{X
d
}|pa(X
d
)
, revient dans ce cas spcier pour chacune des
congurations de parents x
pa(A
d
), la probabilit doccurrence de chacun des lments
de A
d
. Autrement dit,
d
et p
d
reprsentent exactement le mme objet, savoir une table
de probabilit conditionnelle. Nous cherchons donc calculer pour tout d 1, . . . , D une
estimation de p
d
, note p
d
. Lquation (1.4) se rcrit de la manire suivante :
d 1, . . . , D, p
d
= arg max
p
d
L
{X
d
}|pa(X
d
)
N
n=1
ln[p
n
(x
n,d
[pa(x
n,d
))] (1.5)
Posons N
d,x
,x
le nombre de fois o la variable X
d
prend la valeur x A
d
dans les donnes
D
fa(X
d
)
alors que ses parents sont dans la conguration x
pa(A
d
). Par dnition, N
d,x
,x
vrie
N
d,x
,x
=
N
n=1
1I(x
n,d
= x)1I(pa(x
n,d
) = x
),
o 1I est la fonction indicatrice. De cette quantit, il est possible den dduire le nombre
de fois o les parents sont dans la conguration x
, savoir N
d,x
=
xX
d
N
d,x
,x
. Les-
timation du maximum de vraisemblance associe la LPC p
d
vrie alors pour toute
conguration de parents x
pa(A
d
) et tout x A
d
,
p
d
(x[x
) =
N
d,x
,x
N
d,x
,
ce qui revient calculer, pour chaque conguration de parents, la proportion du nombre
doccurrences de la valeur x dans la d-me colonne de D
X
, et ce, pour tout d 1, . . . , D.
La proprit de normalit asymptotique lie la mthode du maximum de vraisemblance
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
permet dans ce cas de dduire un intervalle de conance asymptotique autour de lesti-
mation obtenue. En se xant un seuil de conance [0, 1], nous obtenons pour toute
conguration de parents x
pa(A
d
) et tout x A
d
lencadrement suivant :
_
p
d
(x[x
) u1+
2
p
d
(x[x
)(1 p
d
(x[x
))
N
d,x
, p
d
(x[x
) +u1+
2
p
d
(x[x
)(1 p
d
(x[x
))
N
d,x
_
,
o u1+
2
est le quantile
1+
2
de la loi normale centre-reduite.
Remarques bibliographiques
Il arrive souvent en pratique que les donnes disponibles pour lapprentissage des LPC ne
soient pas compltes. Des variables peuvent ne pas tre observes dans certains exemples
de la base D
X
. Dans ce type de situation, des mthodes, en particulier celles reposant
sur lalgorithme EM
1
(Mclachlan and Krishnan 1997), ont t dveloppes pour une utili-
sation dans les MGP (Cowell et al. 1999). Dautre part lorsque des informations a priori
sont disponibles sur le processus, par exemple des avis dexperts, il est possible den tenir
compte par le biais des mthodes baysiennes (Gelman et al. 2003) telles que le maximum
a posteriori (MAP) ou lesprance a posteriori (EAP).
Enn, en ce qui concerne lapprentissage de la structure graphique du modle, la thse de
Franois (2006) passe en revue la plupart des mthodes existantes tout en les comparant
empiriquement sur divers exemples classiques avec donnes compltes et manquantes. Plus
rcemment, les travaux de Rodrigues de Morais (2009) prsentent de nouvelles techniques
permettant damliorer lapprentissage de la structure partir de donnes compltes com-
poses dun trs grand nombre de variables.
1.3.4 Infrence
Gnralits
Aprs avoir prsent lintrt des MGP pour la modlisation, nous nous intressons ici aux
mcanismes permettant deectuer des raisonnements probabilistes. En pratique, lobjec-
tif est de calculer la loi de probabilit dun sous ensemble de variables alatoires, appel
requte, parmi lensemble des variables alatoires reprsent dans un MGP. Les calculs
raliss an de dduire la distribution de la requte sont appels calculs dinfrence proba-
biliste. Il existe trois classes de mthodes dinfrence probabiliste :
les mthodes exactes, reposant sur des multiplications et sommations de potentiels sans
faire dhypothse simplicatrice sur le modle ;
les mthodes approches dterministes, consistant eectuer des calculs exacts sur une
structure graphique simplie ;
1
Lannexe D prsente le principe de la mthode EM, applique au problme dapprentissage dune loi
discrte et nie en prsence de donnes incompltes.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
les mthodes approches stochastiques, ralisant un chantillonnage de la loi de la requte
en exploitant la structure originale du modle.
Le premier algorithme dinfrence exacte pour les MGP a t propos par Pearl (1986). Il
sagit dun protocole de passage de messages limit aux graphes orients sans circuit ayant
une structure de polyarbre
2
. Cette mthode a t tendue aux graphes quelconques pour
donner naissance lalgorithme de larbre de jonction (Lauritzen and Spiegelhalter 1988).
Cette mthode est trs largement utilise lheure actuelle dans la plupart des logiciels
de modlisation bass sur les MGP. Cet engouement sexplique en partie par sa facult
calculer rapidement la distribution de chacune des variables reprsentes par le modle
graphique. Dans la suite, nous dtaillons la mthode dinfrence exacte dite dlimination de
variables (Dechter 1999). Llimination de variables est un problme intrinsque tous les
algorithmes dinfrence dexacte. Dautre part, sa simplicit, notamment car elle ne fait pas
intervenir de notions complexes issues de la thorie des graphes, permet une mise en uvre
rapide. Cette mthode possde en outre de bonnes proprits algorithmiques lui confrant
les mmes avantages que la mthode de larbre de jonction (Cozman 2000). Prcisons
toutefois quen pratique, la plupart des mthodes dinfrence exactes ne sappliquent pour
linstant qu des modles dont les LPC sont discrtes et nies. mme si la thorie prvoit
en principe une utilisation dans le cadre plus large des LPC appartenant la famille dite
exponentielle (Wei 1998). Par ailleurs, Cooper (1990) montre que linfrence exacte dans des
rseaux quelconques est un problme NP-dicile. Nanmoins la complexit algorithmique
des mthodes est en gnral calculable lavance. Quand le rsultat dpasse une limite
raisonnable, il est alors prfrable dutiliser une mthode approche.
Dans le cadre des mthodes approches dterministes, nous pouvons citer par exemple
les travaux de Murphy et al. (1999) qui montrent quune utilisation de lalgorithme de
Pearl dans le cas gnral peut avoir un certain intrt en considrant un compromis ra-
pidit/prcision des rsultats. Jordan et al. (1999) ont tudi les mthodes variationnelles
appliques linfrence dans les MGP. Intressons nous enn aux mthodes approches
stochastiques qui reposent la fois sur lexploitation de la topologie du modle et dun
chantillonnage des variables alatoires reprsentes. Les deux mthodes les plus utilises
sont la mthode gnrale dchantillonnage MCMC (Monte Carlo Markov Chain, Gilks
(1995)) et la mthode du ltrage particulaire (Arulampalam et al. 2002). La mthode
dchantillonnage est dtaille dans la suite. Ces mthodes possdent les avantages dtre
simples implmenter et exibles dans leur utilisation. Il est possible de les appliquer des
modles o les LPC sont quelconques. La convergence de ces algorithmes vers les solutions
exactes associes est en gnral garantie par la thorie. Malheureusement cette convergence
est lente et nest assure que dans le cas o le nombre dchantillons tend vers linni. Par
consquent, et bien que possdant de bonnes proprits thoriques, ces mthodes ne sont
utilises en pratique que lorsque les algorithmes prcdents ne peuvent sappliquer.
Dans les paragraphes suivants, nous considrons X = (X
1
, . . . , X
D
), un vecteur alatoire
dont la loi jointe se factorise dans un modle graphique probabiliste M = ((, p
d
1dD
).
Formellement, lobjectif de linfrence probabiliste consiste calculer la loi P(X
r
) L
X
r
dun vecteur alatoire X
r
extrait de X, appel requte. Selon le problme considr, cer-
2
Un polyarbre est un graphe orient sans circuit dans lequel il ny pas non plus de circuit non orient.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
taines des variables de X
r
peuvent tre observes, apportant ainsi des informations sup-
plmentaires
3
sur le systme tudi. Notons que ces observations ne changent en rien le
principe des mthodes dinfrence probabiliste mais conduisent en revanche souvent une
rduction de la complexit des calculs eectus.
Infrence exacte : Mthode de llimination de variables
Le principe de la mthode dlimination repose sur le fait que pour tout x
r
X
r
,
P(X
r
= x
r
) =
_
x
e
(X\X
r
)
d=1
p
d
(x
d
[pa(x
d
)). (1.6)
"liminer une variable" signie eectuer une sommation de la loi jointe factorise sur le
domaine de la variable en question. La mthode consiste donc liminer une une les
variables qui nappartiennent pas la requte X
r
, de telle sorte quen n de procdure il
ne reste plus que la LPC sur X
r
. Le rsultat de lquation (1.6) ne dpend pas de lordre
dans lequel sont eectues les sommations. En revanche cet ordre inue trs fortement sur
la complexit des calculs associs. Malheureusement, trouver lordre dlimination opti-
mal savre tre un problme NP-dicile, do lutilisation dheuristiques (Kjaerul 1990),
(Zhang and Poole 1996) permettant dans certains cas dobtenir des ordres convenables.
Lalgorithme 1.1 prsente la mthode dlimination de variables applique aux calculs din-
frence dans le cadre des modles graphiques probabilistes. La complexit algorithmique
de cette mthode est tudie en dtail par Dechter (1999). Nanmoins il est intressant
de remarquer que ltape de calcul du potentiel c
X
concentre lessentiel de la complexit
algorithmique de la mthode. Plus prcisment, en reprenant les notations introduites dans
lalgorithme, nous avons
CA(c
X
) = CA(
_
X
mB
X
m)
= CA(m
) +CA(
_
{X}
m
) avec m
mB
X
m
CA(c
X
) = 2CS(m
) = O(CS(m
)).
Autrement dit, plus le nombre de potentiels contenus dans les ensembles B
X
est important,
plus il est probable que le calcul de c
X
soit coteux du point de vue algorithmique et spatial.
Lexemple 1.9 donne une illustration du fonctionnement de cet algorithme.
Exemple 1.9 (Illustration de lalgorithme dlimination)
Replaons nous dans le contexte introduit dans lexemple 1.8. Il sagit ici de prsenter pas
pas les tapes de lalgorithme 1.1 lors dun calcul dinfrence simple. Intressons nous
par exemple la distribution de la qualit des lots (variable Y ) en considrant le modle
graphique de la gure 1.1. La requte X
r
ne contient ici que la variable Y . En utilisant
lordre dlimination (A, Z, X, Y ), la mthode se droule de la faon suivante :
3
Ces informations sont souvent appeles "vidence".
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Algorithme 1.1 : Mthode de llimination de variables dans un MGP.
Entres :
1. Un ensemble de LPC p
d
1dD
caractrisant la loi jointe dun vecteur alatoire
X = (X
1
, . . . , X
D
) valeurs dans A
1
, . . . , A
D
reprsent par un MGP.
2. Un vecteur alatoire X
r
extrait de X reprsentant la requte de linfrence.
3. Une permutation du vecteur alatoire (X
1
, . . . , X
D
), note (X
1
, . . . , X
D
),
reprsentant lordre dlimination des variables.
Sortie : La loi P(X
r
) L
X
r
.
// Copie de lensemble des LPC
T p
1
, . . . , p
D
;
pour chaque d = 1, . . . , D faire
X
(d)
(X
d
);
si X
(d)
nappartient pas la requte X
r
alors
// Potentiels (ou LPC) dont le domaine contient A
(d)
B
X
(d) m[m T tel que A
(d)
Dom(m);
T T B
X
(d) ;
// Multiplier les potentiels (ou LPC) de B
X
(d)
// Puis sommer sur A
(d)
c
X
(d)
_
{X
(d)
}
mB
X
(d)
m;
// R eins erer le r esultat dans T
T T c
X
(d) ;
n
En dduire P(X
r
)
mP
m;
n
Initialisation : T = p
A
, p
Z
, p
X
, p
Y
.
X
(1)
A.
A X
r
= (Y ).
A Dom{p
A
} et A Dom{p
X
}, donc B
A
{p
A
, p
X
}.
P {p
Z
, p
Y
}.
c
A

A
p
A
p
X
avec c
A
L
{X}|{Z}
, ce qui donne compte tenu des valeurs num-
riques :
c
A
X
Z ok dgrad panne
normale 0.90 0.07 0.03
rapide 0.80 0.16 0.04
P {p
Z
, p
Y
, c
A
}.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
X
(2)
Z.
Z X
r
= (Y ).
Z Dom{p
Z
} et Z Dom(c
M
), donc B
Z
{p
Z
, c
A
}.
P {p
Y
}.
c
Z

Z
p
Z
c
A
avec c
A
L
{X}
, soit :
c
Z
X
ok dgrad panne
0.875 0.092 0.033
P {p
Y
, c
Z
}.
X
(3)
X.
X X
r
= (Y ).
X Dom{p
Y
} et X Dom(c
Z
), donc B
Z
{p
Y
, c
Z
}.
P .
c
X

X
p
Y
c
Z
avec c
X
L
{Y}
, soit :
c
X
Y
conforme non conforme
0.931 0.069
P {c
X
}.
X
(4)
Y .
Y X
r
= (Y ), on ne fait rien.
Il ny a plus de variable liminer.
Rsultat : P(Y ) c
X
.
Infrence approche : Mthode par chantillonnage
Le principe de la mthode dinfrence par chantillonnage consiste dans un premier temps
construire une base dexemples indpendants partir des LPC caractrisant le MGP. Cette
base est ensuite utilise pour estimer la distribution de la requte en utilisant une mthode
destimation quelconque (par exemple la mthode du maximum de vraisemblance, cf. partie
1.3.3). Formellement, il sagit de gnrer N ralisations indpendantes du vecteur alatoire
X = (X
1
, . . . , X
D
), notes x
1
, . . . , x
N
o pour tout n = 1, . . . , N, x
n
= (x
n,1
, . . . , x
n,D
).
Ces ralisations forment alors une base de donnes, note D
X
, identique (1.2). Lal-
gorithme 1.2 prsente une mthode dchantillonnage gnrique dun processus alatoire
reprsent par un MGP. Remarquons quune fois lchantillonnage eectu, il est possible
destimer la loi P(X
r
) L
X
r
de nimporte quelle requte X
r
. Cette estimation est eec-
tue partir de la sous base dexemples, note D
X
r
obtenue en ne gardant que les colonnes
correspondant aux variables appartenant la requte.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Algorithme 1.2 : Mthode dchantillonnage dans un MGP.
Entres :
1. Un ensemble de LPC {p
d
}
1dD
caractrisant la loi jointe dun vecteur alatoire
X = (X
1
, . . . , X
D
) valeurs dans X
1
, . . . , X
D
reprsente par un MGP.
2. Le nombre N dchantillons du vecteur alatoire X raliser.
Sortie : Une base dexemples i.i.d. D
X
= (x
n,d
)1nN
1dD
o x
n,d
dsigne la n-me
ralisation de la variable alatoire X
d
.
pour chaque n = 1, . . . , N faire
// n-` eme echantillonnage
pour chaque d = 1, . . . , D faire
// Tirage al eatoire selon la LPC de la variable X
d
x
n,d
p
d
(: |pa(x
n,d
)) o pa(x
n,d
) correspond la n-me ralisation du
vecteur alatoire associ aux variables parentes de X
d
dans le MGP.
n
n
Dans le cas discret et ni, lestimation de la loi

P(X
r
) se dduit en gnralisant lquation
(1.5). Soit N
x
r
le nombre doccurrences de la conguration x
r
dans la sous base dexemples
D
X
r
. La mthode du maximum de vraisemblance fournit alors une estimation de la loi de
X
r
, note

P(X
r
), dnie pour tout x
r
X
r
par
P(X
r
= x
r
) = p
x
r
=
N
x
r
N
. (1.7)
En appliquant la proprit de normalit asymptotique caractristique de la mthode du
maximum de vraisemblance, lestimation prcdente est prcise
b p
x
r
avec
b p
x
r
= u1+
2
_
p
x
r
(1 p
x
r
)
N
[0, 1], (1.8)
o [0, 1] est le seuil de conance de lencadrement et o u1+
2
est le quantile
1+
2
de la
loi normale centre-reduite. Insistons sur le fait que choisir un seuil de conance signie
que lestimation obtenue a une probabilit dappartenir lencadrement associ. Enn,
il est possible de dterminer le nombre N
,
de manire obtenir un encadrement de la
forme p
x
r

b p
x
r
avec
b p
x
r
< . Nous avons en eet p
x
r
[0, 1] ce qui permet dutiliser
la majoration p
x
r
(1 p
x
r
) < 1/4 et den dduire
b p
x
r
< N
,
>
u
2
1+
2
4
2
. (1.9)
La complexit algorithmique de la mthode dinfrence par chantillonnage se rsume es-
sentiellement au temps de calcul ncessaire la construction de la base dexemples. Ceci
revient valuer la complexit algorithmique de lalgorithme 1.2. Nous en dduisons alors
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
que la mthode possde un cot algorithmique en
O
_
N
D
d=1
CA(x
n,d
p
d
)
_
, (1.10)
o CA(x
n,d
p
d
) dsigne la complexit algorithmique lie la gnration dune ralisation
suivant la LPC p
d
L
{X
d
}|pa(X
d
)
. Or, le cot dun tirage alatoire partir dune LPC
quelconque de L
X|Y
tant en O(|X|), la mthode dchantillonnage dtaille ici ncessite
de lordre de
O
_
N
D
d=1
|X
d
|
_
oprations lmentaires.
Exemple 1.10 (Illustration de la mthode dchantillonnage)
Reprenons la problmatique de lexemple 1.9 et appliquons la mthode dchantillonnage
an dobtenir une estimation de la distribution de la qualit des lots. Rappelons que la
mthode dlimination donne le rsultat exact suivant :
P(Y )
Y
0.931 0.069
.
En se xant un seuil de conance = 0.95 (95%), nous obtenons partir de N = 100
exemples lestimation
P(Y )
Y
0.890 0.110
.
Dans ces conditions, les valeurs obtenus sont prcises 0.0613. Avec N = 1000 exemples,
le rsultat est
P(Y )
Y
0.933 0.067
.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
La prcision est alors de 0.0155. Enn, avec N = 10000 exemples, lestimation

P(Y ) est
gale
P(Y )
Y
0.930 0.070
,
avec une prcision de 0.0066. Par ailleurs, titre indicatif, le nombre dexemples gnrer
pour obtenir une prcision 10
3
avec un seuil de conance = 0.99 slve N
0.99,10
3 =
1658725. Ceci illustre la faiblesse de cette mthode, savoir un cot algorithmique dmesur
par rapport la prcision des estimations calcules.
1.4 Modles graphiques probabilistes markoviens
Lobjectif des paragraphes suivants est dtendre le formalisme des modles graphiques
probabilistes an de reprsenter des systmes dynamiques. Nous entendons par cette ter-
minologie des systmes dont ltat volue en fonction dun paramtre t introduisant une
notion dordre. Nous nous limitons ici au cas o ce paramtre prend ses valeurs dans un
espace discret et ni. Le paramtre t peut par exemple dsigner un temps discret, une
position, . . . Le terme dynamique ne sapplique donc pas la structure du systme, cette
dernire tant suppose xe.
Les rseaux baysiens dynamiques, et en particulier les modles deux tranches de temps,
ont t introduits et largement dcrits par Murphy (2002). Le principe majeur de ces
modles consiste autoriser les variables du modle linstant prsent dpendre de
linstant prcdent. Autrement dit, dun point de vue probabiliste, ces modles vrient
lhypothse markovienne dordre un. Par consquent, et par volont dunication, nous nous
permettons dans ce document de dsigner par modles graphiques probabilistes markoviens
dordre n, abrgs n-MGPM, les modles souvent appels rseaux baysiens n+1 tranches
de temps dans la littrature.
Par analogie avec les modles graphiques probabilistes statiques introduits dans la partie
1.3 , lide est prsent de reprsenter de manire parcimonieuse les processus multivaris
vriant une hypothse markovienne. Par consquent, le formalisme des n-MPGM constitue
un outil dunication pertinent, permettant, entre autre, de reprsenter de nombreux mo-
dles markoviens connus. Par exemple, les modles de Markov cachs (Rabiner and Juang
1993), les ltres de Kalman (1960) ou bien encore les processus dcisionnels markoviens
(Puterman 2005) sont tous reprsentables laide dun 1-MGPM. Dautre part, nous mon-
trons dans les paragraphes suivants que les modles graphiques probabilistes markoviens
hritent largement du formalisme et des outils dvelopps dans le cadre statique.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
1.4 Modles graphiques probabilistes markoviens 39
1.4.1 Dnition
Formellement un n-MGPM est une reprsentation graphique de la distribution dun vecteur
alatoire (X
t
)
tT
= (X
t,1
, . . . , X
t,D
)
1tT
en supposant lhypothse markovienne dordre
n. Autrement dit pour tout t > n, le vecteur alatoire X
t+1
est suppos indpendant
du vecteur X
tn
conditionnellement au vecteur (X
tn+1
, X
tn+2
, . . . , X
t
), ce qui scrit
mathmatiquement
X
tn
X
t+1
|(X
tn+1
, X
tn+2
, . . . , X
t
). (1.11)
Notons que lquation 1.11 avec n = 1 dsigne lhypothse classique selon laquelle le futur
du processus tudi est indpendant de son pass connaissant son prsent, cest--dire
X
t1
X
t+1
|X
t
.
Dnition 1.12 (Modle graphique probabiliste markovien dordre n)
Soit X
t
= (X
t,1
, . . . , X
t,D
t
= X
t,1
. . . X
t,D
. Un
modle graphique probabiliste (ou rseau baysien) markovien dordre n, not M
n
, est un
couple de deux modles graphiques probabilistes (M
ini
, M
) reprsentant un processus
stochastique multivari (X
t
)
t1
.
(i) M
ini
= (G
ini
, {p
ini
1,d
, . . . , p
ini
n,d
}
1dD
) dnit la distribution initiale du processus,
savoir la distribution jointe du vecteur (X
1
, . . . , X
n
), note p
ini
L
S
n
t
=1
X
t
. Daprs
le thorme 1.3, pour tout (x
1
, . . . , x
n
) (
n
t
=1
X
t
)
p
ini
(x
1
, . . . , x
n
) =
n
=1
D
d=1
p
ini
t
,d
(x
t
,d
|pa(x
t
,d
)). (1.12)
(ii) M
= (G
, {p
t,d
} 1dD
n+1tT
) reprsente le modle de transition du processus, au-
trement dit la distribution de X
t
|X
t1
, . . . , X
tn
, note p
L
X
t
|X
t1
...X
tn
.
Dans ce cas, le thorme de factorisation donne pour tout (x
t
, x
t1
, . . . , x
tn
)
(X
t
, X
t1
. . . X
tn
)
(x
t
|x
t1
, . . . , x
tn
) =
D
d=1
p
t,d
(x
t,d
|pa(x
t,d
)), t > n. (1.13)
Daprs lhypothse markovienne dordre n, les parents dune variable X
t,d
quelconque
se trouvent ncessairement entre les tranches t et t n lorsque t > n.
Lorsque le modle de transition ne dpend pas de t, cest--dire si pour tout d,
p
t,d
= p
d
, le n-MGPM est dit homogne.
La distribution jointe du vecteur alatoire (X
t
)
1tT
, note p L
S
T
t=1
X
t
, vrie alors pour
tout (x
1
, . . . , x
T
) (
T
t=1
X
t
)
,
p(x
1
, . . . , x
T
) = p
ini
(x
1
, . . . , x
n
)
T
t=n+1
p
(x
t
|x
t1
, . . . , x
tn
)
=
n
=1
D
d=1
p
ini
t
,d
(x
t
,d
|pa(x
t
,d
))
T
t=n+1
D
d=1
p
t,d
(x
t,d
|pa(x
t,d
)).
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Il existe deux manires quivalentes de reprsenter graphiquement un n-MGPM. La pre-
mire consiste reprsenter les deux modles graphiques M
ini
et M
. Le modle M
ayant la particularit de reprsenter une loi conditionnelle et non plus une loi jointe, les
conventions graphiques suivantes sont utilises :
toutes les variables de la tranche t sont dessines ;
dans les tranches t1 tn, seules les variables ayant au moins un arc vers une variable
de la tranche t sont dessines ;
tous les arcs entrant dans une variable de la tranche t sont dessins.
Les gures 1.2a et 1.2b illustrent cette mthode de reprsentation. La seconde possibilit
pour reprsenter un n-MGPM est plus directe. Il sut uniquement de dessiner les variables
et les arcs sur n + 1 tranches successives, le plus simple tant de reprsenter les tranches
t n t. La gure 1.3 donne un exemple de cette manire de procder. La structure de
modle initial sous-jacent M
ini
se dduit en supprimant la dernire tranche. Le modle de
transition M
sobtient en conservant uniquement les variables de la tranche t, ainsi que

celles des tranches t n t 1, possdant au moins un arc vers la tranche t. Remarquons
toutefois que cette mthode ne permet pas de reprsenter des relations de dpendance
direntes dans le modle initial et dans le modle de transition, ces derniers ntant pas
dissocis.
(a) Modle graphique M
ini
reprsentant le vecteur
alatoire initial (X
1
, Y
1
, Z
1
, X
2
, Y
2
, Z
2
).
(b) Modle graphique M
reprsentant le vecteur alatoire (X

t
, Y
t
, Z
t
) condi-
tionnellement au vecteur alatoire (X
t2
, X
t1
).
Fig. 1.2 Modle graphique probabiliste markovien dordre 2 reprsentant le vecteur
alatoire (X
t
, Y
t
, Z
t
)
t1
partir de son modle initial en gure (a) et son modle de
transition en gure (b).
Remarque 1.2
Dans la dnition 1.12, le vecteur alatoire X
t
= (X
t,1
, . . . , X
t,D
) caractrisant le processus
associ au n-MGPM linstant t est suppos valeurs X
t
= X
t,1
. . .X
t,D
. Toutefois, dans
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Fig. 1.3 Modle graphique probabiliste markovien dordre 2 reprsentant le vecteur
alatoire (X
t
, Y
t
, Z
t
)
t1
partir de trois tranches temporelles successives.
la suite de ce rapport, nous considrons toujours que pour tout t, X
t,d
= X
d
, autrement dit
que le nombre de modalits de chaque variable alatoire ne change pas au cours du temps.
Malgr cela, lindexation par t reste pertinente an dviter certaines confusions. Ceci est
particulirement vrai en ce qui concerne la dnition de LPC possdant des dpendances
dans plusieurs tranches direntes.
Prenons par exemple la variable X
t
situe dans le modle de transition reprsent gure par
la 1.4b. Sa LPC, note p
X
t
, appartient L
{X
t
}|{X
t1
,A
t1
,Z
t
}
. La suppression de lindexation
par t conduirait des dicults de lecture et ncessiterait obligatoirement lutilisation du
graphe pour identier sans erreur les relations de dpendance associes.
Une illustration de la dnition 1.12 est propose dans lexemple 1.11 dans le cadre dun
processus markovien dordre n = 1.
Exemple 1.11 (MGPM dordre 1)
Il sagit ici dtendre lexemple 1.8 en ajoutant une dpendance temporelle dordre un
la variable dcrivant ltat du systme. Le modle est dsormais constitu des variables
A
t
, Z
t
, X
t
et Y
t
reprsentant respectivement la dcision de maintenance, la cadence de
production, ltat du systme et la qualit de la production linstant t. Les relations de
dpendance entre les variables sont :
ltat du systme courant dpend la fois de son tat prcdent et de la dcision de
maintenance prcdente ;
la dcision de maintenance courante dpend de ltat courant ;
la qualit de la production dpend de ltat courant.
Ces relations sont modlises avec un 1-MPGM dont la loi initiale et la loi de transition
sont reprsentes respectivement dans les gures 1.4a et 1.4b.
An dachever la dnition du modle, il est ncessaire de quantier les relations de d-
pendance introduites graphiquement par lintermdiaire de LPC. Notons tout dabord que
comparativement lexemple 1.8, seul lensemble de dnition de la variable de mainte-
nance a chang. En eet, pour tout t, A
t
= A = {aucune action, remettre neuf} donne
les deux dcisions de maintenance possibles. Dans un premier temps, les LPC caractrisant
le modle initial sont :
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
p
ini
X
1
X
1
Z
1
ok dgrad panne
normale 0.999 0.001 0.000
rapide 0.990 0.010 0.000
p
ini
Y
1
Y
1
X
1
ok 0.99 0.01
dgrad 0.70 0.30
panne 0.00 1.00
p
ini
A
1
A
1
X
1
aucune action remise neuf
ok 1.00 0.00
dgrad 0.50 0.50
panne 0.00 1.00
p
Z
1
Z
1
normale rapide
0.75 0.25
Les LPC associes au modle de transition p
Z
t
, p
Y
t
et p
A
t
sont supposes invariantes par
rapport aux valeurs prises la tranche initiale. La loi de transition associe ltat du
systme est donne par,
p
X
t
X
t
X
t1
A
t1
Z
t
ok dgrad panne
ok aucune action normale 0.99 0.01 0.00
dgrad aucune action normale 0.00 0.90 0.10
panne aucune action normale 0.00 0.00 1.00
ok remise neuf normale 1.00 0.00 0.00
dgrad remise neuf normale 1.00 0.00 0.00
panne remise neuf normale 1.00 0.00 0.00
ok aucune action rapide 0.95 0.04 0.01
dgrad aucune action rapide 0.00 0.70 0.30
panne aucune action rapide 0.00 0.00 1.00
ok remise neuf rapide 1.00 0.00 0.00
dgrad remise neuf rapide 1.00 0.00 0.00
panne remise neuf rapide 1.00 0.00 0.00
Cette table de probabilit indique que si une action de remise neuf est dclenche
linstant t 1, le systme repasse dans ltat ok quels que soient ltat prcdent et la
cadence de production. En revanche lorsque quil ny a pas daction prvue, le systme se
dgrade selon deux matrices de transition dpendant de la cadence de production.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
(a) Modle graphique M
ini
reprsentant le vecteur ala-
toire initial (Z
1
, X
1
, Y
1
, A
1
).
(b) Modle graphique M
reprsentant le vecteur ala-

toire (Z
t
, X
t
, Y
t
, A
t
) conditionnellement au vecteur alatoire
(X
t1
, A
t1
).
Fig. 1.4 Modle graphique probabiliste markovien dordre 1 reprsentant lvolu-
tion dun systme de production caractris par le sa loi initiale en gure (a) et sa
loi de transition en gure (b).
Terminons cette introduction aux modles graphiques probabilistes markoviens en souli-
gnant la forte analogie avec le formalisme des chanes de Markov. Si lon ne tient pas
compte des proprits de factorisation caractrises par les quations (1.12) et (1.13) dans
la dnition 1.12, cette dernire correspond exactement la dnition dun processus mar-
kovien multivari dordre n (Aven and Jensen 1999). Autrement dit, les n-MPGM sont des
outils permettant daner la reprsentation de tels processus en exploitant linformation
sur les relations dindpendance entre les variables. En reprenant les notations de la d-
nition 1.12, il apparat quun n-MPGM (M
ini
, M
) est quivalent la chane de Markov

de distribution initiale p
ini
et de loi de transition p
. Lintrt dun n-MPGM rside donc

dans la possibilit de factoriser ces deux lois, permettant ainsi dans certains cas de rduire
de manire importante la complexit spatiale du modle.
1.4.2 Apprentissage des LPC
Les mthodes dapprentissage concernant les LPC dun n-MPGM sinspirent largement
des techniques dveloppes dans le cas statique. En particulier, il ny a aucune dirence
dans le cas o les informations disponibles sont compltes. Les LPC du modle initial et
du modle de transition sont estimes sparment en appliquant la mthodologie prsente
dans la partie 1.3.3. Le problme devient en revanche plus dlicat lorsque les donnes
sont incompltes. linstar du cas statique, des mthodes reposant sur lutilisation de
lalgorithme EM ont t dveloppes. Lapprentissage dans un modle de Markov cach en
est un exemple (Rabiner 2002). Le dernier chapitre de la thse de Murphy (2002) illustre
plus en dtail cette problmatique en prsentant quelques cas dapplications concrtes.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
1.4.3 Infrence
Gnralits
Il est souvent dusage dans la littrature (Murphy 2002) de fragmenter, comme dans le
cas statique, le problme de linfrence dans les n-MPGM selon la nature de la requte
probabiliste considre. Citons par exemple les problmes de ltrage, lissage ou encore
prdiction. Leur nom nest dailleurs pas une concidence, il sagit bien dune extension des
problmes rencontrs en traitement du signal ou en analyse de sries temporelles dans le
cadre des modles graphiques probabilistes. Nanmoins ces requtes particulires peuvent
se ramener au problme plus gnral du calcul de la distribution dun vecteur alatoire
(X
r
t
)
1tT
extrait du vecteur (X
t
)
1tT
reprsent par un n-MPGM.
Mthodes exactes
De nombreuses mthodes exactes ont t mises au point an de rsoudre ce problme. La
plus simple consiste "drouler" le n-MPGM sur T tranches de faon obtenir un grand
rseau baysien statique. Nimporte quel algorithme dinfrence adapt au cas statique
permet alors de calculer la distribution dsire. Cependant, cette approche implique le
stockage de lensemble des LPC de transition sur T n tranches, augmentant du mme
facteur la complexit spatiale du modle. Lintrt mme de lapproche markovienne est
donc perdu ici, ce qui rend cette mthode trs peu commode utiliser en pratique.
Une autre technique, fonde sur la transformation du n-MGPM en sa chane de Markov
quivalente, peut savrer intressante dans certains cas. Lintrt majeur de cette approche
est la possibilit dappliquer directement les nombreuses mthodes dinfrence dveloppes
pour les chanes de Markov dans le cadre des modles graphiques. Son point faible rside
dans la ncessit de stocker la loi initiale p
ini
et surtout la loi de transition p
ds quune
requte dinfrence est traite. Aussi, la proprit de factorisation des modles graphiques
nest plus utilise, entranant souvent une explosion de la complexit spatiale.
Une manire de rduire la complexit spatiale lors de linfrence consiste exploiter la
proprit de Markov associe au n-MGPM. Autrement dit, tout raisonnement probabi-
liste dans la tranche t est possible ds que la distribution jointe des variables des tranches
t n t 1 ou des tranches t + 1 t + n est connue. On appelle alors distribution de la
frontire gauche (resp. droite) linstant t, la loi jointe p
fr
t
= P(X
tn
, . . . , X
t1
) (resp.
p
fr
t
+
= P(X
t+1
, . . . , X
t+n
)) des variables des tranches t n t 1 (resp. t n t 1). Par
consquent, p
fr
t
(resp. p
fr
t
+
) est dnie sur le domaine L
X
tn
...X
t1
(resp. L
X
t+1
...X
t+n
).
Zweig (1996) a propos lalgorithme de la frontire reposant sur la mise jour pour chaque
tranche t, de lune des deux distributions de frontire an deectuer linfrence dans la
tranche t + 1. Pour ce faire, nimporte quel algorithme dinfrence statique peut tre uti-
lis. Lavantage de cette approche provient du fait quici la factorisation du modle de
transition est eectivement mise prot, rduisant ainsi la complexit spatiale. Toutefois
cette mthode reste particulirement sensible lordre n reprsentant la profondeur des
dpendances passes.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Une amlioration de la mthode prcdente est possible en anant la proprit de Markov
dans le cadre n-MGPM Darwiche (2001). En eet, il est possible de montrer que seule
lobservation dune partie des variables appartenant aux tranches tn t1 est ncessaire
pour assurer lindpendance entre le pass et le futur du processus. Ces variables constituent
ce que lon appelle linterface du n-MPGM.
Dnition 1.13 (Interface dun n-MGPM)
Soit (X
t
)
t1
un vecteur alatoire dont la distribution est reprsente par un n-MGPM.
On appelle alors interface gauche de la tranche t le vecteur alatoire, not X
int
t
, compos
des variables des tranches t n t 1 ayant un lien de dpendance avec une variable de
la tranche t. On note en gnral p
int
t
= P(X
int
t
) la distribution de linterface gauche de la

tranche t, et L
X
int
t
son domaine.
De mme, on appelle interface droite de la tranche t le vecteur alatoire, not X
int
t
+
, compos
des variables des tranches t + 1 t + n ayant un lien de dpendance avec une variable de
la tranche t. On note p
int
t
+
= P(X
int
t
+
) la distribution de linterface droite de la tranche t, et
L
X
int
t
+
son domaine.
Par exemple dans le 1-MGPM de la gure 1.4b, linterface gauche de la tranche t est le
vecteur (X
t1
, A
t1
) et linterface droite est le vecteur constitu dune seule variable X
t+1
.
Le thorme suivant nonce les rsultats en matire dindpendance conditionnelle ports
par les variables constituant linterface gauche et linterface droite.
Thorme 1.4
Soit un vecteur alatoire (X
t
)
t1
dont la distribution est reprsente par un n-MGPM. On
note respectivement X
int
t
et X
int
t
+
linterface droite et linterface gauche du n-MGPM de la
tranche t. Alors pour tout t > n,
X
tn1
X
t
|X
int
t
,
et pour tout t 1,
X
t
X
t+n+1
|X
int
t
+
.
La dmonstration du thorme est donne par Darwiche (2001) et Murphy (2002) dans le
cas respectivement de linterface gauche et droite. Ce rsultat permet de rduire la com-
plexit spatiale lors de linfrence dans un n-MPGM. Il nest plus ncessaire de mettre
jour la distribution dune frontire chaque tranche, mais uniquement celle dune interface.
Lalgorithme 1.3 prsente une mthode dinfrence visant calculer la distribution dun
vecteur alatoire X
r
t
extrait de X
t
, et ce pour tout t 1. Cette mthode repose sur le
thorme 1.4 et sur une procdure dinfrence statique quelconque, note A
statique
inf
. Cette
dernire est suppose permettre le calcul de la distribution dune requte quelconque
partir dun ensemble de LPC caractrisant la factorisation dune loi jointe. Notons que la
mthode dlimination prsente dans lalgorithme 1.1 satisfait parfaitement cette condi-
tion. Une application de lalgorithme 1.3 est propose dans lexemple 1.12.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Algorithme 1.3 : Algorithme de linterface gauche.
Entres :
1. Deux ensembles de LPC {p
ini
t
,1
, . . . , p
ini
t
,D
}
1t
n
et {p
t,1
, . . . , p
t,D
}
n+1tT
reprsentant respectivement le modle initial et le modle de transition dun
n-MGPM reprsentant la loi dun vecteur alatoire (X
t,1
, . . . , X
t,D
)
1tT
.
2. Un algorithme dinfrence pour MGP statique A
statique
inf
permettant de calculer la
loi dun vecteur X
r
extrait dun vecteur (X
1
, . . . , X
K
) dont la loi est caractrise
par un ensemble de LPC {p
k
}
1kK
. Autrement dit,
A
statique
inf
({p
k
}
1kK
, X
r
) = P(X
r
).
3. Une suite de requtes (X
r
1
, . . . , X
r
T
) de longueur T.
Sortie : La suite des distributions P(X
r
1
), . . . , P(X
r
T
) correspondant aux requtes
demandes.
// Calcul des requ^ etes impliquant uniquement les LPC initiales
pour chaque t
{1, . . . , n} faire
P(X
r
t
) A
statique
inf
({p
ini
t
,1
, . . . , p
ini
t
,D
}
1t
n
, X
r
t
);
n
// Calcul de linterface gauche de la tranche n + 1
p
int
(n+1)
A
statique
inf
({p
ini
t
,1
, . . . , p
ini
t
,D
}
1t
n
, X
int
(n+1)
);
// Calcul des requ^ etes et mise ` a jour de la distribution dinterface
pour t > n
pour chaque t {n + 1, . . . , T} faire
P {p
int
t
} {p
t,1
, . . . , p
t,D
};
// Calcul de la requ^ ete
P(X
r
t
) A
statique
inf
(P, X
r
t
);
// Calcul de la distribution dinterface gauche suivante
p
int
(t+1)
A
statique
inf
(P, X
int
(t+1)
);
n
Exemple 1.12 (Infrence exacte dans un 1-MGPM)
Replaons nous dans le cadre de lexemple 1.11 et prenons comme objectif le calcul de
la distribution de ltat du systme et celle de la qualit des lots au cours du temps.
Lalgorithme 1.3 est appliqu aux LPC associs au 1-MGPM de la gure 1.4. Lensemble des
LPC initiales est donc {p
ini
Z
1
, p
ini
X
1
, p
ini
Y
1
, p
ini
A
1
} et celui des LPC de transition {p
Z
t
, p
X
t
, p
Y
t
, p
A
t
}.
Linterface gauche la tranche t est constitue des variables X
t1
et A
t1
.
Les requtes soumises lalgorithme sont donc le calcul des lois de X
t
puis de Y
t
pour
t = {1, 2, 3, 4, 5}. Au cours de son excution, la mthode calcule chaque tranche t la
loi des requtes et celle de linterface gauche partir de lalgorithme dlimination. Les
rsultats numriques sont prsents dans les tables 1.1a et 1.1b pour les requtes sur les
variables X
t
et Y
t
respectivement. La table 1.1c donne lvolution de la loi dinterface
gauche au cours du temps.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
X
t
t ok dgrad panne
1 0.9968 0.0033 0.0000
2 0.9784 0.0188 0.0027
3 0.9710 0.0251 0.0039
4 0.9680 0.0277 0.0043
5 0.9668 0.0287 0.0045
(a) P(X
t
)
Y
t
t conforme non conforme
1 0.9891 0.0109
2 0.9818 0.0182
3 0.9789 0.0211
4 0.9777 0.0223
5 0.9772 0.0228
(b) P(Y
t
)
(X
t
, A
t
)
ok dgrad panne ok dgrad panne
t auc. act. auc. act. auc. act. rem. neuf rem. neuf rem. neuf
1 0.9968 0.0016 0.0000 0.0000 0.0016 0.0000
2 0.9784 0.0094 0.0000 0.0000 0.0094 0.0027
3 0.9710 0.0126 0.0000 0.0000 0.0126 0.0039
4 0.9680 0.0138 0.0000 0.0000 0.0138 0.0043
5 0.9668 0.0144 0.0000 0.0000 0.0144 0.0045
(c) p
int
t
= P(X
t
, A
t
)
Tab. 1.1 Rsultats des calculs dinfrence probabiliste eectus par lalgorithme
1.3. Les lois de X
t
, Y
t
et de linterface gauche pour t = {1, 2, 3, 4, 5} sont donnes
respectivement dans les tables (a), (b) et (c).
Mthodes approches
Notons enn que dans certains cas, une structure graphique trop complexe rend linfrence
exacte irralisable dun point de vue calculatoire. Rappelons en eet que toute mthode
dinfrence exacte passe toujours par le problme de la dtermination dun ordre de som-
mation de variables. La rsolution optimale de ce problme ayant une complexit algorith-
mique exponentielle, un ordre de sommation non optimal est souvent utilis en pratique,
pouvant conduire des calculs extrmement complexes. Pour pallier cet inconvnient, des
mthodes dinfrence approches ont t dveloppes. Celles-ci se subdivisant en deux fa-
milles : celle des algorithmes approchs dterministes avec par exemple la mthode BK
(Boyen and Koller 1998) et la mthode de la frontire factorise (Murphy and Weiss 2001)
et celle des algorithmes approchs stochastiques reposant comme dans le cas statique sur
des techniques dchantillonnages (Gilks 1995),(Arulampalam et al. 2002).
Lalgorithme 1.4 est une adaptation de la mthode dchantillonnage dans les MGP sta-
tiques (cf. algorithme 1.2) dans le cadre des n-MGPM. Lobjectif est de construire une base
dexemples reprsentant une trajectoire du processus de longueur T. Lestimation est en-
suite ralise de manire similaire au cas statique. De mme, les rsultats (1.7), (1.8) et (1.9)
associes lestimation par la mthode du maximum de vraisemblance sappliquent lorsque
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
le n-MGPM est discret et ni. Par analogie avec lquation 1.10, la mthode dchantillon-
nage dun n-MPGM possde une complexit algorithmique en O(T
D
d=1
|X
d
|).
Algorithme 1.4 : Mthode dchantillonnage dans un n-MGPM.
Entres :
1. Deux ensembles de LPC {p
ini
t
,1
, . . . , p
ini
t
,D
}
1t
n
et {p
t,1
, . . . , p
t,D
}
n+1tT
correspondant respectivement au modle initial et au modle de transition dun
n-MGPM reprsentant la loi dun vecteur alatoire (X
t,1
, . . . , X
t,D
)
1tT
.
2. Un algorithme dchantillonnage pour MGP statique A
statique
chant
permettant de
gnrer une ralisation dun vecteur alatoire (X
1
, . . . , X
K
) distribu selon un MGP
caractris par lensemble de LPC {p
k
}
1kK
. Autrement dit,
A
statique
chant
({p
k
}
1kK
) = (x
1
, . . . , x
K
).
3. La longueur T de la trajectoire chantillonner.
Sortie : Un base dexemples (x
t,d
) 1tT
1dD
.
//

Echantillonnage du mod` ele initial
pour chaque t
{1, . . . , n} faire
(x
t
,1
, . . . , x
t
,D
) A
statique
chant
({p
ini
t
,1
, . . . , p
ini
t
,D
});
n
//

Echantillonnage du mod` ele de transition
pour chaque t {n + 1, . . . , T} faire
(x
t,1
, . . . , x
t,D
) A
statique
chant
({p
t,1
, . . . , p
t,D
});
n
1.5 Conclusions
Ce chapitre fournit des lments sur le formalisme des modles graphiques probabilistes
statiques et markoviens. Lexemple trait tout au long du chapitre illustre les possibilits
oertes par ces outils en ce qui concerne la modlisation de systmes complexes. Lintrt
principal de ce type dapproche provient du caractre intuitif induit par laspect graphique
de la modlisation. En outre, les mthodes prsentes pour rsoudre les problmes dap-
prentissage et dinfrence probabiliste fournissent aux utilisateurs des outils danalyses
performants et gnriques. Ceci permet dexpliquer en partie lengouement actuel pour
les modles graphiques probabilistes que ce soit en intelligence articielle, pour laide au
diagnostic en gnral ou encore en sret de fonctionnement.
Lutilisation de ce type doutils parat donc pertinente pour le problme de modlisation de
la maintenance en gnral et de la voie ferre en particulier. Lapprentissage dun processus
de vieillissement, son intgration dans un modle de maintenance et enn le calcul din-
dicateurs de la abilit ou le cot du systme sont des tches complexes, mais accessibles
aux modles graphiques comme la suite de ce document le dmontre.
Le chapitre suivant met laccent sur le problme de la modlisation de la dgradation
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
1.5 Conclusions 49
dun systme. Pour ce faire et de par leur formalisme appropri, les modles graphiques
probabilistes markoviens y jouent un rle important. Il y est question en particulier dun
1-MPGM spcique pour la modlisation des processus de dgradations complexes.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Chapitre 2
Modèles Graphiques de Duree
Sommaire
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
2.2 Description graphique . . . . . . . . . . . . . . . . . . . . . . . . . 54
2.3 Description probabiliste . . . . . . . . . . . . . . . . . . . . . . . 55
2.3.1 Distribution initiale des etats du système . . . . . . . . . . . . . 56
2.3.2 Distribution initiale des temps de sejour . . . . . . . . . . . . . . 56
2.3.3 Politique daction . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.3.4 Modèle de transition des etats du système . . . . . . . . . . . . . 59
2.3.5 Modèle de transition du temps de sejour . . . . . . . . . . . . . . 62
2.3.6 Remarques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
2.4 Apprentissage des LPC et simulation de trajectoire . . . . . . . 67
2.4.1 Donnees attendues . . . . . . . . . . . . . . . . . . . . . . . . . . 68
2.4.2 Estimation du maximum de vraisemblance . . . . . . . . . . . . 68
2.4.3 Simulation de trajectoires . . . . . . . . . . . . . . . . . . . . . . 69
2.5 Inference probabiliste exacte . . . . . . . . . . . . . . . . . . . . 71
2.5.1 Probabilite dune trajectoire . . . . . . . . . . . . . . . . . . . . . 71
2.5.2 Calcul naf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
2.5.3 Calcul ad hoc . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
2.6 Application à letude de la abilite . . . . . . . . . . . . . . . . . 77
2.6.1 MGD et mesures de abilite . . . . . . . . . . . . . . . . . . . . . 77
2.6.2 Illustration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
2.7 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
52 Chapitre 2. Modles Graphiques de Dure
2.1 Introduction
Ce chapitre aborde le problme de la modlisation dun systme dynamique (Howard 2007a)
tats discrets et nis dans le cadre des modles graphiques probabilistes. Le terme systme
dynamique conserve le sens donn au dbut de la partie 1.4. Les qualicatifs discret et ni
indiquent que lespace des tats doit tre un ensemble dnombrable et ni. Lobjectif de ce
chapitre concerne en particulier la modlisation :
des temps qui scoulent entre deux vnements (ex : dure de vie dun individu ou
dun systme physique, dure entre le dclenchement dune maladie et la gurison, dure
dun pisode de chmage, dure entre ltablissement dun prt et une dfaillance de
remboursement. . .) ;
des transitions entre deux vnements (ex : transition entre deux tats de fonctionnement
pour un systme de production industriel, transition entre les dirents stades dune
maladie, changement comportemental dun individu au cours dune partie de poker. . .).
La gure 2.1 donne un exemple dvolution dun systme dynamique trois tats au cours
du temps. On parle en gnral dune trajectoire du systme. La question est de proposer un
modle capable dexploiter au mieux linformation contenue dans les trajectoires observes
dun systme (transitions et temps de sjour dans chaque tat). La problmatique souleve
ici est trs gnrale et trouve des applications dans de nombreux domaines tels que la
biologie, la mdecine, la dmographie, lconomie, la nance. . . Ce document aborde ce
problme dans le cadre de la sret de fonctionnement. Toutefois, les dveloppements
raliss sont aisment transposables dans de nombreux domaines connexes.
Il existe de nombreux travaux traitant de lanalyse de la abilit dans la littrature. Des
outils tels que les chanes de Markov (Aven and Jensen 1999) sont bien adapts pour la
modlisation des transitions dans un systme multi-tats. Linconvnient majeur de cette
approche reste la contrainte implicite sur les temps de sjour dans les tats du systme. Dans
ce cas, ces derniers sont ncessairement distribus gomtriquement (ou exponentiellement
en temps continu). Pour dpasser cette limitation les modles semi-markoviens (Limnios
and Oprisan 2001) ont t dvelopps permettant de spcier explicitement des lois de
temps de sjour dans chacun des tats. Dautre part le modle de Cox (1972) ou plus g-
nralement un modle hasards proportionnels (Kay 1977) sont des outils intressants ds
quil sagit danalyser linuence de variables contextuelles sur la dgradation du systme.
Les mthodes cites prcdemment fournissent des outils danalyses performants lorsque le
systme tudi reste de taille raisonnable. Elles possdent en outre lavantage dtre exibles
sur leurs conditions dutilisation (temps discret/continu, variables discrtes/continues). En
revanche, ces approches sont dicilement applicables aux grands systmes caractriss par
un grand nombre de variables interdpendantes.
Par ailleurs, de rcentes tudes reposant sur lutilisation de MGP se sont avres pertinentes
pour reprsenter les systmes dynamiques et tudier leur abilit. En eet, le fort potentiel
des MGP en matire de modlisation permet de reprsenter relativement intuitivement des
systmes complexes en dcrivant leur comportement stochastique local. Ce gain de exibi-
lit en matire de reprsentation se fait nanmoins au dtriment de conditions dutilisation
parfois plus restrictives, notamment la ncessit de travailler en temps discret. Boudali and
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
2.1 Introduction 53
Panne
Dgrad
Ok
Etat du
systme
Temps
Temps de s|our
dans 'tat Dgrad
Transton de
Ok vers Dgrad
Fig. 2.1 volution de ltat dun systme dynamique au cours du temps (trajec-
toire du systme sur dix pas de temps).
Dugan (2005) et Celeux et al. (2006) ont donn des exemples dtudes de abilit sur des
systmes composs de nombreuses variables interdpendantes partir de MGP statiques.
Langseth and Portinale (2007) et Montani et al. (2006) ont montr quil tait possible de
reprsenter les arbres de dfaillance (Vesely et al. 1981) avec un MGP. Weber and Joue
(2003) ont utilis les Modles Graphiques Probabilistes Markoviens dordre un (1-MGPM)
an de modliser des chanes de Markov dpendant de variables exognes pour tudier la
abilit dun systme dynamique temps discret en tenant compte de son contexte. Lin-
trt majeur de cette technique est la possibilit de reprsenter de grands systmes dont
laspect dynamique est gr localement par des chanes de Markov. Bien que susante dans
certains cas, cette approche soure de la limitation lie au temps de sjour gomtrique.
Dans le cadre dun problme dapprentissage dans les modles de Markov cachs, Murphy
(2002) a propos dintroduire explicitement une variable de temps de sjour associe
ltat des variables caches, lobjectif tant damliorer les procdures dapprentissage en
tenant compte de linformation sur les dures passes dans chaque tat. Toutefois lajout
de ces variables de dure engendre souvent une complexit spatiale importante de sorte que
les algorithmes dinfrence exacte gnriques ddis aux MGPM voient leur performance
chuter signicativement.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Dans ce chapitre, nous introduisons un 1-MGPM discret et ni particulier sinspirant des
modles variables de dure proposs par Murphy (2002). Cette structure a pour voca-
tion de reprsenter lvolution dun systme multi-tats dont les lois de temps de sjour
sont quelconques. Cette structure prvoit galement la prise en compte dactions agissant
ventuellement sur le systme au cours du temps. La description graphique et probabiliste
de ce 1-MGPM, que nous appelons Modle Graphique de Dure (MGD), est aborde res-
pectivement dans la partie 2.2 et la partie 2.3. Par la suite, nous mettons laccent sur le
problme de lapprentissage et de la simulation de donnes pour un MGD dans la partie
2.4. Dans la partie 2.5, nous dcrivons une mthode dinfrence probabiliste ecace d-
die cette structure particulire. Enn, une comparaison empirique sur lvaluation de la
abilit dun systme reprsent partir dun MGD et partir dune Chane de Markov
(CM) est propose dans la partie 2.6.
2.2 Description graphique
Un Modle Graphique de Dure (MGD) est un 1-MGPM discret et ni particulier dont
la structure graphique est donne en gure 2.2. Cette structure est dsigne dans la suite
du document par structure MGD. Ce modle sarticule autour des variables alatoires X
t
,
S
t
et A
t
valeurs respectivement dans les ensembles X, S et A. Les variables X
t
, S
t
et
A
t
reprsentent respectivement linstant t ltat du systme, le temps de sjour restant
dans cet tat et laction slectionne. Lexamen du graphe associ un MGD montre qu
une tranche t quelconque ltat du systme X
t
dpend la fois de ltat prcdent X
t1
,
du temps de sjour prcdent S
t1
et de laction slectionne au pas prcdent A
t1
. Ces
relations permettent de contrler les transitions entre les tats par lintermdiaire des temps
de sjour et de laction slectionne. Le modle de transition de ltat du systme est dtaill
dans la partie 2.3.4. Le temps de sjour courant S
t
dpend des variables X
t1
, S
t1
, A
t1
et de ltat courant X
t
. Ces relations ont pour objectif de maintenir une cohrence dans
le dcompte des temps de sjour dans un tat donn et dinitialiser un temps de sjour
dans ltat courant du systme lorsquune transition a eu lieu. Le mcanisme probabiliste
sous-jacent est dcrit dans la partie 2.3.5. Laction A
t
est slectionne conditionnellement
ltat courant X
t
. Ceci permet de spcier une politique daction impactant sur ltat du
systme (cf. partie 2.3.3).
Les relations de dpendance engendres par ce modle donnent lieu une gnralisation
de celles obtenues par une Chane de Markov (CM). En eet, ltat courant ne dpend
plus uniquement de ltat prcdent. Le processus (X
t
)
t1
nest donc pas markovien. Par
construction seul le processus (X
t
, S
t
, A
t
)
t1
est eectivement markovien. Dans la litt-
rature probabiliste, ce type de processus est quali de semi-markovien (Howard 2007b).
Daprs la dnition 1.13, les variables formant respectivement linterface gauche et linter-
face droite linstant t sont X
int
t
= (X
t1
, S
t1
, A
t1
) et X
int
t
+
= (X
t+1
, S
t+1
). Le thorme
1.4 appliqu un MGD scrit alors :
X
t2
, S
t2
, A
t2
X
t
, S
t
, A
t
|X
t1
, S
t1
, A
t1
, (2.1)
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
2.3 Description probabiliste 55
(a) Modle
initial
(b) Modle de transition
Fig. 2.2 Structure du 1-MGPM associ un MGD (structure MGD). X
t
, S
t
et A
t
reprsentent respectivement linstant t, ltat du systme, le temps de sjour restant
et laction slectionne. Les gures (a) et (b) donnent respectivement les structures
du modle initial et du modle de transition.
et
X
t
, S
t
, A
t
X
t+2
, S
t+2
, A
t+2
|X
t+1
, S
t+1
(2.2)
Le thorme de factorisation dans les n-MGPM associ lquation (2.1) conduit la
dnition rcursive suivante pour linterface gauche :
P(X
t
, S
t
, A
t
) =
_
_
P(X
1
)P(S
1
|X
1
)P(A
1
|X
1
) t = 1
X
t1
,S
t1
A
t1
[P(X
t1
, S
t1
, A
t1
)P(X
t
|X
t1
, S
t1
, A
t1
)
P(S
t
|X
t1
, S
t1
, A
t1
, X
t
)]P(A
t
|X
t
)
t 2
(2.3)
Lors de lutilisation de lalgorithme dinfrence exacte 1.3 sur un MGD, le calcul prcdent
est eectu chaque tranche t. Toutefois, la complexit spatiale de ce modle (cf. table
2.1) ne permet pas toujours de se contenter dune telle mthode gnrique. Dans la partie
2.5, un algorithme dinfrence ad hoc est propos permettant dacclrer signicativement
le temps de calcul en exploitant les spcicits probabilistes des MGD.
2.3 Description probabiliste
Les paragraphes suivants abordent les mcanismes probabilistes dun MGD. Il sagit donc
de dtailler la construction des LPC intervenant dans la factorisation du modle initial
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
et du modle de transition. Pour des raisons dunication du formalisme, une description
probabiliste des tats, des temps de sjour et des actions est systmatiquement utilise.
2.3.1 Distribution initiale des tats du systme
La distribution initiale de ltat du systme dcrit la situation dans laquelle il se trouve
t = 1. On note
1
L
{X}
1
la LPC correspondante o X dsigne lensemble des tats
possibles et {X}
1
son domaine. Rappelons que |X| dsigne le cardinal de lensemble X et
donc ici le nombre des tats possibles pour le systme. Mathmatiquement, la LPC est
dnie pour tout x X par
P(X
1
= x) =
1
(x), (2.4)
o
1
(x) donne la probabilit que le systme se trouve initialement dans ltat x. La LPC
1
tant dnie sur une seule dimension, il est possible de la reprsenter sous la forme dun
vecteur stochastique
1
de |X| lments. La complexit spatiale de cette LPC est donne par
CS(
1
) = O(|X|) (cf. dnition 1.6).
Exemple 2.1
Reprenons lexemple 1.11 en laissant pour linstant de ct les variables reprsentant la
cadence Z et la qualit Y de la production. Lobjet de cet exemple et de ceux qui suivront
tout au long de cette partie est dillustrer comment appliquer un MGD la modlisation
du processus de dgradation dun systme simple.
La variable X
t
reprsente ltat de la machine de production valeur dans lensemble
X = {ok, dgrad, panne}. Considrons par exemple que la machine est neuve linstant
initial de sorte que
1
= P(X
1
) vrie :
1
X
1
ok dgrad panne
1 0 0
.
2.3.2 Distribution initiale des temps de sjour
La LPC associe la variable des temps de sjour S
1
caractrise la distribution des di-
rentes dures que le systme peut passer dans chacun des tats x X. La variable S
1
est
valeurs dans lensemble S = {1, 2, . . . , T
S
} o T
S
dsigne la dure maximum possible (en
units de temps) dans chaque tat. Cette LPC est note F
1
L
{S}
1
|{X}
1
et vrie pour
tout x X et tout s S
P(S
1
= s|X
1
= x) = F
1
(x, s), (2.5)
1
Un vecteur stochastique est un vecteur compos dlments de [0, 1] dont la somme gale 1.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
o F
1
(x, s) correspond la probabilit de rester s units de temps dans ltat x. La LPC
F
1
(x, s) est assimilable une matrice stochastique
2
de |X| lignes et |S| = T
S
colonnes. Sa
complexit spatiale, note CS(F
1
), est en O(|X|T
S
).
Le rle de cette distribution consiste caractriser le comportement dynamique de chacun
des tats du systme. La possibilit de spcier des lois de temps de sjour quelconques,
mais toujours discrtes et nies, permet de saranchir de la contrainte gomtrique lie aux
CM. Notons que dans ce cadre de travail les lois ne doivent pas ncessairement possder une
forme analytique spcique pourvu quune masse de probabilit soit donne pour chaque
temps de sjour s S, et ce, pour chaque tat x X. Lorsque des donnes de retour
dexprience sont disponibles, la phase dapprentissage de F
1
(cf. partie 2.4) peut alors se
faire sans a priori, vitant ainsi les problmes induits par un mauvais choix de modle.
Exemple 2.2
Il sagit prsent dajouter une variable de temps de sjour, note S
t
, au modle de
lexemple 1.11. Lunit de temps considre ici est le trimestre. On suppose galement que
des donnes de retour dexpriences sont disponibles indiquant quaucune machine nest res-
te plus de trois ans dans ltat ok. La borne T
S
est donc xe 12 trimestres ce qui implique
que la variable S
t
est valeurs dans le domaine S = {1, 2, . . . , 12}. Il ne reste plus qu
fournir une distribution de temps de sjour pour chacun des tat x {ok, dgrad, panne}.
Prenons par exemple les valeurs suivantes :
F
1
S
1
X
1
1 2 3 4 5 6 7 8 9 10 11 12
ok 0.20 0.12 0.08 0.04 0.04 0.06 0.08 0.12 0.16 0.08 0.02 0
dgrad 0.70 0.20 0.05 0.03 0.02 0 0 0 0 0 0 0
panne 0 0 0 0 0 0 0 0 0 0 0 1
Les valeurs numriques prcdentes rvlent que le systme a plutt tendance sortir de
ltat ok, soit autour du premier ou du deuxime trimestre de fonctionnement (dfauts
de jeunesse), soit au bout de deux ans environ (dfauts de vieillesse). Une fois en mode
dgrad le systme change rapidement dtat puisque dans 90% des cas le temps de sjour
avant une transition est de un ou deux trimestres. Le temps de sjour dans ltat panne
est considr ici comme tant dterministe et x la valeur maximale. Nous verrons dans
lexemple 2.4, traitant du modle de transition des tats du systme, que ce choix na pas
rellement dimportance car ltat panne est un tat absorbant.
Notons nanmoins que dans certaines situations (par exemple, peu ou pas de donnes) il
est utile de travailler partir dune loi de dure dnie analytiquement. La plupart des
lois classiquement utilises (ex : loi exponentielle, loi de Weibull, loi de Pareto . . .) sont
dnies sur un support continu et inni (en gnral R
+
) du fait de lhomognit frquente
2
Une matrice stochastique est une matrice compose dlments de [0, 1] o la somme de chaque ligne
gale 1.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
de la grandeur reprsente un temps. Ceci entrane une contradiction avec lhypothse
discrte et nie de lapproche propose. Le problme li la continuit peut se rsoudre en
eectuant une discrtisation de la loi continue considre ou en choisissant une loi de dure
en temps discret. Les travaux de Bracquemond (2001) et Bracquemond and Gaudoin (2003)
dtaillent les deux alternatives prcdentes. Pour ce qui est du support inni, la solution
retenue consiste eectuer une troncature de ce dernier par la borne T
S
. Cette opration
ne se fait pas sans perte dinformation comme le souligne la remarque 2.1. La question
est alors de choisir une borne T
S
susamment grande an de reprsenter correctement les
lois de temps de sjour, et susamment petite an de conserver une complexit spatiale
raisonnable. De manire gnrale si in ne lobjectif est de raliser des calculs dinfrence
sur un horizon T, choisir T
S
= T assure un calcul sans perte de prcision. Dans le cas o
il existe T
S
< T tel que pour tout x X et pour tout s > T
S
, F
1
(x, s) = 0, tronquer la loi
des temps de sjour par T
S
< T noccasionne aucune perte dinformation et garantit une
meilleur complexit spatiale.
Remarque 2.1 (Troncature dune loi de dure discrte et innie)
Soit W une variable alatoire valeurs dans N \ {0} = {1, 2, . . .} de loi de probabilit
p. Il est alors possible de dnir la variable alatoire discrte et nie S comme tant la
troncature de W sur lensemble S = {1, . . . , T
S
}. La loi de S est note p
T
S
L
{S}
et vrie
pour tout s S
p
T
S
(s) =
_
_
p(s) si 1 s < T
S
1
T
S
1
=1
p(s
) si s = T
S
0 sinon
.
Quantions prsent lerreur commise en eectuant la troncature prcdente. Selon le
critre de lErreur Absolue, note EA, entre la loi originale et la loi tronque, nous avons
EA(T
S
) =
s=1
[p(s) p
T
S
(s)[
=
T
S
s=1
[p(s) p
T
S
(s)
. .
=p(s)
[
. .
=0
+[p(T
S
) p
T
S
(T
S
)
. .
=1
P
T
S
1
s=1
p(s)
[ +
s=T
S
+1
[p(s) p
T
S
(s)
. .
=0
[
= 1
T
S
s=1
p(s) +
s=T
S
+1
p(s)
EA(T
S
) = 2(1 H(T
S
)), (2.6)
o H(T
S
) =
T
S
s=1
p(s) correspond lvaluation de la fonction de rpartition de W en T
S
.
Naturellement plus T
S
est grand, plus H(T
S
) tend vers un et EA(T
S
) vers zro.
Supposons que W suive une loi de Weibull discrte de type I (Khan et al. 1989). La loi de
W est alors dnie pour tout s N 0
p(s; , ) = H
,
(s 1) H
,
(s),
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
o H
,
(s) = 1e
(
s
correspond lexpression de la fonction de rpartition dune loi de

Weibull continue de paramtre dchelle et de paramtre de forme . Daprs lquation
(2.6) lerreur commise en tronquant la variable sur le domaine 1, 2, . . . , T
S
est gale
EA(T
S
) = 2e
(
T
S
.
2.3.3 Politique daction
La LPC associe la variable A
t
permet de dcrire la politique daction agissant sur
le systme. Lensemble des actions possibles est not /. Ce dernier est partitionn entre
lensemble des actions dclenchant une transition de ltat du systme, not /
X
, et celui des
actions laissant ltat du systme inchang, not /
X
. Cette LPC est note G
t
L
{A}
t
|{X}
t
et vrie pour tout x A et tout a /,
P(A
t
= a[X
t
= x) = G
t
(x, a). (2.7)
La valeur G
t
(x, a) donne la probabilit de slectionner laction a sachant que le systme se
trouve dans ltat x. Cette LPC peut se mettre sous la forme dune matrice stochastique
de [A[ lignes et [/[ colonnes. Notons que lorsque la politique daction ne dpend pas de t,
cest--dire G
t
= G, on parle de politique homogne. La complexit spatiale de G
t
, note
CS(G
t
), est en O([A[[/[).
Exemple 2.3
Dans lexemple 1.11, la LPC de la variable A
t
dnit la politique de maintenance du systme
en se basant sur lobservation de son tat. Autrement dit, cette variable correspond la
variable daction de la dnition prcdente, et / = aucune action, remise neuf. Les
valeurs numriques sont identiques celles prsentes dans lexemple 1.11, savoir pour
tout t 1 :
G
t
A
t
X
t
aucune action remise neuf
ok 1.00 0.00
dgrad 0.50 0.50
panne 0.00 1.00
Seule laction remise neuf est suppose avoir un impact sur ltat du systme. Par cons-
quent /
X
= remise neuf et /
X
= aucune action.
2.3.4 Modle de transition des tats du systme
Dans un premier temps, nous abordons uniquement le modle de transition des tats du
systme. Pour plus de clart, nous rservons la description du modle de transition des
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
temps de sjour la section 2.3.5. La LPC associe la variable dtat du systme X
t
lorsque t 2 caractrise la faon dont le systme passe dun tat un autre. Trois cas sont
distinguer selon le temps de sjour restant et laction slectionne linstant prcdent :
(i) Si le temps de sjour linstant t 1 est coul (S
t1
= 1), le systme subit une
transition. Si de plus laction calcule nagit pas sur le systme (A
t1
/
X
), nous
parlons de transition naturelle car cette dernire nest pas la consquence dune action
extrieure. Un nouvel tat courant x est choisi linstant t par lintermdiaire de la
LPC de transition naturelle du systme, note Q
sys
L
{X}
t
|{X}
t1
, vriant pour
tous x
, x A,
P(X
t
= x[X
t1
= x
, S
t1
= 1, A
t1
/
X
) = Q
sys
(x
, x). (2.8)
La valeur Q
sys
(x
, x) correspond la probabilit de passer de ltat x
ltat x
lors dune transition naturelle. Cette LPC peut scrire sous la forme dune matrice
stochastique carre de [A[ lignes et [A[ colonnes. En outre, la LPC Q
sys
ne dpend
pas de t, elle est donc homogne. Pour nir la complexit spatiale de Q
sys
, note
CS(Q
sys
), est en O([A[
2
).
(ii) Si le sjour dans ltat courant nest pas termin (S
t1
2) et que laction slectionne
nagit pas sur le systme (A
t1
/
X
), celui-ci reste dans le mme tat. Dans ce cas la
loi de transition est dterministe (cf. dnition 1.8) et correspond la LPC identit,
note I L
{X}
t
|{X}
t1
, vriant pour tous x
, x A,
P(X
t
= x[X
t1
= x
, S
t1
2, A
t1
/
X
) = I(x
, x) =
_
1 si x = x
0 sinon
. (2.9)
La dnition prcdente assure, avec une probabilit de 1, que le nouvel tat courant
x soit gal ltat prcdent x
. La complexit spatiale de I est identique celle de

Q
sys
, soit CS(I) = O([A[
2
).
(iii) Si laction slectionne agit sur le systme (A
t1
/
X
), une transition articielle, par
opposition la transition naturelle, est dclenche quel que soit le temps de sjour de
ltat courant. Le nouvel tat est alors choisi partir de la loi de transition articielle,
note Q
act
L
X
t
|{X,A
X
}
t1
, dnie pour tous x
, x A et tout a
/
X
par
P(X
t
= x[X
t1
= x
, S
t1
, A
t1
= a
) = Q
act
(x
, a
, x). (2.10)
La valeur Q
act
(x
, a
, x) correspond la probabilit de passer de ltat x
ltat x
sachant que laction dclenche au pas prcdent tait a
. Cette LPC peut scrire sous

la forme dune matrice stochastique de [A[[/
X
[ lignes et [A[ colonnes. La complexit
spatiale de cette LPC, note CS(Q
act
), est en O([A[
2
[/
X
[).
Le modle de transition global associ ltat du systme est donc caractris par la LPC,
note Q
L
{X}
t
|{X,S,A}
t1
, dnie pour tous x
, x A, tout s
o et tout a
/ par
P(X
t
= x[X
t1
= x
, S
t1
= s
, A
t1
= a
) =
Q
(x
, s
, a
, x) =
_
_
Q
sys
(x
, x) si s
= 1 et a
/
X
I(x
, x) si s
2 et a
/
X
Q
act
(x
, a
, x) si a
/
X
. (2.11)
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Notons que si lon calcule navement la complexit spatiale de Q
, il vient CS(Q
) =
O([A[
2
[o[[/[). Cette complexit diminue en tenant compte de la dnition par morceaux
donne dans lquation (2.11). Lespace ncessaire pour stocker Q
est alors gale lespace

ncessaire pour stoker Q
sys
, I et Q
act
, soit
CS(Q
) = CS(Q
sys
) +CS(I) +CS(Q
act
)
= 2O([A[
2
) +O([A[
2
[/
X
[)
CS(Q
) = O([A[
2
[/
X
[).
La rduction despace ainsi engendre est de lordre dun facteur [o[ = T
S
ce qui est bien
souvent non ngligeable puisque la borne T
S
a plutt tendance tre importante (cf. partie
2.3.2).
Exemple 2.4
Il sagit prsent de dnir la LPC de transition naturelle et la LPC de transition articielle
associes ltat de la machine de production considre. Le systme ntant pas suppos
auto-rparable, la LPC de transition naturelle possde deux contraintes :
1. Une transition vers un tat moins dgrad est impossible. La matrice reprsentant
cette loi est donc diagonale suprieure.
2. Ltat panne est absorbant. Cela signie quune fois entr dans cet tat, le systme
ne peut plus en sortir par une transition naturelle. Seule une transition articielle
(ici une opration de maintenance) peut ventuellement modier ltat du systme.
Prenons par exemple la LPC suivante qui tient compte des contraintes prcdentes :
Q
sys
X
t
X
t1
ok dgrad panne
ok 0 0.9 0.1
dgrad 0 0 1
panne 0 0 1
Les valeurs numriques proposes indiquent quaprs un sjour dans ltat ok, le systme
entre dans 90% des cas dans ltat dgrad contre 10% dans ltat panne directement. Si
le systme est dans ltat dgrad, une transition naturelle conduit forcment dans ltat
panne. Notons pour nir que la loi des temps de sjour associe ltat panne na aucune
importance ici. En eet ltat tant absorbant, quel que soit le temps de sjour slectionn,
le systme reste en panne lors dune transition naturelle. La distribution associe la dure
dans ltat panne propose dans lexemple 2.2 est donc totalement arbitraire.
La loi de transition articielle intervient uniquement lors du dclenchement de laction
remise neuf puisque /
X
= remise neuf. On suppose dans ce cas que le systme
retourne dans ltat ok quel que soit ltat dans lequel il se trouve. La LPC Q
act
est dnie
par :
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Q
act
X
t
X
t1
A
t1
ok dgrad panne
ok remise neuf 1 0 0
dgrad remise neuf 1 0 0
panne remise neuf 1 0 0
Remarquons que la LPC de transition articielle Q
act
est souvent dterministe comme le
montre lexemple prcdent, sans que cela soit une obligation.
Lorsque il ny a ni transition naturelle, ni transition articielle, le systme reste dans le
mme tat ce qui sexprime ici par la LPC identit suivante :
I
X
t
X
t1
ok dgrad panne
ok 1 0 0
dgrad 0 1 0
panne 0 0 1
2.3.5 Modle de transition du temps de sjour
La LPC associe la variable du temps de sjour S
t
gre lvolution du temps pass dans
les tats du systme quune transition (naturelle ou articielle) ait eu lieu, ou non, entre
les tranches t 1 et t (t 2).
(i) Si une transition a eu lieu (S
t1
= 1 ou A
t1
/
X
), le systme commence un
nouveau sjour dans ltat slectionn. La loi de ce temps de sjour est donne par la
LPC homogne, note F
sys
L
{S}
t
|{X}
t1
{X}
t
, vriant pour tous x
, x A et tout
s o,
P(S
t
= s[X
t1
= x
, S
t1
= 1 ou A
t1
/
X
, X
t
= x) = F
sys
(x
, x, s). (2.12)
La valeur F
sys
(x
, x, s) dsigne la probabilit de passer s units de temps dans ltat

x sachant que le systme se trouvait dans ltat x
. Cette LPC peut scrire sous la

forme dune matrice stochastique de [A[
2
lignes et T
S
colonnes. La complexit spatiale
de F
sys
, note CS(F
sys
), est en O([A[
2
T
S
).
Il est important de noter que toutes les remarques eectues propos de la LPC
des temps de sjour initiaux F
1
(cf. partie 2.3.2) sont valables pour F
sys
. Lunique
dirence entre ces deux LPC provient du fait que F
sys
dpend galement de ltat
prcdent x
. Il arrive frquemment que cette dpendance soit omise pour viter des
problmes de sur-paramtrisation, rduire la complexit ou encore lorsque peu de
donnes sont disponibles pour lapprentissage. Dans ce cas F
sys
est identique F
1
de
sorte que pour tous x
, x A et tout s o, F
sys
(x
, x, s) = F
1
(x, s).
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
(ii) Si aucune transition ne sest produite (S
t1
2 et A
t1
/
X
). Le temps de sjour
courant est dcompt dune unit de manire dterministe. La LPC dterministe, no-
te C L
{S}
t
|{S\{1}}
t1
, vrie pour tout s
2, 3, . . . , T
S
et tout s 1, 2, . . . , T
S
,
P(S
t
= s[X
t1
, S
t1
= s
, A
t1
/
X
, X
t
) = C(s
, s) =
_
1 si s = s
1
0 sinon
. (2.13)
La dnition prcdente assure que si le temps de sjour restant linstant t 1 est
gale s
2, linstant t ce dernier sera gale s
1. La complexit spatiale de
C, note CS(C), est en O(T
2
S
).
Le modle de transition global associ aux temps de sjour est donc caractris par la LPC,
note F
L
{S}
t
|{X,S,A}
t1
setX
t
, dnie pour tous x
, x A, tous s
, s o et tout a
/
par
P(S
t
= s[X
t1
= x
, S
t1
= s
, A
t1
= a
, X
t
= x) =
F
(x
, s
, a
, x, s) =
_
F
sys
(x
, x, s) si s
= 1 ou a
/
X
C(s
, s) si s
2 et a
/
X
. (2.14)
Notons quun stockage naf de F
conduit une complexit spatiale en O([A[

2
[/[T
2
S
).
A linstar de Q
(cf. partie 2.3.4), il est possible de rduire cette complexit en stockant

uniquement F
sys
et C, soit
CS(F
) = CS(F
sys
) +CS(C) = O([A[
2
T
S
) +O(T
2
S
) = O(T
S
([A[
2
+T
S
)).
Exemple 2.5
De faon conserver une certaine simplicit, la loi des temps de sjour pour t 2 est
suppose indpendante de ltat prcdent et on pose pour tous x
, x A et tout s o,
F
sys
(x
, x, s) = F
1
(x, s). En poursuivant lexemple 2.2, cela donne numriquement :
F
sys
S
t
X
t1
X
t
1 2 3 4 5 6 7 8 9 10 11 12
ok ok 0.20 0.12 0.08 0.04 0.04 0.06 0.08 0.12 0.16 0.08 0.02 0
dgrad ok 0.20 0.12 0.08 0.04 0.04 0.06 0.08 0.12 0.16 0.08 0.02 0
panne ok 0.20 0.12 0.08 0.04 0.04 0.06 0.08 0.12 0.16 0.08 0.02 0
ok dgrad 0.70 0.20 0.05 0.03 0.02 0 0 0 0 0 0 0
dgrad dgrad 0.70 0.20 0.05 0.03 0.02 0 0 0 0 0 0 0
panne dgrad 0.70 0.20 0.05 0.03 0.02 0 0 0 0 0 0 0
ok panne 0 0 0 0 0 0 0 0 0 0 0 1
dgrad panne 0 0 0 0 0 0 0 0 0 0 0 1
panne panne 0 0 0 0 0 0 0 0 0 0 0 1
La LPC dterministe assurant le dcompte du temps de sjour correspond ici
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
C
S
t
S
t1
1 2 3 4 5 6 7 8 9 10 11 12
2 1 0 0 0 0 0 0 0 0 0 0 0
3 0 1 0 0 0 0 0 0 0 0 0 0
4 0 0 1 0 0 0 0 0 0 0 0 0
5 0 0 0 1 0 0 0 0 0 0 0 0
6 0 0 0 0 1 0 0 0 0 0 0 0
7 0 0 0 0 0 1 0 0 0 0 0 0
8 0 0 0 0 0 0 1 0 0 0 0 0
9 0 0 0 0 0 0 0 1 0 0 0 0
10 0 0 0 0 0 0 0 0 1 0 0 0
11 0 0 0 0 0 0 0 0 0 1 0 0
12 0 0 0 0 0 0 0 0 0 0 1 0
2.3.6 Remarques
Complexit spatiale
Daprs les descriptions donnes dans les paragraphes prcdents, un MGD est un 1-MGPM
possdant des mcanismes probabilistes singuliers. Cette spcicit provient des deux lois
de transition qui ont la particularit dtre :
dnies par morceaux, rduisant ainsi la complexit spatiale du modle ;
en partie dterministe, orant la possibilit dacclrer les calculs dinfrence (cf. partie
2.5).
Un MGD est donc caractris par les LPC
1
, F
1
, G
t
, Q
sys
, Q
act
et F
sys
. La table 2.1
propose un rcapitulatif de la description probabiliste dun MGD en prcisant lordre des
complexits spatiales sous-jacentes.
LPC Description CS
Modle initial
1
tat du systme O(|X|)
F
1
Temps de sjour O(|X|T
S
)
Modle Q
sys
Transition naturelle O(|X|
2
)
de transition Q
act
Transition articielle O(|X|
2
|A
X
|)
I Identit O(|X|
2
)
F
sys
Temps de sjour O(|X|
2
T
S
)
C Dcompte O(T
2
S
)
G
t
Politique daction O(|X||A|)
Tab. 2.1 Dtail de la complexit spatiale dun MGD.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
La complexit spatiale dun MGD, note CS(MGD), se dduit alors par addition des
complexits locales. Il vient par consquent
CS(MGD) = O(|X|
2
T
S
|A| +T
2
S
). (2.15)
Lien avec les chanes de Markov
Dun point de vue qualitatif, rappelons que la structure MGD est une gnralisation de
la structure CM. La dirence entre ces deux structures se situe uniquement au niveau
de la variable du temps de sjour. Par ailleurs, il est important de noter que tout rsultat
thorique tabli pour les MGD sapplique aux CM. En eet, il est possible dinhiber leet
de la variable S
t
de manire probabiliste an de se ramener une CM. Pour ce faire,
il sut de considrer un ensemble de temps de sjour S rduit au singleton {1}. Par
consquent, seul un temps de sjour dune unit de temps est autoris, ce qui a pour
eet de dclencher une transition naturelle chaque pas de temps. Ds lors, le processus
caractrisant lvolution naturelle lie tat du systme nest plus contrl que par la
loi initiale et la LPC de transition naturelle Q
sys
. Plus formellement, lorsque S = {1},
les LPC F
1
et F
sys
deviennent deux potentiels unitaires tels que pour tous x
, x X,
F
1
(x, 1) = F
sys
(x
, x, 1) = 1. Ces deux LPC ninuencent donc plus les calculs probabilistes

dans ce cas. Enn, de lquation (2.15), nous en dduisons la complexit spatiale dun MGD
rduit une CM en xant T
S
= 1. Nous obtenons alors
CS(CM) = O(|X|
2
|A|).
Illustration
Notons quil est bien videmment possible dajouter des variables la structure originale
reprsente en gure 2.2. Dans ce cas les LPC dcrites prcdemment doivent tenir compte
des changements apports par les relations de dpendance induites par la nouvelle structure
graphique. Lexemple 2.6 et en particulier la gure 2.3 donnent une illustration o la
structure MGD originale est complte par deux variables : une variable Z
t
relative au
contexte du systme et une variable Y
t
relative une dcision de conformit de la production
du systme.
Exemple 2.6
La gure 2.3 reprsente le MGD associ lexemple 1.11. Dun point de vue graphique,
seule la variable de temps de sjour a t ajoute par rapport au modle original donn en
gure 1.4. Les dirences se situent essentiellement dans la description probabiliste fournie
dans les exemples de la partie 2.3.
Il est important de noter que la dpendance de ltat du systme et des temps de sjour avec
la cadence de production doit tre prise en compte dans la dnition des LPC. Autrement
dit il est ncessaire de modier les LPC
1
, F
1
, Q
sys
et F
sys
de manire dnir le
comportement du systme en cadence normale et rapide. On suppose que les LPC proposes
prcdemment sont caractristiques de la cadence normale. Compltons ces lois pour la
cadence rapide en prenant par exemple les valeurs suivantes :
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
1
X
1
Z
1
ok dgrad panne
normale 1 0 0
rapide 1 0 0
F
1
S
1
Z
1
X
1
1 2 3 4 5 6 7 8 9 10 11 12
normale ok 0.20 0.12 0.08 0.04 0.04 0.06 0.08 0.12 0.16 0.08 0.02 0
rapide ok 0.35 0.22 0.16 0.11 0.09 0.03 0.02 0.01 0.01 0 0 0
normale dgrad 0.70 0.20 0.05 0.03 0.02 0 0 0 0 0 0 0
rapide dgrad 0.90 0.07 0.03 0 0 0 0 0 0 0 0 0
normale panne 0 0 0 0 0 0 0 0 0 0 0 1
normale panne 0 0 0 0 0 0 0 0 0 0 0 1
Q
sys
X
t
X
t1
Z
t
ok dgrad panne
ok normale 0 0.9 0.1
dgrad normale 0 0 1
panne normale 0 0 1
ok rapide 0 0.7 0.3
dgrad rapide 0 0 1
panne rapide 0 0 1
F
sys
S
t
X
t1
Z
t
X
t
1 2 3 4 5 6 7 8 9 10 11 12
ok normale ok 0.20 0.12 0.08 0.04 0.04 0.06 0.08 0.12 0.16 0.08 0.02 0
dgrad normale ok 0.20 0.12 0.08 0.04 0.04 0.06 0.08 0.12 0.16 0.08 0.02 0
panne normale ok 0.20 0.12 0.08 0.04 0.04 0.06 0.08 0.12 0.16 0.08 0.02 0
ok rapide ok 0.35 0.22 0.16 0.11 0.09 0.03 0.02 0.01 0.01 0 0 0
dgrad rapide ok 0.35 0.22 0.16 0.11 0.09 0.03 0.02 0.01 0.01 0 0 0
panne rapide ok 0.35 0.22 0.16 0.11 0.09 0.03 0.02 0.01 0.01 0 0 0
ok normale dgrad 0.70 0.20 0.05 0.03 0.02 0 0 0 0 0 0 0
dgrad normale dgrad 0.70 0.20 0.05 0.03 0.02 0 0 0 0 0 0 0
panne normale dgrad 0.70 0.20 0.05 0.03 0.02 0 0 0 0 0 0 0
ok rapide dgrad 0.90 0.07 0.03 0 0 0 0 0 0 0 0 0
dgrad rapide dgrad 0.90 0.07 0.03 0 0 0 0 0 0 0 0 0
panne rapide dgrad 0.90 0.07 0.03 0 0 0 0 0 0 0 0 0
ok normale panne 0 0 0 0 0 0 0 0 0 0 0 1
dgrad normale panne 0 0 0 0 0 0 0 0 0 0 0 1
panne normale panne 0 0 0 0 0 0 0 0 0 0 0 1
ok normale panne 0 0 0 0 0 0 0 0 0 0 0 1
dgrad normale panne 0 0 0 0 0 0 0 0 0 0 0 1
panne normale panne 0 0 0 0 0 0 0 0 0 0 0 1
Les tables de probabilits proposes prcdemment retranscrivent le fait que le systme se
dgrade plus vite en cadence rapide quen cadence normale. Dans le premier cas les temps
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
2.4 Apprentissage des LPC et simulation de trajectoire 67
de sjour sont en eet souvent plus courts et les transitions de ltat ok directement dans
ltat panne sont plus frquentes.
(a) Modle initial (b) Modle de transition
Fig. 2.3 MGD associ au systme de production introduit dans lexemple 1.11.
Les variables correspondant une structure MGD originale sont colores en bleu.
Les gures (a) et (b) donnent respectivement les structures du modle initial et du
modle de transition.
2.4 Apprentissage des LPC et simulation de trajectoire
Nous abordons prsent lapprentissage des LPC partir de donnes de retour dexp-
riences compltes et la simulation de donnes. Des lments sur le format des donnes
attendues sont prsents dans la partie 2.4.1. Lapplication de la mthode du maximum de
vraisemblance (cf. partie 1.3.3) pour lapprentissage des LPC associes un MGD est d-
taille dans la partie 2.4.2. Notons quici la question se limite lapprentissage du processus
dvolution naturelle du systme. Lestimation de la politique daction et des transitions ar-
ticielles nest pas traite, car suppose comme tant des paramtres dentre du systme.
La partie 2.4.3 prsente un algorithme de type Monte-Carlo pour simuler des trajectoires
correspondant au systme modlis par un MGD.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
2.4.1 Donnes attendues
Lapprentissage des LPC est ralis partir dexemples de trajectoires naturelles issues du
systme tudi. Dans le cas des MGD, une trajectoire naturelle correspond lobservation
dune squence dtats du systme et des temps de sjour associs sans tenir compte des
transitions articielles. Si lon se place dans le domaine de la abilit, cela pourrait signier
que lon observe le systme vieillir sans jamais intervenir jusqu la panne.
Le nombre de trajectoires disponibles est not K. Pour chaque trajectoire k, une squence
de N
k
transitions naturelles est observe. Au cours de la n
k
-me transition, le nouvel tat
courant x
n
k
X et son temps de sjour s
n
k
{1, 2, . . . , T
S
} sont donns. Lobservation
initiale du systme correspond la premire transition. La structure des donnes attendues
est illustre dans la table 2.2.
Transition tat courant Temps de sjour
Trajectoire 1 1
1
x
1
1
s
1
1
.
.
.
.
.
.
.
.
.
N
1
x
N
1
s
N
1
.
.
.
.
.
.
.
.
.
.
.
.
Trajectoire k 1
k
x
1
k
s
1
k
.
.
.
.
.
.
.
.
.
N
k
x
N
k
s
N
k
.
.
.
.
.
.
.
.
.
.
.
.
Trajectoire K 1
K
x
1
K
s
1
K
.
.
.
.
.
.
.
.
.
N
K
x
N
K
s
N
K
Tab. 2.2 Suite de K trajectoires associes lvolution naturelle dun systme
reprsent par un MGD. La notation 1
k
dsigne lindice de la premire transition
(tat initial du systme) de la k-me trajectoire.
Exemple 2.7
La table 2.3 donne un exemple de trois trajectoires supposes issues du systme de pro-
duction dcrit prcdemment. Remarquons que linformation sur la cadence de production
a t ajoute de par son inuence sur ltat et les temps de sjour du systme.
2.4.2 Estimation du maximum de vraisemblance
Il sagit prsent de calculer les estimations, notes
1
,

F
1
,

Q
sys
et

F
sys
, associes respecti-
vement ltat et aux temps de sjour initiaux, au modle de transition naturelle des tats
et aux temps de sjour pour t 2. La mthode du maximum de vraisemblance prsente
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
2.4 Apprentissage des LPC et simulation de trajectoire 69
Transition Cadence tat courant Temps de sjour (en trimestres)
Traj. 1 1 normale ok 11
2 normale dgrad 2
3 normale panne 12
Traj. 2 1 rapide ok 3
2 rapide panne 12
Traj. 3 1 rapide ok 5
2 normale dgrad 3
3 normale panne 12
Tab. 2.3 Trois trajectoires associes lvolution naturelle du systme de pro-
duction introduit initialement dans lexemple 1.11. Dans ce contexte le nombre de
trajectoires K = 3 et le nombre de transitions dans chaque trajectoire valent respec-
tivement N
1
= 3, N
2
= 2 et N
3
= 3.
dans la partie 1.3.3 est applique aux donnes de la table 2.2. Pour ce faire les notations
suivantes sont introduites pour tous x
, x X et tout s {1, . . . , T
S
} :
N
ini
x
=
K
k=1
1I(x
1
= x) correspond au nombre de fois o le systme se trouvait initialement
dans ltat x;
N
ini
x,s
=
K
k=1
1I(x
1
= x)1I(s
1
= s) correspond au nombre de fois o le systme a pass s
units de temps dans ltat initial x;
N
x
,x
=
K
k=1
N
k
n
k
=2
1I(x
n
k
1
= x
)1I(x
n
k
= x) dsigne le nombre de transitions entre les
tats x
et x;
N
x
,x,s
=
K
k=1
N
k
n
k
=2
1I(x
n
k
1
= x
)1I(x
n
k
= x)1I(s
n
k
= s) dsigne le nombre de fois o le
systme est rest s units de temps dans ltat x alors quil se trouvait dans ltat x
.
En appliquant lquation (1.5) au cas prsent, les estimations du maximum de vraisem-
blance vrient pour tous x
, x X et tout s {1, . . . , T
S
}

1
(x) =
N
ini
x
K
,

F
1
(x, s) =
N
ini
x,s
K
,
Q
sys
(x
, x) =
N
x
,x
X
N
x
,x
,

F
sys
(x
, x, s) =
N
x
,x,s
,xX
N
x
,x,s
.
(2.16)
2.4.3 Simulation de trajectoires
Le principe de la simulation dune trajectoire est voqu de manire gnrale la n de la
partie 1.4.3. Cette dmarche est en quelque sorte linverse de celle voque prcdemment
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
lors de lapprentissage des LPC. En eet, il est question ici de simuler des donnes partir
des paramtres probabilistes du MGD. Lalgorithme 2.1 est une application de lalgorithme
gnrique 1.4 au cas particulier des MGD. Il sagit donc dune mthode de type Monte-
Carlo permettant dchantillonner une trajectoire de longueur T partir des LPC
1
, F
1
,
Q
sys
, Q
act
, F
sys
et G
t
. La complexit algorithmique de cette mthode est par consquent
en
O(T(|X| +|A| +|T
S
|)). (2.17)
Notons par ailleurs que lintrt de cet algorithme rside dans le fait que certains tirages
alatoires ne sont pas ncessaires de par les proprits dterministes du modle. Bien que
cela ne change thoriquement pas lordre du temps de calcul de lalgorithmique 2.1, son
excution est en pratique acclre de manire signicative.
Algorithme 2.1 : Simulation dune trajectoire dun systme reprsent par un MGD.
Entres :
1. Un MGD vriant la description probabiliste donne dans la partie 2.3 ;
2. La taille de la trajectoire simuler, note T.
Sortie : Une trajectoire de taille T constitue chaque instant t de ltat x
t
du
systme, du temps de sjour restant s
t
et de laction slectionne a
t
.
// Initialisation de la trajectoire
Gnrer x
1

1
;
Gnrer s
1
F
1
(x
1
, :);
Gnrer a
1
G
1
(x
1
, :);
pour chaque t = 2, . . . , T faire
si a
(t1)
A
X
alors
// Cas o` u laction nagit pas sur le syst` eme
si s
(t1)
= 1 alors
// Transition naturelle
Gnrer x
t
Q
sys
(x
(t1)
, :);
Gnrer s
t
F
sys
(x
(t1)
, x
t
, :);
sinon
// Transition d eterministe
x
t
x
(t1)
;
s
t
s
(t1)
1;
n
sinon
// Transition artificielle
Gnrer x
t
Q
act
(x
(t1)
, a
(t1)
, :);
Gnrer s
t
F
sys
(x
(t1)
, x
t
, :);
n
n
La simulation de trajectoires savre tre un premier outil intressant pour tudier le com-
portement dun systme dynamique. Il est en eet possible deectuer des calculs dinf-
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
2.5 Infrence probabiliste exacte 71
rence probabiliste approchs partir de plusieurs trajectoires an destimer des indicateurs
caractrisant le systme. Toutefois, la prcision des calculs tant directement lie au nombre
de simulations ralises (cf. n de la partie 1.3.4), il est prfrable lorsque cela est possible
dutiliser une mthode dinfrence exacte.
2.5 Infrence probabiliste exacte
Cette partie traite du problme de linfrence exacte dans un MGD. Nous nous intressons
en particulier au calcul de la probabilit dune trajectoire quelconque du systme.
2.5.1 Probabilit dune trajectoire
Plaons nous dans un premier temps dans le cas gnral dun n-MGPM reprsentant un
processus (X
t,1
, . . . , X
t,D
) o chaque variable X
t,d
est valeurs dans X
d
. Au sens large,
une trajectoire de longueur T issue de ce n-MGPM est dnie comme tant une suite de
sous-ensembles (

X
t,1
, . . . ,

X
t,D
)
1tT
telle que pour tout t et tout d,

X
t,d
X
d
.
Par consquent, une trajectoire issue dun MGD est caractrise par une suite de domaines
(

X
t
,

S
t
,

A
t
)
1tT
telle que

X
t
,

S
t
et

A
t
reprsentent respectivement des sous-ensembles
dtats du systme, de temps de sjour et dactions. En posant
t
= (

X
t
,

S
t
,

A
t
), =
(
t
)
1tT
dsigne une trajectoire, issue dun MGD, quelconque et on note P() [0, 1]
sa probabilit dnie par
P() = P(X
1

X
1
, S
1

S
1
, A
1

A
1
, . . . , X
T

X
T
, S
T

S
T
, A
T

A
T
), (2.18)
avec pour tout t,

X
t
X,

S
t
S et

A
t
A. An de simplier lexpression (2.18), lcriture
suivante est admise :
P() = P(
1
,
2
, . . . ,
T
).
La probabilit P() dpend directement des valeurs contenues dans les LPC caractrisant
le MGD sous-jacent. Un exemple de trajectoire de longueur 3 est donn dans lexemple 2.8.
Exemple 2.8 (Trajectoire issue dun MGD)
Considrons un MGD classique reprsentant le processus (X
t
, S
t
, A
t
)
t1
dont lensemble
des tats est X = {x
1
, x
2
}, lensemble des temps de sjour S = {1, 2, 3} et lensemble des
actions A = {a
1
, a
2
, a
3
, a
4
}. Soit une trajectoire de longueur T = 3 dnie par :
= ((X, {3, 4}, {a
3
}
. .
=
1
), ({x
2
}, {2, 3}, {a
2
, a
3
}
. .
=
2
), (X, {1, 2}, {a
1
}
. .
=
3
)).
La trajectoire dcrit
un systme initialement dans un tat quelconque avec un temps de sjour de 3 ou 4
units et o laction a
3
est slectionne ;
t = 2, le systme est dans ltat x
2
avec un temps de sjour gal 2 ou 3 units et le
dclenchement de laction a
2
ou a
3
;
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
enn t = 3, le systme se retrouve dans un tat quelconque avec un temps de sjour
de 1 ou 2 units et laction a
1
slectionne.
La question souleve ici concerne lvaluation de la probabilit (2.18). Pour ce faire, com-
menons par introduire quelques notations. On dsigne par
t
= P(X
t
, S
t
, A
t
) la distribu-
tion la tranche t +1 de linterface gauche dun MGD. Soit = (
t
)
1tT
une trajectoire
issue dun MGD, on note
t
le potentiel dni pour tout x X, tout s S et tout a A
par
t
(x, s, a) =
_

1
(x, s, a) si t = 1,
P(
1
, . . . ,
t1
, X
t
= x, S
t
= s, A
t
= a) sinon
. (2.19)
Notons que la distribution de linterface gauche
t
se dduit partir du potentiel
t
en
xant la trajectoire = ()
1
telle que pour tout = 1, 2, . . . , t 1,
= (X, S, A).
Par ailleurs, le potentiel
t
permet galement de calculer la probabilit de la trajectoire
jusqu ltape t en eectuant une sommation sur le domaine {

X
t
,

S
t
,

A
t
}.
Lalgorithme 2.2 dcrit une mthode itrative gnrique permettant de dduire la probabi-
lit dune trajectoire quelconque issue dun MGD. Le calcul de la trajectoire dune tranche
lautre est assur par la proprit de linterface gauche donne par lquation (2.1). Tou-
tefois lalgorithme ne prcise pas comment est ralis le calcul de
t
(cf. algorithme 2.2,
ligne ). Ceci est lobjet des deux paragraphes suivants qui prsentent respectivement une
mthode gnrique nave et une mthode ad hoc plus rapide pour mener bien ce calcul.
Algorithme 2.2 : Algorithme itratif gnrique calculant la probabilit dune tra-
jectoire issue dun MGD quelconque.
Entres :
1. Un ensemble de LPC associ un MGD (cf. partie 2.3) caractrisant le processus
(X
t
, S
t
, A
t
)
t1
, o les variables X
t
, S
t
et A
t
sont respectivement valeur dans X, S
et A;
2. Une trajectoire = (
t
)
1tT
de longueur T telle que
t
= (

X
t
,

S
t
,

A
t
) avec pour
tout t,

X
t
X,

S
t
S et

A
t
A.
Sortie : La probabilit de la trajectoire .
Calculer
1
=
1
(x)F
1
(x, s)G
1
(x, a);
Calculer P(
1
) =
x

X
1
1
(x)
S
1
F
1
(x, s)
a

A
1
G
1
(x, a);
Calculer
t
;
En dduire P(
1
, . . . ,
t
) =
x

X
1
S
1
a

A
1
t
(x, s, a);
n
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
2.5.2 Calcul naf
Le calcul naf consiste adapter la mthode itrative de calcul de linterface gauche
t
(cf. quation (2.3)) . Le rsultat obtenu est prsent dans la proposition suivante.
Proposition 2.1
Soit (X
t
, S
t
, A
t
)
t1
un processus engendr par un MGD (cf. partie 2.3). Considrons ga-
lement une trajectoire de longueur T, note = (
t
)
1tT
= (

X
t
,

S
t
,

A
t
)
1tT
avec pour
tout t,

X
t
X,

S
t
S et

A
t
A. Dans ce cas,
t
est dni rcursivement pour tout
x X, tout s S et tout a A par
t
(x, s, a) =
_
1
(x)F
1
(x, s)G
1
(x, a) si t = 1,
G
t
(x, a)

X
t1
s
S
t1
a

A
t1
t1
(x
, s
, a
)Q
(x
, s
, a
, x)F
(x
, s
, a
, x, s) si t 2 .
(2.20)
La dmonstration de cette proposition, donne dans lannexe E.2, sobtient par rcur-
rence en appliquant lhypothse markovienne dordre un et la proprit de factorisation
(cf. equation 2.3) aux MGD. Ce rsultat est directement utilisable dans lalgorithme 2.2
pour le calcul de
t
. Notons que cette mthode correspond ladaptation de lalgorithme
gnrique dlimination au problme de lvaluation de la probabilit dune trajectoire dans
un MGD. Il sagit donc de la solution algorithmique de rfrence pour ce problme. Or,
il savre quen pratique cette dernire est rapidement inutilisable de par son importante
complexit algorithmique, comme le montre la proposition suivante.
Proposition 2.2
En reprenant les hypothses et le rsultat de la proposition 2.1, la complexit algorithmique
du calcul de
t
, CA
nave
(
t
) est de lordre :
CA
nave
(
t
) =
_
_
O(|X|T
S
|A|) si t = 1,
O(|X|
2
T
2
S
|A|) si t 2
.
Ce rsultat de complexit algorithmique (cf. annexe E.2) repose essentiellement sur les
propositions 1.1 et 1.2 appliques aux calculs intervenant dans la proposition 2.1. Par
consquent, partir dune trajectoire de longueur T, la complexit de lalgorithme 2.2
reposant sur la proposition 2.1 est de lordre de O(T|X|
2
T
2
S
|A|) oprations lmentaires.
Notons en particulier que la vitesse dexcution de cette mthode dpend de la borne T
S
leve au carr. Or, nous avons vu dans la partie 2.3.2 que cette dernire pouvait tre borne
par la longueur de la trajectoire T. Autrement dit, lordre de la complexit algorithmique
dans le pire des cas passe en O(T
3
|X|
2
|A|). En pratique, cette mthode devient inutilisable
ds que T 100.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
2.5.3 Calcul ad hoc
Lobjectif des paragraphes suivants est daner la mthode prcdente de faon rduire
la complexit algorithmique du rsultat de la proposition 2.1. Pour ce faire, nous exploitons
les proprits probabilistes des LPC Q
et F
, savoir la fois leur caractre dni par

morceaux et leur composante dterministe. Nous obtenons alors le rsultat suivant :
Proposition 2.3
Reprenons les hypothses de la proposition 2.1 et les dnitions de Q
et F
donnes
respectivement par les quations (2.11) et (2.14). Supposons galement que chaque sous-
ensemble dactions

A
t
A soit partitionn de telle sorte que

A
t
=

A
X
t

A
X
t
avec

A
X
t
A
X
et

A
X
t
A
X
. Le calcul de
t
, t 2 se rcrit alors pour tout x X, tout s S et tout
a A comme suit :
t
(x, s, a) = [
sys
t
(x, s) +
det
t
(x, s) +
act
t
(x, s)]G
t
(x, a),
avec
sys
t
(x, s) =
_

X
t1
Q
sys
(x
, x)F
sys
(x
, x, s)

A
X
t1
t1
(x
, 1, a
) si 1

S
t1
0 sinon
,
det
t
(x, s) =
_

A
X
t1
t1
(x, s + 1, a
) si x

X
t1
et s

S
t1
\ {T
S
}
0 sinon
.
et enn,
act
t
(x, s) =

X
t1
F
sys
(x
, x, s)

A
X
t1
Q
act
(x
, a
, x)
S
t1
t1
(x
, s
, a
),
La dmonstration de cette proposition (cf. annexe E.2) est fonde la fois sur le caractre
dni par morceaux des LPC Q
et F
, ainsi que sur leur composante dterministe

respective (cf. quations 2.11 et 2.14).
Comme dans le cas du calcul naf de
t
, il est possible dvaluer la complexit algorith-
mique lie au rsultat de la proposition 2.3.
Proposition 2.4
En reprenant les hypothses et le rsultat de la proposition 2.3, la complexit algorithmique
du calcul de
t
, t 2 est de lordre de
CA
adhoc
(
t
) = O(|X|T
S
|A| +|X|
2
|A| +|X|
2
T
S
),
oprations lmentaires.
La dmontration de cette proposition (cf. annexe E.2) relve exactement du mme principe
que celle de la proposition 2.2. Ce rsultat montre que si lon applique la proposition 2.3
dans lalgorithme 2.2, la complexit algorithmique de ce dernier passe un ordre de
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
O(|X|T
2
|A| +|X|
2
T|A| +|X|
2
T
2
) oprations lmentaires pour le calcul de la probabilit
dune trajectoire de longueur T. Compare lapproche nave, la mthode ad hoc conduit
une rduction du temps de calcul dun facteur T
S
chaque itration. Cette amlioration
permet en pratique de raliser des calculs probabilistes sur de plus grandes trajectoires et
surtout avec une borne T
S
bien suprieure en pratique ( 10000).
Enn, il est intressant dillustrer les rsultats thoriques prsents prcdemment sur
la complexit algorithmique du calcul de
t
. Pour ce faire, nous comparons le temps
dexcution moyen dune itration de lalgorithme 2.2 en fonction du nombre dtats |X|
(cf. gure 2.4), de la borne T
S
(cf. gure 2.5) et du nombre dactions |A| (cf. gure 2.6), et
ce, en utilisant la mthode nave (cf. proposition 2.1), la mthode ad hoc (cf. proposition
2.3) et une mthode approche par chantillonnage (cf. algorithme 2.1). Dans les rsultats
prsents, les trajectoires considres dans les mthodes dinfrence sont de longueur T =
10. Sur chaque gure, la taille des deux paramtres constants est gale 25 et le nombre
de trajectoires gnres pour la mthode dchantillonnage est x 100.
0 20 40 60 80 100 120 140 160 180 200
0
0.5
1
1.5
2
2.5
3
Nombre dtats |X|
T
e
m
p
s

(
s
)
chantillonnage
nave
adhoc
Fig. 2.4 Temps moyen du calcul dune itration de lalgorithme 2.2 en fonction
de |X| (T
S
= |A| = 25) et de la mthode dinfrence utilise.
Nous retrouvons sur ces gures des rsultats conformes ce qui est prvu par la thorie. Le
temps dexcution de la mthode nave est dallure parabolique en fonction de |X| et T
S
, et
dallure linaire en fonction de |A|. Avec la mthode ad hoc, nous vrions un changement
dallure de la complexit en fonction de T
S
qui devient linaire, presque constante. Ceci
sexplique par le fait que lvolution probabiliste des temps de sjour est en grande partie
dterministe. En pratique lors des calculs dinfrence ceci se traduit par une suppression
de calculs arithmtiques au prot de tests logiques, beaucoup moins coteux en temps
dexcution. Pour des raisons similaires, bien que la complexit algorithmique en fonction
de |X| et |A| soit du mme ordre avec les deux mthodes, le temps dexcution augmente
plus lentement en utilisant la mthode ad hoc.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
0 20 40 60 80 100 120 140 160 180 200
0
0.5
1
1.5
2
2.5
3
Borne T
S
T
e
m
p
s

(
s
)
chantillonnage
nave
adhoc
de T
S
(|X| = |A| = 25) et de la mthode dinfrence utilise.
0 20 40 60 80 100 120 140 160 180 200
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
Nombre dactions |A|
T
e
m
p
s

(
s
)
chantillonnage
nave
adhoc
de |A| (|X| = T
S
= 25) et de la mthode dinfrence utilise.
Pour nir, les rsultats concernant la mthode dchantillonnage sont conformes avec la
complexit thorique donne par (2.17). Quelque soit le paramtre considr, lvolution
du temps de calcul est linaire et de pente identique. Rappelons toutefois que la prcision
dune telle mthode volue lentement avec le nombre de simulations raliser (cf. quations
1.8 et 1.9).
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
2.6 Application ltude de la abilit 77
2.6 Application ltude de la abilit
Nous achevons ce chapitre par une application concrte des MGD dans le cadre dune
tude de abilit. Dans un premier temps, nous eectuons un rappel des dnitions usuelles
associes au concept de abilit en temps discret. Nous dcrivons ensuite comment mettre
prot lalgorithme 2.2 an de mesurer la abilit dun systme reprsent par un MGD.
Nous proposons enn une comparaison empirique entre lapproche reposant sur les MGD
et celle utilisant les chanes de Markov pour reprsenter le processus de dgradation dun
systme.
2.6.1 MGD et mesures de abilit
Rappels de abilit en temps discret
Nous supposons prsent que lensemble X des tats dun systme est partitionn en deux
ensembles X
U
et X
D
, contenant respectivement les tats de fonctionnement et les tats de
panne. La abilit en temps discret est alors dnie comme suit :
Dnition 2.1 (Fiabilit en temps discret)
Soit (X
t
)
t1
une suite de variables alatoires valeurs dans X = X
U
X
D
reprsentant
ltat dun systme au cours du temps. La abilit ou fonction de survie dun systme en
temps discret est dnie par la fonction
R :
_
N \ {0 [0, 1]
t R(t) = P(X
1
A
U
, . . . , X
t
A
U
)
.
Autrement dit, R(t) donne la probabilit que le systme reste dans un tat de fonctionne-
ment jusqu linstant t compris. Bien que la abilit soit dnie sur N 0, on suppose
par convention que R(0) = 1.
Dautres indicateurs de abilit dcoulent de la dnition prcdente. Parmi les plus connus,
rappelons la dnition du taux de dfaillance et de la dure de vie rsiduelle moyenne.
Dnition 2.2 (Taux de dfaillance en temps discret)
Soit (X
t
)
t1
une suite de variables alatoires valeurs dans A = A
U
A
D
reprsentant
ltat dun systme au cours du temps. Le taux de dfaillance dun systme en temps discret
est dni par la fonction
h :
_
N 0 [0, 1]
t h(t) = P(X
t
A
D
[X
1
A
U
, . . . , X
t1
A
U
)
.
Autrement dit, h(t) correspond la probabilit quune panne se produise linstant t condi-
tionnement au fait que le systme ait toujours t sain avant. h(t) sexprime en fonction
de la abilit de la faon suivante :
h(t) =
_
1
R(t)
R(t1)
si R(t 1) ,= 0
0 sinon
.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Dnition 2.3 (Dure de vie rsiduelle moyenne)
Soit (X
t
)
t1
une suite de variables alatoires valeurs dans A = A
U
A
D
reprsentant
ltat dun systme au cours du temps. La dure de vie rsiduelle moyenne linstant t,
note m(t), est le temps moyen avant une dfaillance sachant que le systme fonctionne
depuis t units de temps. En temps discret, cette quantit est dnie par
m(t) = E[T
D
t[T
D
> t] ,
o T
D
= inft N 0[X
t
A
D
reprsente la variable alatoire de dure de vie du
systme, qui nest autre que le premier instant de dfaillance. La dure de vie rsiduelle
moyenne sexprime galement en fonction de la abilit par :
m(t) =
1
R(t)
=0
R( +t).
Notons que le temps moyen avant dfaillance, not MTTF (Mean Time To Failure), est
donn par m(0).
La dnition suivante introduit la notion de disponibilit du systme, indicateur couram-
ment utilis lors dtudes de abilit.
Dnition 2.4 (Disponibilit en temps discret)
Soit (X
t
)
t1
une suite de v.a. valeurs dans A = A
U
A
D
reprsentant ltat dun systme
au cours du temps. La disponibilit dun systme en temps discret est dnie par la fonction
A :
_
N 0 [0, 1]
t A(t) = P(X
t
A
U
)
.
Autrement dit, A(t) donne la probabilit que le systme soit dans un tat de fonctionnement
linstant t, quel que soit ses tats passs.
Il est possible dnumrer de nombreux autres indicateurs permettant de rendre compte de
la abilit dun systme en temps discret (Bracquemond and Gaudoin 2003). Par ailleurs,
le point commun de tous ces indicateurs rside dans le fait quils sobtiennent partir
du calcul probabiliste dune trajectoire particulire des tats du systme. En eet, utiliser
lalgorithme 2.2 an de calculer la probabilit de la trajectoire (A
U
, o, /)
1t
revient
calculer la abilit du systme linstant t. De mme, la disponibilit du systme linstant
t sobtient en utilisant lalgorithme 2.2 avec la trajectoire (

A
, o, /)
1t
tel que

A
t
= A
U
et

A
= A sinon.
2.6.2 Illustration
Nous proposons une illustration empirique de lintrt des MGD pour la reprsentation
de systmes dynamiques. Pour ce faire, nous nous replaons dans le cadre du systme de
production introduit initialement dans le chapitre 1. Lobjectif est de prsenter concr-
tement les rsultats concernant lapprentissage et les mesures de abilit associes une
modlisation du processus de dgradation du systme par une approche :
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
(i) classique laide de chanes de Markov (cf. gure 1.4), dsigne par approche CM;
(ii) reposant sur les MGD (cf. gure 2.3), dsigne par approche MGD.
Prsentation des donnes
Pour mener bien la phase dapprentissage, nous disposons de donnes de retour dexp-
rience sur la machine de production considre. Ces donnes contiennent lhistorique de
fonctionnement, sans maintenance, de K = 100 machines de production identiques et in-
dpendantes, de leur mise en service jusqu leur panne (cf. les trajectoires de la table 2.3
pour exemple). Ces 100 trajectoires ont t gnres avec lalgorithme 2.1 partir des LPC
dcrites dans lexemple 2.6. Ces LPC caractrisent donc le modle thorique de dgradation
du systme.
Pour chacune des 100 machines, nous possdons donc une information sur les cadences de
production utilises, les tats traverss et les temps de sjour associs. La table 2.4 fournit
le nombre doccurrences, not N
z,x,s
, o le systme est rest s o = 1, . . . , 12 units de
temps dans ltat x A = ok, dgrad, panne la cadence z Z = normale, rapide.
La table 2.5 donne, quant elle, le nombre de transitions, not N
x
,z,x
, o le systme est
pass de ltat x
x avec une cadence z.

Temps de sjour (en trimestres)
Cadence tat 1 2 3 4 5 6 7 8 9 10 11 12 total
normale ok 161 95 56 37 31 40 56 93 121 55 7 0 752
rapide ok 91 52 43 20 19 9 6 6 2 0 0 0 248
normale dg. 501 126 37 11 10 0 0 0 0 0 0 0 685
rapide dg. 140 13 7 0 0 0 0 0 0 0 0 0 160
Tab. 2.4 Nombre dobservations des temps de sjour allant de 1 12 trimestres
pour chaque tat (except ltat absorbant panne), pour les deux cadences et dans
les K = 100 trajectoires disponibles.
tat (t)
tat (t 1) Cadence ok dgrad panne total
ok normale 0 685 67 752
dgrad normale 0 0 685 685
ok rapide 0 160 88 248
dgrad rapide 0 0 160 160
Tab. 2.5 Nombre des transition observes partir de chaque tat (except ltat
absorbant panne), pour les deux cadences et dans les K = 100 trajectoires dispo-
nibles.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Lapprentissage ne concerne ici que les LPC caractrisant le processus de dgradation du
systme. Les LPC associes ltat initial du systme, la cadence de fonctionnement,
la qualit de la production et la maintenance en gnral sont en eet dnies a priori ou
a posteriori. Pour chacune des deux approches, lapprentissage est ralis par la mthode
du maximum de vraisemblance. Les estimations prsentes dans les paragraphes suivants
sont issues dune adaptation des rsultats de lquation 2.16 au cas du systme tudi.
Notons enn que nous supposons que les tats ok et dgrad constituent les tats de
fonctionnement, autrement dit X
U
= {ok, dgrad} et X
D
= {panne}.
Apprentissage du MGD
Commenons par traiter le modle reposant sur un MGD. Dans ce cas, il y a deux LPC
estimer : la LPC des temps de sjour initiaux, note

F
MGD,1
et la matrice de transition
naturelle, note

Q
sys
MGD
. Rappelons que la LPC des temps de sjour pour t 2 est suppose
identique

F
MGD,1
. Les expressions de ces estimations sont dnies par :
F
MGD,1
(z, x, s) =

F
sys
MGD
(x
, z, x, s) =
N
z,x,s
zZ,xX
N
z,x,s
,

Q
sys
MGD
(x
, z, x) =
N
x
,z,x
X,zZ
N
x
,z,x
,
(2.21)
ce qui donne avec les donnes disponibles :
b
F
MGD,1
S
1
Z
1
X
1
1 2 3 4 5 6 7 8 9 10 11 12
norm. ok 0.21 0.13 0.07 0.05 0.04 0.05 0.07 0.12 0.16 0.07 0.01 0
rap. ok 0.37 0.21 0.17 0.08 0.08 0.04 0.02 0.02 0.01 0 0 0
norm. dg. 0.73 0.18 0.05 0.02 0.02 0 0 0 0 0 0 0
rap. dg. 0.88 0.08 0.04 0 0 0 0 0 0 0 0 0
norm. panne 0 0 0 0 0 0 0 0 0 0 0 1
rap. panne 0 0 0 0 0 0 0 0 0 0 0 1
Q
sys
MGD
X
t
X
t1
Z
t
ok dgrad panne
ok normale 0 0.91 0.09
dgrad normale 0 0 1
panne normale 0 0 1
ok rapide 0 0.64 0.36
dgrad rapide 0 0 1
panne rapide 0 0 1
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Apprentissage de la chane de Markov
Dans le cadre de la modlisation du processus de dgradation par une chane de Markov,
seule la LPC de transition naturelle, note

Q
sys
CM
est estimer, les temps de sjour ntant
plus explicitement reprsents. Lestimation des taux de transition entre tats est eectue,
comme prcdemment, par la mthode du maximum de vraisemblance. Notons toutefois
que le taux de transition dun tat vers lui-mme se dduit de la table 2.4 donnant le
nombre doccurrences des temps de sjour. En eet, lobservation de N
z,x,s
temps de sjour
de s units de temps dans ltat x et la cadence de production z, signie galement que
le systme a eectu N
z,x,s
(s 1) transitions de ltat x vers lui-mme cette cadence z.
Autrement dit, nous avons ici N
x
,z,x
=
12
s=1
N
z,x,s
(s 1) lorsque x = x
. Dans le cas o
x
,= e, la table 2.5 donne directement les dirents N

x
,z,x
. La LPC de transition

Q
sys
CM
sobtient alors comme prcdemment (cf. quation (2.21)), ce qui donne avec les donnes
disponibles :
Q
sys
CM
X
t
X
t1
Z
t
ok dgrad panne
ok normale 0.81 0.17 0.02
dgrad normale 0 0.29 0.71
panne normale 0 0 1
ok rapide 0.63 0.24 0.13
dgrad rapide 0 0.14 0.86
panne rapide 0 0 1
Dans ce cas, la LPC

Q
sys
CM
permet elle seule de caractriser le processus de dgradation
du systme. Cependant, la distribution des temps de sjour ntant pas clairement explici-
te, la comparaison des rsultats dapprentissage avec lapproche prcdente et le modle
thorique nest pas aise. Nous savons nanmoins que les temps de sjour dans chacun des
tats dun processus reprsent par une chane de Markov sont implicitement distribus
gomtriquement. Il est possible daugmenter le modle CM en y ajoutant explicitement
les lois de temps de sjour. Les informations contenues dans la LPC

Q
sys
CM
se scindent alors
en :
une LPC des temps de sjour distribus gomtriquement, note

F
CM
bis
,1
, et dnie pour
tout x A, tout z Z et tout s o = 1, . . . , 12 par
F
CM
bis
,1
(z, x, s) =
_
_
p
geo
(s;
z,x
) si 1 s < 12
1
11
=1
p
geo
(s
;
z,x
) si s = 12
avec p
geo
(s,
z,x
) =
s1
z,x
(1
z,x
) et
z,x
=

Q
sys
CM
(x, z, x). La LPC

F
CM
bis
,1
correspond
donc une suite de lois gomtriques tronques (cf. remarque 2.1). Numriquement, nous
obtenons ici :
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
b
F
CM
bis
,1
S
1
Z
1
X
1
1 2 3 4 5 6 7 8 9 10 11 12
norm. ok 0.19 0.16 0.13 0.10 0.08 0.07 0.05 0.04 0.03 0.03 0.02 0.10
rap. ok 0.37 0.23 0.15 0.09 0.06 0.04 0.02 0.01 0.01 0.01 0.00 0.01
norm. dg. 0.71 0.20 0.06 0.02 0.01 0.00 0.00 0.00 0.00 0.00 0.00 0.00
rap. dg. 0.86 0.12 0.02 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
norm. panne 0 0 0 0 0 0 0 0 0 0 0 1
rap. panne 0 0 0 0 0 0 0 0 0 0 0 1
une LPC de transition strictement diagonale suprieure (except pour ltat absorbant
panne) pour chaque cadence de production, note

Q
sys
CM
bis
, et dnie pour tous x
, x A
et tout z Z par
Q
sys
CM
bis
(x
, z, x) =
_
_
0 si x
= x
Q
sys
CM
(x
, z, x)
Q
sys
CM
(x
, z, x
)
sinon
.
Lapproche CM augmente correspond une approche MGD particulire dont la LPC des
temps de sjour possde une forme paramtrique prcise. Le modle de transition des tats
du systme est donc quivalent dans les deux approches. Par consquent et par construction,
il vient

Q
sys
CM
bis
=

Q
sys
MGD
.
Insistons enn sur le fait que le calcul de la distribution gomtrique des temps de sjour
nest uniquement pertinent qu des ns de comparaison de rsultats dapprentissage. Lors
dun calcul dinfrence avec une approche reposant sur les chanes de Markov, il ny a aucun
intrt augmenter la complexit algorithmique en introduisant la LPC

F
CM
bis
,1
souvent
trs volumineuse et inutile dans ce cas.
Comparaison des rsultats dapprentissage
Nous comparons la qualit des rsultats dapprentissage obtenus par les approches MGD et
CM en nous appuyant sur la vraisemblance des donnes et sur lErreur Absolue Moyenne
(EAM) commise par rapport au modle thorique. La table 2.6 ne fournit ces deux critres
que pour la modlisation des temps de sjour. En eet, en considrant lapproche CM
augmente par une LPC de temps de sjour gomtrique, le modle de transition des tats
du systme est identique dans les deux approches.
Approche MGD CM
Log-vraisemblance -2725 -3002
EAM 0.0014 0.0220
Tab. 2.6 Comparaison de la log-vraisemblance des donnes et de lEAM commise
par rapport au modle thorique dans le cas des deux approches.
La log-vraisemblance est un critre intressant au sens o son calcul ne ncessite pas la
connaissance dun modle thorique. Ce critre est donc bien adapt lorsque le modle
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
thorique du systme tudi est inconnu, comme cest souvent le cas lors de ltude dun
systme complexe. Son interprtation reste toutefois dlicate car la log-vraisemblance est
une grandeur non borne. Dans le cas prsent, cette dernire est plus leve avec lapproche
MGD quavec lapproche CM. Lutilisation dun MGD permet donc de mieux expliquer
les donnes observes quune chane de Markov seule. Lapproche MGD ne fait aucune
hypothse sur la distribution dont sont issues les donnes. Il est donc naturel quun modle
gomtrique, ne possdant quun paramtre, obtienne des rsultats moins satisfaisants.
Intressons nous lEAM commise entre le modle thorique et les deux approches consi-
dres. Il apparat dans cet exemple que lutilisation dun MGD conduit une erreur
moyenne de 0.14% sur la probabilit doccurrence de chaque temps de sjour, et ce, pour
chaque couple (tat, cadence). Lapproche CM commet quant elle une erreur moyenne
de 2.2%. Limprcision est donc en moyenne quinze fois plus grande avec cette dernire ap-
proche. Cette erreur dpend directement du degr de similarit entre le modle thorique
des temps de sjour et une loi gomtrique. Autrement dit, si les deux sont proches, lin-
trt des MGD diminue fortement en raison de laugmentation de complexit occasionne.
Cependant, lorsque le systme possde une dynamique dvolution plus complexe, il savre
souvent intressant de reprsenter plus nement la distribution des temps de sjour. Ceci
est illustr dans la partie suivante o des rsultats en matire de calculs de abilit sont
prsents.
Comparaison des mesures de abilit
Lobjectif est prsent de comparer les rsultats obtenus par les approches MGD et CM
concernant le calcul dindicateurs de abilit. Lalgorithme 2.1 est utilis an de gnrer un
grand nombre de trajectoires (ici 10
6
) de manire dduire la abilit du systme selon le
modle thorique. Lalgorithme 2.2 est quant lui utilis pour le calcul de la abilit dans
le cadre des deux modles appris prcdemment. Par ailleurs, la table 2.7 donne lEAM
commise sur le calcul de divers indicateurs relatifs la abilit du systme par unit de
temps.
Approche MGD CM
Fiabilit 0.0010 0.0059
Taux de dfaillance 0.0018 0.7538
Dure de vie rsiduelle 0.0085 3.8986
Tab. 2.7 Comparaison des EAM commises sur le calcul dindicateurs de abilit
partir des approche MGD et CM.
Le calcul de la abilit est prsent en gure 2.7. Nous observons que lapproche MGD
conduit une lgre sous-estimation de la abilit thorique, tout en respectant son al-
lure gnrale. En revanche, lapproche CM sous-estime la abilit du systme entre son
quatrime et son dixime trimestres de fonctionnement, puis la surestime aprs le onzime
semestre. Cette approche ne permet clairement pas de retrouver lallure thorique de la
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
abilit. Ces constatations visuelles sont conrmes par les rsultats de la table 2.7. LEAM
commise par lapproche MGD est de 1% par unit de temps, tandis quelle slve prs
de 6% pour lapproche CM.
Rappelons que dans lindustrie, la abilit est lun des indicateurs les plus utiliss pour
la mise en place dune politique de maintenance. Sous-estimer la abilit conduit des
politiques de maintenance onreuses ne tenant pas compte de la qualit du systme tudi.
linverse lorsque celle-ci est surestime, le systme soure dune perte de disponibilit due
une insusance dentretien. Cet exemple est donc une illustration de lintrt pratique
des MGD compars une approche CM dans le cadre dtudes de abilit.
0 2 4 6 8 10 12 14 16 18
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Temps (en trimestres)
F
i
a
b
i
l
i
t
Thorique
MGD
CM
Fig. 2.7 valuation de la abilit du systme partir du modle thorique et des
lapproches MGD et CM.
Les gures 2.8 et 2.9 reprsentent respectivement le taux de dfaillance et la dure de
vie rsiduelle du systme obtenus selon la modlisation considre. Lobservation de ces
courbes met en avant lincapacit de lapproche CM retrouver la forme thorique de ces
deux grandeurs. Plus prcisment, la table 2.7 indique que lEAM commise en moyenne
chaque unit de temps par cette approche est de 75% pour le taux de dfaillance et
denviron 3.8 trimestres pour la dure de vie rsiduelle. Ces erreurs sont particulirement
importantes compares celles engendres par lapproche MGD.
Par ailleurs, ces grandeurs de abilit caractrisent le comportement instantan du sys-
tme : la premire en terme de probabilit doccurrence dune dfaillance et la seconde
en terme de dure avant loccurrence dune dfaillance. Le modle thorique un taux de
dfaillance globalement croissant et une dure de vie rsiduelle globalement dcroissante.
Ceci signie que le systme vieillit, autrement dit plus le temps passe, plus la probabilit
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
2.7 Conclusions 85
que survienne une panne augmente. Or, nous observons une fois encore que lapproche CM
savre insusante pour reprsenter une telle dynamique de vieillissement.
0 2 4 6 8 10 12 14 16 18
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
T
a
u
x

d
e

d
f
a
i
l
l
a
n
c
e
Thorique
MGD
CM
Fig. 2.8 valuation du taux de dfaillance du systme partir du modle thorique
et des lapproches MGD et CM.
2.7 Conclusions
Ce chapitre propose une description dtaille des Modles Graphiques de Dure (MGD).
Cette structure graphique particulire, reposant sur le formalisme des Modles Graphiques
Probabilistes Markoviens dordre un (1-MGPM), est ddie la reprsentation de systmes
dynamiques complexes. Cette approche permet de dpasser les limitations sous-jacentes
lutilisation des chanes de Markov dans le cadre des 1-MGPM. Une chane de Markov
impose par construction que les dures dans chaque tat du systme suivent des lois ex-
ponentielles. Cette hypothse nest pas raliste dans un trs grand nombre dapplications
concrtes. Lintrt des MGD provient de la possibilit de spcier une loi de dure quel-
conque, paramtrique ou non, pour chaque tat du systme. Ces proprits sont illustres
par une comparaison entre chanes de Markov et MGD dans le cadre dune analyse de
abilit, montrant ainsi la pertinence pratique lapproche.
Toutefois, la structure MGD tant plus complexe que la structure dune chane de Markov,
son utilisation entrane une augmentation de la complexit spatiale et de la complexit al-
gorithmique lors des calculs dinfrence partir dune mthode gnrique. Nous montrons
cependant quen exploitant les proprits probabilistes particulires associes aux MGD,
il est possible de limiter signicativement cette complexit. La premire proprit remar-
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
0 2 4 6 8 10 12 14 16 18
1
1.5
2
2.5
3
3.5
4
4.5
5
5.5
6
D
u
r
e

d
e

v
i
e

r
s
i
d
u
e
l
l
e

(
e
n

t
r
i
m
e
s
t
r
e
s
)
Thorique
MGD
CM
Fig. 2.9 valuation de la dure de vie rsiduelle du systme partir du modle
thorique et des lapproches MGD et CM.
quable provient du caractre dni par morceaux des Lois de Probabilit Conditionnelle
(LPC) manipules. Cette particularit a en gnral un intrt dun point de vue de leur sto-
ckage en mmoire. La seconde proprit est lie la prsence de composantes dterministes
dans lesdites LPC. En consquence, dimportantes simplications peuvent tre ralises lors
des calculs dinfrence. Une tude thorique complte est prsente, expliquant la rduction
de complexit engendre par la prise en compte de ces spcicits.
Pour nir, il nexiste pas, notre connaissance, doutil logiciel de modlisation par rseaux
baysiens permettant de manipuler ecacement des LPC dnies par morceaux. Il nest
pourtant pas rare de rencontrer des cas dapplications o ce type de LPC est utilisable,
en particulier dans le cadre de la reprsentation de systmes dynamiques. Aussi, au cours
de cette thse, le dveloppement dune boite outils Matlab
R _
a t initi. Lensemble
des rsultats numriques prsents dans ce rapport ont t obtenus partir de cette boite
outils. Cette dernire est prsent utilise au sein du laboratoire INRETS-LTN mais
termes, une diusion plus large est envisage.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Chapitre 3
Modelisation de la maintenance
Sommaire
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
3.1.1 Approche generale . . . . . . . . . . . . . . . . . . . . . . . . . . 88
3.1.2

Etat de lart . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
3.1.3 Objectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
3.2 Modèle VirMaLab . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
3.2.1 Description qualitative . . . . . . . . . . . . . . . . . . . . . . . . 90
3.2.2 Description probabiliste . . . . . . . . . . . . . . . . . . . . . . . 92
3.2.3 Caracterisation parametrique . . . . . . . . . . . . . . . . . . . . 97
3.2.4 Complexite spatiale . . . . . . . . . . . . . . . . . . . . . . . . . 98
3.3 Calculs dutilite . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
3.3.1 Construction dune fonction dutilite . . . . . . . . . . . . . . . . 100
3.3.2

Evaluation dune fonction dutilite . . . . . . . . . . . . . . . . . 102
3.3.3 Complexite algorithmique . . . . . . . . . . . . . . . . . . . . . . 105
3.3.4 Exemple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
3.4 Politiques de maintenance . . . . . . . . . . . . . . . . . . . . . . 115
3.4.1 Maintenance corrective . . . . . . . . . . . . . . . . . . . . . . . 116
3.4.2 Maintenance preventive . . . . . . . . . . . . . . . . . . . . . . . 117
3.5 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
88 Chapitre 3. Modlisation de la maintenance
3.1 Introduction
3.1.1 Approche gnrale
Ltude de la abilit est aujourdhui une tape incontournable lors de la conception in-
dustrielle et une proccupation permanente pour les systmes oprationnels. Ceci est par-
ticulirement vrai pour des systmes excutant des tches critiques comme le transport
de voyageurs. Les connaissances disponibles sur la abilit du systme sont utilises an
dorganiser sa maintenance. Cette approche est connue sous la dnomination Maintenance
Base sur la Fiabilit (MBF ou RCM, Reliability-Centered Maintenance pour lacronyme
anglais). La premire description gnrale de la MBF a t propose par Nowlan and Heap
(1978). La principale rfrence en franais traitant de la MBF est louvrage de Zwingel-
stein (1996). En pratique, lapproche MBF a pour objectif de minimiser les cots dentretien
tout en assurant le meilleur niveau de disponibilit du systme considr. Ce cadre de tra-
vail comporte de nombreuses dclinaisons, notamment suivant la nature de la politique de
maintenance considre. Cependant, la mise en place dune telle dmarche pour un systme
donn ncessite toujours :
(i) un modle reprsentant le processus de dgradation du systme ;
(ii) un modle reprsentant les direntes solutions de maintenance envisageables ;
(iii) une fonction dutilit permettant dvaluer chaque politique de maintenance rali-
sable.
La modlisation du systme constitue en gnral ltape la plus dlicate, le reste de la
mthode reposant grandement sur la pertinence de la reprsentation adopte. Il sagit
dexpliquer au mieux les mcanismes dvolution des dirents tats de fonctionnement
du systme. La prsence dun REX (Retour dEXprience) facilite la comprhension des
processus de dgradation des composants du systme et de leurs interactions. Lexploitation
dun REX possde en outre lavantage de fournir une reprsentation relativement proche de
la ralit. En revanche, sil ny a pas ou peu de donnes REX exploitables, il incombe aux
experts de proposer leur modle ce qui conduit parfois lintroduction de biais importants.
La description des procdures de maintenance est souvent moins complexe. Il est en ef-
fet courant de disposer de rfrentiels dcrivant les direntes actions dentretien et de
rparation possibles et leurs eets sur le systme. Cette tape consiste alors traduire
mathmatiquement ces rfrentiels.
La fonction dutilit retenue permet enn de quantier la pertinence dune politique de
maintenance donne. Le choix de la fonction dutilit dpend du systme reprsent et
du problme considr. Cette dernire doit la fois prendre en compte les contraintes
conomiques et les exigences de sret de fonctionnement. Lobjectif de lapproche MBF
est alors in ne de maximiser la fonction dutilit en ajustant les paramtres de maintenance
an de raliser le meilleur compromis entre cots dentretien et disponibilit du systme.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
3.1 Introduction 89
3.1.2 tat de lart
Une grande partie des travaux scientiques publis dans le domaine de la maintenance
sintressent aux mthodes prventives quelles soient systmatiques ou conditionnelles.
Les politiques prventives savrent, en pratique, souvent bien plus avantageuses quune
politique purement corrective entranant de lindisponibilit. Toutefois, la Maintenance
Prventive (MP) nest rellement ecace que si elle est correctement optimise (Barlow
and Hunter 1960). Citons par exemple les travaux rcents de Bar-Noy et al. (2004), Grigo-
riev et al. (2006) et Courtois and Delsarte (2006) traitant de loptimisation de politiques
systmatiques priodiques. Par ailleurs, les progrs scientiques sur les capteurs et le diag-
nostic en gnral permettent de surveiller les systmes industriels plus souvent et plus
prcisment. Ceci explique le nombre croissant dtudes ddies aux politiques de mainte-
nance conditionnelles. En particulier, les travaux de Grall et al. (2002), Marseguerra et al.
(2002), Castanier et al. (2005) et Brenguer (2008) sintressent la reprsentation de
telles politiques et leur optimisation. Bien que performante dun point de vue calcula-
toire, les tudes prcdentes reposent la plupart du temps sur des hypothses relativement
restrictives quant la description du systme (par exemple sur les lois de dgradation et
la reprsentation du contexte).
Paralllement, des outils plus gnriques, bass notamment sur des modles graphiques ru-
dimentaires, ont t proposs (Vatn et al. 1996), (Vatn 1997) permettant la reprsentation
de systmes plus complexes. En revanche, ces travaux ne fournissent aucune solution al-
gorithmique gnrale aux problmes dinfrence soulevs. Plus rcemment, lutilisation des
Modles Graphiques Probabilistes (MGP) a partiellement rsolu le problme prcdent. Ce
cadre de travail ore en eet un formalisme puissant et intuitif en matire de modlisation,
ainsi quun ensemble doutils danalyse adapts lvaluation de politiques de maintenance.
Les travaux de Corset (2003) et Celeux et al. (2006) ont abord la construction pratique
dun MGP dans le contexte dune tude de sret de fonctionnement. Par ailleurs, Kang
and Golay (1999) a propos un MGP statique ddi la modlisation de la maintenance,
en incluant explicitement une couche diagnostic.
3.1.3 Objectifs
Les objectifs de ce chapitre sont dunier et dtendre les travaux prcdents en propo-
sant une approche MBF dynamique et gnrique. Pour ce faire, nous nous plaons dans
le cadre des MGP Markoviens (MGPM) et nous supposons quun modle de dgradation
du systme considr est disponible sous cette forme (chane de Markov, modle graphique
de dure). La dmarche gnrique initie et dveloppe lINRETS hors du cadre ap-
plicatif que relate ce mmoire, consiste enrichir ce modle de dgradation en ajoutant
une composante de diagnostic, de maintenance et dutilit. Il sagit au nal de fournir
un outil danalyse complet capable de sadapter aux direntes stratgies de maintenance
rencontres couramment dans lindustrie. La partie 3.2 est consacre la description de ce
modle que nous dsignons dans la suite par modle VirMaLab. La partie 3.3 aborde le
problme de linfrence probabiliste applique aux calculs dutilit permettant lvaluation
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
dune politique de maintenance donne. Pour nir, un point sur les direntes politiques
de maintenance reprsentables par cette approche est fourni dans la partie 3.4. Le chapitre
4 dtaille quant lui la traduction de cette approche gnrique au problme industriel
rencontr par la Rgie Autonome des Transports Parisiens (RATP).
3.2 Modle VirMaLab
3.2.1 Description qualitative
Le modle graphique associ lapproche VirMaLab est donn dans la gure 3.1. Ce der-
nier caractrise les relations de dpendance du vecteur alatoire (X
t
, D
t
, A
t
)
t1
sur deux
tranches temporelles. Pour des raisons de lisibilit et de complexit spatiale et algorith-
mique, le modle VirMaLab est reprsent sous la forme dun 1-MGPM . Toutefois, il est
important de noter quil nexiste pas de verrou thorique quant lextension du modle
un ordre markovien suprieur. Le modle VirMaLab est donc constitu de trois compo-
santes principales ddies respectivement lvolution du systme (processus (X
t
)
t1
),
son diagnostic (processus (D
t
)
t1
) et sa maintenance (processus (A
t
)
t1
).
Le vecteur alatoire X
t
reprsente ltat du systme linstant t. Ltat du systme dsigne
ici toutes les variables permettant dexpliquer son volution temporelle. Lhypothse la plus
simple consiste rduire le vecteur X
t
une simple variable X
t
. Dans le chapitre 2, nous
avons tudi le cas o le systme tait dcrit par le vecteur X
t
= (X
t
, S
t
), savoir son
tat linstant t ainsi que la dure avant une transition. Lexemple 2.6 illustre la prise
en compte dun contexte agissant sur le systme (cadence de production). Dans ce cas, le
vecteur X
t
dsigne le triplet (C
t
, E
t
, S
t
).
Le vecteur alatoire D
t
= ((
t,
, D
t,
)
1L
, D
sys
t
) reprsente lensemble des moyens de diag-
nostic du systme. Plus prcisment, le modle de diagnostic est compos de L mthodes
de diagnostic indpendantes entre elles conditionnellement ltat du systme caractri-
ses par les variables alatoires D
t,1
, . . . , D
t,L
. Chaque variable D
reprsente le rsultat
du diagnostic de la -me mthode linstant t. Les variables
t,1
, . . . ,
t,L
{0, 1} sont
des variables binaires indiquant si chaque mthode de diagnostic est active linstant t.
La variable D
sys
t
reprsente le diagnostic nal du systme linstant t issu du traitement
des rsultats des L mthodes de diagnostic.
La variable A
t
dsigne laction de maintenance slectionne linstant t. Dans le modle
VirMaLab, la dcision de maintenance est prise partir du diagnostic nal. Cette action
agit ensuite potentiellement sur ltat du systme linstant suivant.
Daprs la dnition 1.13, le vecteur alatoire associ linterface gauche dans le modle
VirMaLab linstant t est (X
t1
, A
t1
). Le thorme 1.4 scrit alors :
X
t2
, D
t2
, A
t2
X
t
, D
t
, A
t
|X
t1
, A
t1
. (3.1)
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
3.2 Modle VirMaLab 91
Fig. 3.1 1-MPGM (modle de transition) associ au modle VirMaLab. Dans le

but damliorer la lisibilit, remarquons que seul le modle de transition est repr-
sent sur la gure. Le modle initial tant identique celui dune tranche de temps
quelconque, il ny a pas de confusion possible.
Les relations de dpendance engendres par la structure graphique du modle conduisent
la dnition rcursive suivante pour linterface gauche :
P(X
t
, A
t
) =
_
_
P(X
1
)
D
1
P(D
1
|X
1
)P(A
1
|D
1
) t = 1
X
t1
A
t1
P(X
t1
, A
t1
)P(X
t
|X
t1
, A
t1
)
D
t
P(D
t
|X
t1
)P(A
t
|D
t
) t 2
(3.2)
avec pour tout t 1,
P(D
t
) =
L
=1
[P(
t,
)P(D
t,
|X
t
,
t,
)] P(D
sys
t
, |D
t,1
, . . . , D
t,L
),
et
P(A
t
|D
t
) = P(A
t
|D
sys
t
).
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Dun point de vue purement qualitatif, la structure graphique associe lapproche Vir-
MaLab permet de reprsenter :
le processus de dgradation dun systme ;
un nombre quelconque de mthodes de diagnostic dont lactivation dpend du temps ;
une politique de traitement des dirents rsultats de diagnostic ;
une politique dactions de maintenance.
Cette dmarche possde lavantage dtre la fois raliste et gnrique. Elle sadapte en
eet de nombreux systmes industriels et couvre un large ventail de problmes lis
la modlisation de la maintenance. Notons toutefois quan de se placer dans un cadre
permettant de raliser des calculs dinfrence exacte, nous supposons que toutes les variables
du modle VirMaLab sont discrtes et nies.
3.2.2 Description probabiliste
Loi dvolution du systme
Soient X lensemble des tats du systme et A lensemble des actions de maintenance.
Lensemble A est partitionn tel que A = A
X
A
X
o A
X
= et A
X
reprsentent
respectivement lensemble des actions laissant le systme invariant et celui des actions
aectant le systme. Dans le modle VirMaLab, le processus de dgradation du systme
est caractris par la distribution initiale des tats du systme
1
L
{X}
1
et la distribution
de transition L
{X}
t
|{X,A}
t1
. Formellement, nous avons pour tout x X,
P(X
1
= x) =
1
(x).
Autrement dit, la valeur
1
(x) donne la probabilit que le systme se trouve dans la
conguration x linstant initial.
Concernant le modle de transition, deux cas sont distinguer :
(i) Si laction slectionne ltat prcdent laisse le systme invariant (A
t1
A
X
),
le systme volue selon la loi de transition naturelle
sys
L
{X}
t
|{X}
t1
. Pour tous
x
, x X,
sys
vrie alors
P(X
t
= x|X
t1
= x
, A
t1
A
X
) =
sys
(x
, x).
Le systme passe naturellement de la conguration x
x avec une probabilit gale

sys
(x
, x).
(ii) Si laction slectionne ltat prcdent agit sur le systme (A
t1
A
X
), le systme
subit une transition articielle contrle par la loi
act
L
{X}
t
|{X,A
X
}
t1
. Pour tous
x
, x X et tout a
A
X
,
act
vrie alors
P(X
t
= x|X
t1
= x
, A
t1
A
X
) =
act
(x
, a
, x).
La valeur
act
(x
, a
, x) exprime ainsi la probabilit pour le systme de passer de la

conguration x
x alors que laction a
a t slectionne.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Par consquent, la loi de transition du systme est dnie par morceaux telle que pour tous
x
, x X et tout a
A,
P(X
t
= x|X
t1
= x
, A
t1
= a
) = (x
, a
, x) =
_

sys
(x
, x) si a
A
X
act
(x
, a
, x) si a
A
X
.
Remarque 3.1 (Utilisation dun MGD)
La description du modle dvolution du systme dpend la fois du problme considr
et du degr de prcision souhait. En adoptant une reprsentation par Modle Graphique
de Dure (MGD, cf. chapitre 2), le vecteur alatoire modlisant ltat gnral du systme
vaut alors X
t
= (X
t
, S
t
) o X
t
et S
t
dsignent respectivement ltat du processus et le
temps avant une transition naturelle linstant t. Lensemble des valeurs prises par X
t
est X = X S. Par ailleurs, en reprenant les notations de la partie 2.3, la loi initiale du
systme dans le modle VirMaLab,
1
L
{X,S}
1
, est donne pour tout x = (x, s) XS
par
1
(x) =
1
(x, s) =
1
(x)F
1
(x, s). (3.3)
Dans ce cas, la loi de transition naturelle,
sys
L
{X,S}
t
|{X,S}
t1
est dnie pour tous
x
, x X et tous s
, s S par
sys
(x
, s
, x, s) =
_
Q
sys
(x
, x)F
sys
(x
, x, s) si s
= 1
I(x
, x)C(s
, s) si s
2
. (3.4)
Enn, pour toute action a
A
X
agissant sur le systme, la loi de transition articielle,
act
L
{X,S}
t
|{X,A}
t1
est dnie pour tous x
, x X et tout s S par
act
(x
, a
, x, s) = Q
act
(x
, a
, x)F
sys
(x
, x, s). (3.5)
Les quations (3.3), (3.4) et (3.5) caractrisent le processus dcrivant lvolution temporelle
du systme modlis par un MGD dans le cadre dune approche VirMaLab.
Daprs la partie 2.3.6, nous pouvons en outre dduire le cas o le systme est reprsent
par une Chane de Markov (CM). Cela revient simplement supprimer les LPC F
1
et F
sys
des calculs prcdents. Formellement, nous avons pour tout x = (x, s) X {1},
1
(x) =
1
(x, 1) =
1
(x) F
1
(x, 1)
. .
=1
=
1
(x),
sys
(x
, s
, x, s) =
_
_
Q
sys
(x
, x) F
sys
(x
, x, 1)
. .
=1
si s
= 1
I(x
, x)C(s
, s)
. .
cas impossible car s = 1
si s
2
= Q
sys
(x
, x),
et pour tout a
A
X
,
act
(x
, a
, x, s) = Q
act
(x
, a
, x) F
sys
(x
, x, 1)
. .
=1
= Q
act
(x
, a
, x).
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Diagnostic
Dans un premier temps, le diagnostic du systme est ralis chaque instant t par L
mthodes caractrises par les variables alatoire D
t,1
, . . . , D
t,L
valeurs respectivement
dans les ensembles D
1
, . . . , D
L
. Le rle de ces organes de diagnostic consiste fournir des
informations sur ltat rel du systme, ce dernier ntant pas accessible directement. Les
ensembles D
1
, . . . , D
L
contiennent les rsultats possibles de chacune des mthodes de diag-
nostic. Pour chaque mthode , le nombre |D
| reprsente la taille du spectre de dtection

de la -me mthode. Lactivation de chaque mthode D
t,
linstant t est contrle par la
variable binaire
t,
. Notons que chaque ensemble D
contient un lment d
permettant
de signaler explicitement que la mthode correspondante nest pas active. Ceci est dtaill
dans les paragraphes qui suivent.
La LPC de la variable D
t,
permet alors de dcrire le comportement probabiliste de la
-me mthode de diagnostic linstant t. Deux cas sont distinguer :
(i) Si la -me variable dactivation vaut un linstant t (
t,
= 1), le systme est examin
selon la -me mthode de diagnostic. Les caractristiques du diagnostic eectu sont
dcrites dans la LPC
L
{D
}
t
|{X}
t
. Formellement, pour tout d
et tout
x X
P(D
t,
= d
|X
t
= x,
t,
= 1) =
(x, d
).
La quantit
(x, d
) correspond la probabilit de renvoyer le signalement d
sachant
que le systme se trouve dans ltat x. Lorsque les tats du systme sont tris dans
un ordre croissant de gravit, trois situations sont envisageables :
lorsque x < d
, ltat rel est moins grave que le diagnostic,
(x, d
) correspond
un taux de fausse alarme ;
lorsque x = d
, ltat rel est identique au diagnostic,
(x, d
) correspond un
taux de bonne dtection;
lorsque x > d
, ltat rel est plus grave que le diagnostic,
(x, d
) correspond
un taux de non dtection.
(ii) Si la -me variable dactivation vaut zro linstant t (
t,
= 0), la mthode
est inhibe. Cela se traduit formellement en associant au diagnostic d
une
probabilit gale un, et ce, quel que soit ltat rel du systme. Autrement dit, pour
tout d
et tout x X,
P(D
t,
= d
|X
t
= x,
t,
= 0) = 1I(d
= d
).
Les LPC associes aux mthodes de diagnostic sont donc dnies par morceaux telles que
pour tout = 1, . . . , L, tout d
, tout
t,
{0, 1}, et tout x X,
P(D
t,
= d
|X
t
= x,
t,
) =
_

(x, d
) si
t,
= 1
1I(d
= d
) si
t,
= 0
.
Remarquons enn que les temps dactivation de chaque mthode de diagnostic sont des
paramtres participant la dnition de la politique de maintenance du systme. Ceci
nest pas le cas des LPC
1
, . . . ,
L
qui, elles, sont supposes provenir des caractristiques
techniques des appareils de diagnostic considrs.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Exemple 3.1
Soit un systme trois tats dont lvolution est reprsente par une chane de Markov.
Dans ce cas, nous supposons que X
t
= X
t
et X = X = {ok, dgrad, panne}. Considrons
de plus que le systme possde deux mthodes de diagnostic modlises par les variables
D
t,1
et D
t,2
. Admettons enn que ces deux mthodes soient spcialises dans un diagnostic
particulier. Par exemple, la premire mthode est ddie la dtection de ltat dgrad,
et la seconde dtection de ltat panne. Nous xons alors D
1
= {d
, dgrad, dgrad} et
D
2
= {d
, panne, panne}, ainsi que les valeurs numriques suivantes :
1
D
t,1
X
t
d
dgrad dgrad
ok 0 0.95 0.05
dgrad 0 0.15 0.85
panne 0 1 0
2
D
t,2
X
t
d
panne panne
ok 0 1 0
dgrad 0 1 0
panne 0 0.01 0.99
Lobservation de la LPC associe la premire mthode montre que cette dernire commet
5% de fausses alarmes lorsque le systme est dans ltat ok. Dautre part, ltat dgrad est
bien dtect dans 85% des cas contre 15% de non dtection. Conformment la description
donne, cette mthode ne permet pas de diagnostiquer ltat panne. En eet, ds que le
systme est dans cet tat, le rsultat de la dtection indique uniquement que le systme
nest pas dans ltat dgrad. linverse, la seconde mthode ne peut pas dtecter ltat
dgrad, mais fournit un diagnostic correct concernant ltat panne dans 99% des cas.
Rappelons que les LPC
1
et
2
dnissent le comportement probabiliste des mthodes
de diagnostic lorsquelles sont actives. Dans le cas contraire, le rsultat du diagnostic est
dterministe et vaut d
quel que soit ltat rel du systme.

Les rsultats de chaque mthode de diagnostic linstant t sont ensuite traits an den
dduire un diagnostic nal. Ce dernier dpend de la politique de diagnostic dcrite par la
LPC de la variable D
sys
t
valeurs dans D
sys
et note
sys
t
L
{D
sys
}
t
|{D
1
,...,D
L
}
t
. Il est
noter que le diagnostic d
appartient galement lensemble D

sys
et correspond au cas o
aucune mthode de diagnostic nest active linstant t. Formellement,
sys
t
vrie pour
tout = 1, . . . , L, tout d
et tout d D
sys
,
P(D
sys
t
= d|D
t,1
= d
1
, . . . , D
t,L
= d
L
) =
sys
t
(d
1
, . . . , d
L
, d).
La valeur
sys
t
(d
1
, . . . , d
L
, d) correspond la probabilit que le diagnostic nal du systme
linstant t soit d alors que les L diagnostics indpendants ont respectivement donn
les rsultats d
1
, . . . , d
L
. linstar des variables dactivation, la stratgie dcisionnelle du
diagnostic est un des paramtres dnissant la politique de maintenance du systme.
Exemple 3.2
Plaons nous nouveau dans le contexte de lexemple 3.1. Dans ce cas, dnir la politique
du diagnostic revient tablir quel est le diagnostic nal selon la valeur des deux mthodes
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
de diagnostic disponibles. Une manire naturelle de procder consiste prendre
D
sys
= {d
} X = {d
, ok, dgrad, panne}

de faon couvrir lensemble des tats possibles diagnostiquer. La stratgie assurant ici le
minimum de non dtection consiste retenir la dtection la plus critique comme diagnostic
nal. Cela sexprime numriquement par :
sys
D
sys
t
D
t,1
D
t,2
d
ok dgrad panne
d
1 0 0 0
dgrad d
0 1 0 0
dgrad d
0 0 1 0
d
panne 0 1 0 0
dgrad panne 0 1 0 0
dgrad panne 0 0 1 0
d
panne 0 0 0 1
dgrad panne 0 0 0 1
dgrad panne 0 0 0 1
Toutefois, une telle approche peut favoriser les fausses alarmes, entranant parfois un impact
conomique non ngligeable.
Action de maintenance
Le choix de laction de maintenance linstant t est contrl par la LPC associe la
variable alatoire A
t
, note L
{A}
t
|{D
sys
}
t
. Dans le modle VirMaLab, laction de
maintenance est slectionne selon le rsultat du diagnostic nal. La LPC vrie pour
tout d D
sys
et tout a A,
P(A
t
= a|D
t
= d) = (d, a).
La valeur (d, a) dsigne la probabilit de dclencher laction de maintenance a sachant
que le diagnostic nal du systme est d. Si laction slectionne linstant t appartient
lensemble A
X
, ltat du systme est modi via la LPC de transition
act
.
Exemple 3.3
Reprenons lexemple 3.2 et soit {nant, rparation partielle, rparation totale} lensemble
des actions possibles o laction "nant" dsigne labsence daction. Supposons que laction
"rparation partielle" permette de rduire la dgradation du systme dun tat, et que
laction "rparation totale" ramne le systme dans ltat ok. La partition de lensemble A
est donc constitue des deux ensembles
A
X
= {rparation partielle, rparation totale} et A
X
= {nant}. Par ailleurs, daprs les
descriptions prcdentes, la LPC
act
vrie ici :
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
act
X
t
X
t1
A
t1
ok dgrad panne
ok rparation partielle 1 0 0
dgrad rparation partielle 1 0 0
panne rparation partielle 0 1 0
ok rparation totale 1 0 0
dgrad rparation totale 1 0 0
panne rparation totale 1 0 0
.
Considrons enn une politique dactions telle que si le rsultat du diagnostic nal est :
d
ou ok, alors aucune action nest dclenche ;

dgrad, alors une rparation partielle est eectue dans 50% des cas et aucune action
le reste de temps ;
panne, alors une rparation partielle est eectue dans 33% des cas et une rparation
totale le reste de temps.
Ceci se traduit numriquement par :
A
t
D
sys
t
nant rparation partielle rparation totale
d
1 0 0
ok 1 0 0
dgrad 0.5 0.5 0
panne 0 0.33 0.67
.
3.2.3 Caractrisation paramtrique
La description probabiliste du modle VirMaLab donne dans la partie 3.2.2 met en
vidence les dirents paramtres du modle. Ces derniers peuvent tre classs en deux
catgories : les paramtres descriptifs et les paramtres de maintenance. La premire cat-
gorie correspond aux paramtres caractrisant le fonctionnement du systme considr. Il
sagit donc des lments associs lvolution du systme (
1
,
sys
), la prcision des m-
thodes de diagnostic (
)
1L
et aux eets des actions de maintenance
act
. En pratique,
ces paramtres se dduisent partir du Retour dEXprience (REX), davis dexperts, des
caractristiques techniques du matriel utilis ou encore des rfrentiels de maintenance.
Par consquent, hormis lors de changements techniques, les paramtres descriptifs sont
supposs xes pour un systme donn. Dans la suite, nous adoptons la notation
V
desc
= (
1
,
sys
,
act
, (
)
1L
)
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
pour dsigner les paramtres descriptifs du modle.
La seconde catgorie de paramtres dcrit la stratgie de maintenance du systme. Il sagit
par consquent des instants dactivation des diagnostics (
t,
)
t1,1L
, de la politique de
traitement des diagnostics
sys
et de la politique de dcision de maintenance . Lensemble
des stratgies de maintenance reprsentables partir de ces paramtres est abord dans la
partie 3.4. Comme prcdemment, nous dsignons
V
maint
= ((
t,
)
t1,1L
,
sys
, )
les paramtres de maintenance du modle VirMaLab. De manire gnrale, lobjectif
dune telle approche consiste alors dterminer V
maint
, tant donn V
desc
de faon
optimiser un certain critre.
Il est alors possible dutiliser la notation V = (V
desc
, V
maint
) pour caractriser un mo-
dle VirMaLab, cest--dire en spciant ses paramtres descriptifs et ses paramtres de
maintenance.
3.2.4 Complexit spatiale
Soit V = (
1
,
sys
,
act
, (
t,
)
t1,1L
, (
)
1L
,
sys
, ) un modle VirMaLab. La
complexit spatiale de ce modle, note CS(V ), correspond la somme des complexi-
ts spatiales associes aux LPC dcrivant lvolution du systme, la chane de diagnostics
et laction de maintenance. La table 3.1 dtaille le cot de stockage de chacune des LPC
du modle.
LPC Description CS
1
tat initial O(|X|)
sys
Transition naturelle O(|X|
2
)
act
Transition articielle O(|X|
2
|A
X
|)
(
)
1L
Mthodes de diagnostic O(|X|
2
L
=1
|D
|)
sys
Politique du diagnostic O(|D
sys
|
L
=1
|D
|)
Politique des actions de maintenance O(|D
sys
||A|)
Tab. 3.1 Complexit spatiale des LPC associes au modle VirMaLab.
Nous en dduisons par consquent
CS(V ) = O(|X|
2
(|A
X
| +
L
=1
|D
|) +|D
sys
|(
L
=1
|D
| +|A|)). (3.6)
Daprs le rsultat (3.6), la complexit spatiale du processus dvolution du systme, en
O(|X|
2
|A
X
|), contribue de manire signicative au cot de stockage du modle VirMa-
Lab. Par exemple, si le systme est reprsent par une chane de Markov dont lespace
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
3.3 Calculs dutilit 99
dtat est X, la complexit spatiale du systme est en O(|X|
2
|A
X
|). Dans le cadre dune
modlisation par MGD, cette complexit est alors de lordre O(|X|
2
(T
S
+|A
X
|) + T
S
) o
T
S
dsigne la borne suprieure du support des lois de temps de sjour.
Le nombre de mthodes de diagnostic considres et la taille de leur spectre de dtec-
tion ont galement une inuence importante sur la complexit du modle. En particulier,
la LPC
sys
, caractrisant la politique du diagnostic, possde un cot de stockage en
O(|D
sys
|
L
=1
|D
|), pouvant devenir rapidement draisonnable de par le produit sur les

rsultats possibles de chaque mthode de diagnostic. Dans le meilleur des cas, il ny a que
deux diagnostics possibles par mthode ce qui conduit CS(
sys
) = O(2
L+1
). linverse, il
est rare en pratique que le nombre de diagnostics possibles par mthode dpasse le nombre
des tats du systme. La pire situation du point de vue du stockage correspond donc
O(|D
sys
|) = O(|D
1
|) = . . . = O(|D
L
|) = O(|X|) et par consquent CS(
sys
) = O(|X|
L+1
).
3.3 Calculs dutilit
Considrons un modle VirMaLab, not V = (V
desc
, V
maint
), caractris par ses para-
mtres descriptifs et ses paramtres de maintenance (cf. partie 3.2.3). Rappelons que lob-
jectif du modle VirMaLab est de permettre lvaluation de stratgies de maintenance
appliques un systme donn. Dans notre cadre de travail, cette valuation sexprime en
termes dutilit (cf. partie 1.2.3). Nous supposons en eet qu chaque instant t, le systme,
les diagnostics et laction de maintenance engendrent chacun des utilits. En pratique, ces
dernires sont souvent homognes un cot ou un prot. Toutefois, une utilit corres-
pond plus gnralement une grandeur calculable partir de la loi du vecteur alatoire
considr et na donc pas forcment une connotation conomique. Par exemple dans une
tude de abilit, une utilit peut tre associe un nombre de dfauts particuliers ou
un nombre de fausses alarmes pour un appareil de diagnostic.
La gure 3.2 reprsente le modle VirMaLab la tranche t sur lequel des nuds dutilit
sont explicitement reprsents. Contrairement aux nuds usuels dans les MGP, les nuds
dutilit ne sont pas associs des variables alatoires. Ces derniers servent uniquement
indiquer explicitement sur quelles variables les calculs dutilit sont raliss.
Remarque 3.2 (Diagrammes dinuence)
Notons que les MGP possdant des nuds dutilit sont souvent rfrencs sous le terme
diagramme dinuence dans la littrature (Shachter 1988). Plus particulirement, un dia-
gramme dinuence est un MGP constitu de nuds dutilit et de nuds de dcision, et a
pour objectif de modliser graphiquement un problme dcisionnel. Ces nuds de dcision
reprsentent les actions possibles pour le dcideur et nont par consquent pas de variable
parente dans le graphe. Une fois la modlisation du problme eectue, des algorithmes
dinfrence permettent de dterminer les dcisions maximisant lutilit totale. Il est toute-
fois important de noter que les mthodes dinfrence pour les diagrammes dinuence sont
trs proches des mthodes gnriques ddies aux MGP classiques (Jensen et al. 1994).
Par ailleurs, la problmatique aborde dans ce chapitre ne permet pas dutiliser les outils
dvelopps dans le cadre des diagrammes dinuence. Dans la suite de ce document, nous
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
nous limitons donc au cadre plus exible des MGP.
utilite de
disponibilite
utilite du
diagnostic
utilite des actions
de maintenance
utilite du
diagnostic
Fig. 3.2 Modle VirMaLab la tranche t avec utilits. Les nuds carrs repr-
sentent les utilits des variables parentes associes.
3.3.1 Construction dune fonction dutilit
Les paragraphes suivants dtaillent tout dabord le calcul des utilits associes aux di-
rentes composantes du modle linstant t. La construction dune fonction dutilit est
traite par la suite.
Utilits du systme
Soient u
1
X
t
, . . . , u
K
X
X
t
R
{X}
t
une suite de potentiels dutilit associe au vecteur alatoire
X
t
reprsentant ltat du systme linstant t. Notons galement
t
L
{X}
t
la distribution
de X
t
, autrement dit
t
= P(X
t
). Pour tout k
X
= 1, . . . , K
X
et tout x X, la k
X
-me
utilit associe X
t
, note U
k
X
X
t
R, est dnie par
U
k
X
X
t
=
xX
u
k
X
X
t
(x)
t
(x). (3.7)
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
En vue de simplier les notations, le vecteur U
X
t
= (U
1
X
t
, . . . , U
K
X
X
t
) R
K
X
est utilis
an de dsigner les direntes utilits du systme linstant t. Prcisons galement que
lorsque les potentiels dutilit ne dpendent pas de t, ces derniers sont dits homognes,
auquel cas lindice t est omis et lcriture u
1
X
, . . . , u
K
X
X
R
{X}
est adopte.
Utilits des diagnostics
Soit u
1
t,
, . . . , u
K
t,
une suite dutilits associe lactivation de la -me mthode de diag-
nostic linstant t. Pour tout = 1, . . . , L, tout k
= 1, . . . , K
, la k
-me utilit associe

la variable dactivation
t,
{0, 1}, note U
k
,t
R, est dnie par
U
k
,t
= u
k
t,
t,
. (3.8)
Par consquent, lhypothse implicite formule ici consiste xer une utilit nulle lorsque
le diagnostic nest pas activ et une utilit u
k
t,
sinon. Comme prcdemment, le vecteur
U
t,
= (U
1
t,
, . . . , U
K
t,
) R
K
t,
dsigne les utilits lies lactivation de la -me mthode
de diagnostic linstant t.
Il nest pas rare que le dclenchement dun diagnostic entrane une procdure de conrma-
tion qui elle-mme peut avoir son utilit propre (cf. chapitre 4). Pour en tenir compte, nous
introduisons u
1
D
t,
, . . . , u
K
D
D
t,
R
{X}
t
une suite de potentiels dutilit associe la variable
alatoire D
t,
reprsentant le rsultat de la -me mthode de diagnostic linstant t. Pour
tout k
D
= 1, . . . , K
D
et tout d
, la k
D
-me utilit associe D

t,
, note U
k
D
D
t,
R,
est dnie par
U
k
D
D
t,
=
u
k
D
D
t,
(d
)P(D
t,
= d
). (3.9)
Le vecteur U
D
t,
= (U
1
D
t,
, . . . , U
K
D
D
t,
) R
K
D
dsigne les direntes utilits du diagnostic

associes la -me mthode linstant t.
De manire synthtique, le vecteur U
D
t
= (U
t,
, U
D
t,
)
1L
contient lensemble des
utilits lies la composante diagnostic du modle VirMaLab linstant t.
Utilits de laction de maintenance
Soit u
1
A
t
, . . . , u
K
A
A
t
R
{X}
t
une suite de potentiels dutilit associe la variable alatoire
A
t
reprsentant laction de maintenance linstant t. Pour tout a A, la k
A
-me utilit
associe A
t
, note U
k
A
A
t
R, est dnie par
U
k
A
A
t
=
aA
u
k
A
A
t
(a)P(A
t
= d
). (3.10)
Le vecteur U
A
t
= (U
1
A
t
, . . . , U
K
A
A
t
) R
K
A
dsigne les direntes utilits de laction de
maintenance slectionne linstant t.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Fonction dutilit
Soit V = (V
desc
, V
maint
) un modle VirMaLab tel que dni dans la partie 3.2.3. Il
sagit prsent de proposer un critre permettant dvaluer, et donc de comparer, cha-
cune des stratgies de maintenance reprsentables par les paramtres V
maint
. La dmarche
retenue consiste combiner les utilits obtenues chaque instant t de manire obtenir
un rsultat sur un horizon de longueur T. La fonction dutilit dnit la manire dont
sont combines les utilits de chaque composante du systme. Formellement, il sagit de
construire une fonction, note f
util
, qui associe tout modle VirMaLab V un vecteur de
rels f
util
(V ) R
J
. La fonction f
util
est qualie de fonction mono-utilit lorsque J = 1
et de fonction multi-utilit lorsque J 2. Il est important de noter que les calculs dutilit
associs aux quations (3.7), (3.9) et (3.10) ncessitent des calculs dinfrence probabiliste
qui dpendent directement des paramtres du modle V . Seules les utilits lies lactiva-
tion des diagnostics sobtiennent immdiatement partir des valeurs prises par les variables
dactivation (
)
1L
. Autrement dit, lexpression de la fonction dutilit peut se rcrire
en faisant intervenir explicitement les utilits impliques dans le calcul :
f
util
(V ) = f
util
((U
X
t
(V ), U
D
t
(V ), U
A
t
(V ))
1tT
).
La partie 3.3.2 est ddie la description des calculs probabilistes sous-jacents lvaluation
dune fonction dutilit. Enn, lexemple 3.4 illustre les notations prcdentes en dtaillant
la construction dune fonction mono-utilit moyenne.
Exemple 3.4 (Fonction mono-utilit moyenne)
Considrons un modle VirMaLab V o chaque composante ne possde quun nud
dutilit. En reprenant les notations prcdentes, nous avons alors
k
X
= k
1
= . . . = k
L
= k
D
1
= . . . = k
D
L
= k
A
= 1.
Dans ce cas, les exposants associs aux utilits sont omis, ce qui se traduit par :
U
X
t
= U
1
X
t
= U
1
X
t
;
U
D
t
= (U
1
t,
, U
1
D
t,
)
1L
= (U
t,
, U
D
t,
)
1L
;
U
A
t
= U
1
A
t
= U
A
t
.
Par consquent, U
X
t
, (U
t,
, U
D
t,
)
1L
et U
A
t
sont calcules chaque instant t.
Cet exemple prsente le cas simple, mais nanmoins trs utilis en pratique, de la fonc-
tion mono-utilit moyenne sur lhorizon T. Cette fonction dutilit possde lexpression
suivante :
f
util
(V ) =
1
T
T
t=1
_
U
X
t
(V ) +
L
=1
_
U
t,
(V ) +U
D
t,
(V )
+U
A
t
(V )
_
.
3.3.2 valuation dune fonction dutilit
Nous mettons prsent laccent sur lvaluation pratique dune fonction dutilit dans un
modle VirMaLab. Pour ce faire, il est ncessaire de calculer pour tout t 1 :
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
la loi des tats du systme,
t
= P(X
t
) ;
la loi des diagnostics, (P(D
t,
))
1L
;
la loi des actions de maintenance, P(A
t
).
Le modle VirMaLab tant un 1-MPGM particulier, lalgorithme 1.3 est adapt pour
raliser les calculs prcdents en vue den tudier la complexit. Il est nanmoins int-
ressant de dtailler les oprations eectues. Ceci est lobjet des propositions 3.2 et 3.3
prsentes dans les paragraphes suivants. La premire aborde le calcul de la distribution
dinterface gauche, note
t
= P(X
t
, A
t
), tandis que la seconde traite le calcul des dis-
tributions P(D
t,1
), . . . , P(D
t,L
), et ce, chaque instant t. Cependant avant daborder ces
deux propositions, nous introduisons le rsultat utilitaire suivant :
Proposition 3.1
Soit V = (
1
,
sys
,
act
, (
t,
)
t1,1L
, (
)
1L
,
sys
, ) un modle VirMaLab (cf. par-
tie 3.2). Posons G
t
= P(A
t
|X) L
{A}
t
|{X}
t
. La LPC G
t
est alors dnie pour tout t 1,
tout x X et tout a A par
G
t
(x, a) =
dD
sys
(d, a)
rec
t,L
(x, d),
avec pour tout x X, tout = 1, . . . , L, tout d
et tout d D
sys
,
rec
t,
(x, (d
)
<
L
, d) =
_
sys
(d
1
, . . . , d
L
, d) si = 0
_
(x, d
)
rec
t,1
(d
, . . . , d
L
, d) si
t,
= 1
rec
t,1
(d
, . . . , d
L
, d) si
t,
= 0
si 1
.
(3.11)
La dmonstration de ce rsultat (cf. annexe E.3) repose sur la factorisation du modle
VirMaLab une tranche t quelconque, ainsi que sur la dnition par morceaux des LPC
associes aux variables D
t,1
, . . . , D
t,L
(cf. quation (3.2.2)). Par ailleurs, la suite (
rec
t,
)
0L
est introduite an de raliser llimination des variables
t,1
, D
t,1
, . . . ,
t,L
, D
t,L
. Formelle-
ment, la -me itration la LPC
rec
t,
appartient L
{D
sys
}
t
|{X,D
+1
,...,D
L
}
t
et correspond
la LPC
sys
aprs llimination des variables
t,1
, D
t,1
, . . . ,
t,
, D
t,
.
Proposition 3.2
Soit V = (
1
,
sys
,
act
, (
t,
)
t1,1L
, (
)
1L
,
sys
tie 3.2). Le modle V possde une distribution dinterface gauche, note
t
= P(X
t
, A
t
),
dnie pour tout x X et tout a A par
t
(x, a) =
t
(x)G
t
(x, a), (3.12)
o
t
= P(X
t
) reprsente la loi de ltat du systme linstant t et possde la caractrisation
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
rcursive suivante pour tout x X :
t
(x) =
_
1
(x) t = 1
X
_
_
sys
(x
, x)
A
X
t1
(x
, a
) +
A
X
t1
(x
, a
)
act
(x
, a
, x)
_
_
t 2
(3.13)
et o G
t
= P(A
t
|X
t
) dsigne la LPC introduite dans la proposition 3.1.
Remarquons enn que la distribution de laction de maintenance slectionne linstant t
est alors donne pour tout a A par
P(A
t
= a) =
xX
(x, a). (3.14)
La dmonstration de ces rsultats (cf. annexe E.3) consiste aner le calcul gnrique de
linterface gauche dans le cas dun modle VirMaLab (cf. quation (3.2)). La dnition
par morceaux de la loi de transition du systme prsente dans lquation (3.2.2), ainsi que
le rsultat de la proposition 3.1 sont lorigine des simplications dans le calcul de
t
.
Proposition 3.3
Soit V = (
1
,
sys
,
act
, (
t,
)
t1,1L
, (
)
1L
,
sys
tie 3.2). Dans ce cas, pour tout = 1, . . . , L, la loi du -me diagnostic linstant t, note
P(D
t,
), est dnie pour tout d D
sys
par
P(D
t,
= d
) =
_
xX
t
(x)
t,
(x, d
) si
t,
= 1
1I(d
= d
) si
t,
= 0
, (3.15)
o la loi
t
= P(X
t
) est caractrise par lquation (3.12).
La dmonstration de cette proposition (cf. annexe E.3) sappuie dans un premier temps
sur le fait que le modle VirMaLab vrie la relation dindpendance conditionnelle
X
t1
, D
t1
, A
t1
D
t
, A
t
|X
t
.
Ceci implique qu linstant t, la connaissance de la distribution
t
est susante pour
poursuivre les calculs dinfrence courants. Par la suite, la dnition par morceaux des lois
(P(D
t,
|X
t
,
t,
))
1L
est utilise pour simplier lexpression des lois (P(D
t,
))
1L
.
partir des rsultats prsents dans les propositions prcdentes, nous construisons lal-
gorithme dinfrence 3.1, ddi lvaluation dune fonction dutilit dans un modle Vir-
MaLab. Il existe peu de contraintes quant au choix de la fonction dutilit, pourvu que
cette dernire soit calculable chaque instant t partir des utilits associes au systme,
aux diagnostics et la maintenance. Notons galement que la fonction peut tre mono ou
multi-utilit. La partie 3.3.4 prsente une application du modle VirMaLab, ainsi que de
lalgorithme 3.1 dans le cas dune fonction mono-utilit moyenne.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Algorithme 3.1 : valuation dune fonction dutilit dans un modle VirMaLab.
Entres :
1. Un modle VirMaLab vriant la description donne dans la partie 3.2 ;
2. Lhorizon T des calculs dinfrence raliser ;
3. Des potentiels dutilit
((u
k
X
X
t
)
1k
X
K
X
, ((u
k
t,
)
1k
, (u
k
D
D
t,
)
1k
D
K
D
)
1L
, (u
k
A
A
t
)
1k
A
K
A
)
1tT
reprsentant respectivement les utilits associes ltat du systme, aux variables
dactivation des diagnostics, aux rsultats des diagnostics et laction de
maintenance ;
4. Une fonction dutilit f
util
.
Sortie : Lvaluation de la fonction dutilit f
util
correspondant au modle
VirMaLab et aux utilits considrs.
// Inf erence probabiliste
Calcul de
t
(quation (3.13)) ; //

Etat du syst` eme
Calcul de
t
(quation (3.12)) ; // Interface gauche
pour chaque = 1, . . . , L faire
Calcul de P(D
t,
) (quation (3.15)) ; // R esultat des diagnostics
n
Calcul de P(A
t
) (quation (3.14)) ; // Action de maintenance
// Utilit es
Calcul de U
X
t
= (U
k
X
X
t
)
1k
X
K
X
(quation (3.7)) ; //

Etat du syst` eme
pour chaque = 1, . . . , L faire
// Diagnostics
Calcul de U
t,
= (U
k
t,
)
1k
(quation (3.8)) ; // Activation

Calcul de U
D
t,
= (U
k
D
D
t,
)
1k
D
K
D
(quation (3.9)) ; // R esultat

n
U
D
t
(U
t,
, U
D
t,
)
1L
;
Calcul de U
A
t
= (U
k
A
A
t
)
1k
A
K
A
(quation (3.10)) ; // Action de maintenance
n
// Fonction dutilit e
valuation de f
util
((U
X
t
, U
D
t
, U
A
t
)
1tT
) ;
3.3.3 Complexit algorithmique
Cette partie a pour objectif ltude de la complexit de lalgorithme 3.1. Il sagit tout
dabord dvaluer le temps de calcul permettant dobtenir les utilits sur une tranche t
quelconque. La complexit algorithmique des calculs de G
t
,
t
,
t
, (P(D
t,
))
1L
et P(A
t
)
est dterminer. Ceci fait lobjet des propositions suivantes.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Proposition 3.4
En se plaant dans le contexte de la proposition 3.1, la complexit algorithmique du calcul
de G
t
, note CA(G
t
), est de lordre
CA(G
t
) = O
_
|X||D
sys
|
_
L
=1
L
=
|D
| +|A|
__
.
Proposition 3.5
de
t
, t 2, note CA(
t
), est de lordre
CA(
t
) = O(|X|
2
|A|).
Les complexits algorithmiques des calculs de
t
et P(A
t
) sont alors donnes par
CA(
t
) = CA(P(A
t
)) = O(|X||A|).
Proposition 3.6
de chaque loi P(D
t,
), note CA(P(D
t,
)), est de lordre
CA(P(D
t,
)) = O(|X||D
|).
La dmonstration de chacune de ces propositions est donne dans lannexe E.3. Ces rsul-
tats reposent sur la complexit des oprations de base sur les potentiels (cf. propositions
1.1 et 1.2). Les rsultats prcdents permettent de dduire la complexit lie aux calculs
dinfrence probabiliste dans lalgorithme 3.1. Cette complexit algorithmique est note de
manire synthtique comme suit :
CA(G
t
,
t
,
t
, (P(D
t,
))
1L
, P(A
t
)) = CA(G
t
) +CA(
t
) +CA(
t
) +
L
=1
CA(P(D
t,
)) +CA(P(A
t
)).
Or, en remarquant que le terme

L
=1
CA(P(D
t,
)) est ngligeable devant CA(G
t
), puis
que les termes CA(
t
) et CA(P(A
t
)) sont ngligeables devant CA(
t
), nous obtenons
CA(G
t
,
t
,
t
, (P(D
t,
))
1L
, P(A
t
)) = O
_
|X||D
sys
|
_
L
=1
L
=
|D
| +|A|
_
+|X|
2
|A|
_
.
(3.16)
Intressons nous prsent la complexit algorithmique des calculs dutilits U
X
t
, U
D
t
et U
A
t
en proposant le rsultat suivant.
Proposition 3.7
En se plaant dans le contexte de la partie 3.3.1, lensemble des calculs dutilits eectus
la tranche t de lalgorithme 3.1 possde une complexit algorithmique de lordre
CA(U
X
t
, U
D
t
, U
A
t
) = O
_
K
_
|X| +L +
L
=1
|D
| +|A|
__
, (3.17)
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
o K = max(K
X
, (K
, K
D
)
1L
, K
A
) reprsente le plus grand nombre dutilits asso-
cies une mme variable.
Ce rsultat sobtient de manire analogue aux propositions prcdentes. Sa dmonstration
consiste simplement analyser la complexit des calculs (3.7), (3.8), (3.9) et (3.10).
La complexit de lalgorithme 3.1 se rsume ainsi la somme de la complexit lie aux
calculs dinfrence (cf. quation (3.16)) et la complexit lie aux calculs dutilit (cf.
quation (3.17)). En notant CA(V
f
util ) lordre de la quantit doprations lmentaires
ncessaire lvaluation dune fonction dutilit dans un modle VirMaLab sur un horizon
temporel T, nous obtenons alors
CA(V
f
util ) = T [CA(G
t
,
t
,
t
, (P(D
t,
))
1L
, P(A
t
)) +CA(U
X
t
, U
D
t
, U
A
t
)] .
Il convient toutefois de noter quen pratique la complexit algorithmique des calculs duti-
lit est trs souvent ngligeable devant la complexit des calculs dinfrence. En eet, le
nombre K, correspondant au plus grand nombre dutilits associes une mme variable,
est classiquement gal un. Ce nombre atteint parfois deux ou trois si la problmatique
considre fait intervenir des calculs multi-utilit. Cela reste nanmoins dun ordre bien in-
frieur aux complexits des modles dcrivant le systme, le diagnostic ou la maintenance.
Par consquent, nous eectuons lapproximation suivante :
CA(V
f
util ) = O
_
T
_
|X||D
sys
|
_
L
=1
L
=
|D
| +|A|
_
+|X|
2
|A|
__
. (3.18)
Lquation (3.18) montre que la complexit du modle dvolution du systme et la com-
plexit de la composante diagnostic contribuent de manire signicative au temps de calcul
de la fonction dutilit. Le caractre dynamique de la modlisation associe au systme
engendre un cot algorithmique quadratique, rendant lalgorithme 3.1 particulirement
sensible la complexit de la reprsentation choisie pour le processus de dgradation.
Linuence de la composante diagnostic dpend la fois du nombre L de mthodes de
diagnostic considr et du degr de nesse de ces mthodes, correspondant aux quantits
|D
|
1L
. Nous expliquons dans la partie 3.2.4 que pour chaque mthode de diagnostic ,
son degr de nesse peut raisonnablement tre encadr par
2 |D
|, |D
sys
| X. (3.19)
Il est alors possible den dduire un encadrement de la complexit de lalgorithme 3.1
comme le montre la proposition 3.8. Nous achevons donc cette partie par la proposition
donne dans les paragraphes suivants. La preuve de ce rsultat, prsente dans lannexe
E.3, repose sur des simplications de lquation (3.18), rendues possibles en se plaant
chacune des bornes de lencadrement (3.19).
Proposition 3.8
En se plaant dans le contexte de lalgorithme 3.1 et sous lhypothse que pour tout =
1, . . . , L, 2 |D
|, |D
sys
| X, la complexit de lalgorithme 3.1 vrie
O
_
T
_
2
L+2
|X| +|X|
2
|A|
_
CA(V
f
util ) O
_
T
_
|X|
L+2
+|X|
2
|A|
_
.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
0 50 100 150 200 250 300 350 400
0
0.2
0.4
0.6
0.8
1
Temps (en jours)
F
i
a
b
i
l
i
t
= 0.9, = 0
= 0.99, = 0
= 0.9, = 1
= 0.99, = 1
= 0.9, = 2
= 0.99, = 2
Fig. 3.3 volution de la abilit du systme en fonction des paramtres et .
3.3.4 Exemple
Les paragraphes suivants mettent laccent sur les aspects pratiques sous-jacents lapproche
VirMaLab. Pour ce faire, nous proposons un exemple la fois simple et raliste permettant
dillustrer les notions prcdemment introduites.
Description du systme
Le systme considr est une machine de production possdant dix tats de fonctionne-
ment. Dans cet exemple, la modlisation du systme ne fait intervenir quune variable X
t
reprsentant ltat du systme linstant t exprim en jour. Lensemble des tats de fonc-
tionnement est not X = {neuf, dg-1, dg-2, . . . , dg-8, panne}. Autrement dit, le vecteur
alatoire X
t
est rduit lunique variable X
t
. Ceci correspond la situation o le processus
de dgradation du systme est reprsent par une chane de Markov. Notons galement que
les tats sont ordonns par gravit croissante ce qui permet de les indexer sur lensemble
{1, . . . , 10}, en posant x
1
= neuf, x
2
= dg-1, x
3
= dg-2, . . ., x
10
= panne.
Ce processus est dans un premier temps caractris par la LPC de transition naturelle
sys
L
{X}
t
|{X}
t1
. Nous supposons que la dgradation du systme est contrle par les
deux paramtres [0, 1] et 0 tels que
sys
soit dnie pour tout x
i
, x
j
X par
sys
(x
i
, x
j
) =
_
si i = j et i = |X| = 10
1
i
si i = j 1 et i = |X| = 10
1 si i = j et i = |X| = 10
0 sinon
. (3.20)
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
0 50 100 150 200 250 300 350 400
0.02
0
0.02
0.04
0.06
0.08
0.1
0.12
Temps (en jours)
T
a
u
x

d
e

d
f
a
i
l
l
a
n
c
e
= 0.9, = 0
= 0.99, = 0
= 0.9, = 1
= 0.99, = 1
= 0.9, = 2
= 0.99, = 2
Fig. 3.4 volution du taux de dfaillance du systme en fonction des paramtres
et .
La loi de transition naturelle a donc la forme diagonale par bloc suivante :
sys
X
t
X
t1
neuf dg-1 dg-2 dg-3 dg-4 dg-5 dg-6 dg-7 dg-8 panne
neuf 1 0 0 0 0 0 0 0 0
dg-1 0
2
1
2
0 0 0 0 0 0 0
dg-2 0 0
3
1
3
0 0 0 0 0 0
dg-3 0 0 0
4
1
4
0 0 0 0 0
dg-4 0 0 0 0
5
1
5
0 0 0 0
dg-5 0 0 0 0 0
6
1
6
0 0 0
dg-6 0 0 0 0 0 0
7
1
7
0 0
dg-7 0 0 0 0 0 0 0
8
1
8
0
dg-8 0 0 0 0 0 0 0 0
9
1
9
panne 0 0 0 0 0 0 0 0 0 1
.
La gure 3.3 prsente dirents rsultats sur la abilit du systme en faisant varier les
paramtres et . De faon similaire, la gure 3.4 fournit des rsultats concernant le taux
de dfaillance du systme. Les calculs ont t eectus sur un horizon temporel T = 365
jours. Ces deux gures montrent que le paramtre contrle la valeur stationnaire du
taux de dfaillance du systme. Le paramtre caractrise pour sa part la vitesse du
vieillissement. Plus prcisment, plus le paramtre est lev et plus le systme atteint
rapidement son rgime stationnaire.
Nous supposons que le systme possde deux mthodes de diagnostic : une mthode 1,
reprsente par la variable D
t,1
et une mthode 2, reprsente par la variable D
t,2
. Ces
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
deux variables sont respectivement valeurs dans les ensembles D
t,1
et D
t,2
tels que D
1
=
D
2
= D
sys
= {d
, ok, dfaut}. Les deux mthodes de diagnostic sont concurrentes. Elles

ralisent le mme travail qui consiste envoyer un signalement de dfaut lorsque le systme
entre dans ltat dg-6. Toutefois, la mthode 1 est moins prcise que la mthode 2. En
pratique, cela se traduit par des dtections de dfauts alors que ltat dg-6 nest pas encore
atteint (fausses alarmes), ou par des omissions de signalement lorsque le systme est dans
un tat suprieur ou gal ltat dg-6 (non-dtections). Numriquement, ces mthodes
sont caractrises respectivement par les LPC
1
L
{D
1
}
t
|{X}
t
et
2
L
{D
2
}
t
|{X}
t
dnies
comme suit :
1
D
t,1
D
t,1
d
ok dfaut
neuf 0 1 0
dg-1 0 1 0
dg-2 0 1 0
dg-3 0 1 0
dg-4 0 0.80 0.20
dg-5 0 0.35 0.65
dg-6 0 0.30 0.70
dg-7 0 0.25 0.75
dg-8 0 0.20 0.80
panne 0 0.05 0.95
2
D
t,2
D
t,2
d
ok dfaut
neuf 0 1 0
dg-1 0 1 0
dg-2 0 1 0
dg-3 0 1 0
dg-4 0 0.99 0.01
dg-5 0 0.95 0.05
dg-6 0 0.10 0.90
dg-7 0 0.05 0.95
dg-8 0 0 1
panne 0 0 1
.
La politique du diagnostic est xe de faon minimiser les non-dtections en conservant
le rsultat dtect le plus critique. La LPC
sys
L
{D
sys
}
t
|{D
1
,D
2
}
t
donne dans la suite
permet de traduire cela en termes probabilistes.
sys
D
sys
t
D
t,1
D
t,2
d
ok dfaut
d
1 0 0
ok d
0 1 0
dfaut d
0 0 1
d
ok 0 1 0
ok ok 0 1 0
dfaut ok 0 0 1
d
dfaut 0 0 1
ok dfaut 0 0 1
dfaut dfaut 0 0 1
.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Enn, la spcication des variables (
t,1
)
t1
et (
t,2
)
t1
permet de dnir la politique
dactivation du diagnostic 1 et du diagnostic 2 au cours du temps. En notant mod(x, y) le
reste de la division euclidienne de lentier x par lentier y, xer
t,1
= 1I(mod(t,
1
) = 0)
revient considrer une politique dactivation
1
-priodique pour la mthode 1. De manire
analogue, il est possible de poser
t,2
= 1I(mod(t,
2
) = 0) pour la mthode 2.
chaque instant t 2, ltat du systme dpend de laction de maintenance A
t1
s-
lectionne linstant t 1. Quatre oprations de maintenance sont considres dans cet
exemple. Lensemble / = nant, rp-1, rp-3, rp-tot dsigne le support de la variable
alatoire A
t
. Laction nant correspond au cas o il ny a pas daction eectue. Laction
rp-1 eectue une rparation partielle du systme en diminuant la criticit du systme
dun tat. De manire analogue, laction rp-3 permet une diminution de trois niveaux de
criticit. Laction rp-tot correspond un renouvellement du systme, le systme est remis
dans ltat neuf quel que soit son tat courant. Par consquent, lensemble des actions de
maintenance agissant sur le systme est donn par lensemble /
X
= rp-1, rp-3, rp-tot.
Numriquement, la loi de transition articielle
act
L
{X}
t
|{X,A
X
}
t
vrie
act
X
t
X
t1
A
t1
neuf rp-1 1 0 0 0 0 0 0 0 0 0
dg-1 rp-1 1 0 0 0 0 0 0 0 0 0
dg-2 rp-1 0 1 0 0 0 0 0 0 0 0
dg-3 rp-1 0 0 1 0 0 0 0 0 0 0
dg-4 rp-1 0 0 0 1 0 0 0 0 0 0
dg-5 rp-1 0 0 0 0 1 0 0 0 0 0
dg-6 rp-1 0 0 0 0 0 1 0 0 0 0
dg-7 rp-1 0 0 0 0 0 0 1 0 0 0
dg-8 rp-1 0 0 0 0 0 0 0 1 0 0
panne rp-1 0 0 0 0 0 0 0 0 1 0
neuf rp-3 1 0 0 0 0 0 0 0 0 0
dg-1 rp-3 1 0 0 0 0 0 0 0 0 0
dg-2 rp-3 1 0 0 0 0 0 0 0 0 0
dg-3 rp-3 1 0 0 0 0 0 0 0 0 0
dg-4 rp-3 0 1 0 0 0 0 0 0 0 0
dg-5 rp-3 0 0 1 0 0 0 0 0 0 0
dg-6 rp-3 0 0 0 1 0 0 0 0 0 0
dg-7 rp-3 0 0 0 0 1 0 0 0 0 0
dg-8 rp-3 0 0 0 0 0 1 0 0 0 0
panne rp-3 0 0 0 0 0 0 1 0 0 0
neuf rp-tot 1 0 0 0 0 0 0 0 0 0
dg-1 rp-tot 1 0 0 0 0 0 0 0 0 0
dg-2 rp-tot 1 0 0 0 0 0 0 0 0 0
dg-3 rp-tot 1 0 0 0 0 0 0 0 0 0
dg-4 rp-tot 1 0 0 0 0 0 0 0 0 0
dg-5 rp-tot 1 0 0 0 0 0 0 0 0 0
dg-6 rp-tot 1 0 0 0 0 0 0 0 0 0
dg-7 rp-tot 1 0 0 0 0 0 0 0 0 0
dg-8 rp-tot 1 0 0 0 0 0 0 0 0 0
panne rp-tot 1 0 0 0 0 0 0 0 0 0
.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Il sagit enn de dnir la politique des actions de maintenance en spciant lopration de
maintenance eectue lorsque le diagnostic signale un dfaut. Supposons par exemple que
la dtection dun dfaut engendre une rparation minimale (action rp-1). Dans ce cas, la
LPC L
{A}
t
|{D
sys
}
t
scrit comme suit :
rp-1
A
t
D
sys
t
nant rp-1 rp-3 rp-tot
d
1 0 0 0
ok 1 0 0 0
dfaut 0 1 0 0
.
De manire similaire, il est possible dutiliser des rfrentiels de maintenance plus prudents
en dclenchant les actions rp-3, voire rp-tot, aprs un signalement de dfaut en posant
respectivement les deux LPC suivantes :
rp-3
A
t
D
sys
t
d
1 0 0 0
ok 1 0 0 0
dfaut 0 0 1 0
rp-tot
A
t
D
sys
t
d
1 0 0 0
ok 1 0 0 0
dfaut 0 0 0 1
.
Utilits
Nous disposons de la description probabiliste dun modle VirMaLab reprsentant un sys-
tme de production V = (, ,
act
, (
t,1
,
t,2
)
t1
,
1
,
2
,
sys
, ). Lobjectif est prsent
de construire une fonction dutilit permettant dvaluer la politique de maintenance du
systme. Dans cet exemple, la notion dutilit est homogne une grandeur conomique
dont lunit nest pas prcise. Une utilit ngative correspond un cot, tandis quune
utilit positive correspond un bnce. Les paragraphes suivants dcrivent les utilits
associes chacune des variables du modle.
Dans un premier temps, nous supposons que la qualit de la production dpend de ltat
dans lequel se trouve le systme. Plus prcisment, des bnces sont raliss tant que ce
dernier est neuf ou peu dgrad. En revanche, ds lors que le systme atteint ltat dg-
7, des pertes sont occasionnes. Numriquement, lutilit du systme par unit de temps
relativement son tat est caractrise par le potentiel u
X
suivant :
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
X
t
u
X
10 9 9 8 7 5 0 -3 -10 -100
.
Concernant le diagnostic, les utilits associes une utilisation de la mthode 1 et de la
mthode 2 sont notes respectivement u
1
et u
2
. Puisque la mthode 2 est plus performante
que la mthode 1, nous lui attachons un cot dactivation plus lev, cest--dire une utilit
ngative moins grande, savoir :
u
1
u
2
1 4
.
Notons par ailleurs que dans cet exemple, le rsultat des diagnostics nont pas dutilit,
autrement dit, les potentiels dutilit correspondant aux variables D
t,1
et D
t,2
sont des
potentiels nuls. Nous abordons pour nir le cot des actions de maintenance par linterm-
diaire du potentiel dutilit, not u
A
, dni par
A
t
u
A
0 -30 -60 -150
.
Les utilits par unit de temps de chacune des composantes du modle VirMaLab sont
calcules chaque instant t comme suit :
U
X
t
=
xX

t
(x)u
X
(x) (systme) ;
U
t,1
=
t,1
u
1
et U
t,2
=
t,2
u
2
(diagnostics) ;
U
A
t
=
aA
P(A
t
= a)u
A
(x) (action de maintenance).
Par la suite, ces utilits lmentaires sont mises prot dans les valuations de la fonction
dutilit complte du modle, note f
util
, calcule sur un temps de simulation donn. La
fonction mono-utilit moyenne sur un horizon temporel T (cf. exemple 3.4) est utilise dans
la suite, cest--dire
f
util
(T) =
1
T
T
t=1
_
U
X
t
+U
t,1
+U
t,2
+U
A
t
.
Quelques rsultats
Lensemble de tables 3.2 prsente les utilits moyennes sur un horizon temporel de 3 ans
(1095 jours ou units de temps) obtenues en faisant varier les priodes dactivation des
diagnostics et le dclenchement des actions de maintenance. Ces rsultats sont donns pour
un systme se dgradant rapidement et plus lentement, respectivement dans les tables
3.2a et 3.2b. Dans le cas de la dgradation rapide, nous observons que la politique de
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
maintenance minimale
rp-1
ne permet pas de compenser susamment le vieillissement
du systme an dviter des pertes. Parmi les rsultats prsents, la meilleure politique
consiste dclencher les diagnostics conjointement tous les 30 jours et de remettre le
systme neuf en cas de signalement dfectueux (politique
rp-tot
).
En revanche, lorsque la dgradation est plus lente, toutes les politiques de maintenance
exprimentes deviennent bnciaires. Dans ce cas, le meilleur rsultat en termes dutilit
moyenne sobtient en eectuant un diagnostic 1 tous les 30 jours, un diagnostic 2 tous les 90
jours et une rparation de niveau trois en cas de dfaut dtect. Remarquons galement que
la stabilit des utilits obtenues par rapport aux variations de la politique de maintenance
dpend fortement de la vitesse de dgradation du systme.
1

2
Maintenance Utilit moy.
(en jours) (en jours) (par jour)
30 30
rp-1
-6.88
60 30
rp-1
-8.51
90 30
rp-1
-9.02
30 60
rp-1
-7.74
60 60
rp-1
-14.60
90 60
rp-1
-13.41
30 90
rp-1
-8.02
60 90
rp-1
-13.09
90 90
rp-1
-17.34
30 30
rp-3
6.88
60 30
rp-3
5.94
90 30
rp-3
5.56
30 60
rp-3
6.21
60 60
rp-3
-0.57
90 60
rp-3
1.11
30 90
rp-3
5.95
60 90
rp-3
1.41
90 90
rp-3
-7.25
30 30
rp-tot
8.14
60 30
rp-tot
7.92
90 30
rp-tot
7.81
30 60
rp-tot
8.00
60 60
rp-tot
6.85
90 60
rp-tot
6.69
30 90
rp-tot
7.92
60 90
rp-tot
6.69
90 90
rp-tot
4.62
(a) Avec = 0.99 et = 1.
1

2
Maintenance Utilit moy.
(en jours) (en jours) (par jour)
30 30
rp-1
8.51
60 30
rp-1
8.41
90 30
rp-1
8.36
30 60
rp-1
8.56
60 60
rp-1
8.40
90 60
rp-1
8.36
30 90
rp-1
8.58
60 90
rp-1
8.43
90 90
rp-1
8.28
30 30
rp-3
8.73
60 30
rp-3
8.62
90 30
rp-3
8.56
30 60
rp-3
8.79
60 60
rp-3
8.65
90 60
rp-3
8.58
30 90
rp-3
8.80
60 90
rp-3
8.66
90 90
rp-3
8.55
30 30
rp-tot
8.65
60 30
rp-tot
8.59
90 30
rp-tot
8.55
30 60
rp-tot
8.70
60 60
rp-tot
8.62
90 60
rp-tot
8.57
30 90
rp-tot
8.72
60 90
rp-tot
8.63
90 90
rp-tot
8.54
(b) Avec = 0.99 et = 0.1.
Tab. 3.2 Utilit moyenne journalire du systme de production sur 3 ans en
fonction des priodes
1
et
2
dactivation des diagnostics et des trois politiques
dactions de maintenance. Les paramtres permettant dobtenir la meilleure utilit
sont indiqus en gras.
La gure 3.5 illustre lvolution de la fonction dutilit moyenne journalire horizon crois-
sant, (f
util
(t))
1t1095
, en fonction du temps et pour des vitesses de dgradation du systme
direntes. Les rsultats prsents correspondent la situation o les deux diagnostics sont
eectus conjointement tous les 30 jours en appliquant la politique de rparation minimale
(
rp-1
). Nous observons que la politique de maintenance applique dans cet exemple nest
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
3.4 Politiques de maintenance 115
valable long terme que si le systme ne se dgrade pas trop vite ( 0.3). Pour 0.6,
la politique globale retenue (diagnostic et action) aboutit en moyenne des pertes. Ceci
souligne clairement lintrt de possder pralablement des informations prcises sur le
processus de dgradation du systme dans loptique dajuster sa politique de maintenance.
0 200 400 600 800 1000 1200
50
40
30
20
10
0
10
Temps (en jours)
U
t
i
l
i
t
= 0
= 0.3
= 0.6
= 1
Fig. 3.5 volution de lutilit moyenne journalire en fonction du paramtre de
dgradation , avec = 0.99,
1
=
2
= 30 et la politique
rp-1
.
Bien que raliste, lexemple prsent dans cette partie reste simple an dillustrer eca-
cement les notions introduites dans ce chapitre. En eet, le systme est mono-composant
avec un processus de dgradation reprsent uniquement par une chane de Markov. Le cha-
pitre 4 dcrit lutilisation du modle VirMaLab dans le cadre de la maintenance des rails,
avec une modlisation bi-composant, bi-utilit et des processus de dgradation complexes
utilisant une structure de type MGD.
3.4 Politiques de maintenance
Dans cette partie, nous montrons en quoi le modle VirMaLab savre pertinent pour re-
prsenter les principaux concepts de maintenance (cf. introduction). Nous dcrivons com-
ment se dclinent en pratique les dirents paramtres du modle an de simuler une
politique de maintenance donne. Pour ce faire, lensemble dsignant les tats du systme
X est partitionn par lensemble des tats de bon fonctionnement X
U
et lensemble des
tats de panne X
D
. Rappelons quun tat de panne est un tat dans lequel le systme ne
parvient pas raliser une fonction requise. Nous faisons galement lhypothse que les
systmes tudis ne sont pas auto-rparables, autrement dit lensemble des tats de panne
est absorbant. Parmi les tats de bon fonctionnement, nous notons x
neuf
X
U
ltat du
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
systme lorsque ce dernier est neuf ou remis neuf.
3.4.1 Maintenance corrective
La maintenance corrective dsigne toute action dentretien visant ramener le systme
dans un tat de bon fonctionnement lorsque ce dernier est entr dans un tat de panne. La
prsence dlments de maintenance corrective dans le modle VirMaLab est conditionne
par les points suivants :
(i) Lensemble des actions de maintenance agissant sur le systme doit possder au moins
une action corrective, cest--dire permettant la transition dun tat de panne vers
un tat de fonctionnement susant. Cela signie formellement quil existe une action
a
cor
/
X
, un tat de panne x
D
X
D
et un tat de bon fonctionnement x
U
X
U
tels que la LPC de transition articielle
act
L
{X}
t
|{X,A
X
}
t1
vrie
act
(x
D
, a
cor
, x
U
) > 0.
(ii) Il est ncessaire quau moins une des L mthodes de diagnostic considres permette
le signalement dun tat de panne. Cela signie quil doit exister un 1, . . . , L
tel que la -me mthode de diagnostic possde une alerte d
,cor
T
correspondant
un tat de panne x
D
X
D
. En outre, la LPC
L
{D
}
t
|{X}
t
doit vrier
(x
D
, d
,cor
) > 0.
(iii) Supposons lexistence dune action de maintenance corrective a
cor
/
X
et dun
signalement de panne d
,cor
T
. Dans le cas o seule la -me mthode de diagnostic

est active, la politique du diagnostic et la politique dactions de maintenance doivent
permettre le dclenchement de laction a
cor
lorsque lalerte d
,cor
est observe. Dun
point de vue probabiliste, cela se traduit par lexistence dun rsultat de diagnostic
d
cor
T
sys
tel que les LPC
sys
et L
{A
t
}|{D
sys
}
t
vrient
sys
(d
, . . . , d
,cor
, . . . , d
, d
cor
) > 0 et (d
cor
, a
cor
) > 0.
Exemple 3.5
Reprenons le contexte et les notations introduites dans lexemple prsent dans la partie
3.3.4. Nous avons alors :
X = A = neuf, dg-1, dg-2, . . . , dg-8, panne ;
X
U
= A
U
= neuf, dg-1, dg-2, . . . , dg-8 et X
D
= A
D
= panne ;
x
neuf
= neuf.
Toutes les actions agissant sur le systme peuvent tre considres comme action corrective
relativement ltat panne. En eet, daprs la loi de transition articielle chacune des
actions disponibles, excepte laction nant, permettent de ramener le systme dans un
tat de bon fonctionnement lorsque celui-ci a atteint ltat panne. Dautre part, les deux
mthodes de diagnostic sont susceptibles de dtecter ltat panne en lanant le signalement
dfaut. Or, daprs la politique de diagnostic, il sut dun seul signalement dfaut pour
dclencher une action une maintenance.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Selon limportance des modications apportes au systme par une action de maintenance
corrective, deux catgories daction sont possibles : les actions palliatives et les actions
curatives.
Action palliative
Une action de maintenance palliative est destine rtablir provisoirement tout ou une par-
tie dune fonction requise dun systme tomb en panne. Notons galement que la main-
tenance palliative est couramment appele "dpannage". Plus prcisment, elle consiste
rparer le systme de manire le ramener dans un tat de bon fonctionnement sans
pour autant le remettre neuf. Formellement, une action corrective a
cor
/
X
est dite
palliative relativement ltat de panne x
D
X
D
si la LPC de transition articielle
act
L
{X}
t
|{X,A
X
}
t1
vrie pour tout x X,
act
(x
D
, a
cor
, x) =
_
> 0 si x X
U
x
neuf
0 sinon
.
Exemple 3.6
Dans lexemple prsent dans la partie 3.3.4, les actions de maintenance rp-1 et rp-3 sont
correctives palliatives relativement ltat panne puisque
act
(panne, rp-1, dg-8) =
act
(panne, rp-3, dg-6) = 1,
o les tats dg-6 et dg-8 appartiennent bien lensemble des tats de bon fonctionnement.
Action curative
Une action de maintenance curative a pour objectif de compltement rtablir une fonction
requise dun systme tomb en panne en eectuant une remise neuf. La maintenance
curative correspond une rparation parfaite ou un renouvellement du systme. Aprs
ce type daction, le systme est considr comme tant neuf. Formellement, une action
corrective a
cor
/
X
est dite curative relativement ltat de panne x
D
X
D
si la LPC
de transition articielle
act
L
{X}
t
|{X,A
X
}
t1
vrie pour tout x X,
act
(x
D
, a
cor
, x) = 1I(x = x
neuf
).
Exemple 3.7
Dans lexemple prsent dans la partie 3.3.4, seule laction de maintenance rp-tot est
curative relativement ltat panne puisque
act
(panne, rp-tot, neuf) = 1.
3.4.2 Maintenance prventive
La maintenance prventive dsigne toute action dentretien visant diminuer ltat de
dgradation du systme avant que ce dernier natteigne un tat de panne. Dans le modle
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
VirMaLab, la maintenance prventive est caractrise par la vrication des hypothses
suivantes :
(i) Lensemble des actions de maintenance agissant sur le systme doit possder au moins
une action prventive, cest--dire permettant la transition dun tat de bon fonction-
nement vers un tat de bon fonctionnement moins critique. Remarquons que sil
nexiste pas de relation dordre de gravit parmi au moins un sous ensemble dtats
de bon fonctionnement, le terme action prventive na pas de sens. Aussi, nous suppo-
sons prsent que lensemble X
U
= x
U
1
, x
U
2
, . . . o x
U
i
est un tat moins critique
que x
U
j
si i < j. Cela signie formellement quil existe une action a
prv
/
X
et
deux tats de bon fonctionnement x
U
i
, x
U
j
X
U
, avec i < j, tels que la LPC de
transition articielle
act
L
{X}
t
|{X,A
X
}
t1
vrie
act
(x
U
j
, a
prv
, x
U
i
) > 0.
(ii) Il est ncessaire quau moins une des L mthodes de diagnostic considres soit ddie
au signalement dun tat de bon fonctionnement dirent de ltat x
neuf
. Cela signie
quil doit exister un 1, . . . , L tel que la -me mthode de diagnostic possde
une alerte d
,prv
T
correspondant un tat x
U
X
U
x
neuf
. En outre, la LPC
L
{D
}
t
|{X}
t
doit vrier
(x
U
, d
,prv
) > 0.
(iii) Supposons lexistence dune action de maintenance prventive a
prv
/
X
et dun
signalement prventif d
,prv
T
. Dans le cas o seule la -me mthode diagnostic

est active, la politique du diagnostic et la politique daction de maintenance doivent
permettre le dclenchement de laction a
prv
lorsque lalerte d
,prv
est observe. Dun
point de vue probabiliste, cela se traduit par lexistence dun rsultat de diagnostic
d
prv
T
sys
tel que les LPC
sys
et L
{A
t
}|{D
sys
}
t
vrient
sys
(d
, . . . , d
,prv
, . . . , d
, d
prv
) > 0 et (d
prv
, a
prv
) > 0.
Il est important de noter quune mme action de maintenance peut avoir un rle correctif
ou prventif selon le contexte (cf. exemple 3.8). Cela dpend uniquement de ltat dans
lequel se trouve le systme au moment de la maintenance. Si ltat courant est dirent
dun tat de panne, laction est prventive. Dans le cas contraire, laction est corrective.
Exemple 3.8
Poursuivons lexemple 3.5 en remarquant que toutes les actions de maintenance dcrites
dans la partie 3.3.4 peuvent tre considres comme tant prventives. En eet, les deux
appareils de diagnostic sont capables denvoyer un signalement de dfaut avant que le
systme natteigne ltat panne. Or, tout signalement de dfaut dclenche une action de
maintenance. Cette dernire est donc qualie de prventive si le diagnostic a t eectu
susamment tt.
La mise en place dune politique de maintenance prventive gagne en pertinence lorsquelle
est adapte au systme considr. Remplacer prventivement un composant coteux tous
les mois alors que ce dernier possde une dure de vie moyenne se comptant en annes
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
na que peu dintrts. Bien que souvent dlicate, loptimisation des actions prventives
est envisageable ds lors quun modle de dgradation du systme est exploitable. Il est
galement ncessaire de choisir un critre optimiser. Dans cette tude, nous utilisons
la fonction dutilit, note f
util
. Considrons par ailleurs un modle VirMaLab, not
V = (V
desc
, V
maint
), avec pour rappel (cf. partie 3.2.3) :
les paramtres descriptifs V
desc
= (
1
,
sys
,
act
, (
)
1L
) ;
les paramtres de maintenance V
maint
= ((
t,
) t1
1L
,
sys
, ), incluant les paramtres
du diagnostic.
Par consquent, optimiser la maintenance revient chercher les paramtres de mainte-
nance

V
maint
maximisant la fonction dutilit f
util
. Autrement dit, il sagit de rsoudre le
problme :
V
maint
= arg max
(
t,
)
t1
1L
,
sys
,
f
util
(V
desc
, V
maint
), (3.21)
o les paramtres descriptifs V
desc
sont invariants pour un systme donn. La fonction
dutilit ne possdant aucune proprit de direntiabilit vidente et compte tenu du
nombre de paramtres ajuster, le problme (3.21) est un problme doptimisation di-
cile. Lutilisation de mtaheuristiques (Dro et al. 2003) semble donc approprie dans ce
contexte. Prcisons que cette thse na pas pour objectif dtudier le problme de loptimi-
sation de manire approfondie. Seuls quelques travaux exploratoires sont prsents dans la
suite.
En gnral, ce problme se subdivise en tudiant indpendamment la composante systma-
tique et la composante conditionnelle caractrisant la maintenance prventive. Nous notons
alors V
maint
= (V
maint
sys
, V
maint
cond
) o
V
maint
sys
= (
t,
) t1
1L
dsigne les paramtres de maintenance prventive systmatique ;
V
maint
cond
= (
sys
, ) dsigne les paramtres de maintenance prventive conditionnelle.
Composante systmatique
La composante systmatique correspond toute opration de surveillance ou dentretien
eectue selon un chancier. Dans le modle VirMaLab, le caractre systmatique de la
maintenance prventive est contrl par les variables dactivation (
t,
) t1
1L
.
Remarque 3.3
De manire rendre totalement indpendant les actions de maintenance des instants eec-
tifs des diagnostics, il est possible de crer articiellement une
t,
spcique une politique
dactions donne (systmatique en particulier).
Loptimisation de la maintenance systmatique sur un horizon temporel de longueur T
consiste dterminer

V
maint
sys
= (
t,
)1tT
1L
{0, 1}
TL
maximisant la fonction dutilit.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
En dautres termes, lobjectif est de rsoudre
V
maint
sys
= arg max
(
t,
)
1tT
1L
{0,1}
TL
f
util
(V
desc
, V
maint
sys
, V
maint
cond
), (3.22)
les autres paramtres tant xs. Lespace des paramtres explorer dans le problme (3.22)
contient 2
TL
lments soulignant clairement la dicult de loptimisation pour les grandes
valeurs de TL (TL 20 dans les exprimentations ralises). Une manire de simplier la
problmatique sans pour autant sloigner des ralits pratiques consiste considrer un
chancier priodique. Dans ce cas,

V
maint
sys
= (
)
1L
{1, . . . , T}
L
o
correspond
la priode dactivation de la -mthode de diagnostic telle que
t,
= 1I(mod(t,
) = 0). Le
problme de maximisation (3.22) se rcrit alors
V
maint
sys
= arg max
(
)
1L
{1,...,T}
L
f
util
(V
desc
, V
maint
sys
, V
maint
cond
).
Lespace des paramtres explorer est alors grandement rduit T
L
lments. Une explo-
ration exhaustive des priodes dinspection est envisageable lorsque lhorizon temporel et
le nombre de diagnostics prennent des valeurs raisonnables.
Exemple 3.9
Reprenons le contexte de lexemple prsent dans la partie 3.3.4. La gure 3.6 reprsente les
variations de lutilit journalire moyenne sur 3 ans en fonction des priodes dactivation du
diagnostic 1 et du diagnostic 2, notes respectivement
1
et
2
. Ces rsultats sont obtenus en
supposant un systme se dgradant selon les paramtres = 0.99 et = 1. Nous observons
que lutilit moyenne maximum est atteinte en inspectant le systme uniquement laide de
la mthode 1 tous les
1
= 2 jours. Ceci sexplique par le fait que dans ce cas les mthodes
de diagnostic sont en concurrence et que le rapport prcision/cot est moins rentable pour
la mthode 2 que pour la mthode 1. Sur cet exemple, la suppression du diagnostic 2 peut
tre envisage sans perte dutilit.
Supposons prsent que les mthodes de diagnostic soient spcialises et non concurrentes
(inverse du cas prcdent). Considrons les caractristiques donnes par les LPC suivantes :
1
D
t,1
D
t,1
d
ok dfaut
neuf 0 1 0
dg-1 0 1 0
dg-2 0 1 0
dg-3 0 1 0
dg-4 0 1 0
dg-5 0 1 0
dg-6 0 0.40 0.60
dg-7 0 1 0
dg-8 0 1 0
panne 0 1 0
2
D
t,2
D
t,2
d
ok dfaut
neuf 0 1 0
dg-1 0 1 0
dg-2 0 1 0
dg-3 0 1 0
dg-4 0 1 0
dg-5 0 1 0
dg-6 0 1 0
dg-7 0 1 0
dg-8 0 1 0
panne 0 0 1
.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Priode dinspection mthode 1 (en jours)
P
r
i
o
d
e

d
i
n
s
p
e
c
t
i
o
n

m
t
h
o
d
e

2

(
e
n

j
o
u
r
s
)
1 2 3 4 5 Inf
1
2
5
10
20
100
200
300
Inf
20
15
10
5
0
5
Fig. 3.6 volution de lutilit journalire moyenne sur 3 ans en fonction des
priodes de diagnostic
1
et
2
. La dgradation du systme est caractrise par les
paramtres = 0.99 et = 1 et la politique dactions eectue est
rp-1
. Les
mthodes de diagnostic possdent les caractristiques prsentes dans la partie 3.3.4
(concurrentes). La notation "Inf" sur les axes correspond linni. Lorsque
1
=
(resp.
2
= ), cela signie que la mthode de diagnostic 1 (resp. mthode 2) nest
pas utilise au cours du scnario.
La mthode 1 est ddie la dtection prventive et exclusive de ltat de dgradation
dg-6. Cette mthode dclenche une action de maintenance prventive lorsque le systme
se trouve dans ltat dg-6 avec un taux de dtection de 60%. La mthode 2 permet quant
elle le dclenchement dune action corrective lorsque le systme atteint ltat panne. La
gure 3.7 prsente les variations de lutilit journalire moyenne sur 3 ans en fonction des
priodes dactivation des deux mthodes de diagnostic munies des caractristiques donnes
prcdemment. Loptimum est atteint pour
1
= 1 jour et
2
= 5 jours. Cet exemple
illustre un cas o la maintenance corrective et la maintenance prventive ont des rles
complmentaires.
Composante conditionnelle
La composante conditionnelle correspond aux traitements des indices rvlateurs de ltat
du systme ainsi quaux dcisions de maintenance qui en dcoulent. Dans le modle Vir-
MaLab, laspect conditionnel est caractris par la LPC de gestion des diagnostic
sys
L
{D
sys
}|{D
1
,...,D
L
}
et la LPC associe la politique dactions de maintenance L
{A}|{D
sys
}
.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Priode dinspection mthode 1 (en jours)
P
r
i
o
d
e

d
i
n
s
p
e
c
t
i
o
n

m
t
h
o
d
e

2

(
e
n

j
o
u
r
s
)
1 2 3 4 5 6 Inf
1
2
3
4
5
6
Inf
20
15
10
5
0
Fig. 3.7 volution de lutilit journalire moyenne sur 3 ans en fonction des
priodes de diagnostic
1
et
2
. La dgradation du systme est caractrise par les
paramtres = 0.99 et = 1, Laction de maintenance eectue est rp-1. Les
mthodes de diagnostic possdent les caractristiques prsentes dans cette exemple
(non concurrentes).
Loptimisation de la composante conditionnelle revient chercher

V
maint
cond
= (
sys
, ) maxi-
misant la fonction dutilit, ce qui scrit
V
maint
cond
= arg max
sys
L
{D
sys
}|{D
1
,...,D
L
}
,L
{A}|{D
sys
}
f
util
(V
desc
, V
maint
sys
, V
maint
cond
), (3.23)
les autres paramtres tant xs. Dans ce cas, il sagit dexplorer les espaces L
{D
sys
}|{D
1
,...,D
L
}
et L
{A}|{D
sys
}
associs des domaines discrets et nis. Quels que soient ces domaines, ces
espaces contiennent un nombre inni de LPC. Lexploration de ces espaces ne peut tre
ralise de manire exhaustive. Des rsultats encourageants ont t obtenus partir dune
mthode de recuit simul adapte lexploration despace continu (Corana et al. 1987).
Nanmoins, en se restreignant aux seules LPC dterministes (cf. dnition 1.8), le nombre
de LPC possibles chute |D
sys
|
L
=1
|D
| pour
sys
et |A||D
sys
| pour . Sous cette hypo-
thse dterministe, il y a donc |A||D
sys
|
2
L
=1
|D
| ajustements explorer pour dterminer

la politique conditionnelle optimale correspondante. Une fois encore, il est rare en pratique
dtre en mesure de tester chaque conguration, ce qui souligne la ncessit dappliquer des
mthodes doptimisation adaptes ce type de situations.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
3.5 Conclusions 123
3.5 Conclusions
Ce chapitre est ddi la description dun modle de maintenance gnrique que nous appe-
lons VirMaLab. Ce dernier repose sur le formalisme des Modles Graphiques Probabilistes
Markoviens (MGPM). Cette approche permet de reprsenter le processus de dgradation
dun systme dynamique ainsi que ses moyens de diagnostic et de maintenance.
Le premier intrt du modle VirMaLab provient de sa exibilit. La plupart des m-
thodes de maintenance ayant cours dans lindustrie peuvent y tre intgres. Il est en outre
possible de tenir compte de direntes politiques de maintenance conjointement (correc-
tive, prventive systmatique, prventive conditionnelle) en vue den tudier les eets sur
le systme. Le second point intressant de cette approche concerne lhritage des outils
danalyse associs aux MGPM. Ladaptation des algorithmes dinfrence gnriques dans
le cadre du modle VirMaLab rend possible lvaluation de politiques de maintenance
selon un critre donn. Dans cette tude, notre choix sest arrt sur le critre dutilit au
vue du large ventail de problmes quil permet de traiter. Nous prsentons en particulier
dans ce chapitre quelques rsultats sur lajustement des paramtres de maintenance dans
le cas o lutilit correspond un cot ou un prot.
Notons enn quune tude rigoureuse de la complexit spatiale et algorithmique de lap-
proche VirMaLab est prsente. Par ailleurs, la boite outils Matlab
R
voque dans
la conclusion du chapitre 2 a t mise prot pour la modlisation de la maintenance de
systmes multi-composants.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Chapitre 4
Application ` a la prevention des ruptures
de rails
Sommaire
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126
4.1.1 Contexte de letude . . . . . . . . . . . . . . . . . . . . . . . . . 126
4.1.2 Defauts de fatigue et ruptures . . . . . . . . . . . . . . . . . . . . 127
4.1.3 Deroulement de letude . . . . . . . . . . . . . . . . . . . . . . . 128
4.2 Representation de la voie ferree . . . . . . . . . . . . . . . . . . . 128
4.3 Degradation dun coupon elementaire . . . . . . . . . . . . . . . 129
4.3.1 Generalites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
4.3.2 Modelisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
4.3.3 Co ut associe à lindisponibilite de la voie . . . . . . . . . . . . . 136
4.3.4 Apprentissage des lois de temps de sejour . . . . . . . . . . . . . 136
4.4 Methodes de diagnostic . . . . . . . . . . . . . . . . . . . . . . . . 138
4.4.1 Diagnostic ultrasonore . . . . . . . . . . . . . . . . . . . . . . . . 141
4.4.2 Diagnostic par signalisation . . . . . . . . . . . . . . . . . . . . . 143
4.4.3 Politique de diagnostic . . . . . . . . . . . . . . . . . . . . . . . . 144
4.4.4 Co uts associes aux diagnostics . . . . . . . . . . . . . . . . . . . 145
4.5 Actions de maintenance . . . . . . . . . . . . . . . . . . . . . . . 145
4.5.1 Description qualitative . . . . . . . . . . . . . . . . . . . . . . . . 145
4.5.2 Politique daction . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
4.5.3 Co uts associes aux actions de maintenance . . . . . . . . . . . . 148
4.5.4 Consequences sur le coupon elementaire . . . . . . . . . . . . . . 148
4.6 Outil developpe . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
4.6.1 Description . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
4.6.2 Resultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
4.7 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
126 Chapitre 4. Application la prvention des ruptures de rails
4.1 Introduction
4.1.1 Contexte de ltude
Ces dernires annes, la Rgie Autonome des Transports Parisiens (RATP) a constat une
recrudescence des dfauts de rails. Ces dfauts, touchant en particulier la ligne A du R-
seau Express Rgional (RER), peuvent conduire des ruptures de rails. Les procdures de
maintenance tablies par le service de la voie permettent de conserver un niveau de scu-
rit lev face ce phnomne. En revanche, ces procdures se traduisent le plus souvent
par larrt immdiat du trac en cas de dtection dune rupture, ce qui occasionne une
dgradation de la qualit de service et des cots de maintenance importants. Une tude
prliminaire ralise lunit Voie de la RATP a montr lintrt dune analyse prvi-
sionnelle de la maintenance de faon prvenir lapparition de ruptures (Le Bihan and
Jouve 2005). Linspection des rails, le suivi des dfauts et les remplacements prventifs ont
clairement t identis comme des paramtres clefs pour lamlioration du rseau.
Il existe dans la littrature quelques travaux abordant lanalyse des risques associs aux
ruptures de rails (Barkan et al. 2003), (Dick et al. 2003), (Anderson and Barkan 2004). Les
mthodes proposes sapparentent dans la plupart des cas une tude statistique spcique
sur les donnes de Retour dEXprience (REX) du rseau considr. Aucune mthodologie
gnrique nest rellement dcrite, ce qui rend ces approches dicilement transposables
aux problmatiques dautres exploitants. De plus, ces tudes norent pas la possibilit
dvaluer les eets de direntes stratgies de maintenance. Dautres travaux sintressent
lajustement de la maintenance prventive des rails. Orringer (1988) a propos un modle
statique pour loptimisation des intervalles de temps entre deux inspections de la voie. Plus
rcemment, Podollini et al. (2006) ont ajout une dimension temporelle en reprsentant
la dgradation des rails par une chane de Markov. Dans ce cas, loptimisation de la poli-
tique de maintenance est ralise partir dun algorithme gntique. Bien que possdant
un cadre dapplication relativement large, cette mthode soure dun nombre lev de pa-
ramtres slectionner pour loptimisation, compliquant son utilisation pratique. Notons
par ailleurs que tous les travaux cits prcdemment ne tiennent pas compte des spcici-
ts engendres par les soudures aluminothermiques (cf. gure 4.1c) qui sont pourtant au
cur des proccupations de la maintenance des rails. Ces dernires sont introduites deux
occasions :
au moment de la pose initiale de la voie ou suite un renouvellement de rails des pas
despace important (environ tous les 250 mtres) ;
lors de la pose dun coupon de rparation (longueur moyenne de 23 mtres sur le RER)
suite une opration de maintenance corrective.
Les soudure possdent une dure de vie bien infrieure aux rails standards, dits encore rails
"pleine barre". Autrement dit, plus il y a de soudures sur la voie, plus le risque dapparition
dun dfaut par mtre linaire augmente. Ces soudures apparaissent et disparaissent au l
des oprations de maintenance, ce qui rend dlicate la modlisation de leur impact sur la
dgradation de la voie. notre connaissance, seul larticle de Zhao et al. (2007) propose
un modle tenant compte de ces soudures, les processus de dgradation sous-jacents tant
l encore reprsents par des chanes de Markov.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
4.1 Introduction 127
patin
me
champignon
(a) Schma dun rail
File haute
File basse
(b) Voie en courbe (c) Soudure aluminothermique
Fig. 4.1 Illustrations caractristiques de la voie.
4.1.2 Dfauts de fatigue et ruptures
Les rails sont soumis dimportantes contraintes rptes au niveau du contact rail-roue
lors de la circulation des trains (Bondeux et al. 2006). Ces contraintes, conjugues lexis-
tence de glissements entre le rail et la roue, entranent dirents modes de dgradations
qui se traduisent par lapparition :
dusure des prols qui est caractrise par larrachement rpt de mtal sur le rail et la
roue ;
dusure ondulatoire qui se prsente sous la forme dune ondulation de la surface du rail
plus ou moins rgulire ;
de dfauts de surface provenant du dveloppement de ssures inities dans la zone de
contact, en surface ou en subsurface immdiate ;
de dfauts de fatigue internes provenant du dveloppement de ssures inities sur de
petites inclusions dimpurets communment prsentes dans lacier.
Ce dernier type est le plus pnalisant car il aboutit terme la rupture systmatique du
rail. Les dfauts de fatigue internes ou de surface apparaissent majoritairement au niveau
des soudures aluminothermiques, points faibles de la voie. Toute anomalie, mme lgre,
lors du soudage est susceptible dentraner une htrognit du mlange (par exemple
un prchauage insusant). Lutilisation des moules de soudage peut galement crer en
surface des petites ssures qui constituent autant damorces de ruptures. Notons cepen-
dant que lvolution des procdures de soudage tend danne en anne minimiser ces
inconvnients.
Lvolution de ces ssures dpend principalement de la charge lessieu des matriels
roulants circulant sur la voie. Plus cette charge augmente, plus le phnomne de fatigue
sintensie, acclrant la propagation des ssures. De mme, ces dfauts se dclarent le
plus souvent dans les courbes de faible rayon et en le dite haute (par opposition la le
dite basse, cf. gure 4.1b) o les contraintes sont les plus fortes du fait de linscription du
matriel roulant en courbe. La gure 4.2 illustre les dirents types de rupture. La rupture
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
simple (cf. gures 4.2a et 4.2b), cas le plus frquent, prsente un danger limit pour la
circulation et est quasiment toujours dtecte immdiatement par la signalisation (coupure
du courant circulant dans les rails).
(a) Rupture simple sur rail (b) Rupture simple sur soudure
Fig. 4.2 Exemples de ruptures.
La rparation dune rupture se traduit par une opration de maintenance curative visant
insrer un coupon de rail neuf en lieu et place de la rupture. Cette mthode prsente
linconvnient de multiplier le nombre de soudures aluminothermiques, introduisant ainsi
sur la voie des points singuliers plus faible dure de vie. Lvolution temporelle du nombre
de soudures complique le problme de modlisation de la voie en vue dtudier sa abilit.
Ceci revient en eet considrer un systme dans lequel le nombre de composants nest
pas xe. La partie 4.2 explicite la solution introduite pour contourner cette dicult.
4.1.3 Droulement de ltude
Lobjectif de ce chapitre est dappliquer lapproche gnrique VirMaLab (cf. chapitre
3) de la prvention des ruptures de rails. La partie 4.2 dcrit lapproche adopte pour
reprsenter la voie ferre dans le cadre de cette tude. Le modle de dgradation de la voie
est prsent dans la partie 4.3. Les parties 4.4 et 4.5 dtaillent respectivement lintgration
des systmes de diagnostic et des actions de maintenance dans le modle VirMaLab
associ cette tude. Enn, cette tude a donn lieu au dveloppement dun outil danalyse
de la maintenance des rails. La partie 4.6 propose une brve description de cet outil ainsi
quune tude de cas illustrant le type danalyses ralisables.
4.2 Reprsentation de la voie ferre
Dans cette tude, nous nous intressons au processus de dgradation de la voie ferre li
aux dfauts de fatigue. De manire synthtique, nous supposons quune voie est constitue
de deux les de rails, chacune delles tant compose de rails standards (pleines barres) et
dun certain nombre de soudures aluminothermiques. Notons que les rails en pleines barres
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
4.3 Dgradation dun coupon lmentaire 129
sont par nature des composants de nature continue, tandis que les soudures sont des points
singuliers de la voie. Cette dirence de nature complique la reprsentation dune le de
rail dans un cadre formel. Pour remdier ce problme, nous procdons une discrtisation
de la voie. Plus prcisment, nous faisons les hypothses suivantes :
1. Toute voie de longueur L
v
est reprsente comme une succession de N
ce
= 2L
v
/L
ce
coupons de longueur L
ce
.
2. Chaque coupon peut ventuellement possder au plus une soudure aluminothermique.
3. Pour une section de voie donne, les coupons sont supposs indpendants et rgis par
le mme processus de dgradation.
Le couple compos dun coupon de rail pleine barre de taille L
ce
et dune ventuelle soudure
aluminothermique est appel coupon lmentaire. La gure 4.3 illustre les hypothses pr-
cdentes. Une bonne pratique quant au choix de la taille du coupon lmentaire L
ce
consiste
prendre la longueur moyenne du coupon remplac lors dune opration de maintenance
curative, savoir environ 25 mtres sur le RER.
Cette reprsentation de la voie permet de ramener ltude dune portion de voie quelconque
ltude de son coupon lmentaire moyen. Autrement dit, cette approche simplie la pro-
blmatique initiale en modlisant une voie ferre donne par uniquement deux composants,
savoir la pleine barre de longueur L
ce
et lventuelle soudure caractristique de la voie
considre. Supposons par exemple que lobjectif soit danalyser la abilit des rails situs
en courbe ayant un rayon de courbure infrieur 500 mtres sur le RER A. La mthode
consiste alors construire partir du REX disponible les modles de dgradation de la
pleine barre moyenne et de la soudure moyenne dans ce contexte particulier. Lhypothse
dindpendance est ensuite utilise an dextrapoler les rsultats obtenus pour le coupon
lmentaire la totalit de la voie considre.
Remarquons toutefois que ces hypothses simplicatrices rendent impossible une analyse
gographique de la dgradation de la voie ferre. La prvision de la localisation dune
rupture est exclue avec une telle approche. En revanche, la mthodologie dcrite est bien
adaptes pour le calcul dindicateurs moyens tels que le cot moyen annuel de la mainte-
nance ou le nombre moyen annuel de ruptures. Notons enn quil est thoriquement possible
de construire un modle intgrant les informations gographiques dune voie donne. Ce-
pendant, pour des raisons de complexit spatiale et algorithmique, cela nest actuellement
pas ralis.
4.3 Dgradation dun coupon lmentaire
4.3.1 Gnralits
Nous abordons prsent la modlisation du processus de dgradation dun coupon lmen-
taire. Autrement dit, il sagit dtudier lvolution des dfauts de fatigue dans une pleine
barre et dans une soudure pour un contexte donn. Dans les paragraphes suivants, nous
nous reposons sur la classication des dfauts de fatigue en vigueur la RATP (Le Bihan
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Section de voie
Soudure
aumnothermque
Fe de ra
Discretisation
Voie discretisee
Coupon
avec soudure
Coupon
sans soudure
Modelisation
Coupon elementaire
Pene barre
Soudure
(probabt d'exstence)
Fig. 4.3 Modlisation de la voie.
2005). Cette classication est directement lie la taille du dfaut dtect, et par cons-
quent au degr durgence de son limination. Le classement, par gravit croissante, est le
suivant :
N : pas de dfaut dtect ;
O : dfaut en observation ;
X1 : dfaut surveiller de prs ;
X2 : dfaut rparer avec dlai dun mois maximum;
S : dfaut rparer durgence.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Daprs les rfrentiels de maintenance, les ruptures napparaissent pas explicitement dans
le classement prcdent mais sont regroupes dans la classe S avec les dfauts internes
majeurs et les ssures visibles ayant atteint un stade critique. En revanche, les donnes de
REX disponibles proposent une discrtisation plus dtaille de la classe S en SInt, SVis et
SRup dsignant respectivement un dfaut interne critique, une ssure visible critique et
une rupture. Du point de vue de la maintenance, cette distinction est intressante car seule
la dtection dune rupture entrane, pour des raisons de scurit, une rparation immdiate
quelles que soient les consquences pour lexploitation. Une rupture est donc susceptible
dengendrer des perturbations importantes du service voyageur puisque la maintenance
ncessite larrt du trac. Il est noter que les dfauts critiques autres que les ruptures
sont en gnral traits immdiatement, mais de manire palliative sans interrompre lex-
ploitation (renforcement du dfaut par clissage), puis de manire curative sous un certain
dlai.
Rappelons que cette tude a pour objectif la prvention des ruptures de rails en valuant
les performances de telle ou telle politique de maintenance sur un horizon temporel donn.
Pour cette raison, et galement an de limiter la complexit algorithmique de lapproche,
une prcision temporelle mensuelle est utilise dans la suite. Par consquent, la classe X2
et la classe S, sans les ruptures, peuvent tre agrges de par lchelle temporelle utilise.
Pour des raisons similaires, il est galement intressant de fusionner la classe O et la classe
X1. Des remarques prcdentes, nous dduisons lensemble des tats de dgradation dun
coupon lmentaire (pleine barre + soudure) pour notre modlisation :
N : pas de dfaut ;
OX1 : dfaut mineur ;
X2S : dfaut critique ;
SRup : rupture.
Prcisons enn quil existe de nombreux facteurs contextuels agissant sur le processus
de dgradation des rails. Dans le cadre de cette application, nous nous intressons en
particulier :
la charge lessieu et au tonnage support par la zone tudie ;
au rayon des courbes ;
la localisation sur le haute ou basse.
Dautres paramtres pourraient tre ajouts cette liste tels que linsusance de dvers
1
,
la nuance de lacier
2
des rails ou le type des soudures. Cependant, augmenter le degr
de prcision du contexte a pour consquence une diminution des donnes disponibles per-
mettant den expliquer les eets. Le choix des variables contextuelles retenues provient
dun compromis entre la pertinence qualitative du modle de dgradation et la quantit
dinformations utilisables pour son apprentissage.
1
Linsusance de dvers est lcart, ngatif, entre le dvers thoriquement ncessaire pour compenser
la force centrifuge et le dvers rel, le dvers tant la valeur de linclinaison transversale dune voie ferre.
2
La nuance dun acier correspond ses caractristiques de construction exprimes par un certain nombre
de proprits mcaniques et chimiques.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
4.3.2 Modlisation
Description qualitative
La gure 4.4 prsente le Modle Graphique Probabilistes Markovien dordre un (1-MGPM,
cf. chapitre 1) associ au processus de dgradation dun coupon lmentaire. Ce dernier
tant constitu dune pleine barre de rail de longueur L
ce
et dune ventuelle soudure, le
processus global est reprsent par deux sous-modles correspondant ces deux compo-
sants. Dans cette application, nous utilisons les Modles Graphiques de Dure (MGD, cf.
chapitre 2) de manire faire face dventuels dynamiques dvolution complexes.
systme
cot
d'indisponibilite
coupon
elementaire
soudure
contexte
pleine
barre
Fig. 4.4 Modle de transition du 1-MGPM associ la dgradation dun coupon
lmentaire. Comme dans les chapitres prcdents, les liens de couleur rouge indique
une dpendance entre la tranche t 1 et la tranche t.
Le vecteur alatoire X
pb,t
= (X
pb,t
, S
pb,t
) reprsente les caractristiques de la pleine
barre de rail linstant t. La variable alatoire X
pb,t
valeurs dans lensemble dtats
A = N, OX1, X2S, SRup dsigne son niveau de dgradation linstant t. La variable
alatoire S
pb,t
valeurs dans o = 1, . . . , T
S
dsigne le temps restant linstant t avant
le prochain changement dtat, o T
S
correspond au temps de sjour maximum possible
dans chaque tat. De mme, le vecteur alatoire X
sd,t
= (E
sd,t
, X
sd,t
, S
sd,t
) reprsente les
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
caractristiques de la soudure linstant t. La signication des variables alatoires X
sd,t
et S
sd,t
est analogue ce qui est dcrit pour la pleine barre. La variable E
sd,t
, valeurs
dans lensemble c = absente, prsente est une variable alatoire deux tats permettant
de modliser la probabilit que le coupon lmentaire prsente ou non une soudure. De
manire synthtique, ltat du coupon lmentaire est dni comme tant gal ltat le
plus critique entre celui de la pleine barre et celui de la soudure associe. De ce fait, nous
introduisons galement la variable alatoire X
ce,t
de manire reprsenter explicitement
ltat du coupon lmentaire linstant t. Par ailleurs, la variable dutilit C
sys
t
dsigne le
cot associ ltat du systme, autrement dit ltat du coupon lmentaire, linstant
t. Ce cot sinterprte comme la pnalit conomique engendre par une indisponibilit du
systme.
Le contexte est dcrit par un vecteur z suppos indpendant du temps et agissant sur la
dgradation de la pleine barre et de la soudure. La variable symbolisant le contexte est
volontairement note en lettre minuscule de faon souligner le fait quil ne sagit pas
dune variable alatoire. Chaque tude sur la dgradation du systme est donc ralise
avec un contexte dni a priori. De ce contexte, nous pouvons dduire les deux grandeurs
suivantes :
L
v,z
, le nombre de mtres de rails correspondant au contexte z ;
N
ce,z
= L
v,z
/L
ce
, le nombre de coupons lmentaires associ la voie de contexte z.
Pour nir, en utilisant les notations de lapproche VirMaLab (cf. chapitre 3), le vecteur
alatoire reprsentant ltat global du systme correspond X
t
= (z, X
pb,t
, X
sd,t
, X
ce,t
).
Description probabiliste
Soit z le vecteur contenant les informations contextuelles relatives la voie que nous sou-
haitons tudier. Dun point de vue probabiliste, le processus de dgradation naturelle dune
pleine barre est caractris par la distribution de son tat linstant initial, note
pb,z,1
,
sa Loi de Probabilit Conditionnelle (LPC) de transition naturelle, note Q
sys
pb,z
, et sa LPC
des temps de sjour, note F
sys
pb,z
. Rappelons que la loi
pb,z,1
constitue un des paramtres
descriptifs du modle puisquil permet de spcier ltat initial des pleines barres sur la voie
considre. En gnral, nous nous plaons dans le cas o la voie est initialement neuve en
aectant une probabilit gale un ltat N. Sous rserve dexistence, lvolution dune
soudure possde des caractristiques probabilistes analogues. Excepte la LPC des temps
de sjour F
sys
sd,z
, les paramtres probabilistes de la soudure
sd,z,1
et Q
sys
sd,z
dpendent expli-
citement de son existence. En pratique, sil ny pas de soudure linstant t, cest--dire si
E
sd,t
= absente, une probabilit gale 1 est associe ltat N. Nous considrons donc que
labsence de soudure est modlise par une soudure neuve qui ne se dgrade pas. Dautre
part, nous supposons que :
les processus de dgradation ne sont pas auto-rparables ;
ltat rupture est absorbant ;
les transitions entre tats seectuent de proche en proche, dans lordre croissant de
gravit.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Ces remarques, et en particulier le dernier point, sont conformes la physique de pro-
pagation des ssures internes. Daprs les descriptions prcdentes, les lois de transition
naturelle de la pleine barre et de la soudure vrient respectivement :
Q
sys
pb,z
X
pb,t
X
pb,t1
N OX1 X2S SRup
N 0 1 0 0
OX1 0 0 1 0
X2S 0 0 0 1
SRup 0 0 0 1
Q
sys
sd,z
X
sd,t
X
sd,t1
E
sd,t
N OX1 X2S SRup
N absente 1 0 0 0
OX1 absente 1 0 0 0
X2S absente 1 0 0 0
SRup absente 1 0 0 0
N prsente 0 1 0 0
OX1 prsente 0 0 1 0
X2S prsente 0 0 0 1
SRup prsente 0 0 0 1
Il est important de noter que le processus de dgradation de la soudure dpend galement
de lvolution de sa probabilit de prsence. Rappelons que dans cette section nous nous
intressons lvolution naturelle du coupon lmentaire. Le processus dcrivant lexistence
dune soudure est donc dni dans un premier temps par sa loi initiale de prsence, note
sd,z,1
. linstar des lois initiales
pb,z,1
et
sd,z,1
, la loi
sd,z,1
est un paramtre descriptif
du modle permettant de tenir compte du nombre de soudures prsentes initialement sur
la voie, not N
sd,z,1
. Rappelons que par hypothse, le nombre de soudures est au plus
gal au nombre de coupons lmentaires, cest--dire N
sd,z,1
N
ce,z
La probabilit initiale
dexistence dune soudure est alors donne par
P(E
sd,1
= prsente; z) =
+
sd,z,1
=
N
sd,z,1
N
ce,z
, (4.1)
Le processus rgissant lexistence de la soudure dpend galement de sa loi de transition
naturelle, note W
sys
sd
. Or, aprs la pose initiale et sans intervention extrieure, il ne peut
y avoir cration de soudures, ces dernires tant introduites sur la voie lors doprations
de maintenance correctives. Autrement dit, la probabilit de prsence dune soudure ne
change pas et par consquent la LPC W
sys
sd
correspond la LPC identit :
W
sys
sd
E
sd,t
E
sd,t1
absente prsente
absente 1 0
prsente 0 1
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
La dnition de la LPC de transition articielle de cration/suppression de soudure, note
W
act
sd,z
, est aborde la n de la partie 4.5.4.
Nous introduisons enn la LPC
cd
permettant de dnir ltat du coupon lmentaire
conditionnellement ltat de la pleine barre et ltat de la soudure. Rappelons que ltat
du coupon lmentaire correspond ltat de dgradation le plus critique entre celui de la
pleine barre et celui de la soudure. Cela se traduit formellement par :
ce
X
ce,t
X
pb,t
X
sd,t
N OX1 X2S SRup
N N 1 0 0 0
OX1 N 0 1 0 0
X2S N 0 0 1 0
SRup N 0 0 0 1
N OX1 0 1 0 0
OX1 OX1 0 1 0 0
X2S OX1 0 0 1 0
SRup OX1 0 0 0 1
N X2S 0 0 1 0
OX1 X2S 0 0 1 0
X2S X2S 0 0 1 0
SRup X2S 0 0 0 1
N SRup 0 0 0 1
OX1 SRup 0 0 0 1
X2S SRup 0 0 0 1
SRup SRup 0 0 0 1
En conclusion, nous supposons ici que la dgradation naturelle du coupon lmentaire ne
dpend que des lois de temps de sjour associes chacun des deux composants. Lap-
prentissage de ces lois est dtaill dans la partie 4.3.4. Par ailleurs, cet exemple illustre la
possibilit de traiter les systmes multi-composants dans le cadre du modle VirMaLab.
Remarque 4.1 (Notations VirMaLab)
En reprenant les notations introduites au chapitre 3, la loi initiale du systme
1
est dnie
par
z,1
=
pb,z,1
F
sys
pb,z

sd,z,1

sd,z,1
F
sys
sd,z

ce
.
La LPC de transition naturelle
sys
z
est quant elle dnie par
sys
z
=
_
Q
sys
pb,z
F
sys
pb,z
W
sys
sd,z
Q
sys
sd,z
F
sys
sd,z
si transition
C
pb
I
pb
C
sd
I
sd
sinon
,
o C
pb
et I
pb
dsignent respectivement la LPC de dcompte des temps de sjour et la
LPC identit associes au composant pleine barre (cf. notations introduites dans le cadre
des MGD au chapitre 2). Les LPC C
sd
et I
sd
correspondent aux mmes objets pour le
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
composant soudure. La description de la LPC de transition articielle
act
z
est donne dans
la partie 4.5, laquelle aborde la modlisation des actions de maintenance et leur eet sur
le systme.
4.3.3 Cot associ lindisponibilit de la voie
Dans cette tude, nous supposons que seule la prsence dune rupture sur la voie entrane
de lindisponibilit. Cette dernire a des rpercussions conomiques dues aux perturbations
du service voyageur. Nous notons alors c
sys
ind
la pnalit nancire occasionne par lappa-
rition dune rupture sur la voie considre et nous en dduisons son cot pour un coupon
lmentaire linstant t :
C
sys
z,t
= c
sys
ind
P(X
ce,t
= SRup; z), (4.2)
o P(X
ce,t
= SRup; z) correspond la probabilit quune rupture apparaisse sur le coupon
lmentaire associ la voie de contexte z linstant t.
Remarquons que les perturbations engendres par les ruptures ont galement des cons-
quences en termes dimage pour lexploitant. Par consquent, ltude du nombre de ruptures
au cours du temps savre galement pertinente, et ce, indpendamment des considrations
nancires directes. Notons N
rup,z,t
lesprance du nombre de ruptures prsentes sur la voie
linstant t. Par dnition, nous avons :
N
rup,z,t
= N
ce,z
P(X
ce,t
= SRup; z). (4.3)
4.3.4 Apprentissage des lois de temps de sjour
Donnes disponibles
Lapprentissage des LPC associes aux temps de sjour dans chacun des tats de dgrada-
tion de la pleine barre et de la soudure seectue en exploitant les bases de REX disponibles.
la RATP, le REX concernant le suivi des dfauts de fatigue est stock dans une base
dite Avaries. Le traitement de cette base permet dobtenir une information sur les dures
de vie des pleines barres et des soudures qui ont prsent un dfaut. Plus prcisment,
le contexte gnral, le classement du dfaut et la date de chaque avarie sont donns. Il
est donc possible de reconstruire lhistorique de chaque pleine barre ou de chaque soudure
ayant prsent un dfaut, de son installation sur la voie jusqu son retrait.
Notons que pour des raisons de scurit videntes, la RATP ne laisse pas voluer les dfauts
dtects jusqu lapparition dune rupture. Ceci constitue une dicult dun point de vue
statistique car, de fait, il existe trs peu de donnes disponibles sur les temps de sjour
dans les tats dgrads OX1 et X2S. Les seules informations rellement exploitables par une
mthode dapprentissage automatique concernent ltat N. Les distributions des temps de
sjour associs aux tat OX1 et X2S sont xes par avis dexperts et prennent gnralement
la forme de lois de Weibull.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Il est important de noter que la prise en compte des seules donnes davaries conduit
une estimation pessimiste du processus de dgradation du coupon lmentaire. Il est en
eet ncessaire de tenir compte de toutes les pleines barres et toutes les soudures qui
nont pas encore prsent de dfaut la date o ltude a lieu. Pour ces matriels toujours
fonctionnels, nous disposons uniquement dune borne infrieure du temps de sjour rel dans
ltat N. Le traitement de ces donnes, dites censures droite (Kalbeisch and Prentice
2002), constitue la seconde dicult de ce problme dapprentissage. titre indicatif, les
informations concernant le matriel encore en voie une date donne se trouve dans une
seconde base appele Rail.
Au nal, pour un contexte z donn, un ltrage des bases Avaries et Rail est ralis de
manire obtenir les quantits suivantes :
N
pb,z,s
et N
sd,z,s
dsignent respectivement le nombre de mtres de rail et le nombre de
soudures retirs suite toutes les avaries intervenues s mois aprs la pose du matriel
en voie ;
N
+
pb,z,s
et N
+
sd,z,s
dsignent respectivement le nombre de mtres de rail et le nombre de
soudures gs de s mois la n de ltude qui nont pas prsent davarie.
Par exemple, la quantit N
z,pb,6
= 200 signie quun total de 200 mtres de rail pleine
barre gs de 6 mois ont t retirs suite des avaries dans le contexte z. En revanche, la
quantit N
+
z,pb,6
= 3500 signie quun total de 3500 mtres de rail gs de 6 mois taient
sains la n de ltude. La prise en compte de ces donnes ne permet plus de dterminer
une expression analytique pour les estimations du maximum de vraisemblance, comme
dcrit dans la partie 2.4.2. Lutilisation dune mthode de type EM savre en gnral
bien adapte dans ce cadre (Hartley 1958). Le principe consiste dans un premier temps
estimer la distribution des donnes censures, puis appliquer ce rsultat lestimation du
maximum de vraisemblance comme si les donnes taient compltes. Il sagit ensuite ditrer
les deux tapes prcdentes jusqu convergence des estimations. Lannexe D prsente en
dtails lalgorithme mis en place pour lestimation des distributions de temps de sjour.
Quelques rsultats dapprentissage
Dans les paragraphes suivants, nous prsentons les estimations obtenues en exploitant le
REX RATP des distributions du temps entre la pose et lapparition du premier dfaut
(class OX1, X2S ou SRup) associes la pleine barre et la soudure moyenne dans
dirents contextes. Nous nous intressons au tronon central de la ligne A du rseau RER
qui stend entre les stations La Dfense et Vincennes. Ce tronon est la zone la plus
critique en matire de dfaut de fatigue sur le rseau RATP. Ceci est principalement d
un trac trs soutenu et la circulation de matriels roulants agressifs (tonnage et charge
lessieu importants). La table 4.1 donne les taux davaries sur cette zone, calculs partir
du REX sur les dix dernires annes, en fonction du rayon de courbure. Nous observons que
les courbes de rayon infrieur 500 mtres possdent un taux davarie bien suprieur aux
deux autres cas. Ces courbes de faible rayon constituent une des proccupations majeures
de la maintenance des rails. Aussi, les rsultats prsents dans la suite de ce chapitre portent
sur ce contexte particulier.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Rayon de courbure Longueur de la voie Nombre davaries Taux davarie
(en mtres) (en mtres) (par mtre et par anne)
]0, 500] 12492 231 1.3 10
3
]500, 1000] 21512 167 7.8 10
4
]1000, [ 39644 63 1.6 10
4
Tab. 4.1 Analyse du REX entre les 1
er
janvier 1999 et 2009 associ aux avaries
du tronon central du RER A en fonction du rayon de courbure.
Les gures 4.5a et 4.5b reprsentent les distributions des temps avant apparition dun dfaut
sur la le haute des courbes (contraintes fortes) respectivement pour les pleines barres et les
soudures. Les gures 4.5c et 4.5d donnent les mmes rsultats pour la le basse des courbes
(contraintes plus faibles). Ces distributions fournissent une caractrisation numrique du
processus de dgradation associ au coupon lmentaire dans le contexte considr. Par
ailleurs, ces gures montrent clairement la dirence de dure de vie entre les pleines
barres et les soudures. Daprs la gure 4.5a, lapparition dun dfaut sur une pleine barre
en le haute se produit majoritairement entre 20 et 35 mois, ainsi que dans une moindre
mesure entre 40 et 50 mois. En revanche, dans le mme contexte, les soudures ont tendance
prsenter un dfaut entre 1 et 20 mois aprs leur cration (cf. 4.5b). De mme, limpact
de la le dans la dgradation des pleines barres est clairement illustr par les gures 4.5a
et 4.5c. En eet, une pleine barre en le basse a tendance prsenter un dfaut aprs 110
mois, ce qui correspond plus du double de la dure de vie en le haute. Lobservation des
gures 4.5b et 4.5d indique une inuence de la le moins marqu dans le cas des soudures.
Remarquons enn que les formes de ces distributions sont loignes de la forme expo-
nentielle (ou gomtrique en temps discret). Par consquent, ceci justie lutilisation dun
MGD de manire capturer plus prcisment la dynamique dapparition des dfauts sur
la voie tudie.
4.4 Mthodes de diagnostic
La surveillance des dfauts de fatigue sur le rseau RATP est essentiellement ralise par
les deux techniques de diagnostic suivantes :
1. la mthode par ultrasons visant dtecter de faon prventive les ssures internes ;
2. la mthode reposant sur la signalisation, et en particulier les Circuits de Voie (CdV),
permettant de dtecter les ruptures de rails.
Notons quil existe dautres oprations de surveillance permettant de dtecter les rup-
tures telles que les parcours pied ou les signalements de conducteurs. Toutefois, leur
contribution reste trs faible compare aux deux principales mthodes cites prcdem-
ment. Dans cette partie, nous enrichissons le modle de dgradation prsent en gure 4.4
en ajoutant une couche de diagnostics comme le montre la gure 4.6. Le vecteur alatoire
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
4.4 Mthodes de diagnostic 139
10 20 30 40 50 60
0
0.05
0.1
0.15
0.2
Temps (en mois)
P
r
o
b
a
b
i
l
i
t
(a) Pleine barre - File haute

10 20 30 40 50 60
0
0.02
0.04
0.06
0.08
0.1
0.12
Temps (en mois)
P
r
o
b
a
b
i
l
i
t
e
(b) Soudure - File haute
20 40 60 80 100 120
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.18
Temps (en mois)
P
r
o
b
a
b
i
l
i
t
(c) Pleine barre - File basse

20 40 60 80 100 120
0
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
Temps (en mois)
P
r
o
b
a
b
i
l
i
t
(d) Soudure - File basse

Fig. 4.5 Distributions du temps avant apparition du premier dfaut dans les
courbes ayant un rayon infrieur 500 mtres sur le tronon central du RER A.
D
us
t
= (D
us
t,pb
, D
us
t,sd
,
us
t
) reprsente le diagnostic ultrasonore associ au coupon lmentaire.
Les variables alatoires D
us
t,pb
et D
us
t,sd
dsignent respectivement les rsultats du diagnostic
pour la pleine barre et la soudure. Lactivation de linspection ultrasonore linstant t
dpend de la valeur de la variable binaire
us
t
. De manire similaire, le vecteur alatoire
D
sig
t
= (D
sig
t,pb
, D
sig
t,sd
,
sig
t
) modlise le diagnostic du coupon lmentaire issue de la signalisa-
tion. Enn, la politique du diagnostic est reprsente par la variable D
sys
t
. Dans le cadre de
lapproche VirMaLab, le vecteur alatoire caractrisant le diagnostic du systme scrit
D
t
= (D
us
t
, D
sig
t
, D
sys
t
). Des dtails sur le principe et les proprits de chaque mthode
sont fournis dans les paragraphes suivants.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
systme
cot
d'indisponibilite
coupon
elementaire
contexte
soudure
pleine
barre
activation des
diagnostics
cot du
diagnostic
resultat
inspection
ultrasonore
resultat
signalisation
diagnostic
final
diagnostic
ultrasonore
diagnostic
par signalisation
diagnostic
Fig. 4.6 Modle graphique reprsentant le diagnostic de la voie linstant t. Pour
des raisons de lisibilit, les variables X
pb,t
et S
pb,t
sont reprsentes par un seul
nud X
pb,t
= (X
pb,t
, S
pb,t
). De mme, le nud X
sd,t
reprsente le vecteur alatoire
(E
sd,t
, X
sd,t
, S
sd,t
).
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
4.4.1 Diagnostic ultrasonore
Principe
Les ssures internes sont dtectes dans un premier temps par le passage dune voiture
de contrle, nomme V365 (cf. gure 4.7), quipe de sondes ultrasonores. Ces dernires
sont insres dans un patin qui frotte sur le rail pralablement mouill par un liquide de
couplage (gnralement de leau). Les directions de vise de ces sondes sont choisies en
fonction de linclinaison des ssures rencontres. Les auscultations sont eectues une
vitesse maximum de 40 km/h et chaque dtection dclenche un jet de peinture au pied du
rail qui marque lemplacement des dfauts. Par la suite, une quipe de conrmation est
dpche sur le lieu de chaque dtection an de vrier le niveau de gravit du dfaut ou si
le signalement est une fausse alarme. Si le dfaut est conrm, une estimation de sa taille
est obtenue par linspection ultrasonore manuelle. Un classement est ensuite attribu au
dfaut selon son degr de gravit.
Fig. 4.7 Voiture de contrle ultrasonore V365.
Modlisation
Par soucis de simplication, nous appelons par la suite "diagnostic ultrasonore", lensemble
compos du diagnostic opr par le vhicule ainsi que sa conrmation par lquipe spcia-
lise. Formellement, les rsultats des diagnostics ultrasonores linstant t sont reprsents
par les variables alatoires D
us
pb,t
et D
us
sd,t
, toutes deux valeurs dans D = {N, DNC, DC}.
Les direntes issues du diagnostic sont dnies de la manire suivante :
N (Nant) indique quaucun dfaut na t dtect ;
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
DNC (Dfaut Non Conrm) correspond un signalement de la voiture dinspection
V365 qui sest rvl tre une fausse alarme ;
DC (Dfaut Conrm) correspond un dfaut de classe OX1 ou X2S signal par la V365
qui a t conrm manuellement.
Remarquons quen vue dune tude conomique, la distinction des cas DNC et DC est
importante pour tenir compte des cots de conrmation. En eet, ces deux rsultats de
diagnostic supposent quune conrmation, engendrant un cot, a t eectue, tandis que
seul le signalement DC conduit au dclenchement dune opration de maintenance.
La prcision des diagnostics ultrasonores est dcrite par lintermdiaire des LPC
us
pb
et
us
sd
dnies comme suit :
us
pb
(resp.
us
sd
)
D
us
pb,t
(resp. D
us
sd,t
)
X
pb,t
(resp. X
sd,t
) N DNC DC
N 1
us
fa

us
fa
0
OX1 1
us
ox1
0
us
ox1
X2S 1
us
x2s
0
us
x2s
SRup 1 0 0
.
La variable
us
fa
correspond au taux de fausses alarmes de la voiture dinspection. Les
variables
us
ox1
et
us
x2s
dsignent, quant elles, les taux de dtection dun dfaut class OX1
et class X2S respectivement. Ces taux constituent les premiers paramtres descriptifs de la
maintenance dans la modlisation propose. Dans la pratique, les valeurs numriques de ces
taux sont estimes partir du retour dexprience des agents responsables des inspections.
Notons enn que le taux de dtection dune rupture par linspection ultrasonore est ici x
zro bien quen thorie, les sondes de la voiture dinspection soient capables de dtecter la
plupart des ruptures de rails. Ceci provient du pas de temps mensuel (voire hebdomadaire)
considr dans cette tude. Cette discrtisation temporelle est adapte au processus de
dgradation des rails et des soudures, mais pas celui du passage ponctuel de la voiture
dinspection. Dans notre modlisation, dire quune auscultation a lieu linstant t signie
en ralit que cette dernire sest produite dans lintervalle ]t1, t]. Par consquent, lorsque
t est en mois et en considrant la prsence dune surveillance quasi continue de la voie par
la signalisation (cf. partie 4.4.2), la probabilit quune rupture soit dtecte par le vhicule
ultrasonore tend bien vers zro.
Notons enn que les instants de passage de la voiture de surveillance sont contrls par la
variable dactivation
us
t
. En pratique, les auscultations seectuent de manire priodique
telle que
us
t
=
_
1 si mod (t,
us
) = 0
0 sinon
,
o
us
dsigne la priode de passage du vhicule ultrasonore. Cette priode est un des
paramtres participant la dnition de la politique de maintenance dans cette tude.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
4.4.2 Diagnostic par signalisation
Principe
Le second moyen de surveillance des rails considr dans cette application est reprsent par
les Circuits de Voie (CdV). Leur fonction premire est dassurer la dtection de prsence
dun train sur une section (ou canton) donne et dagir sur la signalisation en consquence
(cf. 4.8). Lorsque la section de voie est libre de tout vhicule, les CdV sont galement
capables de reprer les rails casss en observant en continu limpdance lectrique entre
les deux les de rail. Dans un tel cas, lexploitation commerciale du rseau bascule alors
en mode dgrad jusqu ce quune quipe de maintenance soit dpche sur la section
concerne de faon conrmer la nature de lanomalie.
direction d'avancement
Canton
tat
haut
metteur rcepteur
voie
libre
ler essieu
voie
occupe
tat
bas
metteur
Icc
rcepteur
voie
libre
tat
bas
metteur rcepteur
rupture
de rail
Fig. 4.8 Schma de principe dun circuit de voie. Lorsque le circuit de voie est libre,
le courant provenant de lmetteur parvient au rcepteur. Ds quun train entre sur ce
circuit de voie, le courant est court-circuite par les essieux du train, ce qui provoque
un signal darrt pour les trains suivants. Icc dsigne le courant de court-circuit.
Modlisation
Dun point de vue probabiliste, le principe de la modlisation du diagnostic par signalisa-
tion est analogue au diagnostic ultrasonore (cf. partie 4.4.1). Les variables D
sig
pb,t
et D
sig
sd,t
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
reprsentent les diagnostics raliss par la signalisation linstant t pour le rail et la soudure
respectivement. Comme prcdemment, lensemble des rsultats de diagnostic possibles est
T = N, DNC, DC. Suite lobservation dune isolation lectrique anormale au niveau
dun CdV et au reprage dun rail cass par lquipe de conrmation, le diagnostic prend
la valeur DC. En revanche, si lquipe de conrmation ne constate aucun dfaut sur la voie,
le diagnostic prend nalement la valeur DNC.
Les LPC
sig
pb
et
sig
sd
permettent de spcier les caractristiques du diagnostic par signa-
lisation de la manire suivante :
sig
pb
(resp.
sig
sd
)
D
sig
pb,t
(resp. D
sig
sd,t
)
X
pb,t
(resp. X
sd,t
) N DNC DC
N 1
sig
fa

sig
fa
0
OX1 1 0 0
X2S 1 0 0
SRup 1
sig
srup
0
sig
srup
.
La variable
sig
fa
correspond au taux de fausses alarmes associ au diagnostic la signalisation.
Rappelons par ailleurs que cette mthode ne permet pas de dtecter les dfauts internes,
le taux de dtection des dfauts classs OX1 ou X2S est donc suppos nul. Enn, le taux
de dtection dune rupture avre est donn par
sig
srup
. Bien que ce dernier soit trs proche
de un, il arrive nanmoins que certaines ruptures (par exemple en toile) ne soient pas
dtectes par la signalisation; de mme en cas de dilatation des rails par temps chaud.
Rappelons enn que la mthode de diagnostic reposant sur la signalisation eectue une
surveillance quotidienne de la voie et de manire quasi continue. Aussi, en se plaant sur
une chelle mensuelle, il est tout fait raisonnable de considrer cette mthode comme
tant active en permanence. Ceci se traduit formellement en posant pour tout instant t,
sig
t
= 1. Par consquent, la variable dactivation associe au diagnostic par signalisation
ne gure pas parmi les paramtres de maintenance du modle.
4.4.3 Politique de diagnostic
Dans cette application, la politique de diagnostic consiste simplement dclencher une
alerte ds quune des mthodes de surveillance dtecte un dfaut sur une pleine barre ou
une soudure. Lobjectif est de signaler tout dfaut sur le coupon lmentaire, et ce, quels
que soient sa nature et son emplacement. Ceci est dle aux ralits du terrain puisquen
pratique, ds quun dfaut est dtect, une opration de maintenance est dclenche, abou-
tissant au remplacement du coupon dfectueux, que lavarie ait lieu en pleine barre ou sur
une soudure. La variable D
sys
t
est donc valeurs dans T
sys
= N, D o N dsigne une
absence dalarme et D correspond la dtection dun dfaut. Autrement dit, lorsquau
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
4.5 Actions de maintenance 145
moins un signalement DC est observ linstant t, le diagnostic nal est D
sys
t
= D. Dans
le cas contraire, le diagnostic nal prend la valeur D
sys
t
= N.
4.4.4 Cots associs aux diagnostics
Le modle conomique associ au diagnostic repose sur les cots suivants :
c
us
insp
: cot de linspection ultrasonore par mtre de voie inspecter ;
c
us
conf
: cot de la conrmation dun signalement mis par la voiture de surveillance ul-
trasonore ;
c
sig
insp
: cot de la surveillance par circuit de voie par mois ;
c
sig
conf
: cot de la conrmation dun signalement li au circuit de voie.
Lesprance du cot de lensemble des oprations de diagnostic pour un coupon lmentaire
linstant t est calcule comme suit
C
diag
z,t
=
_
L
ce
c
us
insp
+c
us
conf
_
P(D
us
pb,t
,= N; z) +P(D
us
sd,t
,= N; z)
us
t
. .
cot du diagnostic ultrasonore
+
c
sig
insp
+c
sig
conf
_
P(D
sig
pb,t
,= N; z) +P(D
sig
sd,t
,= N; z)
_
. .
cot de la surveillance par signalisation
. (4.4)
4.5 Actions de maintenance
4.5.1 Description qualitative
Nous abordons prsent la modlisation des actions de maintenance concernant la correc-
tion des dfauts de fatigue. La gure 4.9 reprsente la dernire tape dans la construction
du modle VirMaLab, savoir lajout de la variable daction, ainsi que ses liens de dpen-
dance mettant en vidence son impact sur ltat du systme. Dans cette application, cette
dernire consiste en un vecteur alatoire A
t
= (A
s
t
,
t
). La variable alatoire A
s
t
dsigne
laction slectionne linstant t dans lensemble / = N, C, R o :
la valeur N signie quaucune action nest ralise ;
la valeur C correspond la rparation du coupon lmentaire (action curative) ;
la valeur R dsigne le renouvellement complet de la voie considre.
Dautre part, la variable
t
0, 1 est une variable indicatrice permettant de dclencher
explicitement un renouvellement linstant t. Comme le montre le modle graphique,
laction slectionne linstant t 1 agit sur le coupon lmentaire linstant t. Ltat et
les temps de sjour associs la pleine barre et la soudure sont modis en fonction de
laction dclenche au pas de temps prcdent. Il est important de souligner que la soudure
voit galement sa probabilit dexistence changer de manire dirente aprs une rparation
ou aprs un renouvellement. Rappelons en eet que les soudures sont introduites sur la voie
suite aux rparations de coupons dfectueux (cf. partie 4.2). Une mthode permettant de
tenir compte de cette proprit est propose dans la partie 4.5.4.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
diagnostic
cot du
diagnostic
diagnostic
final
diagnostic
ultrasonore
diagnostic
par signalisation
cot
d'indisponibilite
systme
coupon
elementaire
contexte
pleine
barre
soudure
action
selectionnee
variable de
renouvellement
cot de
maintenance
action de
maintenance
Fig. 4.9 Modle VirMaLab associ la maintenance des ruptures de
rails. les nuds D
us
t
et D
sig
t
reprsentent respectivement les vecteurs alatoires
(D
us
pb,t
, D
us
sd,t
,
us
t
) et (D
sig
pb,t
, D
sig
sd,t
,
sig
t
).
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
4.5.2 Politique daction
De manire limiter la propagation des dfauts de fatigue, tout dfaut conrm est trait
par une procdure de maintenance ad hoc consigne dans le rfrentiel de maintenance.
Les dfauts reprs susamment tt (classs OX1) sont mis sous surveillance en vue dune
rparation ultrieure. De mme, les dfauts plus critiques (classs X2S) subissent une conso-
lidation en vue dune rparation dnitive dans un dlai dun mois. Autrement dit, ces deux
cas entranent une action de maintenance prventive puisque le matriel est rpar avant
la rupture. En revanche, lorsquune rupture est dtecte, une action de maintenance cura-
tive immdiate est ralise. Par consquent, chaque diagnostic de dfaut aboutit plus ou
moins long terme une rparation du coupon prsentant lavarie. Notons cependant que
si un renouvellement de rail est prvu linstant t, aucune action de rparation locale ne
peut tre dclenche, et ce, quel que soit le diagnostic courant. Ceci se traduit en termes
probabilistes par la LPC dnie comme suit :
si
t
= 0, aucun renouvellement nest prvu et une action corrective est dclenche en
cas de dtection dun dfaut :
(
t
= 0)
A
s
t
D
sys
t
N C R
N 1 0 0
D 0 1 0
.
si
t
= 1, le renouvellement complet de la voie est eectu quel que soit le rsultat du
diagnostic courant :
(
t
= 1)
A
s
t
D
sys
t
N C R
N 0 0 1
D 0 0 1
.
En pratique sur les voie RER de la RATP, les renouvellements sont raliss de manire
priodique telle que
t
=
_
1 si mod (t,
ren
) = 0
0 sinon
,
o
ren
correspond la priode de renouvellement des rails sur la voie considre. Dans
cette tude, la politique de maintenance est donc caractrise par la priode dauscultation
ultrasonore
us
et la priode de renouvellement
ren
.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
4.5.3 Cots associs aux actions de maintenance
Le cot associ aux actions de maintenance est dni par :
c
act
C
: cot dune opration de maintenance corrective par mtre de rail remplac ;
c
act
R
: cot dune remise neuf de la voie par mtre de rail renouvel.
Lesprance du cot correspondant aux actions de maintenance sur un coupon lmentaire
linstant t est donne par
C
act
z,t
= L
ce
_
c
act
C
P(A
s
t
= C; z)(1
t
) +c
act
R

t
. (4.5)
4.5.4 Consquences sur le coupon lmentaire
Comme le montre la gure 4.9, laction de maintenance agit la fois sur ltat de la pleine
barre et sur ltat de la soudure, ainsi que sur la probabilit dexistence de cette dernire.
Les paragraphes suivants ont pour objet la description probabiliste de limpact des actions
de maintenance sur le coupon lmentaire.
tat du coupon lmentaire
Le coupon lmentaire est remis neuf que laction de maintenance slectionne soit cu-
rative (C) ou de type renouvellement (R). Autrement dit, la pleine barre et la soudure se
retrouve dans ltat neuf (N) quelle que soit leur tat prcdent. Ceci se traduit en termes
probabilistes par lintermdiaire des lois de transition articielle Q
act
pb
et Q
act
sd
dnies comme
suit :
Q
act
pb
(resp. Q
act
sd
)
X
pb,t
(resp. X
sd,t
)
X
pb,t1
(resp. X
sd,t1
) A
s
t1
N OX1 X2S SRup
N C 1 0 0 0
OX1 C 1 0 0 0
X2S C 1 0 0 0
SRup C 1 0 0 0
N R 1 0 0 0
OX1 R 1 0 0 0
X2S R 1 0 0 0
SRup R 1 0 0 0
.
En ne sintressant qu ltat du coupon lmentaire, une simple rparation et un renou-
vellement ont exactement le mme eet. En revanche, ces deux actions nont pas les mmes
cots ni les mmes consquences sur le processus de cration ou de suppression de soudures.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Existence de la soudure
Rappelons que les soudures aluminothermiques sont introduites sur la voie suite la pose
de coupons neufs lors dune opration de maintenance. Chaque rparation entrane thori-
quement lintroduction de deux soudures. Toutefois, lorsque le dfaut a lieu au droit dune
soudure, la rparation du coupon correspondant conduit lajout de deux nouvelles sou-
dures de rparation et supprime la soudure dfectueuse. Il se peut galement que plusieurs
soudures soient proches de la position dun dfaut. Dans ce cas, une rparation entrane
gnralement le retrait des soudures proches du dfaut, faisant ainsi chuter le nombre de
soudures total sur la voie. La quantit de soudures naugmente donc pas forcment linai-
rement en fonction du nombre de rparations eectues. Plus prcisment, ce phnomne
de recouvrement de soudures se produit dautant plus souvent que les dfauts sont peu
disperss, conduisant des concentrations locales de soudures. linverse, si les dfauts
apparaissent de manire uniforme sur la voie, la probabilit de faire chuter le nombre de
soudures lors dune rparation est plus faible.
Dans la suite, nous proposons une mthode empirique permettant de tenir compte de cette
ralit pratique. En se xant un contexte z, la modlisation adopte permet de calculer
lesprance du nombre de soudures prsentes linstant t sur la voie tudie, compose de
N
ce,z
coupons lmentaires de longueur L
ce
. Cette quantit, note N
sd,z,t
, est dnie par
N
z,sd,t
= N
ce,z

+
sd,z,t
, (4.6)
o
+
sd,z,t
= P(E
sd,t
= prsente; z) dsigne la probabilit dexistence dune soudure sur le
coupon lmentaire linstant t.
Dcrivons prsent lapproche empirique propose permettant de caractriser le proces-
sus de cration/suppression dune soudure conditionnellement aux actions de maintenance
eectues. Deux situations sont envisageables :
1. Laction de renouvellement est slectionne (A
s
t1
= R). La voie est donc entirement
remise neuf et par consquent les soudures de rparation sont toutes supprimes.
Nanmoins, un certain nombre de soudures aluminothermiques, not N
sd,z,1
, est ra-
lis an dassembler les coupons neufs entre eux selon la technique dite des longs rails
souds. Cette quantit de soudures dpend donc de la longueur des rails de renouvel-
lement : une longueur de rail importante implique moins de soudures raliser. Par
consquent, la probabilit dexistence dune soudure sur le coupon lmentaire aprs
un renouvellement est gale la probabilit dexistence dune soudure linstant
initial
+
sd,z,1
(cf. quation (4.1)), quel que soit le nombre de soudures eectues dans
le pass.
2. Une action corrective est dclenche suite la dtection dun dfaut (mineur, critique
ou rupture). Dans ce cas, il convient de distinguer les deux cas suivants :
(a) Aucune soudure nest prsente sur le coupon lmentaire (E
sd,t1
= absente).
La pose du nouveau coupon seectue donc en ralisant deux soudures. Daprs
la modlisation de la voie considre, ceci se traduit en ajoutant de manire
dterministe une soudure au coupon lmentaire. La probabilit quune soudure
existe linstant t sachant quune action corrective a t eectue et que le
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
coupon ne possdait pas de soudure est gale P(E
sd,t
= prsente|E
sd,t1
=
absente, A
s
t1
= C) = 1.
(b) Le coupon lmentaire possde dj une soudure (E
sd,t1
= prsente). Dans ce
cas, il est ncessaire de tenir compte dun possible recouvrement de soudure. Par
consquent, la probabilit de prsence de la soudure aprs rparation ne vaut
plus forcment un, puisquen pratique plusieurs soudures peuvent tre suppri-
mes lors de lopration de maintenance.
An destimer cette probabilit, nous avons t contraint dtudier la distribution spatiale
des avaries. Lobjectif est de calculer une estimation de la loi de probabilit des Points
Kilomtriques (PK) associs aux dfauts. Soient pk
i
et pk
f
le PK initial et le PK nal
dlimitant la section de voie considre. Notons Y
pk
la variable alatoire valeurs dans
{pk
i
, . . . , pk
f
} reprsentant la PK dun dfaut. Il sagit destimer pour tout y = pk
i
, . . . , pk
f
,
la distribution des PK davaries, note

P(Y
pk
= y), en exploitant les informations spatiales
contenues dans la base Avaries.
Par la suite, nous ralisons une mesure de la dispersion des dfauts. Nous calculons pour
cela lentropie des PK davaries. Plus prcisment, nous utilisons lentropie normalise,
note H(Y
pk
) [0, 1], qui a pour dnition
H(Y
pk
) =
1
log(pk
f
pk
i
)
pk
f
y=pk
i
P(Y
pk
= y) log P(Y
pk
= y). (4.7)
Lorsque la distribution spatiale des dfauts est uniforme, la dispersion est maximale et
H(Y
pk
) = 1, tandis qu linverse si tous les dfauts sont localiss au mme PK, le lieu
des avaries est dterministe et H(Y
pk
) = 0. Autrement dit, plus H(Y
pk
) est proche de un,
moins il y a de chance quun recouvrement de soudure ait lieu lors dun changement de
coupon.
Nous notons enn
+
sd,z
= P(E
sd,t
= prsente[E
sd,t1
= prsente, A
s
t1
= C; z), le taux de
cration dune soudure aprs une opration de maintenance corrective sur un coupon pos-
sdant dj une soudure. Ce taux est x de faon vrier les deux conditions suivantes :
(i) Si la dispersion des dfauts est uniforme, chaque coupon lmentaire devrait possder
une soudure au bout dun certain temps. Aussi, la probabilit asymptotique dexis-
tence dune soudure, note lim
t
P(E
sd,t
= prsente; z) =
+
sd,z,
doit tendre vers
1.
(ii) Si tous les dfauts apparaissent au mme PK, seul un coupon sur la section de voie
tudie prsente des dfauts. Or, daprs lhypothse des coupons lmentaires in-
dpendants et identiquement distribus, la probabilit asymptotique quun coupon
particulier prsente tous les dfauts est donne par
+
sd,z,
= 1/N
ce,z
.
De faon vrier les conditions prcdentes, nous utilisons lentropie dnie par lquation
(4.7) an de traiter les cas intermdiaires. Nous cherchons
+
sd,z
tel que la probabilit
asymptotique dexistence dune soudure soit gale :
+
sd,z,
=
1
N
ce,z
+H(Y
pk
)
N
ce,z
1
N
ce,z
.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
En utilisant les proprits asymptotiques associes la chane de Markov reprsentant le
processus de suppression/cration de la soudure, nous en dduisons
+
sd,z
= 2
1
+
sd,z,
.
Lapproche dcrite dans les paragraphes prcdents permet de construire la LPC W
act
sd,z
contrlant lvolution du processus dexistence dune soudure :
W
act
sd,z
E
sd,t
E
sd,t1
A
s
t
absente prsente
absente C 0 1
prsente C 1
+
sd,z

+
sd,z
absente R 1
+
sd,z,1

+
sd,z,1
prsente R 1
+
sd,z,1

+
sd,z,1
.
Reprenons lexemple du contexte z correspondant aux courbes de rayon infrieur 500
mtres dans le tronon central du rseau RER A (entre les stations La Dfense et Vin-
cennes). Cette zone correspond L
v,z
= 6246 mtres de rails . En considrant un coupon
lmentaire de longueur L
ce
= 25 mtres, la voie tudie est constitue de N
ce,z
= 249.8
coupons lmentaires indpendants. Les gures 4.10a et 4.10b reprsentent respectivement
la distribution spatiale des avaries pour les les hautes et pour les les basses dans ce
contexte. La table 4.2 donne lentropie normalise de la localisation des dfauts ainsi que
la valeur de
+
sd,z
pour les deux types de les.
20415 22614 23118 25166 25612 26149 26595 27428
0
0.5
1
1.5
2
2.5
3
3.5
4
x 10
3
PK
P
r
o
b
a
b
i
l
i
t
e
(a) File haute
20415 22614 23118 25166 25612 26149 26595 27428
0
1
2
3
4
5
6
7
x 10
3
PK
P
r
o
b
a
b
i
l
i
t
e
(b) File basse
Fig. 4.10 Distributions spatiales des dfauts sur les courbes de rayon infrieur
500 mtres sur le tronon central du RER A.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Nous observons graphiquement que les dfauts apparaissent de manire plus disperse sur
les les hautes. Ceci est conrm numriquement par une entropie des PK de dfaut plus
importante compare celle calcule sur les les basses. Le taux de cration dune soudure
est plus lev denviron 10% sur les les hautes que sur les les basses.
File haute File basse
H(Y
pk
) 0.907 0.809
+
sd,z
0.898 0.765
Tab. 4.2 Entropie normalise de la localisation des dfauts et taux de cration de
soudure dans le contexte des courbes de rayon infrieur 500 mtres sur le tronon
central du RER A.
Remarque 4.2 (Notations VirMaLab)
En reprenant les notations de lapproche VirMaLab, le processus dvolution du sys-
tme (coupon lmentaire) suite une action de maintenance est caractris par la loi de
transition articielle
act
dnie par
act
z
= Q
act
pb
F
sys
pb,z
W
act
sd,z
Q
act
sd
F
sys
sd,z
. (4.8)
Daprs les quations (4.1) et 4.8, nous dduisons la LPC de transition gnrale du systme,
note
z
et dnie par
z
=
ce
_

act
z
si action de maintenance
sys
z
sinon
,
4.6 Outil dvelopp
Ces travaux sur ltude et la prvention des ruptures de rails ont donn lieu au dveloppe-
ment dun outil permettant de comparer direntes stratgies de maintenance. Lobjectif
est de proposer un outil daide la dcision permettant de simuler dirents scnarios,
en vue de rechercher un compromis entre rduction du nombre de ruptures de rails et
diminution des cots de maintenance.
4.6.1 Description
Loutil dvelopp ore dans un premier temps la possibilit dexploiter les donnes REX
RATP de faon estimer les paramtres de dgradation dun coupon lmentaire condi-
tionnellement un contexte de voie donn. Rappelons que lapprentissage du processus de
dgradation du coupon lmentaire est ralis pour une voie caractrise par un certain
contexte not z. Les dirents paramtres permettant de dcrire ce contexte sont rsums
dans le tableau 4.3. Un ltrage des bases Avaries et Rail est ralis de manire obtenir
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
4.6 Outil dvelopp 153
les eectifs des temps de sjour (N
pb,z,s
, N
sd,z,s
, N
+
pb,z,s
, N
+
sd,z,s
)
s1
, ainsi que le taux de
cration de soudure
+
sd,z
.
Par la suite, loutil propos permet la prise en compte des moyens de maintenance dploys.
Dans cette application, il sagit de spcier les caractristiques des mthodes de diagnostic.
Ceci revient en pratique dterminer les taux de fausses alarmes et de bonnes dtections
donns dans la table 4.4. Les aspects conomiques de la maintenance sont, quant eux,
pris en compte en spciant les dirents cots rpertoris dans la table 4.5.
Paramtre Description
Rseau RER ou mtro
Ligne A ou B pour le RER et 1 14 pour le mtro
pk
i
, pk
f
PK dlimitant une zone sur la ligne tudie
[RC
min
, RC
min
] Intervalle des rayons de courbure associs aux courbes considrer
File Haute et/ou basse
Tab. 4.3 Paramtres descriptifs dune voie tudier.
us
fa
Taux de fausse alarme du vhicule dinspection ultrasonore (V365)
us
ox1
Taux de dtection de la V365 pour un dfaut mineur (class OX1)
us
x2s
Taux de dtection de la V365 pour un dfaut critique (class X2S)
sig
fa
Taux de fausse alarme de la surveillance par signalisation
sig
rup
Taux de dtection dune rupture par la signalisation
Tab. 4.4 Paramtres descriptifs des mthodes de diagnostic.
c
sys
ind
Cot dindisponibilit li lapparition dune rupture
c
us
insp
Cot dinspection de la V365 par mtre de voie parcourue
c
us
conf
Cot de conrmation dun dfaut dtect par la V365
c
sig
insp
Cot de la surveillance de la voie par la signalisation
c
sig
conf
Cot de conrmation dun dfaut dtect par la signalisation
c
act
C
Cot de rparation dun coupon par mtre de rail remplac
c
act
R
Cot du renouvellement dune voie par mtre de rail remplac
Tab. 4.5 Paramtres conomiques du modle VirMaLab.
Lorsque les paramtres descriptifs du modle sont spcis, lalgorithme dinfrence 3.1
ddi lapproche VirMaLab peut tre utilis pour valuer lutilit dune politique de
maintenance donne. Dans cette application, cette politique de maintenance est dnie par
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
la priode dinspection ultrasonore, note
us
;
la priode de renouvellement de la voie, note
ren
.
Par ailleurs, nous supposons dans cette tude que lvaluation dune politique est ralise
selon deux critres. Le premier est conomique et correspond au cot moyen sur un horizon
temporel T engendr par la stratgie de maintenance adopte. Le second concerne le nombre
de ruptures moyen obtenu en appliquant ladite stratgie. Par consquent et daprs les
quations (4.2), (4.4), (4.5) et (4.3), nous travaillons avec la fonction multi-utilit suivante :
f
util
(
us
,
ren
) =
_
_
f
cot
(
us
,
ren
) =
N
ce,z
T
T
t=1
_
C
sys
z,t
+C
diag
z,t
+C
act
z,t
_
f
rup
(
us
,
ren
) =
1
T
T
t=1
N
rup,z,t
,
o f
cot
(
us
,
ren
) et f
rup
(
us
,
ren
) dsignent respectivement sur un horizon temporel T
le cot moyen et le nombre de ruptures moyen associs la politique (
us
,
ren
). Lobjectif
est alors de dterminer
us
et
ren
minimisant le cot moyen de la maintenance tout en
assurant que le nombre de ruptures reste sous un certain seuil > 0. Il sagit donc de
rsoudre le problme doptimisation suivant :
_
_
(
us
,
ren
) = arg min
(
us
,
ren
)
f
cot
(
us
,
ren
)
sous la contrainte :
f
rup
(
us
,
ren
)
. (4.9)
Notons que le temps dvaluation de la fonction dutilit pour une politique donne est de
lordre de quelques minutes pour un horizon temporel T = 120 mois. Nanmoins, du fait
que seuls deux paramtres sont ajuster, une simple tude paramtrique savre en gnral
susante pour rechercher les ventuelles politiques satisfaisant les contraintes du problme
(4.9).
Pour nir, un schma rcapitulatif dtaillant les relations entre les dirents modules de
loutil dvelopp est prsent dans la gure 4.11.
4.6.2 Rsultats
Nous achevons ce chapitre en nous plaant nouveau dans le contexte des courbes de rayon
infrieure 500 mtres sur le tronon central du RER A. Nous prsentons quelques rsultats
sur loptimisation des cycles dinspections ultrasonores et de renouvellements de la voie.
Les les hautes et les les basses sont traites sparment conformment aux procdures
dentretien en vigueur la RATP. Rappelons que les paramtres du modle de dgradation
pour chaque type de les ont t tudis la n de la partie 4.3.4. Loutil dvelopp
est utilis dans un premier temps an dvaluer les fonctions f
cot
et f
rup
pour direntes
valeurs de
us
et
ren
, et ce, sur un horizon temporel de 10 ans (T = 120 mois). Dans ltude
paramtrique ralise, nous avons fait varier la priode dauscultation ultrasonore de 1
12 mois et la priode de renouvellement de 1 10 ans. Par ailleurs, la notation
us
=
(resp.
ren
= ), ou "Inf" dans les illustrations, signie quaucune auscultation ultrasonore
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Description du contexte :
- Reseau
- Ligne
- PK zone
- Rayon
- File
Bases REX :
- Avaries
- Rail
Experts
Apprentissage du
modle de degradation
Filtrage
donnees REX
Modle
diagnostic
maintenance
diag
(t)
maint
(t)
Modle de degradation
du coupon elementaire
C.E.
(t-1)
C.E.
(t)
Calcul
d'indicateurs
Virmalab
C.E.
(t-1)
diag
(t)
maint
(t)
C.E.
(t)
maint
(t)
Politique de maintenance
- Periode U.S.
- Periode renouv.
Analyse des
resultats
Fig. 4.11 Schma de principe de loutil dvelopp. Les blocs de couleur bleu, rose
et orange reprsentent respectivement les paramtres dentre, les modles construits
lors dune analyse et les traitements raliss.
(resp. renouvellement) nest ralise au cours du scnario. Nous supposons galement que
lobjectif consiste dterminer la politique de maintenance permettant de minimiser les
cots de maintenance tout en assurant un nombre de ruptures annuel maximum
ext
= 5
pour les les hautes et
ext
= 1 pour les les basses sur les 6246 mtres de voie considre.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Notons enn que par soucis de condentialit, les cots prsents dans la suite sont ctifs.
Priode de renouvellement
(en annes)
P
r
i
o
d
e

d
i
n
s
p
e
c
t
i
o
n

u
l
t
r
a
s
o
n
o
r
e
(
e
n

m
o
i
s
)
1 2 3 4 5 6 7 8 9 10 Inf
1
2
3
4
5
6
7
8
9
10
11
12
Inf
20
40
60
80
100
Region des politiques
satisfaisant la contrainte sur
le nombre de ruptures
(a) Nombre de ruptures moyen annuel (f
rup
).
(en annes)
P
r
i
o
d
e

d
i
n
s
p
e
c
t
i
o
n

u
l
t
r
a
s
o
n
o
r
e
(
e
n

m
o
i
s
)
1 2 3 4 5 6 7 8 9 10 Inf
1
2
3
4
5
6
7
8
9
10
11
12
Inf
1
1.5
2
Frontire des politiques
satisfaisant la contrainte
sur le nombre de ruptures
Politique optimale
selon le critre
economique uniquement Politique optimale
respectant le critre
2.5
(b) Cot moyen annuel (f
cot
).
Fig. 4.12 Cot et nombre de ruptures en fonction de la politique de maintenance
des les hautes situes sur les courbes de rayon infrieur 500 mtres sur le tronon
central du RER A.
Dans le cas des les hautes, les rsultats de ltude paramtrique sont prsents dans
les gures 4.12b et 4.12a donnant respectivement le cot et le nombre de rupture annuels
moyens pour chaque couple
us
et
ren
. Nous observons sur la gure 4.12b que les stratgies
conduisant aux cots les plus faibles consistent renouveler les rails tous les 2 ans. En eet,
si la voie est remise neuve plus souvent, le cot de renouvellement augmente le cot global
de la maintenance. linverse, lorsque la frquence des renouvellements est plus faible, les
conomies ralises sur la maintenance prventive ne sont pas signicatives par rapport
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
us
ren
f
rup
(
us
,
ren
) f
cot
(
us
,
ren
)
(en mois) (en annes)
1 1 0.27 9.98
1 2 0.65 7.63
2 1 1.25 8.12
1 3 2.45 9.24
3 1 2.61 7.67
2 2 3.07 6.08
1 4 3.1 9.47
4 1 3.79 7.55
5 1 3.8 7.42
1 8 4.23 10.24
1 7 4.26 10.41
1 6 4.29 10.49
1 5 4.32 11.05
7 1 4.38 7.29
9 1 4.76 7.20
1 9 4.78 10.96
8 1 4.88 7.28
11 1 4.89 7.15
10 1 4.9 7.20
6 1 4.94 7.45
Tab. 4.6 Cot et nombre de ruptures annuels moyens en fonction des politiques
de maintenance satisfaisant la contrainte de = 5 ruptures annuelles. Ces rsultats
concernent les les hautes situes sur les courbes de rayon infrieur 500 mtres sur
le tronon central du RER A.
aux cots de maintenance corrective. Sans renouvellement rgulier, le nombre de soudures
augmente et la dure de vie globale de la voie tudie diminue. La probabilit de rupture
devient par consquent de plus en plus forte, en particulier si linspection ultrasonore est
peu frquente. Ceci entrane nalement des cots dindisponibilit importants et explique
laugmentation des cots globaux.
En ce qui concerne les rsultats sur loccurrence de ruptures prsents dans la gure 4.12a,
nous observons naturellement que plus les oprations de maintenance sont frquentes et
moins les dfauts ont le temps dvoluer jusqu la rupture.
La table 4.6 liste les stratgies de maintenance satisfaisant la contrainte sur le nombre
de ruptures maximum autoris en le haute, savoir
ext
= 5. Parmi cet ensemble de
politiques admissibles, nous avons mis en vidence quune inspection ultrasonore tous les
2 mois associe un renouvellement de rails tous les 2 ans se rvlait tre la stratgie la
moins coteuse.
Aprs ltude des les hautes, intressons nous prsent aux les basses pour lesquelles des
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
(en annes)
P
r
i
o
d
e

d
i
n
s
p
e
c
t
i
o
n

u
l
t
r
a
s
o
n
o
r
e
(
e
n

m
o
i
s
)
1 2 3 4 5 6 7 8 9 10 Inf
1
2
3
4
5
6
7
8
9
10
11
12
Inf
2
4
6
8
10
12
Region des politiques
satisfaisant la contrainte sur
le nombre de ruptures
(a) Nombre de ruptures moyen annuel (f
rup
).
(en annes)
P
r
i
o
d
e

d
i
n
s
p
e
c
t
i
o
n

u
l
t
r
a
s
o
n
o
r
e
(
e
n

m
o
i
s
)
1 2 3 4 5 6 7 8 9 10 Inf
1
2
3
4
5
6
7
8
9
10
11
12
Inf
3
4
5
6
7
8
9
Frontire des politiques
satisfaisant la contrainte
(b) Cot moyen annuel (f
cot
).
Fig. 4.13 Cot et nombre de ruptures en fonction de la politique de maintenance
des les basses situes sur les courbes de rayon infrieur 500 mtres sur le tronon
central du RER A.
rsultats analogues sont prsents sur les gures 4.13b et 4.13a. Nous observons dans ce cas
que les politiques minimisant les cots de maintenance consistent surveiller et renouveler
la voie peu frquemment. Cette dirence avec les les hautes sexplique simplement du
fait que la dure de vie des rails est plus leve sur les les basses. Autrement dit, les cots
engendrs par des auscultations ultrasonores et des renouvellements frquents ne sont pas
justis au regard de la vitesse de dgradation de la voie en le basse.
linstar du cas prcdent, la gure 4.13a montre un accroissement des ruptures avec la
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
us
ren
(en annes) f
rup
(
us
,
ren
) f
cot
(
us
,
ren
)
(en mois) (en annes)
1 1 0.14 9.71
1 2 0.21 6.98
1 4 0.27 5.36
1 3 0.29 5.94
1 9 0.29 4.81
1 8 0.3 4.83
1 6 0.31 4.83
1 7 0.31 4.84
1 5 0.32 5.40
1 0.52 4.98
1 10 0.52 5.38
2 1 0.7 7.86
2 2 0.99 5.17
Tab. 4.7 Cot et nombre de ruptures annuels moyens en fonction des politiques
de maintenance satisfaisant la contrainte de = 1 ruptures annuelles. Ces rsultats
concernent les les basses situes sur les courbes de rayon infrieur 500 mtres sur
le tronon central du RER A.
diminution des oprations de maintenance. Notons toutefois que cet accroissement seec-
tue par paliers, le premier correspondant laugmentation des priodes de renouvellement
entre 1 et 5 ans et le second lorsque la priode de renouvellement est suprieure ou gale
10 ans. En eet, que la voie soit ausculte tous les 4 mois ou jamais, nous observons trs
peu de variations en termes de rupture ds lors que les rails sont renouvels priodique-
ment entre 5 et 9 ans. Le premier accroissement des ruptures est essentiellement d aux
soudures qui possdent une dure de vie infrieure 4 ans en moyenne (cf. gure 4.5d).
Nous observons ensuite que le deuxime accroissement est plus fort que le premier. Ce der-
nier correspond la fois lapparition de dfauts sur les rails, dont la dure de vie est en
moyenne entre 9 et 10 ans (cf. gure 4.5c), ainsi quaux dfauts sur les soudures introduites
lors des oprations correctives ralises 5 ans plus tt.
Les stratgies de maintenance satisfaisant la contrainte sur le nombre de ruptures maximum
autoris en le basse, savoir
int
= 1, sont prsentes dans la table 4.7. Deux politiques
sont alors remarquables. Dun point de vue purement numrique, une auscultation ultra-
sonore mensuelle accompagne dun renouvellement tous les 9 ans permet de minimiser les
cots de maintenance. Cependant, lors de son passage, le vhicule de surveillance ultraso-
nore ralise un diagnostic sur les deux les simultanment. Aussi, les priodes de passage
sur les les hautes et basses doivent tre identiques. La question est alors de savoir sil faut
diminuer dun mois la priode dauscultation pour les les hautes ou augmenter dun mois
celle des les basses. Daprs le table 4.6, la premire ventualit occasionne un cot suppl-
mentaire de 7.636.08 = 1.55. En revanche, surveiller les les basses tous les 2 mois en les
renouvelant tous les 2 ans nentrane quune augmentation des cots de 5.174.81 = 0.36.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Il sagit par consquent de la solution adopter en pratique.
Cette approche permet galement danalyser en dtails les proprits des politiques de
maintenance slectionnes. Il est en eet possible de calculer un grand nombre dindica-
teurs permettant de mettre en vidence les divers aspects dune stratgie donne. Parmi
les indicateurs les plus utiles dans cette application, citons par exemple : le nombre de
dfauts internes et de ruptures, lvolution du nombre de soudures au cours du temps, les
cots dindisponibilit, de diagnostic et de maintenance. titre dillustration, nous pr-
sentons dans les gures 4.14a et 4.14b la rpartition des cots associe aux politiques de
maintenance optimales dans le contexte des les hautes et basses respectivement.
Lobservation de ces graphiques montre dans les deux cas que les postes de dpenses les plus
importants concernent le renouvellement et la conrmation des inspections ultrasonores.
Limpact conomique des conrmations est directement li au taux de fausses alarmes de
linspection ultrasonore. Par consquent, ces rsultats suggrent quune amlioration du
diagnostic ultrasonore pourrait diminuer de manire signicative les cots de maintenance.
Nous observons par ailleurs les dirences en termes dindisponibilit entre les les hautes
et basses. Le cot de lindisponibilit due aux dfauts sur pleine barre ou soudure reprsente
plus de 10% des dpenses totales sur les les hautes contre moins de 4% sur les les basses.
Ces rsultats apportent donc une quantication conomique de la sensibilit des rails en
les hautes.
4.7 Conclusions
Ce chapitre dtaille lapplication de lapproche VirMaLab an de modliser et dvaluer la
maintenance de la voie. Nous montrons que cette problmatique industrielle complexe peut
se ramener ltude dun systme deux composants (pleine barre et soudure) se dgradant
au cours du temps. Le travail de modlisation ralis illustre ainsi la possibilit de traiter
des systmes multi-composants partir de lapproche VirMaLab. Cette application fait
galement intervenir les modles graphiques de dure pour la reprsentation du processus de
dgradation de chaque composant. Une analyse des donnes de REX conrme la pertinence
de ce choix par rapport aux solutions classiques reposant sur les chanes de Markov. Les
lois contrlant les temps dapparition des dfauts savrent en eet bien direntes dune
loi exponentielle. Dautre part, une mthode dapprentissage utilisant lalgorithme EM est
dcrite de manire tenir compte de la grande quantit dinformations censures dans les
bases de REX.
Par la suite, la reprsentation des procdures de maintenance est aborde. Les deux princi-
pales mthodes de surveillance de la voie relativement aux ruptures de rails sont considres.
Linspection prventive ultrasonore, qui constitue la premire mthode, est caractrise par
ses taux de dtection de dfauts internes et sa priode de passage. La seconde mthode,
reposant sur la signalisation et ralisant une surveillance continue de la voie, est gale-
ment intgre au modle de manire reprer les rails casss. Tout diagnostic de dfaut
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
4.7 Conclusions 161
Indisponibilit due
aux dfauts sur
pleine barre
(2.3%)
(22.7%)
Confirmation ultrasonore
(11.6%)
Maintenance corrective
(46.2%)
Renouvellement
Indisponibilit due
aux dfauts sur
soudure
(7.9%)
Inspection ultrasonore
(9.4%)
(a) File haute.
(3.4%)
Indisponibilit due
aux dfauts sur
soudure (0.4%)
Indisponibilit due
aux dfauts sur
pleine barre
(11.1%)
Inspection ultrasonore
(26.5%)
Confirmation ultrasonore
(4.3%)
Maintenance corrective
(54.3%)
Renouvellement
(b) File basse.
Fig. 4.14 Rpartition des cots associe un rfrentiel de maintenance dclen-
chant une inspection ultrasonore tous les 2 mois et un renouvellement tous les 2
ans sur les courbes de rayon infrieur 500 mtres sur le tronon central du RER A.
entrane la rparation du coupon endommag. Lopration est prventive si le dfaut est
repr avant la rupture et curative sinon. En parallle, nous tenons galement compte des
oprations priodiques de renouvellement de la voie tudie ayant pour eet sa remise
neuf.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Pour nir, nous dcrivons comment appliquer cette approche an dajuster la priode de
lauscultation ultrasonore et la priode des renouvellements de voie dans un contexte donn.
La rsolution de cette problmatique a donn lieu au dveloppement dun outil daide la
dcision spcique lajustement de ces priodes dintervention. Ce type danalyse peut
donc savrer pertinente an de justier une augmentation ou une rduction de budget
associ un ou plusieurs postes de maintenance donns. Notons par ailleurs que cette
mthodologie est bien adapte au traitement dautres dgradations des rails, telles que
loptimisation des cycles de meulage visant traiter lusure ondulatoire et les dfauts de
fatigue de surface.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Conclusions generales et perspectives
Conclusions
Au cours de ces travaux de thse, nous avons abord dans un premier temps la probl-
matique de la reprsentation dun processus de dgradation dans le cadre des Modles
Graphiques Probabilistes (MGP), et plus particulirement dans celui des MGP Marko-
viens (MGPM). Ce formalisme intuitif, aux capacits de modlisation tendues, est bien
adapt pour dcrire formellement les relations de dpendance entre les dirents compo-
sants dun systme complexe voluant au cours du temps. Nous avons mis en vidence le
fait quen pratique, les MGPM taient essentiellement utiliss pour modliser les aspects
dynamiques dun systme sous forme de chanes de Markov. Cette dmarche se traduit
ncessairement par le fait que les temps de sjour dans chacun des tats du systme sont
distribus selon des lois gomtriques. Or, cette hypothse est peu raliste dans bon nombre
dapplications. Nous avons alors montr quil tait possible de dpasser cette limitation en
utilisant une structure de MGPM particulire que nous avons appele Modle Graphique
de Dure (MGD). Une description complte des proprits probabilistes de cette structure
est prsente de faon mettre en vidence son intrt pour la modlisation de systmes
possdant une dynamique dvolution complexe.
Une fois le problme de la reprsentation du processus de dgradation rsolu, laccent a
naturellement t mis sur la modlisation de la maintenance. Lapproche que nous propo-
sons dans ce rapport a lavantage dtre gnrique et applicable dans dirents domaines
industriels. Il est en eet possible de dcliner le modle de manire simuler un grand
nombre de politiques de maintenance. En outre, chaque stratgie peut tre value par le
biais dun calcul dutilit reposant sur un algorithme dinfrence spcique que nous avons
dvelopp. Ainsi, sous rserve de possder une fonction dutilit associe au systme tudi,
lapplication de mthode doptimisation visant ajuster des paramtres de maintenance
est envisageable.
Nous achevons ces travaux en dclinant lapproche dcrite prcdemment an de raliser
une tude sur la prvention des ruptures de rail. Cette problmatique industrielle concrte
nous a permis de valider la dmarche formelle propose. Ceci a donn lieu au dveloppe-
ment dun outil de maintenance prvisionnelle permettant dvaluer limpact des cycles de
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
surveillance et de renouvellement des rails. Deux tudes de cas sont prsents de faon
illustrer lintrt dun tel outil en vue dajuster ces cycles de maintenance dans un cadre
multi-critre. Nous montrons par exemple que cette mthodologie permet de fournir des ar-
guments numriques dans des situations darbitrages associes aux nancements des divers
postes de maintenance.
Perspectives
Les travaux raliss au cours de cette thse ont ouvert plusieurs pistes de recherches et de
dveloppements. La majorit des ouvertures concernent des points thoriques ou algorith-
miques associs au formalisme des MGP.
Intressons nous tout dabord au problme de linfrence probabiliste dans un MGPM re-
prsentant le fonctionnement dynamique dun systme multi-composant. Dans ce cas, le
processus de dgradation de chaque composant est lui-mme modlis par un MGPM plus
simple, par exemple une chane de Markov ou un MGD. Naturellement, lorsque le nombre
de composants augmente, les calculs dinfrence dune tranche temporelle la suivante
deviennent de plus en plus complexes. Une faon de simplier ces calculs consisterait
exploiter les dpendances entre les composants. Prenons lexemple dun systme constitu
de n composants indpendants. Dans cette situation, les calculs dinfrence dynamiques
peuvent se rsumer n calculs locaux peu coteux dun point dun point de vue algorith-
mique. Pourtant, lutilisation dune mthode gnrique reposant sur linterface temporelle
du modle conduirait au calcul de la loi jointe des n composants, possdant une complexit
exponentielle. En pratique, il sagirait donc damliorer lalgorithme de linterface en tenant
compte de linformation porte par les relations de dpendance entre les composants an
de factoriser les calculs en consquence. Notons que de manire assez surprenante au vue
des applications possibles, il existe peu darticles rcents traitant du problme dinfrence
dans le cadre des MGPM.
Par ailleurs, il semblerait intressant de gnraliser le fonctionnement probabiliste particu-
lier des MGD. Ce MGPM particulier possde en eet des proprits probabilistes singulires
provenant de ses Lois de Probabilit Conditionnelles (LPC) dnies par morceaux et par-
tiellement dterministes. Lexploitation de ces caractristiques a permis llaboration dun
algorithme ralisant des calculs dinfrence exacte dans cette structure bien plus rapide-
ment quune mthode gnrique classique. Le gain venant de la forme particulire de ses
LPC, une tude approfondie des LPC dnies par morceaux pourrait savrer pertinente.
Le travail consisterait optimiser les oprations arithmtiques usuelles (somme et pro-
duit) pour ces LPC et dtablir les proprits mathmatiques des oprations avec les LPC
classiques. Ds lors, les algorithmes dinfrence exacte gnriques pourraient sappliquer
de manire transparente en bnciant dans certains cas dune baisse signicative de la
complexit.
En se plaant prsent dans le cadre des problmes dapprentissage, nous avons galement
d nous intresser durant ces travaux aux traitements des donnes de Retour dEXprience
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
(REX), et ce, dans le but destimer les paramtres de dgradation du systme considr. Or,
comme cest souvent le cas dans ce type dtude, de nombreuses donnes taient censures.
Des solutions algorithmiques existent permettant dapprendre les paramtres dun MGP
(structure et LPC) en prsence de donnes manquantes. En revanche, trs peu de travaux
traitent du cas o les donnes sont incompltes (ou partiellement observes). Aussi, le
dveloppement de mthodes dapprentissage gnriques permettant de tenir compte de ce
type donnes semble une perspective intressante.
Dans un registre plus pratique, nous sommes convaincus que la mthode de modlisation
propose peut se dcliner bien dautres problmatiques que la prvention des ruptures
de rails. Par exemple en restant dans le contexte ferroviaire, nous pensons en particulier
au phnomne dusure ondulatoire. Cette dernire se prsente sous forme dune ondulation
de la surface du rail plus ou moins rgulire selon les cas. Elle aecte principalement les
voies en courbes qui supportent un trac homogne (matriels roulants identiques, suivant
une marche similaire). Cette usure provoque des nuisances sonores au passage dun train,
conduisant parfois des plaintes de riverains. En labsence de mesures prventives ecaces,
lusure ondulatoire est limine priodiquement en meulant la surface des rails. Lexploi-
tation du REX sur lvolution de cette usure permettrait dappliquer notre mthodologie
en vue doptimiser les cycles de meulage de faon rduire linsatisfaction des riverains.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
References
R. Anderson and C. Barkan (2004, January). Railroad accident rates for use in transpor-
tation risk analysis. Transportation Research Record : Journal of the Transportation
Research Board 1863(-1), 8898.
M. Arias and F. J. Dez (2007, September). Operating with potentials of discrete va-
riables. International Journal of Approximate Reasoning 46(1), 166187.
M. S. Arulampalam, S. Maskell, N. Gordon, and T. Clapp (2002). A tutorial on particle
lters for online nonlinear/non-gaussian bayesian tracking. Signal Processing, IEEE
Transactions on 50(2), 174188.
T. Aven and U. Jensen (1999). Stochastic Models in Reliability. Stochastic Modelling
and Applied Probability. Springer.
A. Bar-Noy, V. Dreizin, and B. Pattshamir (2004, June). Ecient algorithms for periodic
scheduling. Computer Networks 45(2), 155173.
C. P. L. Barkan, C. T. Dick, and R. Anderson (2003). Railroad derailment factors af-
fecting hazardous materials transportation risk. Transportation Research Record :
Journal of the Transportation Research Board 1825, 6474.
R. Barlow and L. Hunter (1960, January). Optimum preventive maintenance policies.
Operations Research 8(1), 90100.
C. Brenguer (2008, September). On the mathematical condition-based maintenance
modelling for continuously deteriorating systems. International Journal of Materials
and Structural Reliability 6(2), 133151.
S. Bondeux, C. Mielnik, P. Burnet, H. Clment, J. Y. Etienne, R. Grbille, D. Lvy, and
A. Naszalyi (2006). La voie de la ratp. Technical report, RATP EST Voie.
H. Boudali and J. B. Dugan (2005, March). A discrete-time bayesian network reliability
modeling and analysis framework. Reliability Engineering & System Safety 87(3),
337349.
L. Bouillaut, R. Donat, A. Neji, and P. Aknin (2009, June). Estimation of multi-
component systems reliability : Comparison of two graphical model approaches. In
proceedings of the 13th IFAC Symposium on Information Control Problems in Ma-
nufacturing, pp. 17331738.
X. Boyen and D. Koller (1998, July). Tractable inference for complex stochastic pro-
cesses. In Uncertainty in articial Intelligence, Madison, Wisconsin, pp. 3242.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
168 RFRENCES
C. Bracquemond (2001, October). Modlisation stochastique du Vieillissement en temps
discret. Ph. D. thesis, Institut National Politechnique de Grenoble.
C. Bracquemond and O. Gaudoin (2003). A survey on discrete lifetime distributions.
International Journal on Reliability, Quality, and Safety Engineering 10(1), 6998.
B. Castanier, A. Grall, and C. Berenguer (2005, January). A condition-based mainte-
nance policy with non-periodic inspections for a two-unit series system. Reliability
Engineering & System Safety 87(1), 109120.
E. Castillo, J. M. Gutirrez, and A. S. Hadi (1996, December). Expert Systems and
Probabilistic Network Models (Erste ed.). New York, NY, USA : Springer.
G. Celeux, F. Corset, A. Lannoy, and B. Ricard (2006, July). Designing a bayesian
network for preventive maintenance from expert opinions in a rapid and reliable way.
Reliability Engineering & System Safety 91(7), 849856.
B. R. Cobb and P. P. Shenoy (2006, May). Operations for inference in continuous baye-
sian networks with linear deterministic variables. International Journal of Approxi-
mate Reasoning 42(1-2), 2136.
G. F. Cooper (1990, March). The computational complexity of probabilistic inference
using bayesian belief networks. Articial Intelligence 42(2-3), 393405.
A. Corana, M. Marchesi, C. Martini, and S. Ridella (1987, September). Minimizing
multimodal functions of continuous variables with the &ldquo ;simulated annea-
ling&rdquo ; algorithm. ACM Trans. Math. Softw. 13(3), 262280.
F. Corset (2003). Aide loptimisation de maintenance partir de rseaux baysiens
et abilit dans un contexte doublement censur. Ph. D. thesis, Universit Joseph
Fourier.
P. Courtois and P. Delsarte (2006, January). On the optimal scheduling of periodic
tests and maintenance for reliable redundant components. Reliability Engineering &
System Safety 91(1), 6672.
R. G. Cowell, A. P. Dawid, S. L. Lauritzen, and D. J. Spiegelhalter (1999). Probabilistic
Networks and Expert Systems. Berlin-Heidelberg-New York : Springer-Verlag.
D. R. Cox (1972). Regression models and life-tables. Journal of the Royal Statistical
Society. 34(2), 187220.
F. G. Cozman (2000). Generalizing variable elimination in bayesian networks. In the
IBERAMIA/SBIA Workshops on Probabilistic Reasoning in Articial Intelligence,
pp. 2732. Editora Tec Art.
A. Darwiche (2001, April). Constant-space reasoning in dynamic bayesian networks.
International Journal of Approximate Reasoning 26(3), 161178.
R. Dechter (1999). Bucket elimination : A unifying framework for reasoning. Articial
Intelligence 113(1-2), 4185.
A. Dempster, N. Laird, and D. B. Rubin (1977). Maximum likelihood from incomplete
data via the EM algorithm. Journal of the Royal Statistical Society B 39, 138.
R. C. Dick, C. Barkan, E. Chapman, and M. Stehly (2003, January). Multivariate sta-
tistical model for predicting occurrence and location of broken rails. Transportation
Research Record : Journal of the Transportation Research Board 1825(-1), 4855.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
RFRENCES 169
R. Donat, L. Bouillaut, P. Aknin, and P. Leray (2008). A dynamic graphical model to
represent complex survival distributions. In T. Bedford, J. Quigley, L. Walls, B. Al-
kali, A. Daneshkhah, and G. Hardman (Eds.), Advances in Mathematical Modeling
for Reliability, pp. 1724. Amsterdam : IOS Press.
R. Donat, L. Bouillaut, P. Aknin, P. Leray, and S. Bondeux (2008, June). Specic gra-
phical models for analysing reliability. In proceedings of 16th IEEE Mediterranean
Conference on Control and Automation, pp. 621626.
R. Donat, L. Bouillaut, P. Aknin, P. Leray, and D. Levy (2007, July). A generic approach
to model complex system reliability using graphical duration models. In proceedings
of the Fifth International Mathematical Methods in Reliability Conference, Glasgow,
Scotland.
R. Donat, L. Bouillaut, A. Neji, and P. Aknin (2009, July). Comparison of two graphi-
cal models approaches for the modelling of multi-components systems reliability. In
proceedings of the 39th International Conference on Computers & Industrial Engi-
neering.
R. Donat, P. Leray, L. Bouillaut, and P. Aknin (2008, May). Rseaux baysiens dyna-
miques pour la reprsentation de modles de dure en temps discret. In actes de la
4me Journe Francaise sur les Rseaux Baysiens.
R. Donat, P. Leray, L. Bouillaut, and P. Aknin (To appear in 2010). A dynamic bayesian
network to represent discrete duration models. Neurocomputing.
J. Dro, A. Ptrowski, P. Siarry, and E. Taillard (2003, September). Mtaheuristiques
pour loptimisation dicile. Algorithmes. Eyrolles.
R. A. Fisher (1922). On the mathematical foundations of theoretical statistics. Philoso-
phical Transactions of the Royal Society of London. Series A, Containing Papers of
a Mathematical or Physical Character 222, 309368.
O. Franois (2006). De lidentication de structure de rseaux baysiens la reconnais-
sance de formes partir dinformations compltes ou incompltes. Ph. D. thesis,
Institut National des Sciences Appliques de Rouen.
M. R. Garey and D. S. Johnson (1979). Computers and Intractability : A Guide to the
Theory of NP-Completeness. W. H. Freeman.
A. Gelman, J. B. Carlin, H. S. Stern, and D. B. Rubin (2003). Bayesian Data Analysis
(Second ed.). Texts in statistical Science. Chapman & Hall/CRC.
W. R. Gilks (1995, December). Markov Chain Monte Carlo in Practice. Chapman &
Hall/CRC.
A. Grall, C. Brenguer, and L. Dieulle (2002, May). A condition-based maintenance
policy for stochastically deteriorating systems. Reliability Engineering & System Sa-
fety 76(2), 167180.
A. Grigoriev, J. Vandeklundert, and F. Spieksma (2006, August). Modeling and solving
the periodic maintenance problem. European Journal of Operational Research 172(3),
783797.
J. L. Gross and J. Yellen (2004). Handbook of Graph Theory. CRC Press.
H. O. Hartley (1958, June). Maximum likelihood estimation from incomplete data. Bio-
metrics 14(2), 174194.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
170 RFRENCES
R. A. Howard (2007a, June). Dynamic Probabilistic Systems, Volume I : Markov Models.
Dover Publications.
R. A. Howard (2007b, June). Dynamic Probabilistic Systems, Volume II : Semi-Markov
and Decision Processes (1 ed.). Dover Publications.
C. Huang and A. Darwiche (1996, October). Inference in belief networks : A procedural
guide. International Journal of Approximate Reasoning 15(3), 225263.
F. Jensen, F. V. Jensen, and S. L. Dittmer (1994). From inuence diagrams to junction
trees. In Proceedings of the tenth conference on Uncertainty in Articial Intelligence.
M. Jordan (1999). Learning in graphical models. Cambridge, MA, USA : MIT Press.
M. Jordan, Z. Ghahramani, T. S. Jaakkola, and L. K. Saul (1999). An introduction to
variational methods for graphical models. Machine Learning 37(2), 183233.
J. D. Kalbeisch and R. L. Prentice (2002). The Statistical Analysis of Failure Time
Data. Second Edition. Wiley Series in Probability and Statistics. Wiley.
R. E. Kalman (1960). A new approach to linear ltering and prediction problems. Journal
of basic Engineering 82(1), 3545.
C. W. Kang and M. W. Golay (1999, July). A bayesian belief network-based advisory
system for operational availability focused diagnosis of complex nuclear power sys-
tems. Expert Systems with Applications 17(1), 2132.
R. Kay (1977). Proportional hazard regression models and the analysis of censored sur-
vival data. Applied Statistics 26(3), 227237.
E. S. Keeping (1962). Introduction to Statistical Inference. Princeton, New Jersey : D.
Van Nostrand.
M. S. A. Khan, A. Khalique, and A. M. Abouammoh (1989). On estimating parameters
in a discrete weibull distribution. Reliability, IEEE Transactions on 38(3), 348350.
U. Kjaerul (1990, March). Triangulation of graphs : algorithms giving small total state
space. Technical report, Department of Mathematics and Computer Science.
P. Komarek and A. Moore (2000). A dynamic adaptation of ad-trees for ecient machine
learning on large data sets. In Proceedings of the 17th International Conference on
Machine Learning, pp. 495502.
H. Langseth and L. Portinale (2007, January). Bayesian networks in reliability. Reliability
S. L. Lauritzen and D. J. Spiegelhalter (1988). Local computations with probabilities
on graphical structures and their application to expert systems. Journal of the Royal
Statistical Society 50(2), 157224.
J. F. Le Bihan (2005). Maintenance prventive et corrective - it09 : Classement des
dfauts internes, des ssures et ruptures de rails. Technical report, RATP EST Voie.
J. F. Le Bihan and M. Jouve (2005, March). Prvention des ruptures de rails : Nouvelle
politique de renouvellement des rais. Technical report, RATP, Dpartement EST,
Unit Voie SLI/PMM.
N. Limnios and G. Oprisan (2001). Semi-Markov Processes and Reliability. Statistics for
Industry & Technology. Springer.
M. Marseguerra, E. Zio, and L. Podollini (2002, August). Condition-based maintenance
optimization by means of genetic algorithms and monte carlo simulation. Reliability
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
RFRENCES 171
G. Mclachlan and T. Krishnan (1997). The EM Algorithm and Extensions. New York :
Wiley.
S. Montani, L. Portinale, A. Bobbio, and D. Codetta-Raiteri (2006, April). Automati-
cally translating dynamic fault trees into dynamic bayesian networks by means of a
software tool. In Proceedings of the First International Conference on Availability,
Reliability and Security, pp. 804809.
K. P. Murphy (2002). Dynamic Bayesian Networks : Representation, Inference and Lear-
ning. Ph. D. thesis, University of California, Berkeley.
K. P. Murphy and Y. Weiss (2001). The factored frontier algorithm for approximate
inference in dbns. In Proceedings of the 17th Conference on Uncertainty in Articial
Intelligence, pp. 378385.
K. P. Murphy, Y. Weiss, and M. I. Jordan (1999). Loopy belief propagation for approxi-
mate inference : An empirical study. In Proceedings of the 15th on Uncertainty in
Articial Intelligence, pp. 467475.
P. Nam, P. H. Wuillemin, P. Leray, O. Pourret, and A. Becker (2007). Rseaux baysiens
(Troisime ed.). Collection Algorithmes. Paris : Eyrolles.
R. E. Neapolitan (2003, April). Learning Bayesian Networks. Prentice Hall.
F. S. Nowlan and H. F. Heap (1978). Reliability-Centered Maintenance. San Francisco,
CA : United Air Lines Inc.
O. Orringer (1988). Rail testing : strategies for safe and economical rail quality assu-
rance. Transportation Research Record : Rail Replacement and Maintenance Mana-
gement 1174, 2842.
M. P. Panos and G. C. Mauricio (2002, January). Handbook of Applied Optimization.
Oxford University Press.
J. Pearl (1986, September). Fusion, propagation, and structuring in belief networks.
Articial Intelligence 29(3), 241288.
J. Pearl (1988, September). Probabilistic Reasoning in Intelligent Systems : Networks of
Plausible Inference. Morgan Kaufmann.
J. Pearl and A. Paz (1985). Graphoids : A graph based logic for reasonning about re-
levance relations. Technical Report 850038 (R-53-L), Cognitive Systems Laboratory,
University of California, Los Angeles.
L. Podollini, E. Zio, and J. Vatn (2006). Risk-informed optimisation of railway tracks
inspection and maintenance procedures. Reliability Engineering and System Sa-
fety 91, 2035.
M. L. Puterman (2005). Markov Decision Processes : Discrete Stochastic Dynamic Pro-
gramming. Wiley.
L. Rabiner and B. H. Juang (1993). Fundamentals of Speech Recognition. Signal Proces-
sing Series. Prentice Hall.
L. R. Rabiner (2002, August). A tutorial on hidden markov models and selected appli-
cations in speech recognition. Proceedings of the IEEE 77(2), 257286.
M. M. Rao and R. J. Swift (2006). Probability Theory with Applications. Springer.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
172 RFRENCES
S. Rodrigues de Morais (2009, November). Bayesian Network structure learning with
applications in feature selection. Ph. D. thesis, INSA de Lyon.
D. B. Rubin (1976, December). Inference and missing data. Biometrika 63(3), 581592.
R. D. Shachter (1988). Probabilistic inference and inuence diagrams. Operations Re-
search 36(4), 589604.
J. Vatn (1997, November). Maintenance optimisation from a decision theoretical point
of view. Reliability Engineering & System Safety 58(2), 119126.
J. Vatn, P. Hokstad, and L. Bodsberg (1996, March). An overall model for maintenance
optimization. Reliability Engineering & System Safety 51(3), 241257.
T. Verma and J. Pearl (1988). Causal networks : Semantics and expressiveness. In Pro-
ceedings of the 4th Workshop on Uncertainty in Articial Intelligence, pp. 352359.
W. E. Vesely, F. F. Goldberg, N. H. Roberts, and D. F. Haasl (1981). Fault Tree Hand-
book. Washington, DC : U.S. Nuclear Regulatory Commission.
P. Weber and L. Joue (2003, June). Reliability modelling with dynamic bayesian net-
works. In Proceedings of the 5th IFAC Symposium on fault Detection, Supervision
and Safety of Technical Processes, Washington D.C., USA.
B.-C. Wei (1998). Exponential Family Nonlinear Models. Springer Verlag.
N. L. Zhang and D. Poole (1996). Exploiting causal independence in bayesian network
inference. Journal of Articial Intelligence Research 5, 301328.
J. Zhao, A. H. C. Chan, and M. P. N. Burrow (2007). Probabilistic model for predic-
ting rail breaks and controlling risk of derailment. Transportation Research Record :
Journal of the Transportation Research Board 1995, 7683.
G. Zweig (1996). A forward-backward algorithm for inference in bayesian networks
and an empirical comparison with hmms. Masters thesis, Department of Compu-
ter Science, U.C. Berkeley.
G. Zwingelstein (1996). La maintenance base sur la abilit - guide pratique dapplica-
tion de la RCM. Diagnostic et maintenance. Hermes. t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Table des gures
1.1 MGP quatre variables reprsentant une machine de production . . . . . . 25
1.2 Exemple dun 2-MGPM reprsent par son modle initiale et de transition . 40
1.3 Exemple dun 2-MGPM reprsent par 3 tranches de temps successives . . . 41
1.4 1-MGPM reprsentant lvolution dun systme de production . . . . . . . . 43
2.1 volution de ltat dun systme dynamique au cours du temps . . . . . . . 53
2.2 Reprsentation graphique dun MGD . . . . . . . . . . . . . . . . . . . . . . 55
2.3 Exemple de MGD reprsentant un systme de production . . . . . . . . . . 67
2.4 Temps moyen du calcul dune itration de lalgorithme 2.2 en fonction de
[A[ (T
S
= [/[ = 25) et de la mthode dinfrence utilise. . . . . . . . . . . 75
T
S
([A[ = [/[ = 25) et de la mthode dinfrence utilise. . . . . . . . . . . 76
[/[ ([A[ = T
S
= 25) et de la mthode dinfrence utilise. . . . . . . . . . . 76
2.7 valuation de la abilit du systme partir du modle thorique et des
lapproches MGD et CM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
2.8 valuation du taux de dfaillance du systme partir du modle thorique
et des lapproches MGD et CM. . . . . . . . . . . . . . . . . . . . . . . . . . 85
2.9 valuation de la dure de vie rsiduelle du systme partir du modle
thorique et des lapproches MGD et CM. . . . . . . . . . . . . . . . . . . . 86
3.1 Modle graphique probabiliste markovien associ au modle VirMaLab . . 91
3.2 Utilits dans le modle VirMaLab . . . . . . . . . . . . . . . . . . . . . . . 100
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
174 TABLE DES FIGURES
3.3 Fiabilit dun systme de production en fonction de ses paramtres de d-
gradation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
3.4 Taux de dfaillance dun systme de production en fonction de ses para-
mtres de dgradation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
3.5 Utilit moyenne journalire dun systme de production en fonction de ses
paramtres de dgradation et de sa politique de maintenance. . . . . . . . . 115
3.6 Utilit dun systme de production en fonction des priodes de diagnostic
(diagnostics concurrents). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
3.7 Utilit dun systme de production en fonction des priodes de diagnostic
(diagnostics complmentaires). . . . . . . . . . . . . . . . . . . . . . . . . . 122
4.1 Illustrations caractristiques de la voie. . . . . . . . . . . . . . . . . . . . . . 127
4.2 Exemples de ruptures. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
4.3 Modlisation de la voie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
4.4 1-MGPM associ la dgradation dun coupon lmentaire. . . . . . . . . . 132
4.5 Distributions du temps avant apparition du premier dfaut dans les courbes
ayant un rayon infrieur 500 mtres sur le tronon central du RER A. . . 139
4.6 Modle graphique reprsentant le diagnostic de la voie linstant t. . . . . . 140
4.7 Voiture de contrle ultrasonore V365. . . . . . . . . . . . . . . . . . . . . . . 141
4.8 Schma de principe dun circuit de voie. . . . . . . . . . . . . . . . . . . . . 143
4.9 Modle VirMaLab associ la maintenance des ruptures de rails. . . . . . 146
4.10 Distributions spatiales des dfauts sur les courbes de rayon infrieur 500
mtres sur le tronon central du RER A. . . . . . . . . . . . . . . . . . . . . 151
4.11 Schma de principe de loutil dvelopp daide la dcision pour la mainte-
nance des rails. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
4.12 valuation des politiques de maintenance sur les les hautes situes sur les
courbes de rayon infrieur 500 mtres sur le tronon central du RER A. . 156
4.13 valuation des politiques de maintenance sur les les basses situes sur les
4.14 Rpartition des cots associe au rfrentiel de maintenance optimal sur les
B.1 Exemple de graphe orient cinq nuds. . . . . . . . . . . . . . . . . . . . 182
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Liste des tableaux
1.1 Rsultats dinfrence par la mthode dlimination dans un 1-MGPM . . . . 47
2.1 Dtail de la complexit spatiale dun MGD. . . . . . . . . . . . . . . . . . . 64
2.2 Trajectoires gnriques associes lvolution naturelle dun systme repr-
sent par un MGD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
2.3 Exemple de 3 trajectoires associes lvolution naturelle du systme de
production . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
2.4 Exemple de temps de sjour observs dans chaque tat dun systme de
production . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
2.5 Exemple de transitions observes entre chaque tat dun systme de production 79
2.6 Comparaison de rsultats dapprentissage entre les approches MGD et CM . 82
2.7 Comparaison des msures de abilit entre les approches MGD et CM . . . 83
3.1 Complexit spatiale des LPC associes au modle VirMaLab. . . . . . . . 98
3.2 Utilit dun systme de production en fonction des priodes de diagnostic et
de sa politique de maintenance. . . . . . . . . . . . . . . . . . . . . . . . . . 114
4.1 Analyse du REX entre les 1
er
janvier 1999 et 2009 associ aux avaries du
tronon central du RER A en fonction du rayon de courbure. . . . . . . . . 138
4.2 Entropie normalise de la localisation des dfauts et taux de cration de
soudure dans le contexte des courbes de rayon infrieur 500 mtres sur le
tronon central du RER A. . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
4.3 Paramtres descriptifs dune voie tudier. . . . . . . . . . . . . . . . . . . 153
4.4 Paramtres descriptifs des mthodes de diagnostic. . . . . . . . . . . . . . . 153
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
176 LISTE DES TABLEAUX
4.5 Paramtres conomiques du modle VirMaLab. . . . . . . . . . . . . . . . 153
4.6 valuation des politiques de maintenance sur les les hautes situes sur les
4.7 valuation des politiques de maintenance sur les les basses situes sur les
D.1 Une base de N = 10 mesures indpendantes dune variable alatoire X
valeurs dans x
1
, x
2
, x
3
, x
4
. . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Annexe A
Notations
Gnralits
[E[ Cardinal de lensemble E.
arg max
xX
f(x) Valeur de la variable x maximisant la fonction f sur X.
1I(C) Fonction indicatrice de C, c--d. 1I(C) =
_
1 si C est vraie
0 sinon
.
CS(x) Complexit spatiale de lobjet x.
CA(x) Complexit algorithmique du calcul de lobjet x.
f = O(g) Se lit "f est en grand O de g" et signie quil existe un rel positif
M telle que f < M|g|.
Algoritme EM Algorithme Esprance-Maximisation, de langlais Expectation-
Maximisation.
Probabilits
X Variable alatoire (v.a.).
X Ensemble des valeurs prise par la v.a. X.
x Ralisation de la v.a. X avec x X.
X = (X
1
, . . . , X
D
) Vecteur alatoire.
X =
D
d=1
X
d
Ensemble des valeurs prises par le vecteur X.
x = (x
1
, . . . , x
D
) Ralisation du vecteur alatoire X (x X).
X
I
Vecteur alatoire index par lensemble dindices I N.
X Y X et Y indpendantes.
X Y |Z X et Y indpendantes conditionnellement Z.
MAP Maximum A Posteriori.
EAP Esprance A Posteriori.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
178 Chapitre A. Notations
Potentiel
X = {X
1
, . . . , X
d
} Domaine sur D dimensions caractrises par les ensembles
X
1
, . . . , X
d
.
X
Produit cartsien des ensembles constituant le domaine X, cest--

dire X
D
d=1
X
d
.
R
X
Ensemble des potentiels dnis sur le domaine X et valeurs relles.
R
X
Un potentiel rel dni sur X.
Dom() Domaine du potentiel , cest--dire Dom() = X = {X
1
, . . . , X
d
}.
Loi de probabilit conditionnelle
L
X|Y
Ensemble des lois de probabilit dnies sur le domaine X condi-
tionnellement au domaine Y.
LPC Loi de Probabilit Conditionnelle.
L
X
Ensemble des LPC dnies sur le domaine X (pas de conditionne-
ment).
p L
X|Y
Une loi de probabilit dnie sur le domaine X conditionnellement
au domaine Y.
x p(: |y) x X
est une ralisation ou un tirage alatoire de la loi p lorsque

la valeur y Y
est observe.
Graphe
G = (V, E) Un graphe (orient).
V = {v
1
, . . . , v
N
} Ensemble des nuds du graphe.
E V V Ensemble des arcs (orients) du graphe.
pa(v
d
) Ensemble des nnds parents du nud d.
en(v
d
) Ensemble des nnds enfants du nud d.
an(v
d
) Ensemble des nnds anctres du nud d.
de(v
d
) Ensemble des nnds descendants du nud d.
nd(v
d
) Ensemble des nnds non descendants du nud d.
fa(v
d
) Famille du nnd d correspondant au nud d et ses parents.
DAG Graphe orient sans circuit, de langlais Directed Acyclic Graph.
Modle graphique probabiliste/Rseau baysien
RB Rseau Baysien.
MGP Modle Graphique Probabiliste (Graphical Probabilistic Model ).
n-MGPM Modle Graphique Probabiliste Markovien dordre n.
MGD Modle Graphique de Dure.
CM Chane de Markov.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
179
Application industriel/Ferroviaire
REX Retour DEXprience.
RATP Rgie Autonome des Transports Parisiens.
RER Rseau Express Rgional.
PK Point Kilomtrique.
RC Rayon de Courbure.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
180 Chapitre A. Notations
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Annexe B
Elements sur la theorie des graphes

orientes
On distingue trois grandes familles de graphes : les graphes non orients, semi-orients
et orients. Pour dnir les modles graphiques probabilistes orients, seule la dernire
catgorie est ncessaire, bien que les graphes non orients soient couramment utiliss dans
certains algorithmes dinfrence.
Lobjectif des paragraphes suivants est de prsenter la notion de graphe orient ainsi que
le vocabulaire associ. Les dnitions nonces sont illustres par le graphe donn en gure
B.1.
Dnition B.1 (Graphe orient)
Un graphe orient est un couple G = (V, E), o V = {v
1
, . . . , v
D
} reprsente lensemble des
D nuds, ou sommets, et o E est une partie de lensemble des couples (v
i
, v
j
) V V
reprsentant les arcs du graphe.
Le graphe de la gure B.1 possde cinq nuds, do V = {v
1
, v
2
, v
3
, v
4
, v
5
}, et quatre arcs
tels que E = {(v
1
, v
3
), (v
2
, v
3
), (v
2
, v
4
), (v
3
, v
5
)}.
Dnition B.2 (Parent, enfant, racine et feuille)
Soit G = (V, E) un graphe orient. Nous avons alors les dnitions suivantes :
(i) v
j
est un parent de v
i
si larc (v
j
, v
i
) existe, c--d. si (v
j
, v
i
) E. Lensemble des
parents du nud v
i
est not pa(v
i
) = {v
j
|(v
j
, v
i
) E}.
(ii) v
j
est un enfant de v
i
si v
j
est un parent de v
i
, c--d. si v
j
pa(v
i
). Lensemble des
enfants du nud v
i
est not en(v
i
) = {v
j
|v
j
pa(v
i
)}.
(iii) v
i
est une racine du graphe sil na pas de parent, c--d. si pa(v
i
) = .
(iv) v
i
est une feuille du graphe sil na pas denfant, c--d. si en(v
i
) = .
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
182 Chapitre B. lments sur la thorie des graphes orients
Fig. B.1 Exemple de graphe orient cinq nuds.
Dans lexemple, les nuds v
1
et v
2
sont des racines puisque pa(v
1
) = pa(v
2
) = . Le parent
de v
3
est v
2
, c--d. pa(v
3
) = {v
2
}, et les enfants de v
2
sont v
3
et v
4
, c--d. en(v
2
) = {v
3
, v
4
}.
Enn, v
4
et v
5
sont des feuilles puisque en(v
4
) = en(v
5
) = .
Dnition B.3 (Chemin orient, circuit et DAG)
Soit G = (V, E) un graphe orient. Un chemin orient entre v
i
et v
j
, not v
i
v
j
, est une
suite de nuds distincts (v
i
, . . . , v
j
) telle que pour tout i < k j, il existe un arc entre
v
k1
et v
k
), c--d (v
k1
, v
k
) c. Tout chemin du graphe tel que v
i
= v
j
est appel circuit.
Par ailleurs, les graphes orients sans circuit sont souvent dsigns par lacronyme anglais
DAG (Directed Acyclic Graph).
tant donn que le graphe prsent dans lexemple ne possde pas de circuit, cest donc
un DAG.
Dnition B.4 (Anctre, descendant et non descendant)
Soit ( = (1, c). Nous avons alors les dnitions suivantes :
(i) v
j
est un anctre de v
i
sil existe un chemin orient entre v
j
et v
i
. Lensemble des
anctres du nud v
i
est not an(v
i
) = v
j
[v
j
v
i
.
(ii) v
j
est un descendant de v
i
si v
i
est un anctre de v
j
, c--d. si v
i
an(v
j
). Lensemble
des descendants du nud v
i
est not de(v
i
) = v
j
[v
i
an(v
j
).
(iii) Lensemble des non descendants du nnd v
i
est not nd(v
i
) = 1 de(v
i
) v
i
.
Sur le graphe de la gure B.1, nous lisons par exemple que les anctres de v
3
sont v
1
et
v
2
, c--d. an(v
3
) = v
1
, v
2
, que son seul descendant est v
5
, c--d. de(v
3
) = v
5
et que ses
non descendants sont v
1
, v
2
et v
4
, c--d. nd(v
3
) = v
1
, v
2
, v
4
.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Annexe C
Elements sur la theorie des probabilites

Cette annexe a pour vocation de donner quelques lments sur la thorie des probabilits.
Par ailleurs, ce document tant ax sur lutilisation de modles graphiques probabilistes
discrets et nis, les exemples donns dans la suite ne font intervenir que des distributions
discrtes et nies.
C.1 Rappels de probabilits
Un univers ou espace fondamental est lensemble, souvent not , des issues envisages
dune exprience alatoire. Les lments de sont appels issues ou encore vnements
lmentaires. Pour une exprience alatoire donne, nous ne considrons pas toujours tous
les vnements mais seulement ceux qui sont disponibles ou intressants, do le notion de
tribu.
Dnition C.1 (Tribu et espace probabilisable)
Soit un univers associ une exprience alatoire. une tribu correspond toute famille
/ de parties de satisfaisants :
(i) /;
(ii) si A /, alors

A / (stabilit par passage au complmentaire) ;
(iii) si (A
i
)
iI
est une famille dnombrable dvnements alors
_
iI
A
i
/ (stabilit par runion dnombrable).
Le couple (, /) est alors appel espace probabilisable.
En prenant lexemple classique du jeu de pile ou face et en supposant que la pice utilise
ne puisse tomber sur la tranche, alors dans ce cas, lunivers associ lexprience alatoire
dun lanc est = pile, face. Il existe deux tribus possibles : /
1
= , pile, face et
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
184 Chapitre C. lments sur la thorie des probabilits
/
1
= , pile, facepile, face. La deuxime tribu est dite exhaustive car elle contient
toutes les parties de . Cette tribu est note 2
ou T().
Dnition C.2 (Probabilit et espace probabilis)
Soit (, /) un espace probabilisable. Une probabilit ou mesure de probabilit est une
application P dnie sur / valeurs dans [0, 1] qui vrie :
(i) P() = 1 ;
(ii) pour toute famille nie ou innie dnombrable dvnements (A
i
)
iI
deux deux
incompatibles (i.e. A
i
A
j
= , si i ,= j), alors
P(
_
iI
A
i
) =
iI
P(A
i
).
Le triplet (, /, P) est alors appel espace probabilis.
Reprenons lexemple du pile ou face et considrons lespace probabilisable (, /), avec
= pile, face et / = 2
{pile,face}
. Il est alors possible de vrier que lapplication P dnie
par P(pile) = P(face) = 1/2 est une mesure de probabilit.
Dnition C.3 (Variable alatoire discrte)
Une variable alatoire (v.a.) discrte est une application dun espace probabilisable (, /)
vers un autre (A, B), avec A un ensemble ni ou inni dnombrable, telle que pour tous
x, B B,
X
1
(x) = [X() = x.
et
X
1
(B) = [X() B.
Par ailleurs, Les vnements X
1
(x) et X
1
(B) peuvent tre nots X = x et X B
respectivement.
Dans de nombreux cas, notamment dans le cadre de ce document, la tribu associe
lunivers A est la tribu exhaustive B = 2
X
. Ainsi, il est possible de simplier les notations
en parlant de v.a. dnie sur valeurs dans A ou uniquement de v.a. valeurs dans A.
Ceci permet donc, lorsquil ny pas dambigut, de simplier les notations en omettant de
mentionner les tribus.
Dans la suite de cette annexe, toutes les dnitions et thormes sont noncs partir
de variables alatoires. Toutefois, des noncs analogues existent en utilisant lapproche
ensembliste partir dvnements.
Dnition C.4 (Loi de probabilit dune v.a. discrte)
Soient (, /, P) un espace probabilis et X une v.a. discrte valeurs dans A. Lapplication
p
X
dnie sur A par
p
X
(B) = P(X
1
(B)) = P( [X() = B), B A,
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
C.1 Rappels de probabilits 185
est appele loi de probabilit ou distribution de la v.a. X. Par abus de langage, P(X)
dsigne la loi de la v.a. X.
Considrons par exemple la v.a. discrte et nie X valeurs dans lensemble A = 1, 2, 3
dont la loi est dnie par
P(X = 1) = P(X = 2) = 1/4; P(X = 3) = 1/2.
Il est alors possible de reprsenter cette loi par le vecteur :
P(X) = p
X
X
1 2 3
1/4 1/4 1/2
.
Nous abordons prsent la notion de probabilit conditionnelle qui est la base du for-
malisme de reprsentation des modles graphiques probabilistes.
Dnition C.5 (Loi de probabilit conditionnelle discrte)
Soient X et Y deux v.a. discrtes valeurs dans A et respectivement. Considrons de
plus B avec P(Y B) ,= 0. La loi de probabilit conditionnelle de la v.a. X sachant
Y B correspond la distribution, note P(X[Y B), vriant
P(X A[Y B) =
P(X A, Y B)
P(Y B)
, A A.
De plus et par abus de langage, lapplication de A dans [0, 1] dnie par
P(X[Y ) :
_
A [0, 1]
(x, y)
P(X=x,Y =y)
P(Y =y)
, P(Y = y) ,= 0
(C.1)
est note P(X[Y ).
Dnition C.6 (v.a. vectorielle discrte)
Soient X
1
, . . . , X
N
une suite de v.a. discrtes valeurs dans A
1
, . . . , A
N
respectivement. Le
N-uplet X = (X
1
, . . . , X
N
) valeurs dans X = A
1
. . . A
N
est appel v.a. vectorielle
discrte ou vecteur alatoire discret.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Dnition C.7 (Loi jointe discrte)
Soit X = (X
1
, . . . , X
N
) une v.a. vectorielle discrte valeurs dans X = A
1
. . . A
N
.
Lapplication dnie par
P(X) :
_
X [0, 1]
x P(X = x)
,
ou de manire quivalente par
P(X
1
, . . . , X
N
) :
_
A
1
. . . A
N
[0, 1]
(x
1
, . . . , x
N
) P(X
1
= x
1
, . . . , X
N
= x
N
)
,
est appele loi jointe des variables X
1
, . . . , X
N
(c--d. la loi de la v.a. X).
Dnition C.8 (Marginalisation)
Soient X et Y deux v.a. discrtes valeurs dans A et respectivement. Il vient alors par
dnition :
P(X = x) =
yY
P(X = x, Y = y), x A,
ce qui scrit galement P(X) =
Y
P(X, Y ). Cette opration est appele marginalisation
sur la v.a. X ou sommation sur la v.a. Y .
De manire plus gnrale, soit (X
1
, . . . , X
N
) un vecteur alatoire discret valeurs dans
A
1
. . . A
N
. En considrant le sous vecteur alatoire X
I
= (X
i
)
iI
, o I 1, . . . , N
et J = 1, . . . , N I, nous obtenons
P(X
I
= x
I
) =
x
J
Q
jJ
X
j
P(X
1
= x
1
, . . . , X
N
= x
N
), I 1, . . . , N,
ce qui scrit galement P(X
I
) =
X
J
P(X
1
, . . . , X
N
). Il sagit dans ce cas dune margi-
nalisation sur le vecteur alatoire X
I
.
Soient X et Y deux v.a. discrtes et nies valeurs dans A = 1, 2, 3 et = 1, 2
respectivement. La loi jointe de X et Y , note P(X, Y ), est donne par :
P(X, Y )
(X, Y )
1 2 3 1 2 3
1 1 1 2 2 2
1/4 1/12 1/4 0 1/6 1/4
. Les marginalisations sur X et sur Y aboutissent aux deux rsultats suivants :
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
C.1 Rappels de probabilits 187
P(X)
X
1 2 3
1/4 1/4 1/2
P(Y )
Y
1 2
7/12 5/12
. De mme, en appliquant lquation (C.1) pour calculer P(X[Y ), nous obtenons :
P(X[Y )
X
Y 1 2 3
1 3/7 1/7 3/7
2 0 2/5 3/5
.
Nous nonons prsent le thorme de Bayes. Ce dernier est un rsultat fondamental
dans la thorie des probabilits et est galement un outil incontournable de nombreuses
mthodes dinfrences dans les modles graphiques probabilistes.
Thorme C.1 (Bayes)
Soient X et Y deux v.a. discrtes. La loi conditionnelle de la v.a. Y sachant X est donne
par
P(Y [X) =
P(X[Y )P(Y )
P(X)
=
P(X[Y )P(Y )
Y
P(X, Y )
=
P(X[Y )P(Y )
Y
P(X[Y )P(Y )
.
Ce thorme fondamental, aussi appel formule dinversion de Bayes, permet donc dex-
primer la loi de Y conditionnellement X uniquement en fonction de la loi de X condi-
tionnellement Y et de la loi de Y . Cette dernire est souvent appele loi a priori de
Y .
Thorme C.2 (Bayes gnralis)
Soient X
1
, . . . , X
N
une suite de v.a. discrtes. La loi jointe des v.a. admet la factorisation
suivante :
P(X
1
, . . . , X
N
) = P(X
1
)P(X
2
[X
1
)P(X
3
[X
1
, X
2
) . . . P(X
N
[X
1
, . . . , X
N1
).
Dnition C.9 (Esprance dune v.a. discrte)
Soit X une v.a. discrte valeurs dans A. Lesprance de X, note E[X], est dnie, sous
rserve dexistence, par
E[X] =
xX
xP(X = x).
De manire plus gnrale, pour toute fonction g : R R, nous avons
E[g(X)] =
xX
g(x)P(X = x),
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
sous rserve que E[[g(X)[] =
xX
[g(x)[P(X = x) < +.
C.2 Indpendance conditionnelle
La notion dindpendance conditionnelle se situe au centre du formalisme de la modli-
sation partir de modles graphiques probabilistes. Commenons par dnir la notion
dindpendance.
Dnition C.10 (Indpendance de deux v.a. discrtes)
Soient X et Y deux v.a. discrtes. X et Y sont dites indpendantes si de manire quivalente
(i) P(X[Y ) = P(X) ;
(ii) P(Y [X) = P(Y ) ;
(iii) P(X, Y ) = P(X)P(Y ).
Dans ce cas, la notation X Y est utilise.
Reprenons lexemple prcdent et vrions si X et Y sont indpendantes. Pour ce faire, il
est ncessaire de calculer P(X)P(Y ) :
P(X)P(Y )
(X, Y
1 2 3 1 2 3
1 1 1 2 2 2
7/48 7/48 7/24 0 5/48 5/24
. Do, P(X, Y ) ,= P(X)P(Y ) et par consquent X et Y ne sont pas indpendantes.
Dnition C.11 (Indpendance conditionnelle de v.a. discrtes)
Soient X, Y et Z, trois v.a. discrtes. X et Y sont dites indpendantes conditionnellement
Z si de manire quivalente
(i) P(X[Y, Z) = P(X[Z) ;
(ii) P(Y [X, Z) = P(Y [Z) ;
(iii) P(X, Y [Z) = P(X[Z)P(Y [Z).
Dans ce cas, la notation X Y [Z est utilise.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Annexe D
Apprentissage ` a partir de donnees
incomplètes
D.1 Problmatique et notations
Soit X une variable alatoire discrte et nie valeurs dans lensemble A = x
1
, . . . , x
K
.
Nous supposons que X est distribue selon la loi p = (p
k
)
1kK
. Lobjectif de cette annexe
est de prsenter une mthode dapprentissage permettant de calculer une estimation de la
loi p, note p = ( p
k
)
1kK
, partir de donnes incompltes.
Nous supposons dans la suite que les donnes sont reprsentes sous forme disjonctive
laide dune matrice de N lignes et K colonnes, note D = (x
n,k
)1nN
1kK
, o N reprsente
le nombre dexemples disponibles et K le nombre de valeurs possibles prises par la variable
mesure. Lorsque x
n,k
= 1, cela signie que la n-me observation est x
k
. La forme dis-
jonctive impose qu chaque ligne de la matrice D, une et une seule colonne contienne le
"1". linverse, si x
n,k
= 0, cela indique que la n-me observation ne prend pas la valeur
x
k
. Toutefois, il arrive dans certaines situations que la valeur prise par un individu ne soit
pas connue avec prcision. Dans les cas favorables, des informations permettent dexclure
certaines valeurs rduisant ainsi lincertitude. En pratique, cela se traduit par une impos-
sibilit de placer le "1" sur la ligne une donne dans la matrice D. Aussi, la notation " ?"
est introduite de manire indiquer explicitement les colonnes possibles dans lesquelles se
trouve la valeur relle. Lorsquil existe au moins deux k, k
1, . . . , K distincts tels que

x
n,k
= x
n,k
= ?, la n-me donne est dite incomplte ou partiellement observe.
La table D.1 donne un exemple de base de donnes compose de N = 10 mesures indpen-
dantes de la variable alatoire X valeurs dans x
1
, x
2
, x
3
, x
4
, autrement dit avec K = 4.
Les cinq premires mesures sont compltes alors que les cinq dernires sont incompltes.
Il existe plusieurs types de donnes incompltes remarquables. Quatre formes particulires
sont dtailles dans la suite.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
190 Chapitre D. Apprentissage partir de donnes incompltes
X
n x
1
x
2
x
3
x
4
1 0 0 0 1
2 0 1 0 0
3 0 1 0 0
4 1 0 0 0
5 0 0 1 0
6 ? ? ? 0
7 0 ? ? ?
8 0 ? ? 0
9 ? ? ? ?
10 ? 0 ? 0
Tab. D.1 Une base de N = 10 mesures indpendantes dune variable alatoire X
valeurs dans x
1
, x
2
, x
3
, x
4
.
1. Censure gauche : la n-me donne est censure gauche la valeur x
k
si pour tout
k 1, . . . , K,
x
n,k
=
_
? si k k
0 sinon
.
Dans la table D.1, seule la sixime mesure est censure gauche la valeur x
3
.
2. Censure droite : la n-me donne est censure droite la valeur x
k
si pour tout
k 1, . . . , K,
x
n,k
=
_
? si k k
0 sinon
. (D.1)
Dans la table D.1, seule la septime mesure est censure droite la valeur x
2
.
3. Censure par intervalle : la n-me donne est censure par intervalle entre les valeurs
x
k
1
et x
k
2
si pour tout k 1, . . . , K,
x
n,k
=
_
? si k
1
k k
2
0 sinon
.
Dans la table D.1, seule la huitime mesure est censure par intervalle entre x
2
et x
3
.
4. Donne manquante : la n-me donne est manquante si pour tout k 1, . . . , K,
x
n,k
= ?. Dans la table D.1, seule la neuvime mesure est manquante.
La dernire mesure de la table D.1 est partiellement observe sans pour autant prsenter
une forme remarquable.
Nous terminons cette partie en introduisant lensemble des informations disponibles T =
x
n,k
1nN
1kK
. Notons que lensemble T contient la mme information que la matrice D.
Cet ensemble permet nanmoins de construire une partition des informations compose
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
D.2 Mthode EM 191
de lensemble des informations observes T
o
= x
n,k
T[x
n,k
= 1 ou x
n,k
= 0 et de
lensemble des informations manquantes T
m
= x
n,k
T[x
n,k
= ?. Nous posons de
plus ^
I
= n 1, . . . , N[x
n,k
T
m
, lensemble des indices associes aux donnes
partiellement observes et ^
C
= 1, . . . , N ^
I
, lensemble des indices associes aux
donnes compltes. Nous en dduisons les deux matrices D
C
= (x
n,k
)
nN
C
1kK
et D
I
=
(x
n,k
)
nN
I
1kK
reprsentant respectivement les donnes compltes et les donnes incompltes.
Il est intressant de souligner la dirence dinformations contenues dans lensemble T
o
et
la matrice D
C
en gnral. Contrairement lensemble T
o
, la matrice D
C
ne contient pas
les informations avres concernant les donnes incompltes (position des "0"). Toutefois,
cela devient le cas lorsque les donnes incompltes sont constitues uniquement de donnes
manquantes.
D.2 Mthode EM
Nous supposons prsent que la probabilit quune donne soit incomplte dpende unique-
ment des informations observes, cest--dire en termes probabilistes lorsque P(^
I
[T) =
P(^
I
[T
o
). Nous nous plaons alors dans le cadre des donnes dites MAR (Missing At
Random, Rubin (1976)). Soit X une variable alatoire discrte et nie valeurs dans
A = x
1
, . . . , x
K
de loi p = (p
k
)
1kK
. Considrons galement D = (D
n,k
)1nN
1kK
une base
de N ralisations i.i.d. issues de la variable alatoire X. Dans les paragraphes suivants, nous
dtaillons le principe de lalgorithme EM (Hartley (1958), Dempster et al. (1977)) dans le
cadre dutilisation pour lestimation de la loi discrte et nie p = (p
k
)
1kK
lorsque les
observations disponibles sont de type MAR.
Posons l(D[p) = l(D
C
, D
I
[p) la log-vraisemblance des donnes. Daprs lhypothse i.i.d.,
Nous avons
l(D
C
, D
I
[p) = ln
_
P(D
C
, D
I
[p)
_
= ln
_
P(D
C
[p)
_
+ ln
_
P(D
I
[p)
_
=
nN
C
K
k=1
x
n,k
ln (p
k
) +
nN
I
ln
_
_
k|x
n,k
=0
p
k
_
_
=
K
k=1
nN
C
x
n,k
. .
=N
obs
k
ln (p
k
) +
nN
I
ln
_
_
k|x
n,k
=0
p
k
_
_
l(D
C
, D
I
[p) =
K
k=1
N
obs
k
ln (p
k
)
. .
vraisemblance des donnes compltes
+
nN
I
ln
_
_
k|x
n,k
=0
p
k
_
_
. .
vraisemblance des donnes incompltes
,
o N
obs
k
dsigne le nombre doccurrences de la valeur x
k
dans les donnes compltes.
Lexpression de la vraisemblance des donnes incompltes ne permet pas de dduire une
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
expression analytique des paramtres p maximisant la vraisemblance totale. Ce verrou
justie lutilisation dune alternative aux mthodes doptimisation directes
Le principe de lalgorithme EM consiste dans un premier temps introduire la matrice des
donnes compltes, note D
I
+
, dnie pour tout n ^
I
et tout k 1, . . . , K par
_
D
I
+
n,k
=
_
z
n,k
si x
n,k
,= 0
0 sinon
,
o chaque z
n,k
est une variable alatoire de Bernouilli (donc valeurs dans 0, 1) vriant
pour tout n ^
I
,

k
z
n,k
= 1. En dautres termes, construire D
I
+
revient simplement
remplacer les lments inconnus de la matrice des donnes incompltes D
I
par des va-
riables alatoires. La matrice D
I
+
est donc une variable alatoire, tout comme la quantit
l(D
C
, D
I
+
[p, T
o
), appele vraisemblance complte, qui a pour expression
l(D
C
, D
I
+
[p, T
o
) =
K
k=1
N
obs
k
ln (p
k
) +
nN
I
k|x
n,k
=0
z
n,k
ln (p
k
) (D.2)
Remarquons prsent quen se xant une loi de rfrence p
= (p
k
)
1kK
, il est possible de
calculer la distribution des donnes incompltes, cest--dire des z
n,k
, note P(D
I
+
[p
, T
o
) =
P((z
n,k
)
nN
I
,k|x
n,k
=0
[p
, T
o
). Prcisment, pour tout n ^
I
et tout k tel que x
n,k
,= 0,
nous avons
P(z
n,k
= 1[p
, T
o
) =
p
|x
n,
=0
p
n,
. (D.3)
Rappelons que la vraisemblance complte (cf. quation (D.2)) est une variable alatoire
qui, en ltat, ne permet pas la dduction de rsultats numriques utilisables en pratique.
De manire contourner cette dicult, le calcul desprance suivant est ralis :
Q(p, p
) = E
p
_
l(D
C
, D
I
+
[p, T
o
)
. (D.4)
Q(p, p
) correspond lesprance de la vraisemblance complte dune loi p quelconque que

nous pouvons calculer partir de la distribution des donnes incompltes. De lquation
(D.4), nous construisons la suite (p
(i)
)
i1
dnie par
(p
(i)
) =
_
_
_
p
(1)
donn
p
(i+1)
= arg max
p
Q(p, p
(i)
) i 2
. (D.5)
La mthode EM repose sur le fait que la suite (p
(i)
)
i1
converge vers un maximum local
de la vraisemblance l(D
C
, D
I
[p) du jeu de donnes original. Ce rsultat permet de dduire
le schma itratif suivant :
1. Choisir une loi initiale p
(1)
.
2. Tant que la suite (p
(i)
) na pas converg :
(a) tape E - valuer lesprance Q(p, p
(i)
) = E
p
(i)
_
l(D
C
, D
I
+
|p, D
o
)
.
(b) tape M - Trouver la loi p
(i+1)
telle que p
(i+1)
= arg max
p
Q(p, p
(i)
).
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
D.2 Mthode EM 193
Le schma prcdent prsente une vision relativement gnrale de la mthode EM. Dans le
cadre de la problmatique considre dans cette annexe, il est possible de dtailler les calculs
des tape E et M. Daprs lexpression de la log-vraisemblance complte (cf. quation
(D.2)), lquation (D.4) se rcrit de la faon suivante :
Q(p, p
) = E
p
_
_
K
k=1
N
obs
k
ln (p
k
) +
nN
I
k|x
n,k
=0
z
n,k
ln (p
k
)
_
_
=
K
k=1
N
obs
k
ln (p
k
) +
nN
I
k|x
n,k
=0
E
p
[z
n,k
] ln (p
k
)
=
K
k=1
N
obs
k
ln (p
k
) +
K
k=1
nN
I
|x
n,k
=0
E
p
[z
n,k
] ln (p
k
)
=
K
k=1
N
obs
k
ln (p
k
) +
K
k=1
nN
I
|x
n,k
=0
P(z
n,k
= 1|p
, D
o
) ln (p
k
)
Q(p, p
) =
K
k=1
N
obs
k
ln (p
k
) +
K
k=1
nN
I
|x
n,k
=0
_
p
|x
n,
=0
p
n,
_
. .
=N
esp
k
ln (p
k
) ,
o N
esp
k
sinterprte comme le nombre doccurrences espres de la valeurs x
k
dans les
donnes incompltes. Nous obtenons donc au nal
Q(p, p
) =
K
k=1
_
N
obs
k
+N
esp
k
ln (p
k
) .
Lquation (D.2) est identique lexpression dune log-vraisemblance associe des donnes
compltes. Par consquent, trouver la loi p = ( p
k
)
1kK
maximisant Q(p, p
) est dnie
pour tout k {1, . . . , K} par
p
k
=
N
obs
k
+N
esp
k
K
k=1
N
obs
k
+N
esp
k
.
En conclusion, dans le cadre de cette tude, le schma itratif EM se ramne :
1. Calculer les eectifs de chaque valeur x
k
dans les donnes compltes :
N
obs
k
=
nN
C
x
n,k
2. Choisir une loi initiale p
(1)
.
3. Tant que la suite (p
(i)
) na pas converg :
(a) tape E - valuer les eectifs esprs de chaque valeur x
k
dans les donnes
incompltes :
N
esp
k
=
nN
I
|x
n,k
=0
_
_
p
(i)
k
|x
n,
=0
p
(i)
n,
_
_
.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
(b) tape M - En dduire p
(i+1)
telle que pour tout k {1, . . . , K} :
p
(i+1)
k
=
N
obs
k
+N
esp
k
K
k=1
N
obs
k
+N
esp
k
.
D.3 Applications
D.3.1 Exemple simple
Lobjectif des paragraphes suivants est dillustrer les tapes de la mthode EM sur les
donnes prsentes dans la table D.1. Dans cet exemple, nous avons
D =
_
_
0 0 0 1
0 1 0 0
0 1 0 0
1 0 0 0
0 0 1 0
? ? ? 0
0 ? ? ?
0 ? ? 0
? ? ? ?
? 0 ? 0
_
_
D
C
=
_
_
0 0 0 1
0 1 0 0
0 1 0 0
1 0 0 0
0 0 1 0
_
_
et D
I
=
_
_
? ? ? 0
0 ? ? ?
0 ? ? 0
? ? ? ?
? 0 ? 0
_
_
.
Les eectifs des donnes compltes sont N
obs
1
= 1, N
obs
2
= 2, N
obs
3
= 1 et N
obs
4
= 1.
Dtaillons prsent les tapes de la mthode sur deux itrations.
1. Initialisons lalgorithme avec la loi p
(1)
=
_
p
(1)
1
, p
(1)
2
, p
(1)
3
, p
(1)
4
_
= [1/4, 1/4, 1/4, 1/4].
2. Itration 1.
(a) tape E - Estimation des donnes incompltes :
E
p
(1)
_
D
I
+
_
_
1/3 1/3 1/3 0
0 1/3 1/3 1/3
0 1/2 1/2 0
1/4 1/4 1/4 1/4
1/2 0 1/2 0
_
_
N
esp
[1.0933, 1.4167, 1.9167, 0.5833] .
(b) tape M - Calcul de la loi courante :
p
(2)
[0.2083, 0.3417, 0.2917, 0.1583] .
3. Itration 2.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
D.3 Applications 195
(a) tape E - Estimation des donnes incompltes :
E
p
(2)
_
D
I
+
_
_
0.2475 0.4059 0.3465 0
0 0.4316 0.3684 0.2000
0 0.5395 0.4605 0
0.2083 0.3417 0.2917 0.1583
0.4167 0 0.5833 0
_
_
N
esp
[0.8725, 1.7187, 2.0505, 0.3583] .
(b) tape M - Calcul de la loi courante :
p
(3)
[0.1873, 0.3719, 0.3050, 0.1358] .
4. litration 20, lerreur absolue entre les deux dernires estimations de la loi p est
infrieure 10
6
. Nous considrons que lalgorithme a converg, en obtenant les
rsultats suivants :
E
p
(19)
_
D
I
+
_
_
0 1 0 0
0 1 0 0
0 1 0 0
0 1 0 0
0 0 1 0
_
_
N
esp
[0, 4, 1, 0] p
(20)
[0.1, 0.6, 0.2, 0.1] .
D.3.2 Estimation dune loi de dure
Il sagit prsent dappliquer lapproche dcrite dans cette annexe lestimation dune
loi de dure en prsence de donnes censures droite. Cette problmatique est souleve
dans la partie 4.3.4 de la thse. Soit S une variable alatoire discrte et nie reprsentant
une dure. La variable alatoire S suit une loi F L
{S}
, avec S = {1, . . . , T
S
} lensemble
des dures possibles. Nous supposons que les donnes disponibles arrivent sous la forme
suivante :
N
s
: Nombre dobservations de la dure s ;
N
+
s
: Nombre dobservations dune censure droite la dure s, avec s T
S
1.
Tout dabord, il faut remarquer que les quantits N
1
, N
2
, . . . sont identiques aux eectifs
N
obs
1
, N
obs
2
, . . . de la mthode EM et sont par consquent directement utilisables. En re-
vanche, les eectifs des dures censures droite demandent quelques manipulations avant
de pouvoir tre utiliss dans lalgorithme. Considrons dans un premier temps lexemple
simple o T
S
= 4, et N
+
1
= 1, N
+
2
= 3 et N
+
3
= 2. Daprs la dnition dune censure
droite (cf. quation (D.1)), la matrice des donnes incompltes correspondante est donne
par :
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
S
1 2 3 4
N
+
1
= 1 ? ? ? ?
N
+
2
= 3 0 ? ? ?
0 ? ? ?
0 ? ? ?
N
+
3
= 2 0 0 ? ?
0 0 ? ?
Par consquent litration i de lalgorithme, les eectifs esprs N
esp
1
, N
esp
2
, N
esp
3
et N
esp
4
vrient
N
esp
1
= N
+
1
F
(i)
(1)
F
(i)
(1) +F
(i)
(2) +F
(i)
(3) +F
(i)
(4)
,
N
esp
2
= N
+
1
F
(i)
(2)
F
(i)
(1) +F
(i)
(2) +F
(i)
(3) +F
(i)
(4)
+N
+
2
F
(i)
(2)
F
(i)
(2) +F
(i)
(3) +F
(i)
(4)
,
N
esp
3
=N
+
1
F
(i)
(3)
F
(i)
(1) +F
(i)
(2) +F
(i)
(3) +F
(i)
(4)
+N
+
2
F
(i)
(3)
F
(i)
(2) +F
(i)
(3) +F
(i)
(4)
+N
+
3
F
(i)
(3)
F
(i)
(3) +F
(i)
(4)
,
et notons que le dernier eectif peut sexprimer en fonction de N
esp
3
, F
(i)
(3) et F
(i)
(4)
comme suit :
N
esp
4
=
F
(i)
(4)
F
(i)
(3)
N
esp
3
.
Il est alors possible de gnraliser ces rsultats pour tout s 1, . . . , T
S
de la faon
suivante :
N
esp
s
=
_
_
F
(i)
(s)
s
=1
_
_
N
+
s
T
S
=s
F
(i)
(s
)
_
_
si s T
S
F
(i)
(T
S
)
F
(i)
(T
S
1)
N
esp
T
S
1
si s = T
S
. (D.6)
En conclusion, lestimation des lois de temps de sjour dcrites dans la partie 4.3.4 ont
t estimes en pratique par la mthode EM dcrite dans les paragraphes prcdents. Le
calcul (D.6) a t utilis de manire obtenir les eectifs esprs de chaque temps de sjour
censur partir des donnes disponibles.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Annexe E
Demonstrations
E.1 Dmonstrations du chapitre 1
Dmonstration (Proposition 1.1)
Soit c > 0 le cot algorithmique dune addition ou dune multiplication entre deux rels.
Par dnition la somme ou produit de deux potentiels
1
R
X
et
2
R
Y
ncessite
respectivement [(X Y)
[ additions ou multiplications entre deux rels. Par consquent,

le cot algorithmique de telles oprations est de
CA(
) = [(X Y)
[c = O([(X Y)
[) = CS(
).

Soit c > 0 le cot algorithmique associ une addition entre deux rels. Par dnition
de la marginalisation, pour chaque x
, le calcul de
(x
) ncessite [(X X
[ 1
additions. Le cot algorithmique total du calcul de
vaut donc
CA(
) = [X
[([(X X
[ 1)c
= O([X
[[(X X
[)
= O([(X X X
[)
CA(
) = O([X
[) = CS().
Dmonstration (Thorme 1.1)

Soit W X. En considrant p uniquement comme un potentiel, alors q =
_
W
p
[0, 1]
(XY)\W
par dnition de la sommation. Par ailleurs comme p est galement une
LPC, les domaines X et Y sont disjoints, do
(X Y) W = (X W) Y = X
Y.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
198 Chapitre E. Dmonstrations
Il sagit prsent de vrier que sur le domaine X
, le potentiel q somme un. Or pour

tout tout (y, x
) (Y X
,
q(y, x
) =
_
wW
p(w, x
[y).
Par consquent, pour tout y Y
_
x
q(y, x
) =
_
x
_
wW
p(w, x
[y)
=
_
(x
,w)(WX
p(w, x
[y)
_
x
q(y, x
) =
_
xX
p(x[y) = 1.
Do q L
X
|Y
.
Dmonstration (Thorme 1.2)

Daprs la dnition du produit de deux potentiels, (p q) [0, 1]
XY
WZ
puisque on a
pos Y
= Y W. Il reste donc vrier que sur le domaine X W, le potentiel (p q)

somme un. Nous avons donc pour tout (y
, z) (Y
Z)
_
(x,w)(XW)
p(x[y)q(w[z) =
_
wW
_
xX
p(x[y
, w
)q(w[z)
=
_
wW
q(w[z)
_
xX
p(x[y
, w)
. .
=1
car X (W Z) =
_
(x,w)(XW)
p(x[y)q(w[z) =
_
wW
q(w[z) = 1.
Do (p q) L
XW|Y
Z
.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
E.2 Dmonstrations du chapitre 2 199
Dmontrons cette proposition par rcurrence sur t. Pour t = 1, le rsultat sobtient imm-
diatement en appliquant la proprit de factorisation la loi initiale dun MGD. En eet,
pour tout x A, tout s o et tout a /,
1
(x, s, a) vrie
1
(x, s, a) = P(X
1
= x, S
1
= s, A
1
= a)
=
1
(x, s, a)
1
(x, s, a) =
1
(x)F
1
(x, s)G
1
(x, a).
Pour t 2, la dmonstration repose essentiellement sur la proprit de linterface gauche
et sur la proprit de factorisation applique la loi de transition dun MGD. Pour tout
t 2, tout x A, tout s o et tout a /, nous avons par dnition :
t
(x, s, a) = P(
1
, . . . ,
t1
, X
t
= x, S
t
= s, A
t
= a)
= P(
1
, . . . ,
t1
) P(X
t
= x, S
t
= s, A
t
= a[
1
, . . . ,
t1
)
. .
= P(X
t
=x,S
t
=s,A
t
=a|
t1
) daprs lhypothse markovienne dordre un
=

X
t1
s
S
t1
a

A
t1
P(
1
, . . . ,
t2
, X
t1
= a
, S
t1
= s
, A
t1
= a
)
. .
=
t1
(x
,s
,a
) par hypothse de rcurrence

P(X
t
= x, S
t
= s, A
t
= a[X
t1
= a
, S
t1
= s
, A
t1
= a
)
=

X
t1
s
S
t1
a

A
t1
t1
(x
, s
, a
)
P(X
t
= x, S
t
= s, A
t
= a[X
t1
= a
, S
t1
= s
, A
t1
= a
)
. .
= Q
(x
,s
,a
,x)F
(x
,s
,a
,x,s)G
t
(x,a) daprs lquation (2.3) et la partie 2.3
t
(x, s, a) = G
t
(x, a)

X
t1
s
S
t1
a

A
t1
t1
(x
, s
, a
)Q
(x
, s
, a
, x)F
(x
, s
, a
, x, s),
ce qui achve la rcurrence.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Lorsque t = 1, le calcul
t
ncessite le produit des trois LPC
1
L
X
, F
1
L
{S}
1
|{X}
1
et G
1
L
A
1
|{X}
1
. Nous avons donc
1
=
1
F
1
. .
=
(1)
L
{X,S}
1
G
1
. .
=
(2)
L
{X,S,A}
1
.
Daprs la proposition 1.1, CA(
(1)
) = O([A[T
S
) et CA(
(2)
) = O([A[T
S
[/[), do la
complexit algorithmique du calcul
1
donne par
CA(
1
) = CA(
(1)
) +CA(
(2)
) = O([A[T
S
[/[).
Lorsque t 2, le calcul de
t
, t 2, se dcompose de la faon suivante :
t
= G
t
{

X,

S,

A}
t1
t1
Q
. .
=
(1)
L
{X,S}
t
|{X,S,A}
t1
. .
=
(2)
[0,1]
{X,S}
t
. .
=
(3)
[0,1]
{X,S,A}
t
,
avec CA(
(1)
) = O([A[T
S
), CA(
(2)
) = O([

A
t1
[[A[[
o
t1
[T
S
[[

/
t1
[), et CA(
(3)
) =
O([A[[T
S
[[/[). Do,
CA(
t
) = CA(
(1)
) +CA(
(2)
) +CA(
(3)
)
= O([A[T
S
) +O([

A
t1
[[A[[
o
t1
[T
S
[[

/
t1
[) +O([A[[T
S
[[/[)
CA(
t
) = O([A[
2
T
2
S
[/[),
en se plaant dans le pire des cas dun point de vue algorithmique, savoir lorsque

A
t1
=
A,

o
t1
= o et

/
t1
= /.

La preuve de cette proposition sobtient en dcomposant la sommation sur

A
t
,

o
t
et

/
t
de
lquation (2.20) selon les trois sous-domaines de dnition caractrisant les LPC Q
et
F
. On distingue donc les cas suivants :

a
/
X
et s
= 1 (transition naturelle) ;
a
/
X
t
et s
2 (transition dterministe) ;
a
/
X
t
(transition articielle).
Appliquons donc cette dcomposition lquation (2.20), ce qui donne pour tout x A,
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
tout s o et tout a /,
t
(x, s, a)
G
t
(x, a)
=

X
t1
s
S
t1
a

A
t1
t1
(x
, s
, a
)Q
(x
, s
, a
, x)F
(x
, s
, a
, x, s)
=

X
t1

A
X
t1
1I(s

o
t1
)1I(s
= 1)
t1
(x
, s
, a
)
Q
(x
, s
, a
, x)F
(x
, s
, a
, x, s) +

X
t1

A
X
t1
S
t1
\{1}
t1
(x
, s
, a
)
Q
(x
, s
, a
, x)F
(x
, s
, a
, x, s) +

X
t1
S
t1

A
X
t1
t1
(x
, s
, a
)
Q
(x
, s
, a
, x)F
(x
, s
, a
, x, s)
=

X
t1

A
X
t1
1I(1

o
t1
)
t1
(x
, 1, a
)Q
sys
(x
, x)F
sys
(x
, x, s) +

X
t1

A
X
t1
S
t1
\{1}
t1
(x
, s
, a
)I(x
, x)C(s
, s) +

X
t1
S
t1

A
X
t1
t1
(x
, s
, a
)Q
act
(x
, a
, x)F
sys
(x
, x, s)
= 1I(1

o
t1
)

X
t1
Q
sys
(x
, x)F
sys
(x
, x, s)

A
X
t1
t1
(x
, 1, a
)
. .
=
sys
t
(x,s)
+

A
X
t1
S
t1
\{1}
1I(s
= s + 1)

X
t1
t1
(x
, s
, a
)1I(x
= x) +

X
t1
F
sys
(x
, x, s)

A
X
t1
Q
act
(x
, a
, x)
S
t1
t1
(x
, s
, a
)
. .
=
act
t
(x,s)
=
sys
t
(x, s) +
act
t
(x, s) +
1I(x

A
t1
)

A
X
t1
S
t1
\{1}
1I(s
= s + 1)
t1
(x, s
, a
t
(x, s, a)
G
t
(x, a)
=
sys
t
(x, s) +
act
t
(x, s) +
1I(x

A
t1
) 1I(2 s + 1 T
S
)1I(s

o
t1
)
. .
=1I(s
S
t1
\{T
S
})

A
X
t1
t1
(x, s + 1, a
)
. .
=
det
t
.
Do le rsultat.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1

Ltude de la complexit algorithmique du calcul de
t
, t 2 prsent dans la proposition
2.3 revient dans un premier temps tudier la complexit des calculs de
sys
t
,
det
t
et
act
t
. Plaons nous dans le pire des cas dun point de vue algorithmique, savoir lorsque
A
t1
= A,

o
t1
= o,

/
X
t1
= /
X
et

/
X
t1
= /
X
. Pour
sys
t
, nous obtenons alors
sys
t
=
{X}
t1
Q
sys
F
sys
. .
= v
(1)
[0,1]
{X,S}
t
{A
X
}
t1
t1
(:, 1, /
X
)
. .
= v
(2)
[0,1]
{X}
t1
. .
= v
(3)
[0,1]
{X,S}
t
,
avec CA(v
(1)
) = O([A[
2
T
S
), CA(v
(2)
) = O([A[[/
X
[) et CA(v
(3)
) = O([A[
2
T
S
). Do
CA(
sys
t
) = CA(v
(1)
) +CA(v
(2)
) +CA(v
(3)
) = O([A[
2
T
S
+[A[[/
X
[).
Pour ce qui est du calcul
det
t
, seule la sommation sur /
X
t
possde un cot algorithmique
non ngligeable. Nous avons en eet
det
t
=
{A
X
}
t1
t1
(:, o
t1
1, /
X
)
. .
[0,1]
{X,S\{T
S
}}
t
.
Do,
CA(
det
t
) = O([A[T
S
[/
X
[).
Enn, le calcul de
act
t
se dcompose comme suit :
act
t
=
{X}
t1
F
sys
{A
X
}
t1
Q
act
{S}
t1
t1
(:, :, /
X
)
. .
= w
(1)
[0,1]
{X,A
X
}
t1
. .
= w
(2)
[0,1]
{X}
t1
{X}
t
. .
= w
(3)
[0,1]
{X,S}
t
,
avec CA(w
(1)
) = O([A[T
S
[/
X
[), CA(w
(2)
) = O([A[
2
[/
X
[) et CA(w
(3)
) = O([A[
2
T
S
) et
par consquent
CA(
act
t
) = O([A[T
S
[/
X
[ +[A[
2
[/
X
[ +[A[
2
T
S
).
La somme de
sys
t
,
det
t
et
act
t
a un cot algorithmique de lordre :
CA(
sys
t
+
det
t
+
act
t
) = O([A[
2
T
S
+[A[[/
X
[) +O([A[T
S
[/
X
[) +
O([A[T
S
[/
X
[ +[A[
2
[/
X
[ +[A[
2
T
S
) +O([A[T
S
)
CA(
sys
t
+
det
t
+
act
t
) = O([A[T
S
[/[ +[A[
2
[/[ +[A[
2
T
S
).
Pour nir, le produit par G
t
a une complexit en O([A[T
S
[/[) et on en dduit la complexit
du calcul de
t
:
CA(
t
) = O([A[T
S
[/[ +[A[
2
[/[ +[A[
2
T
S
) +O([A[T
S
[/[)
= O([A[T
S
[/[ +[A[
2
[/[ +[A[
2
T
S
).
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Lobjectif de cette dmonstration consiste calculer lexpression de la LPC G
t
= P(A
t
[X
t
)
dans un modle Virmalab. Les relations de dpendance sous-jacentes ce modle au sein
dune mme tranche t (cf. gure 3.1) conduisent la factorisation suivante :
P(X
t
, D
t
, A
t
) = P(X
t
) P(D
t
|X
t1
) P(A
t
|D
t
)
avec,
P(D
t
) =
L
=1
[P(
t,
) P(D
t,
|X
t
,
t,
)] P(D
sys
t
|D
t,1
, . . . , D
t,L
),
et
P(A
t
|D
t
) = P(A
t
|D
sys
t
).
Aprs division par la loi P(X
t
), lquation prcdente devient
P(D
t
, A
t
|X
t
) = P(D
t
|X
t1
) P(A
t
|D
t
)
P(A
t
|X
t
) =
D
t
P(D
t
|X
t1
) P(A
t
|D
t
)
P(A
t
|X
t
) =
D
sys
t
t,1
,D
t,1
. . .
t,L
,D
t,L
L
=1
[P(
t,
) P(D
t,
|X
t
,
t,
)]
P(D
sys
t
|D
t,1
, . . . , D
t,L
) P(A
t
|D
sys
t
)
P(A
t
|X
t
) =
D
sys
t
t,1
,D
t,1
P(
t,1
) P(D
t,1
|X
t
,
t,1
) . . .
t,L
,D
t,L
P(
t,L
) P(D
t,L
|X
t
,
t,L
)
P(D
sys
t
|D
t,1
, . . . , D
t,L
) P(A
t
|D
sys
t
).
En utilisant les notations introduites dans la partie 3.2.2, nous obtenons pour tout x X
et tout a A,
G
t
(x, a) =
dD
t,1
{0,1}
d
1
D
1
t,1
P(D
t,1
= d
1
|X
t
= x,
t,1
) . . .
t,L
{0,1}
d
L
D
L
t,L
P(D
t,L
= d
L
|X
t
= x,
t,L
)
sys
(d
1
, . . . , d
L
, d)(d, a)
=
dD
(d, a)
_
_
d
1
D
1
t,1
1
(x, d
1
) + (1
t,1
)1I(d
1
= d
)
_
_
. . .
_
_
d
L
D
L
t,L
L
(x, d
L
) + (1
t,L
)1I(d
L
= d
)
_
_
sys
(d
1
, . . . , d
L
, d).
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Il sagit prsent de dmontrer que pour tout entier strictement positif L, tout x X et
tout d T
sys
,
rec
t,L
(x, d) =
_
_
d
1
D
1
t,1
1
(x, d
1
) + (1
t,1
)1I(d
1
= d
)
_
_
. . . (E.1)
_
_
d
L
D
L
t,L
L
(x, d
L
) + (1
t,L
)1I(d
L
= d
)
_
_
sys
(d
1
, . . . , d
L
, d)
Pour ce faire, procdons par rcurrence sur L. Pour L = 1, lhypothse (E.1) est vrie
puisque lquation (3.11) scrit
rec
t,1
(x, d) =
_
d
1
D
1
1
(x, d
1
)
sys
(d
1
, d) si
t,1
= 1
sys
(d
, d) si
t,1
= 0
=
d
1
D
1
t,1
1
(x, d
1
)
sys
(d
1
, d) + (1
t,1
)
sys
(d
, d)
=
d
1
D
1
t,1
1
(x, d
1
)
sys
(d
1
, d) + (1
t,1
)1I(d
1
= d
)
sys
(d
1
, d)
=
_
_
d
1
D
1
t,1
1
(x, d
1
) + (1
t,1
)1I(d
1
= d
)
_
_
sys
(d
1
, d).
Supposons quil existe L telle que la proposition (E.1) soit vraie. La LPC
rec
t,L+1
(x, d)
possde pour tout x X et tout d T
sys
lexpression suivante :
rec
t,L+1
(x, d) =
_
d
L+1
D
L+1
L+1
(x, d
L+1
)
rec
t,L
(d
L+1
, d) si
t,L+1
= 1
rec
t,L
(d
, d) si
t,L+1
= 0
=
_
_
d
L+1
D
L+1
t,L+1
L+1
(x, d
L+1
) + (1
t,L+1
)1I(d
L+1
= d
)
_
_
rec
t,L
(d
L+1
, d).
Par la suite, en utilisant lhypothse (E.1), nous obtenons
rec
t,L+1
(x, d) =
_
_
d
L+1
D
L+1
t,L+1
L+1
(x, d
L+1
) + (1
t,L+1
)1I(d
L+1
= d
)
_
_
_
_
d
1
D
1
t,1
1
(x, d
1
) + (1
t,1
)1I(d
1
= d
)
_
_
. . .
_
_
d
L
D
L
t,L
L
(x, d
L
) + (1
t,L
)1I(d
L
= d
)
_
_
sys
(d
1
, . . . , d
L
, d
L+1
, d).
Do le rsultat.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Il sagit de calculer pour tout t lexpression de la loi dinterface gauche, note
t
=
P(X
t
, A
t
), associe au modle Virmalab. Daprs lquation (3.2), nous avons :
P(X
t
, A
t
)
. .
=
t
=
_
_
P(X
1
)
. .
=
1
D
1
P(D
1
[X
1
) P(A
1
[D
1
)
. .
=G
1
t = 1
X
t1
A
t1
P(X
t1
, A
t1
)
. .
=
t1
P(X
t
[X
t1
, A
t1
)
. .
=
. .
=
t
D
t
P(D
t
[X
t1
) P(A
t
[D
t
)
. .
=G
t
t 2
.
Autrement dit, nous obtenons pour tout t, tout x X et tout a /,
t
(x, a) =
t
(x)G
t
(x, a),
avec pour tout x X,
t
(x) =
_
1
(x) t = 1
t1
(x
, a
)(x
, a
, x) t 2
.
Lorsque t 2, il est possible de sparer la somme sur / entre /
X
et /
X
de faon
exploiter la dnition par morceaux de (cf. quation (3.2.2)). Il vient alors pour tout
x X,
t
(x) =
t1
(x
, a
)(x
, a
, x)
=
X
_
A
X
t1
(x
, a
) (x
, a
, x)
. .
=
sys
(x
,x)
+
A
X
t1
(x
, a
) (x
, a
, x)
. .
=
act
(x
,a
,x)
_
t
(x) =
X
_
_
sys
(x
, x)
A
X
t1
(x
, a
) +
A
X
t1
(x
, a
)
act
(x
, a
, x)
_
_
.
Do le rsultat.

Il sagit ici de dterminer pour tout = 1 . . . , L lexpression de la loi associe au -me
diagnostic, note P(D
t,
), dans le modle Virmalab. Pour ce faire, il sut de sommer la
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
loi jointe du modle de la tranche t sur toutes les variables, except D
t,
. Lapplication du
thorme de factorisation donne ici :
P(D
t,
) =
X
t
,D
t
\D
t,
,A
t
P(X
t
, D
t
, A
t
)
=
X
t
t,
D
sys
t
A
t
P(X
t
)
1L
[P(
t,
) P(D
t,
[X
t
,
t,
)]
P(D
sys
t
[D
t,1
, . . . , D
t,L
) P(A
t
[D
sys
t
).
Il est alors possible dextraire le terme P(D
t,
[X
t
,
t,
) du produit des L LPC de diagnostic,
comme suit :
P(D
t,
) =
X
t
t,
D
sys
t
A
t
P(X
t
) P(D
t,
[X
t
,
t,
)
=L
_
P(
t,
)P(D
t,
[X
t
,
t,
)
P(D
sys
t
[D
t,1
, . . . , D
t,L
) P(A
t
[D
sys
t
).
Les sommations sont ensuite rarranges de manire obtenir des simplications :
P(D
t,
) =
X
t
P(X
t
)
t,
P(D
t,
[X
t
,
t,
)
=L
_
_
(
t,
,D
t,
)
1
=L
P(
t,
) P(D
t,
[X
t
,
t,
)
_
_
D
sys
t
P(D
sys
t
[D
t,1
, . . . , D
t,L
)
A
t
P(A
t
[D
sys
t
)
. .
=1
. .
=1
=
X
t
P(X
t
)
t,
P(D
t,
[X
t
,
t,
)
=L
_
(
t,
)
1
=L
P(
t,
)
(D
t,
)
1
=L
P(D
t,
[X
t
,
t,
)
. .
=1
_
_
. .
=1
P(D
t,
) =
X
t
P(X
t
)
t,
P(D
t,
[X
t
,
t,
).
Enn, en appliquant la dnition par morceaux de la LPC P(D
t,
[X
t
,
t,
) (cf. quation
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
(3.2.2)), nous obtenons pour tout d
,
P(D
t,
= d
) =
xX
t
(x)
t,
{0,1}
P(D
t,
= d
[X
t
= x,
t,
)
=
xX
t
(x)
_
t,
(x, d
) si
t,
= 1
1I(d
= d
) si
t,
= 0
P(D
t,
= d
) =
_
xX
t
(x)
t,
(x, d
) si
t,
= 1
1I(d
= d
xX
t
(x)
. .
=1
si
t,
= 0
Do le rsultat.

Daprs les propositions 1.1 et 1.2, la complexit algorithmique du calcul de G
t
vrie
CA(G
t
) = CA
_
D

rec
t,L
_
+CA(
rec
t,L
). (E.2)
Le premier terme de lquation (E.2) consiste en une somme et un produit de LPC avec
L
{A}
t
|{D
sys
}
t
et
rec
t,L
L
{D
sys
}
t
|{X}
t
. Do,
CA
_
D
sys

rec
t,L
_
= O([X[[T
sys
[[/[). (E.3)
Le second terme correspond la complexit algorithmique du calcul de
rec
t,L
. Rappelons
que la LPC
rec
t,L
dsigne le L-me terme de la suite (
rec
t,
)
0
dnie par (3.11). Le calcul
du -me terme de cette suite dpend de la valeur de la variable
t,
. Lorsque
t,
= 0,
rec
t,
sobtient par une simple valuation de
rec
t,1
. En revanche, lorsque
t,
= 1, une somme et
un produit de LPC sont raliss. Au regard du temps de calcul, lvaluation de
rec
t,
dans le
premier cas est ngligeable par rapport lvaluation dans le second. Par consquent, dans
la suite de cette dmonstration, nous nous plaons dans le pire des cas, savoir lorsque
pour tout = 1, . . . , L,
t,
= 1. Il vient alors pour tout = 1, . . . , L,
CA(
rec
t,
) = CA
_
_

rec
t,1
_
_
+CA(
rec
t,1
). (E.4)
Par dnition,
L
{D
}
t
|{X}
t
et
rec
t,
L
{D
sys
}
t
|{D
+1
,...,D
L
}
t
, ce qui implique
CA
_
_

rec
t,1
_
_
= O
_
[X[[T
sys
[
L
=+1
[T
[
_
.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
Par rcurrence, lquation (E.4) se rcrit comme suit :
CA(
rec
t,L
) = O([X[[T
sys
[) +CA(
rec
t,L1
)
= O([X[[T
sys
[) +O([X[[T
sys
[[T
L
[) +CA(
rec
t,L2
)
CA(
rec
t,L
) = O([X[[T
sys
[) +O([X[[T
sys
[[T
L
[) +. . . +O
_
[X[[T
sys
[
L
=1
[T
[
_
+CA(
rec
t,0
),
avec CA(
rec
t,0
) = CA(
sys
) = 0 puisque
sys
est une donne et nest donc pas calculer.
Il sensuit alors que
CA(
rec
t,L
) = O
_
[X[[T
sys
[
L
=1
L
=1
[T
[
_
. (E.5)
La dmonstration sachve en remplaant les deux termes de lquation E.2 par les expres-
sions obtenues dans les quations E.3 et E.5.

Notons tout dabord que le temps de calcul de la loi
1
est nul puisque cette dernire
constitue un des paramtres du modle Virmalab. Lorsque t 2, le calcul de
t
conduit
la manipulation des potentiels/LPC suivants :
t
=
{X}
t1
_
sys
{A
X
}
t1
t1
(:, /
X
)
. .
=
(1)
L
{X}
t1
+
{A
X
}
t1
t1
(:, /
X
)
act
. .
=
(2)
L
{X
t1
,A
X
}
t1
{X}
t
_
_
=
{X}
t1
_
sys

(1)
. .
=
(3)
L
{X}
t1
{X}
t
+
{A
X
}
t1
(2)
. .
=
(4)
L
{X}
t1
{X}
t
_
t
=
{X}
t1
_
_

(3)
+
(4)
. .
=
(5)
L
{X}
t1
{X}
t
_
_
. .
=
(6)
L
{X}
t
.
La complexit algorithmique du calcul de
t
vrie donc
CA(
t
) = CA(
(1)
)
. .
= O(|X||A
X
|)
+ CA(
(2)
)
. .
= O(|X|
2
|A
X
|)
+CA(
(3)
)
. .
= O(|X|
2
)
+ CA(
(4)
)
. .
= O(|X|
2
|A
X
|)
+CA(
(5)
)
. .
= O(|X|
2
)
+CA(
(6)
)
. .
= O(|X|
2
)
= O([X[[/
X
[ +[X[
2
[/
X
[ +[X[
2
+[X[
2
[/
X
[ +[X[
2
+[X[
2
)
= O([X[
2
([/
X
[ +[/
X
[
. .
= |A|
) + [X[[/
X
[ + 3[X[
2
. .
ngligeable devant le premier terme
)
CA(
t
) = O([X[
2
[/[).
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
En supposant que la LPC G
t
L
{A}
t
|{X}
t
a pralablement t calcule laide de la
proposition 3.1, la complexit algorithmique de
t
se dduit immdiatement de
t
=
t
G
t
. .
L
{X,A}
t
CA(
t
) = O([X[[/[).
Enn, la loi P(A
t
) sobtenant en sommant
t
sur le domaine X
t
, nous en dduisons
directement CA(P(A
t
)) = CS(
t
) = O([X[[/[).

Pour tout = 1, . . . , L, la complexit algorithmique du calcul de P(D
t,
) dpend de la
valeur de
t,
. La situation est similaire celle du calcul de G
t
(cf. proposition 3.1). En
eet, lorsque
t,
= 0, le calcul se rsume lvaluation dune fonction indicatrice. Ceci
est ngligeable compar la marginalisation eectue lorsque
t,
= 1. Nous nous plaons
donc dans le pire des cas du point de vue de la complexit algorithmique, savoir lorsque
t,
= 1. Dans ce contexte, nous avons simplement
P(D
t,
) =
{X}
t
. .
L
{X,D
}
t
CA(P(D
t,
)) = O([X[[T
[). (E.6)

Reprenons les notations introduites dans la partie 3.3.1 et posons
K = max(K
X
, (K
, K
D
)
1L
, K
A
). La complexit algorithmique du calcul (3.7) vrie
U
k
X
X
t
=
{X}
t
u
k
X
X
t

t
. .
R
{X}
t
CA(U
k
X
X
t
) = O([X[).
Nous en dduisons
CA(U
X
t
) =
K
X
k
X
=1
CA(U
k
X
X
t
) = O(K
X
[X[) = O(K[X[).
En suivant le mme principe, nous obtenons
_
_
U
k
t,
= u
k
t,
t,
.
U
k
D
D
t,
=
{D
}
t
u
k
D
D
t,
P(D
t,
)
. .
R
{D
}
t
_
_
_
CA(U
k
t,
) = O(1)
CA(U
k
D
D
t,
) = O([T
[)
CA(U
D
t
) =
L
=1
_
_
K
=1
CA(U
k
t,
) +
K
D
k
D
=1
CA(U
k
D
D
t,
)
_
_
CA(U
D
t
) =
L
=1
[O(K
) +O(K
D
[T
[)]
CA(U
D
t
) = O(KL) +
L
=1
O(K[T
[)
CA(U
D
t
) = O
_
K
_
L +
L
=1
[T
[
__
,
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1
et
CA(U
A
t
) =
K
A
k
A
=1
CA(U
k
A
A
t
) = O(K
A
[/[) = O(K[/[).
Do le rsultat
CA(U
X
t
, U
D
t
, U
A
t
) = CA(U
X
t
) +CA(U
D
t
) +CA(U
A
t
)
= O
_
K
_
[X[ +L +
L
=1
[T
[ +[/[
__
.

Lobjectif de cette dmonstration est de simplier lexpression de la complexit associe
lalgorithme 3.1 suivant la complexit du modle des diagnostics. Dans le meilleur des cas,
nous avons [T
sys
[ = [T
1
[ = . . . = [T
L
[ = 2 et dans le pire des cas, nous considrons que
[T
sys
[ = [T
1
[ = . . . = [T
L
[ = [X[. Remarquons tout dabord que si [T
sys
[ = [T
1
[ = . . . =
[T
L
[ = C 2, nous obtenons
[T
sys
[
L
=1
L
=
[T
[ = C
L
=1
L
=
C
= C
_
C
L
+C
L1
+. . . +C
_
[T
sys
[
L
=1
L
=
[T
[ = C
2
1 C
L
1 C
.
En se plaant dans le meilleur des cas, cest--dire en xant C = 2, il vient
CA
inf
(V
f
util ) = O
_
T
_
[X[(2
L+2
4) + 2[X[[/[ +[X[
2
[/[
_
= O
_
T
_
2
L+2
[X[ +[X[
2
[/[
_
.
En revanche, dans le pire des cas, cest--dire en xant C = X, nous obtenons
CA
sup
(V
f
util ) = O
_
T
_
[X[ [X[
2
1 [X[
L
1 [X[
+[X[[/[ +[X[
2
[/[
__
= O
_
_
_
_
_
T
_
_
[X[
3
1 [X[
L
1 [X[
. .
= O(|X|
L1
)
+[X[
2
[/[
_
_
_
_
_
_
_
CA
sup
(V
f
util ) = O
_
T
_
[X[
L+2
+[X[
2
[/[
_
.
Do le rsultat.
t
e
l
-
0
0
4
7
4
3
8
9
,

v
e
r
s
i
o
n

2

-

2
0

J
a
n

2
0
1
1

Donat

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Donat

Transféré par

Droits d'auteur :

Formats disponibles

Modlisation de la abilit

est appel conguration du domaine X ;

est alors un D-uplet (x

= A Z est lensemble des congurations de ce

sont dits quivalents,

, vriant pour toute conguration x

le rsultat de la marginalisation de sur le domaine . Les potentiels et sont alors

), est de lordre de sa complexit spatiale. Formellement,

= X W. La complexit algorithmique du calcul de

qui maximise la vraisemblance, note L, des donnes observes D

qui maximise l(; D

sobtient en conservant uniquement les variables de la tranche t, ainsi que

reprsentant le vecteur alatoire (X

reprsentant le vecteur ala-

) est quivalent la chane de Markov

. Lintrt dun n-MPGM rside donc

) la distribution de linterface gauche de la

correspond lexpression de la fonction de rpartition dune loi de

, x) correspond la probabilit de passer de ltat x

. La complexit spatiale de I est identique celle de

, x) correspond la probabilit de passer de ltat x

. Cette LPC peut scrire sous

est alors gale lespace

, x, s) dsigne la probabilit de passer s units de temps dans ltat

. Cette LPC peut scrire sous la

2, linstant t ce dernier sera gale s

conduit une complexit spatiale en O([A[

(cf. partie 2.3.4), il est possible de rduire cette complexit en stockant

, x, 1) = 1. Ces deux LPC ninuencent donc plus les calculs probabilistes

, savoir la fois leur caractre dni par

, ainsi que sur leur composante dterministe

x avec une cadence z.

,= e, la table 2.5 donne directement les dirents N

Fig. 3.1 1-MPGM (modle de transition) associ au modle VirMaLab. Dans le

x avec une probabilit gale

, x) exprime ainsi la probabilit pour le systme de passer de la

x alors que laction a

| reprsente la taille du spectre de dtection

) correspond la probabilit de renvoyer le signalement d

, ltat rel est moins grave que le diagnostic,

, ltat rel est identique au diagnostic,

, ltat rel est plus grave que le diagnostic,

, panne, panne}, ainsi que les valeurs numriques suivantes :

quel que soit ltat rel du systme.

appartient galement lensemble D

, ok, dgrad, panne}

ou ok, alors aucune action nest dclenche ;

|), pouvant devenir rapidement draisonnable de par le produit sur les

-me utilit associe

-me utilit associe D

dsigne les direntes utilits du diagnostic

(quation (3.8)) ; // Activation

(quation (3.9)) ; // R esultat

, ok, dfaut}. Les deux mthodes de diagnostic sont concurrentes. Elles

. Dans le cas o seule la -me mthode de diagnostic

. Dans le cas o seule la -me mthode diagnostic

| ajustements explorer pour dterminer

(a) Pleine barre - File haute

(c) Pleine barre - File basse

(d) Soudure - File basse

Produit cartsien des ensembles constituant le domaine X, cest--

est une ralisation ou un tirage alatoire de la loi p lorsque

Elements sur la theorie des graphes

Elements sur la theorie des probabilites