Académique Documents
Professionnel Documents
Culture Documents
JURY :
Christian Olivier Professeur des Universits, Universit de Poitiers, Prsident
du jury
Zohra Cherfi Boulanger Professeur des Universits, Universit de Technologie de
Compigne
Abdessamad Kobi Professeur des Universits, Universit dAngers
Gilles Mourioux Matre de Confrences, Universit de Limoges
Yann Chamaillard Professeur des Universits, Universit dOrlans
Frdric Kratz Professeur des Universits, ENSI de Bourges
Manuel Avila Matre de Confrences, Universit dOrlans
Florent Duculty Matre de Confrences, Universit dOrlans
Remerciements
Je tiens remercier en tout premier lieu M. Frdric Kratz davoir accept, il y a quelques
annes de cela, que je dbute une thse sous sa direction. Jai ainsi dcouvert le monde de
la recherche au sein de lquipe IRAuS du laboratoire PRISME.
Je remercie Mme Zohra Cherfi Boulanger et M. Abdessamad Kobi davoir accept de rap-
porter sur mon travail de thse. Leur intrt pour ce travail et leurs remarques pertinentes
mont pouss aller plus loin dans certaines rflexions.
Merci M. Manuel Avila et M. Florent Duculty qui ont co-dirig ce travail de thse, ils
ont cadrs mon travail tout au long de ma thse et ont su me diriger sur ce long chemin
sinueux.
M. Stphane Bgot pour les corrections quatre mains que nous avons ralis durant
de longues heures.
Merci aussi tous les personnels de lIUT de lIndre qui mont encourag pendant toutes
ces annes. Merci Nicole Stride qui ma montr comment motiver les tudiants de LPSAR
pendant 4 heures de CM...
Merci Mme Pinkney pour son aide prcieuse dans la rdaction de communications en
i
anglais.
Merci Fanny, pour la correction des nombreuses erreurs de frappe sur ce manuscrit et
aussi pour sa patience de mavoir support travailler durant de nombreux soirs et week-end.
ii
Table des matires
Avant-propos 1
iii
TABLE DES MATIRES
4 Exprimentations et rsultats 87
4.1 Rsultats de simulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.1.1 Paramtres du modle de simulation . . . . . . . . . . . . . . . . . . 89
4.1.2 Pertinence des observations de simulation . . . . . . . . . . . . . . . . 90
4.1.3 volution de la modlisation . . . . . . . . . . . . . . . . . . . . . . . 92
4.1.4 Pertinence de larchitecture des modles de simulation . . . . . . . . . 98
4.1.5 Rsultats avec les autres topologies . . . . . . . . . . . . . . . . . . . 104
4.2 Rsultats des tudes relles . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
4.2.1 Prsentation des environnements dtude . . . . . . . . . . . . . . . . 107
4.2.2 Modlisation des processus industriels . . . . . . . . . . . . . . . . . . 107
4.2.3 Description des MMC utiliss . . . . . . . . . . . . . . . . . . . . . . 108
4.2.4 Pertinence des observations empiriques . . . . . . . . . . . . . . . . . 110
4.2.5 volution de la modlisation . . . . . . . . . . . . . . . . . . . . . . . 119
4.2.6 Confrontation du modle de synthse avec lapplication relle . . . . . 125
4.2.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
4.3 Comparaison du modle de synthse avec le cas industriel . . . . . . . . . . . 126
4.3.1 Ajustement du modle de synthse . . . . . . . . . . . . . . . . . . . 126
4.3.2 Rsultats aprs ajustement du modle de synthse . . . . . . . . . . . 129
4.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
iv
TABLE DES MATIRES
A Algorithmes 139
A.1 Apprentissage Interactive Dichotomizer 3 (ID3) . . . . . . . . . . . . . . . . 141
A.2 Compression de Lempel-Ziv-Welch . . . . . . . . . . . . . . . . . . . . . . . 142
A.3 Itratif dEspace de Version (IVSA) . . . . . . . . . . . . . . . . . . . . . . . 143
A.4 Viterbi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
A.5 Algorithme de calcul de lentropie moyenne . . . . . . . . . . . . . . . . . . . 146
Bibliographie 155
Communications 171
v
TABLE DES MATIRES
vi
Avant-propos
Le but des modles nest pas de reprsenter les donnes mais de prciser les
questions.
Samuel Karlin, 19242007
1
Avant-propos
Pour rester comptitives tout en prennisant leur productivit, les entreprises doivent
maintenir leurs quipements de production dans un tat de bon fonctionnement. En effet,
un simple dysfonctionnement dans un processus de fabrication peut savrer catastrophique
pour tout le reste de la chane de production et ainsi engendrer des pertes importantes de
bnfice pour lentreprise, voire dans le pire des cas, des priodes de chmage technique
pour les employs. Sous la pression de tels facteurs socio-conomiques, de nombreuses en-
treprises doivent non seulement investir continuellement dans leur politique de maintenance
industrielle mais galement dans linnovation technologique afin damliorer la qualit des
interventions de maintenance tout en assurant un retour sur exprience.
Nos travaux sinscrivent dans la continuit de ceux mens dans la thse de Pascal Vri-
gnat : Gnration dindicateurs de maintenance par une approche semi-paramtrique et
par une approche markovienne soutenue le 14 octobre 2010 [177]. Dans ces prcdents
travaux, lauteur sest concentr sur lestimation globale du niveau de dgradation dun pro-
cessus industriel. Lauteur a dmontr qu partir dobservations empiriques, il tait possible
deffectuer une modlisation de ces niveaux de dgradation.
Dans ce manuscrit, nous nous concentrerons sur ltude dun ensemble de modles dfinis
dans la thse de Pascal Vrignat [177]. Nous tudierons en effet la pertinence de ces diffrentes
architectures. Pour cela, nous parlerons de topologies, dobservations, de critres dchan-
tillonnage, dalgorithmes dapprentissage et de dcodage ou de critres de distributions des
observations.
Ainsi, dans le cadre dune politique de maintenance prventive, notre dmarche tente
damliorer laide la dcision des experts. Ce manuscrit sarticule autour dune prsenta-
tion des stratgies modernes de maintenance industrielle. Nous en dfinirons ensuite leurs
objectifs principaux. Pour tayer notre propos, un tat de lart des diffrentes approches
visant tudier la pertinence des paramtres de modlisation sera prsent dans un pre-
mier temps. Nous exposerons par la suite les lments de modle(s) (architecture) les plus
appropris. Pour terminer, les rsultats issus des donnes simules seront compars ceux
provenant de deux applications concrtes de maintenance industrielle.
1. Modle de Markov Cach
2. Hidden Markov Model
2
Avant-propos
La plupart des travaux publis ont pour objectif doptimiser la qualit du diagnostic
suivant la stratgie de fiabilisation applique. Notre dmarche se diffrencie des approches
habituelles de la littrature : utilisation des rseaux de Petri (Labadi et al. [105]) ou des filtres
particulaires (Li et al. [109]) ou encore des rseaux Baysiens (Przytula et Thompson [133]).
En effet, la dmarche utilise dans ces travaux consiste modliser les dgradations dun
processus en utilisant des MMC. Cet outil nous est apparu comme particulirement adapt
lidentification de signatures de ltat dun systme. Afin dtre dcorrl da priori, un
processus de synthse a t cr pour produire des vnements simuls associs un niveau
de dgradation connu. Cest en comparant le comportement de ce modle ceux dfinis
empiriquement dans le cadre industriel que nous arriverons prsenter des prconisations
concernant :
Les informations utilises comme observations des modles empiriques proviennent des
activits de maintenance issues de divers secteurs de lindustrie. Le but de notre dmarche
est dtablir des indicateurs de niveaux de dgradation globale dun processus quelconque.
Ainsi, on peut esprer valider un modle indpendant de caractristiques trop lies un
processus industriel particulier.
Ceci est dautant plus vrai quune telle stratgie peut sappliquer des domaines trs
diffrents. Il pourrait sagir, par exemple, dun routeur indiquant lingnieur informatique
la charge probable de son rseau. Lors dune augmentation du niveau de collisions des pa-
quets IP, cet outil lui permettrait alors dallger cette charge avant quun arrt complet du
systme ne survienne.
A voir ces applications potentielles, on imagine bien que les modles doivent se construire
autour de caractristiques globales et non particulires. En suivant cette dmarche, nous
pouvons esprer obtenir une modlisation beaucoup plus transposable nimporte quel pro-
cessus.
Dans un premier chapitre, nous dtaillerons les diffrents aspects de la maintenance in-
dustrielle, ses objectifs principaux, ses politiques de mise en uvre classiques ainsi que ses
volutions. Nous prsenterons la problmatique gnrale ainsi que les objectifs de cette tude.
Comme nous lavons dj prcis, cette thse se situe dans la continuit de la thse de Pascal
Vrignat [177] sur la gnration dindicateurs de maintenance par une approche markovienne.
3
Avant-propos
Nous prsenterons dans un second chapitre, les diffrentes approches danalyse de mo-
dles. Nous dfinirons les diffrents types danalyse de sensibilit dans la conception dun
modle, les incertitudes dans la chane de modlisation ainsi que leurs impacts sur les mo-
dles. Cette analyse devrait nous permettre de dterminer les caractristiques des modles
les plus sensibles. Ensuite, nous raliserons une tude sur les diffrentes approches dvalua-
tion de pertinence dun modle.
Dans un troisime chapitre, nous dfinirons nos attentes thoriques, en ce qui concerne la
pertinence des observations, lvolution de la modlisation et la pertinence de larchitecture
des modles tudis. Ensuite, nous prsenterons notre approche markovienne et ces diffrents
aspects et proprits, ainsi que dautres approches pouvant rpondre notre problmatique.
Nous prsenterons galement la complexit du calcul de la squence la plus probable dtats
cachs ayant conduit la production dune squence dobservations donne. En effet, le
nombre de chemins possibles pour gnrer une telle squence est de lordre de N T (N tant
le nombre dtats dun MMC et T la longueur dune squence dobservations). Lapproche
directe nest pas acceptable sachant que pour notre cas N = 4 et T = 1000, le calcul de-
manderait alors approximativement 10600 oprations. Afin que notre modle soit ractif, il
est quand mme prfrable de mettre en place des alternatives au calcul direct. Enfin, le
processus de synthse sera introduit et ses caractristiques seront compares celles des
architectures empiriques mises en uvre partir de donnes industrielles.
Le quatrime chapitre sera consacr lanalyse des rsultats issus de notre modle de si-
mulation reprsentant le fonctionnement dune GMAO industrielle. Nous prsenterons dans
un premier temps les caractristiques de ce modle, puis les rsultats sur les trois points sui-
vants : la pertinence des observations, la pertinence de larchitecture des diffrents modles
utiliss et lvolution de la modlisation afin den amliorer son architecture. Nous utilise-
rons notamment le principe du maximum de vraisemblance pour valuer la pertinence des
paramtres dun ensemble de MMC. Ce principe permet en gnral de dterminer lappar-
tenance dun chantillon de n observations indpendantes un ensemble de distributions
donnes. Nous appliquerons la notion dentropie de Shannon, un second critre commun-
ment utilis dans la slection de modle. Ce critre est utilis dans de nombreux domaines.
Nous le trouvons dans le langage courant comme synonyme de dsorganisation . En fonc-
tion de la minimalit ou de la maximalit de lentropie, nous valuerons la pertinence des
squences de symboles en terme de quantit dinformation. Nous raliserons ensuite deux
tudes exprimentales, issues de cas concrets de processus industriels. Nous dbuterons par
une prsentation de ces environnements exprimentaux puis nous prsenterons nos rsul-
tats sur les trois points prcdemment cits. Nous terminerons en donnant des perspectives
damliorations possibles pour la modlisation.
4
Chapitre 1
5
Chapitre 1 : Principes gnraux, objectifs et politique de maintenance industrielle
6
1.1 Introduction
Depuis quelques annes, des auteurs proposent lutilisation de MMC pour la mainte-
nance. Nous vous prsenterons ces approches afin de comprendre la gense de ces travaux
dbuts en 2007 [176].
Enfin, une prsentation succincte des travaux de Pascal Vrignat [177] : Gnration din-
dicateurs de maintenance par une approche semi-paramtrique et par une approche marko-
vienne , viendra conclure ce chapitre, point de dpart de notre contribution. En effet, ces
indicateurs de dgradation dun processus industriel quelconque doivent permettre lexpert
en maintenance damliorer la productivit des quipements dont il a la responsabilit. Sur
ces bases ainsi tablies, nous exposerons les objectifs de cette tude.
1.1 Introduction
La base de donnes ARIA 1 , du Ministre de lcologie, rpertorie toutes les informations
sur les accidents technologiques. Sur les 7716 accidents recenss sur une vingtaine dan-
nes, les experts ont mis en cause, pour 12% dentre eux, les stratgies de maintenances,
de rparations ou les protocoles de tests. Parmi eux, 30 % sont des accidents mortels ! Les
circonstances de ces accidents sont les suivantes :
1. Depuis 1992, elle rpertorie les incidents ou accidents qui ont, ou auraient, pu porter atteinte la sant
ou la scurit publique, lagriculture, la nature et lenvironnement. Site : http ://www.aria.developpement-
durable.gouv.fr
7
Chapitre 1 : Principes gnraux, objectifs et politique de maintenance industrielle
Fig 1.1 Nombres daccidents mortels et de victimes lis un manque de suivi des quipe-
ments, pour les principales activits concernes.
Concrtement, les installations impliques (voir Figure 1.1, p. 8) sont lorigine de 254
accidents mortels et de 425 victimes entre 1992 et 2010. Il est regrettable de constater quun
dfaut ou un manque de suivi des quipements est trop souvent mis en cause par les experts.
8
1.2 Prsentation de la maintenance dans le domaine industrielle
Il ne faut pas perdre de vue que lobjectif premier de la maintenance est de garantir la
disponibilit optimale de loutil de production dune entreprise. Nous verrons dans les sections
suivantes que cette ide est toujours la base de la maintenance mais quelle se dcline suivant
beaucoup dautres aspects.
9
Chapitre 1 : Principes gnraux, objectifs et politique de maintenance industrielle
Les cots lis la maintenance font dsormais partie intgrante de la politique budgtaire
de lentreprise. Son budget consacr la maintenance doit tre un juste quilibre entre
comptitivit et qualit de la production. En effet, environ 10 % des effectifs industriels sont
concerns par des tches de maintenance et sont toujours en constante croissance malgr
la conjoncture conomique actuelle. Selon lObservatoire Rseau Maintenance 2012 ,
les dpenses de maintenance ont progress de + 1,9 % en 2011, par rapport 2010 (les
chiffres pour 2013 sont bass sur des estimations). Le secteur de la mcanique reste toujours
dynamique mais ceux de lautomobile, du raffinage, de la fonderie ou de la papeterie ont
minimis ces cots, en ajustant leur budget maintenance la baisse ou en fermant des units
de production. Voir Tableau 1.1, p. 10.
Tableau 1.1 volution des valeurs et des grands ratios de la maintenance. Source : lOb-
servatoire Rseau Maintenance 2012.
Le Petit Larousse 2010 donne la dfinition suivante : Ensemble de tout ce qui per-
met de maintenir ou de rtablir un bien dans un tat spcifi ou en mesure dassurer un
service dtermin .
En effet, le rle premier de la maintenance est la rparation et le dpannage au moindre
cot. Cest aussi le maintien des quipements en tat de marche avec une scurit de fonc-
tionnement maximale. La maintenance doit se conjuguer avec la notion de maintenabilit.
Les quipements de production doivent en effet pouvoir tre entretenus tout au long de leur
dure de vie (voir louvrage de Roucoules et al. [143] sur le cycle de vie dun produit).
10
1.2 Prsentation de la maintenance dans le domaine industrielle
Avant le passage dune politique corrective vers une politique de maintenance prventive,
il faut tenir compte dventuelles rnovations futures. Il ne faudrait pas intgrer dans cette
politique, un quipement qui serait mis au rebut dans un avenir proche.
qualitatif : larrt et le redmarrage ont une incidence sur la qualit des produits.
Si lon ne tient pas compte des cas extrmes o le risque est inacceptable, la politique de
maintenance mise en uvre devra tenir compte dautres situations pour lesquelles le risque
peut tre tolrable, ou mme totalement acceptable :
Une tendance actuelle, de plus en plus frquente dans les grandes industries, est de confier
la maintenance de niveau 1 et 2 (voir ci-dessous la classification de lAFNOR) aux opra-
teurs de production afin de dcharger le service de maintenance sur des tches basiques et
de responsabiliser les oprateurs au bon entretien de leurs outils de travail.
2me niveau : dpannage par change standard des lments prvus cet effet et dop-
ration mineure de maintenance prventive. Ces interventions peuvent tre ralises par
un technicien habilit ou lutilisateur de lquipement dans la mesure o ils ont reu
une formation particulire.
Ce sont des oprations de remplacement, danalyse, de rglages simples ncessitant
ventuellement un outillage spcifique.
11
Chapitre 1 : Principes gnraux, objectifs et politique de maintenance industrielle
assurer la scurit humaine : dans certains cas, elle permet de limiter les interventions
dangereuses qui comporteraient des risques pour les oprateurs de maintenance comme
par exemple la manipulation de mtal en fusion chez un mtallurgiste. La maintenance
doit minimiser les risques aux personnes sans augmenter pour autant les risques en-
courus par les personnels de maintenance ;
12
1.2 Prsentation de la maintenance dans le domaine industrielle
Nous prsentons ici les deux principaux types de maintenance utiliss dans lindustrie :
la maintenance prventive et la maintenance corrective.
La maintenance prventive
Se prmunir dune dfaillance matrielle avant quelle narrive est devenu une rgle dor en
matire de maintenance industrielle. La maintenance prventive doit tre applique lorsque
la panne potentielle a une incidence notable sur la scurit en devenant donc inacceptable
conomiquement pour lentreprise. Celle-ci permet damliorer la scurit des personnes en
minimisant les dpannages, daugmenter le taux de productivit en optimisant les temps
darrt de production (i.e. dassurer une continuit de service en planifiant des oprations de
maintenance pendant larrt de travail) et daugmenter la dure de vie des quipements.
Selon lAFNOR, cest une maintenance excute des intervalles prdtermins ou se-
lon des critres prescrits. Cette stratgie de maintenance est destine rduire la probabilit
de dfaillance ou la dgradation du fonctionnement dun bien . Les dfinitions suivantes
sont extraites de la norme NF EN 13306 X 60-319 [121].
La maintenance prventive est souvent subdivise en trois principaux types (voir Fi-
gure 1.2, p. 15) :
13
Chapitre 1 : Principes gnraux, objectifs et politique de maintenance industrielle
La maintenance corrective
Cette norme [121] dfinit la maintenance corrective comme suit : Maintenance excute
aprs dtection dune panne et destine remettre un bien dans un tat dans lequel il peut
accomplir une fonction requise .
Elle dsigne llimination dune avarie aprs une dfaillance dans le fonctionnement dune
entit 3 matrielle, par rparation ou remplacement de celle-ci. Le caractre temporel est
parfois utilis dans certaines politiques de maintenance :
La maintenance corrective est souvent subdivise en deux types (voir Figure 1.2, p. 15) :
la maintenance corrective curative : elle a pour but la rparation dun quipement, afin
de lui permettre daccomplir une fonction requise. Ces activits doivent prsenter un
caractre permanent.
Ce type de politique est destin rendre oprationnelle une machine qui est tombe
en panne. Elle est peu efficace pour les quipements vitaux de production mais son
application est bien adapte certains matriels peu coteux.
14
1.3 La Gestion de la Maintenance Assiste par Ordinateur : GMAO
Maintenance
Maintenance Maintenance
Prventive Corrective
Fig 1.2 Typologies des actions de maintenance (NF EN 13306 (indice de classement :
X60319)) [121].
tre ainsi prises en considration a posteriori, par lexpert. Ces logiciels possdent de nom-
breuses fonctionnalits comme la planification des interventions, la gestion des stocks et
mme, le calcul en temps rel du KPI 5 . Certains logiciels intgrent des prvisions de dgra-
dation. Sans faire une tude approfondie, de nombreuses entreprises nutilisent pas doutils
de ce type. Nous donnons dans le Tableau 1.2, p. 16 les donnes issues de ltude de Fu-
magalli et al. de 2009 [69] montrant lutilisation de logiciels de GMAO dans les diffrents
secteurs dactivits. Nous pouvons voir que le secteur automobile (19%) est particulirement
bien dot par rapport aux autres secteurs industriels.
Le Tableau 1.3, p. 16 montre pour exemple une base de donnes utilise en GMAO dans
une usine de production agroalimentaire.
Ces outils font dsormais partie intgrante du systme dinformation de lentreprise [101].
Ils se rapprochent mme parfois dun logiciel dERP possdant une base de donnes centra-
lise et intgrant toutes les fonctionnalits de gestion dune entreprise (stock, commande,
facturation, ressources humaines, etc.). Ces donnes vont servir de base de travail notre
tude. Une phase consquente dinterprtation des donnes dentreprises a t mene par
Pascal Vrignat [177]. Le problme majeur consistait codifier toutes les actions de mainte-
nances, observations, sous forme de symboles (cf. colonne action ACT. (Tableau 1.3,
p. 16)). Lalphabet ainsi cr est alors utilisable trs simplement pour des traitements infor-
matiss de calculs divers, de statistiques ou de modlisations.
5. Key Performance Indicator ou indicateur cl de performance qui mesure lefficacit des mesures prises
en amont pour atteindre un objectif fix
15
Chapitre 1 : Principes gnraux, objectifs et politique de maintenance industrielle
SECTEUR %
Automobile 19,10%
Chimie 8,40%
Logistique et transport 13,80%
Energie 0,60%
Alimentation, boisson 5,00%
Sant 20,90%
Tourisme, hotels 0,20%
Industrie mcanique 5,00%
Industries pharmaceutiques 0,40%
Services publics 6,00%
Papeterie 1,00%
Sidrurgie 2,50%
Textiles 1,90%
Immobiliers 9,30%
Autres 5,90%
Tableau 1.3 Exemple dune base de donnes utilise dans une Gestion de la Maintenance
Assiste par Ordinateur.
16
1.4 volution des politiques de maintenance industrielle
Recherche de la documentation et
des donnes concernant le systme
De nouvelles mthodes ont ainsi fait leur apparition comme la mthode MBF 6 [194] ou
RCM 7 [120], qui sintgre aux politiques de maintenance en vigueur en y rajoutant de nou-
velles instructions de maintenance prventive. Cette mthode se base sur les consquences
des dfaillances. Elle est reprsente sur la Figure 1.3, p. 17. La mthode consiste, avant
tout, aider lexpert en maintenance dans son choix parmi toutes les tches de maintenance
disponibles. Par ailleurs, le caractre itratif de cette mthode permet de faire voluer les
programmes de maintenance en fonction du retour dexprience. La mthode met dispo-
sition un certain nombre doutils pour lutilisateur (listes gnriques de fonctions pour les
systmes et les diffrents types de dfaillance pour les matriels). Ce guide comporte des
listes de tches gnriques utilises en maintenance prventive. Il dcrit les procdures
utiliser pour chaque type de dfaillance de matriels gnriques (vrins, pompes, etc.) en
dtaillant les prconisations dutilisation recommandes de ces matriels (niveau de criticit,
environnement particulier, conditions de fonctionnement).
Une autre mthode plus rcente, dcrite dans louvrage dAntoine Despujols de 2009 [58] :
l Optimisation de la Maintenance par la Fiabilit (OMF), mise en uvre par EDF, est
aujourdhui utilise dans dautres secteurs industriels. Elle possde les mmes spcificits
17
Chapitre 1 : Principes gnraux, objectifs et politique de maintenance industrielle
que la mthode base sur la fiabilit explicite ci-dessus. Cette mthode est base sur trois
principes :
Il sagit dans un premier temps de dterminer les objectifs viss : scurit, sret de
fonctionnement, taux de disponibilit, cots de fonctionnement, etc. La mthode dcrite Fi-
gure 1.4, p. 19, permet de dterminer les risques potentiels.
Dautres techniques prometteuses comme le Soutien Logistique Intgr (SLI) [13] sont
utilises par Alstom, Arva et EADS. Elle a pour but de rduire les cots de fonctionne-
ment et dinvestissements dun matriel, tout en maximisant lefficacit oprationnelle pour
lutilisateur (scurit, rgularit, disponibilit). Une autre mthode comme la maintenance
productive totale (TPM 9 ) [72], consiste assurer la maintenance tout en produisant, ou en
pnalisant le moins possible la production. Tous les aspects de lentreprise ainsi que tous ses
acteurs sont pris en considration. Cette technique est surtout mise en place dans lindustrie
automobile comme le lean manufacturing 10 chez Toyota.
Le lecteur pourra se rfrer au livre dAntoine Despujols [57], qui fait un tat des lieux
de diffrentes mthodes doptimisation de la maintenance dans divers secteurs industriels.
Rcemment publi dans larticle de Fumagalli et al. [69], la maintenance base sur des
conditions ou CBM 11 est considre comme lune des politiques les plus pertinentes en
ce qui concerne lamlioration de la gestion de la maintenance. Elle est trs proche de la
maintenance prvisionnelle ou prdictive. Cest une maintenance conditionnelle qui est
base sur le franchissement dun seuil de dgradation critique permettant de dclencher une
opration de maintenance. Couple avec le systme de GMAO ou dERP de lentreprise,
18
1.4 volution des politiques de maintenance industrielle
Matriels et modes
Analyse du retour dexp-
de dfaillance
rience vnements - cots
significatifs
critiques
Programme de main-
tenance prventive
elle utilise sa base de donnes centralise. Elle permet de rduire le nombre de maintenances
prventives planifies inutiles et ainsi diminuer considrablement les cots de la maintenance.
Dans certains cas, un programme de surveillance peut viter dinutiles tches de maintenance
en prenant des mesures dentretien uniquement lorsque il y a la preuve dun comportement
anormal de lquipement.
La mise en uvre dune CBM [108] peut conduire des avantages significatifs. En effet,
contrairement un entretien systmatique, une CBM est ralise en fonction de ltat de sant
rel du matriel, estim ou mesur par des capteurs prsents sur lquipement. Les techniques
19
Chapitre 1 : Principes gnraux, objectifs et politique de maintenance industrielle
les pronostics bass sur les donnes de tests rels, visent modliser la dgradation du
systme laide des donnes fournies par les capteurs ;
enfin, le pronostic empirique , bas sur des retours dexprience, exploite les donnes
recueillies partir de la machine pendant une longue priode de temps pour estimer
les paramtres des lois de fiabilit traditionnelles. Ils sont utiliss pour faire des extra-
polations et des projections afin den estimer la RUL.
Pour rester comptitif, les grandes entreprises doivent intgrer ces nouvelles stratgies
dans leur organisation et ainsi investir des sommes importantes. Lobjectif gnral de toutes
ces nouvelles techniques de gestion de la maintenance est de maximiser le temps de
production. Ces nouvelles techniques sont bases sur un historique de fonctionnement. La
fiabilit de ces tudes repose tout de mme en partie sur une saisie correcte des actions de
maintenance (observations) et sur de bonnes pratiques des oprateurs de production et du
service maintenance.
Quelques mthodes lies notre problmatique utilisant des MMC, proposes dans la
littrature seront abordes dans la prochaine section. Celles-ci feront probablement lobjet
doutils oprationnels mis disposition lexpert.
12. Technique permettant dobtenir, au moyen dun appareillage appropri, limage thermique dune
scne observe dans un domaine spectral de linfrarouge selon lAFNOR
13. Science qui tudie les phnomnes se produisant entre deux objets en contact (frottement, usure et
lubrification, etc.)
14. Remaining Useful Life = dure de vie utile restante
20
1.5 Utilisation de Modles de Markov Cachs dans le cadre dune politique de maintenance industrielle
Symboles ou observations
1 1 2 1
21
Chapitre 1 : Principes gnraux, objectifs et politique de maintenance industrielle
Pronostic de panne
Diagnostic de panne
Pass Futur
Prsent
Dans la littrature rcente, de nombreuses tudes utilisent des MMC pour anticiper une
dfaillance dun systme. Dans la section suivante, quelques uns de ces travaux les plus
pertinents seront rsums.
Lapproche de Tobon-Mejia et al. [167], modle prdictif fond sur les donnes, utilise les
MMC avec des mlanges de Gaussiennes (MoGHMM 15 ) pour modliser la dgradation et
estimer la valeur de la RUL avant une ventuelle dfaillance. Ce modle contient le nombre
dtats de sant ainsi que la dure de chaque tat. Les paramtres temporels sont estims
par lalgorithme de Viterbi [175]. Les autres paramtres sont estims par celui de Baum-
Welch [55]. Nous utiliserons par la suite ces deux algorithmes pour tester lapprentissage et
le dcodage des donnes de nos modles.
Une autre tude sur le diagnostic base de MMC [190], qui tente de trouver la meilleure
estimation des tats dun systme, arrive quantifier les avantages dune approche MMC
(base sur une distance de Hamming 16 ).
Jian Zhou et Xiao-Ping Zhang [192] utilisent une analyse de donnes squentielles,
pour tendre le modle classique (MMC) un systme continu 17 en modlisant les densi-
ts dobservation comme un mlange de non-Gaussiennes. Ils ont dvelopp des formules
de restimation pour les trois problmes fondamentaux dun MMC, savoir le calcul de la
vraisemblance, lestimation de squence dtats et lapprentissage des paramtres du modle.
Afin dobtenir une reprsentation paramtrique de la densit, ils appliquent une Analyse en
15. Mixture of Gaussians Hidden Markov Model
16. La distance de Hamming permet de quantifier la diffrence entre deux squences de symboles
17. Modlise un processus continu
22
1.5 Utilisation de Modles de Markov Cachs dans le cadre dune politique de maintenance industrielle
Composantes Indpendantes (ACI). Elle permet de sparer plusieurs des sources mlanges
sur chacune des composantes du mlange.
De nombreuses approches bases sur lanalyse des donnes ont t dveloppes en raison
de leur grande fiabilit et du faible cot des capteurs. La plupart de ces tudes sont axes
sur des mthodes destimation de densit de probabilit. On peut citer notamment celle de
Serir et al. [151], qui utilise la thorie de lvidence (voir 2.3.2, p. 34) pour des donnes
dapprentissage limites, en particulier les donnes dtats de dfaillance, qui sont gnrale-
ment coteuses et difficiles obtenir. Les paramtres estims ne sont alors plus fiables. Ce
nouvel outil bas sur des MMC (ou EvHMM 18 ) semble trs prometteur [138].
Une autre tude de prdiction de la RUL [168], aussi base sur les donnes, utilise les
mthodes temps-frquence, et en particulier, lanalyse par ondelettes associe un MMC.
Cette technique utilise dans un premier temps, les donnes issues des capteurs. Celles-ci sont
traites pour extraire les caractristiques sous la forme de coefficients permettant la dcom-
position par ondelettes. Les caractristiques ainsi extraites, sont ensuite introduites dans les
algorithmes dapprentissage pour estimer les paramtres du MMC correspondant au mieux
au phnomne de dgradation tudi. Le modle ainsi obtenu est exploit dans un deuxime
temps, afin dvaluer ltat de sant de lquipement et destimer sa dure de vie (RUL).
Une autre tude [35], utilise la Dcomposition Modale Empirique (EMD). Elle
consiste dcomposer un signal en un ensemble de fonctions, comme la dcomposition en
sries de Fourier ou une dcomposition en ondelettes. La particularit de lEMD rside dans
le fait que la base de fonctions nest pas donne a priori mais est construite partir des pro-
prits du signal. Associe une modlisation par Markov cach, elle permet par exemple
de dtecter des dfauts (fissures ou dents casses) dans une boite de vitesse.
Pour tenir compte de ces facteurs, Zhou Zhi-Jie et al. [193] ont dvelopp un nouveau
MMC bas sur la thorie des fonctions de croyances voir 2.3.2, p. 34. Ce MMC est
propos pour prdire une dfaillance cache en temps rel, en tenant compte des influences
des facteurs environnementaux. Dans le modle propos, le MMC est utilis pour capturer les
relations entre la panne cache et les observations dun systme. Les fonctions de croyances
sont utilises pour modliser les relations entre les facteurs environnementaux et les proba-
bilits de transition entre les tats cachs du systme, y compris la dfaillance cache.
23
Chapitre 1 : Principes gnraux, objectifs et politique de maintenance industrielle
de la planification des tches de maintenance (qui nest peu, voire jamais remise en
question) ;
Nous venons de voir quil existe des solutions plus ou moins complexes mettre en uvre
avec lexpert. Les travaux initis par Pascal Vrignat dans sa thse [177], sur une modlisa-
tion de la maintenance en utilisant des MMC ont montr quil tait possible de modliser la
dgradation dun processus industriel quelconque. A travers des cas concrets, il a pu donner
aux experts une nouvelle approche de leur gestion de la maintenance prventive.
Enfin, nous analyserons les diffrentes architectures prsentes dans [177] afin den confir-
mer ou den infirmer les choix thoriques. Nous tudierons ainsi la pertinence des topologies,
des algorithmes dapprentissage et de dcodage ainsi que des lois statistiques utilises dans
la modlisation. Les donnes empiriques sont issues de GMAO (voir 1.3, p. 14) dentre-
24
1.6 Conclusion et objectifs de cette tude
prises, du secteur industriel de la rgion. Nous comparerons ensuite ces rsultats avec ceux
provenant de la simulation. Cette architecture la plus pertinente, permettra damliorer la
conception du modle de simulation.
25
Chapitre 1 : Principes gnraux, objectifs et politique de maintenance industrielle
26
Chapitre 2
27
Chapitre 2 : Approches classiques de mesures de pertinence dans la chane de modlisation
28
2.1 Introduction
2.1 Introduction
Afin de mieux apprhender les objectifs de notre travail sur lvaluation des Modles
de Markov Cachs, il est important de resituer les mthodes de la littrature traitant de
lvaluation de modles en gnral. Nous trouvons dans ce deuxime chapitre, les bonnes
pratiques pour la qualification de nos modles, un tat de lart des diffrentes approches
danalyse de modles ainsi quune rflexion prliminaire sur leur adquation aux MMC.
Nous dfinissons en premier lieu le terme analyse de sensibilit dun modle. Ces dfi-
nitions sont suivies dune prsentation des mthodes recenses dans la littrature, concernant
les mesures de pertinence dun modle, associes cette analyse. Nous dtaillons ainsi les
mthodes avec score dintrt qui permettent dvaluer et de comparer plusieurs modles
entre eux, de manire quantitative. Les mthodes statistiques diriges par les donnes sont
une alternative ces mthodes avec score dintrt. Elles sont tudies par la suite afin de
nous permettre de comparer nos modles candidats , par une analyse quantitative. Dans le
cadre de notre modle de simulation de type modle stochastique , nous donnons quelques
mthodes mesurant le caractre stochastique dun modle.
Incertitudes
Paramtres pist-
dentre miques
Dcomposi- Incertitudes
Robustesse Incertitudes
tion de la de concep-
du modle dentre
variance tion
Incertitudes
Distribution
probabi-
de sortie
listes
Modles
de Markov
Cachs
Entropie Meilleur
de score
Shannon entropique
Mesures de Choix du
pertinence modle
Applications Maximum
AIC, BIC,
Maintenance de vrai-
HQC
Industrielle semblance
Tests Choix
statistiques stastistique
29
Chapitre 2 : Approches classiques de mesures de pertinence dans la chane de modlisation
30
2.3 Analyse de sensibilit dun modle
Nous parlons ici de lanalyse de sensibilit dun modle. Il sagit de la raction dun
modle suite un ensemble dexcitations externes ou internes.
Selon Rosen [142], lanalyse de sensibilit tudie les relations des flux dinformations entre
les sorties et les entres dun modle. Lanalyse de sensibilit est quantifie par des indices
de sensibilit que nous allons dtailler dans les sections suivantes. La valeur de lindice
est directement lie limportance de la variable i.e. plus lindice sera grand, plus la
variable aura de limportance.
Le lecteur pourra se rfrer lexcellent ouvrage de Saltelli et al. [145] ainsi que celui
de Iooss [89], donnant un bon aperu des mthodes de calcul des indices de sensibilit. Il
distingue ainsi deux principaux types danalyse de sensibilit :
lanalyse de sensibilit dite locale , qui est la variation de la rponse de sortie, par
rapport la variation dune entre (cette approche est souvent dterministe) ;
2. attribuer des fonctions probabilistes ou des plages de variation chaque facteur den-
tres ;
4. valuer le modle, dfinir ainsi une fonction de mesure ou distribution, pour la rponse
tudie ;
5. valuer linfluence ou limportance relative de chaque facteur dentres sur les variables
de sortie.
31
Chapitre 2 : Approches classiques de mesures de pertinence dans la chane de modlisation
1.
2.
Symboles :
5.
3.
1 : ...
2 : ...
...
S1 S2 S3 S4
Le systme
est arrt
Le systme fonctionne avec
un niveau de dgradation estim
4.
Les plans dexpriences permettent dorganiser au mieux les essais qui accompagnent une
recherche scientifique ou des tudes industrielles [73]. Cette mthode sappuie sur diffrentes
notions :
la notion de surface de rponse, est forme par les rponses (sorties du modle) asso-
cies aux domaines des variables ;
En 1991, Morris [117] a propos une mesure de sensibilit pour identifier les variables les
plus significatives dun modle. Cette mesure est surtout utilise dans le cadre de modles
dterministes 1 ayant un nombre trs lev dentres et dont lanalyse mathmatique savre
assez complique. Cette mthode utilise des plans dexpriences bass sur la technique du
One factor At a Time (OAT), explicite ci-dessous. Lanalyse des donnes est base sur
lobservation des effets lmentaires sur un chantillon alatoire et des modifications dune
sortie par rapport une entre particulire du modle. Campolongo et al. [34] ont rcem-
ment amlior la stratgie dchantillonnage de Morris [117], permettant un cot de calcul
1. Les relations entre les variables sont strictement fonctionnelles. Aucune variable alatoire nintervient
dans la modlisation
32
2.3 Analyse de sensibilit dun modle
moindre. Cette dernire est employe pour valuer la sensibilit dun modle de raction
chimique du sulfure de dimthyle (DMS), un gaz impliqu dans le changement climatique.
Dans sa finalit, cette mthode permet didentifier les lments du modle ncessitant dtre
approfondis et ceux pouvant tre simplifis.
Nous nutiliserons pas cette technique assez lourde mettre en uvre. Il nous faudrait en
effet formaliser les domaines de fonctionnement de chaque variable et modliser nos MMC
sous forme de preuves mathmatiques.
Il existe dautres techniques comme le One factor At a Time (OAT) dont le principe
consiste modifier chaque entre du modle tudi de +10% et 10% par rapport leur
valeur relle. Leffet de ces petites variations est analys en sortie du modle. Cela nous
donne un pourcentage de variation appel Indice de Sensibilit qui nous donne les sorties
les plus sensibles aux paramtres dentre. Le lecteur curieux trouvera quelques applications
supplmentaires dans [169] et [4].
33
Chapitre 2 : Approches classiques de mesures de pertinence dans la chane de modlisation
Pour estimer les paramtres non dterministes dun modle, Hijazi et al. [82] utilisent la
BCRB (Borne Cramr-Rao Baysienne) qui permet danalyser des performances optimales
en terme dErreur Quadratique Moyenne 3 dun estimateur.
34
2.3 Analyse de sensibilit dun modle
0 Sj 1.
E(Y |Xj ) est la fonction de Xj qui approche le mieux Y (expected fonction) ;
V ar[E(Y |Xj )] : fluctuation de la sortie si elle tait fonction des Xj ;
V ar(Y ) : pour la normalisation par la fluctuation totale.
Incertitudes physico-mathmatiques
Cette incertitude est lie au passage du phnomne physique au modle mathmatique.
Elle est dune part, lie linterprtation humaine du phnomne qui engendre des imperfec-
35
Chapitre 2 : Approches classiques de mesures de pertinence dans la chane de modlisation
tions dans la conception du modle. Elle est dautre part, inhrente lIngnierie Dirige par
les Modles MDE (Model Driven Engineering). Le MDE propose, en effet, la dfinition dun
modle en se limitant un niveau dabstraction fini. Cette limite engendre invitablement
des incertitudes de description. En effet, Tous les modles sont faux, mais certains sont
utiles [27]. Selon Burnham et al. [31], le choix dun modle est peru comme un moyen
dapprocher la ralit plutt que de lidentifier compltement.
Incertitudes probabilistes
Dans les annes 1970, les ingnieurs probabilistes ont commenc prendre en compte les
incertitudes apparaissant dans la modlisation des systmes physiques et ont tudi limpact
de ces incertitudes sur la rponse des systmes. Une tude rcente dEDF division R&D [52]
et [53] sur les incertitudes industrielles propose une analyse pertinente des incertitudes, dans
un contexte industriel. Les principales tapes de cette analyse sont rsumes Figure 2.3,
p. 36.
Tarentola et al. [166] ont rcemment dfini un nouvel indice de sensibilit bas sur la
variance dite total order permettant de quantifier la propagation de lincertitude dun
modle dentre sur un modle de sortie en tenant compte de linteraction entre le modle
dentre et les autres paramtres du modle.
Modle
Environnement
stochastique Rponse du modle
Paramtres Probabilit dchec
dentre
tape C
Analyse de Sensibilit
36
2.3 Analyse de sensibilit dun modle
tape B : quantification des sources dincertitude i.e. identifier les paramtres connus
ou inconnus. Lintroduction dun processus stochastique est parfois ncessaire dans cer-
tains cas dvolution de variables dans le temps. Cette tape peut-tre aussi assimile
la phase didentification de paramtres, ou du calage/qualification du modle ;
Incertitudes dapprentissage
Prenons par exemple lapprentissage par Version Space (Mitchell [116]). Lavantage
est : plus on apprend, plus on colle aux donnes. Mais le risque est, qu la fin, tous les
exemples sont appris par cur, y compris le bruit (les informations contenues dans lexemple
ne servant pas dans ltude). Cest le phnomne de sur-apprentissage. Pour viter ce pige,
le critre darrt de lapprentissage doit tre dfini. Soit erreurapp (h) lerreur commise par
lhypothse h sur les donnes dapprentissage et erreurD (h) lerreur commise par h sur la
distribution totale des donnes.
Dfinition : on dira que h sur-apprend les donnes dapprentissage sil existe une hypo-
thse h telle que :
et
37
Chapitre 2 : Approches classiques de mesures de pertinence dans la chane de modlisation
n
S 2 = S 2. (2.8)
n1
n1 2
(Car E(S 2 ) = que lon retrouve dans lquation (2.8)).
n
Si nous calculons la variance sur x :
2
.
V ar(x) = (2.9)
n
Lincertitude sur la moyenne de Pibouleau [129] :
v
u n
u 1 X
x = = t (xi x)2 . (2.10)
n n.(n 1) i=1
Si lcart type est fini, lincertitude de Pibouleau [129] converge inexorablement vers zro
lorsque n tend vers linfini [76].
Lestimation des incertitudes dans notre problmatique, permettra de trouver les archi-
tectures des modles les plus pertinentes, sous la forme dintervalle de confiance.
2.4.1 Introduction
Selon Stoica et Babu [162], la problmatique de la slection dun modle est base sur
la minimisation dun critre de pnalit. Les premiers critres qui apparaissent dans la lit-
trature sont lAIC : lAkaike Information Criterion [3] [38] [153] [32], le BIC : Bayesian
38
2.4 Mthodes de mesures de pertinence de modles
Information Criterion [148] [102], le MDL : Minimum Description Length [140] [50] puis le
Cp de Mallows [112]. De nombreux travaux thoriques ont t raliss sur leurs proprits
statistiques afin de les adapter des modles spcifiques. Prenons comme exemple lAICc ,
qui est une version corrige du critre AIC dHurvich [86] [54] et [32]. Nous trouvons ga-
lement Sugiura [164] avec le c AIC pour les petites tailles dchantillons par rapport au
nombre de paramtres estimer, lAICR [141] [95] pour une rgression derreurs non gaus-
siennes, le QAIC [32] et le c QAIC [155] pour les donnes sur-disperses. De nouveaux
outils statistiques apparaissent comme par exemple la technique PAC-Baysienne, pour les-
timation et la prdiction de modles de grandes dimensions [74]. Elle propose ainsi un oracle
pour lestimation et la reconstruction de modle.
Lchantillon
discrtes : il y a une chelle relle mais les valeurs de lchantillon ne sont pas toutes
possibles (par exemple : nombre despces dans un chantillon) ;
continues : o toute valeur est thoriquement possible, seulement limite par lappareil
de mesure (longueur par exemple).
Les MMC que nous tudions sont de type discret i.e. le champ dapplication des valeurs
des observations nutilise pas une chelle continue.
Test dhypothse
Un test statistique dhypothse est dfini par Steinebach [160] comme une mthode de
prise de dcisions statistiques utilisant des donnes exprimentales. Le concept est assez
simple : lorsque lon effectue un test statistique, on teste la probabilit quune hypothse est
correcte. Si cette probabilit est faible, alors lhypothse est considre comme fausse et elle
est rejete en faveur de lhypothse la plus intressante (souvent note H1 ). Lhypothse nulle
(souvent note H0 ) est lhypothse o rien ne se passe. Par exemple : pour un chantillon
donn, si lon rejette lhypothse nulle (H0 = lchantillon est issue dune population de
mme distributions) alors nous pouvons accepter lhypothse la plus intressante (H1 =
lchantillon est issue dune population de distributions diffrentes). Il ny a pas de test
statistique sans hypothse.
39
Chapitre 2 : Approches classiques de mesures de pertinence dans la chane de modlisation
P-value
La p-value permet de dfinir un seuil au del duquel le postula dune galit ou dune
ingalit entre deux donnes dun modle est vrai. Si cette p-value est infrieure la valeur
du seuil pralablement dfinie, on rejette ce postula. Il est habituel de prendre une valeur de
5% comme niveau critique.
chantillonnage
Selon Steinebach et al. [160], les observations doivent tre recueillies dune certaine faon.
Ce processus dacquisition de donnes est appel chantillonnage. Bien quil existe de nom-
breuses mthodes pouvant tre utilises pour un chantillonnage, il y a nanmoins quelques
rgles gnrales : une des plus videntes est quun grand nombre dobservations est gnra-
lement mieux quun petit nombre. Il faut ensuite quilibrer lchantillonnage i.e. prendre un
mme nombre dobservations pour chaque squence tudie. La plupart des tests statistiques
supposent que les chantillons sont pris au hasard.
Statistiques
tests dinvestigation de donnes : contrairement aux tests prcdents, ces tests nont
pas besoin dhypothse. Dans le cas de groupes trop nombreux de population, il est
prfrable dutiliser une technique multivarie afin de faire apparaitre des relations
entre groupes dchantillons.
40
2.4 Mthodes de mesures de pertinence de modles
Dfinition de lentropie
Lentropie de Shannon est dfinie dans [48] et [83] comme suit :
n
X
H(S) = Pi log Pi , (2.12)
i=1
la minimalit : une distribution pure (un seul symbole) a une entropie nulle : si un
seul symbole est reprsent, limpuret est nulle. On a donc une premire condition de
minimalit : lentropie dune distribution est nulle si cette distribution est pure.
5
X
H([, , , 1, ]) = Pi log Pi
i=1
= (0. log 0 + 0. log 0 + 0. log 0 + 1. log 1 + 0. log 0)
= 0.
Nous utiliserons les deux proprits prcdentes dans ce manuscrit. Dans notre cas
dtude, nous aurons dterminer les observations les plus discriminantes de notre modle
en utilisant la proprit de minimalit. La maximalit sera utilise pour trouver les tats du
systme o le maximum dobservations est reprsent.
41
Chapitre 2 : Approches classiques de mesures de pertinence dans la chane de modlisation
principe dassignation des probabilits une distribution lorsque nous ne disposons pas
dinformations compltes sur elle ;
de toutes les distributions de probabilit qui satisfont les contraintes, choisir celle qui
prsente lentropie maximale au sens de Shannon [154].
Chandrasekaran [43] utilise ce 2me principe pour la slection de modles, ainsi que [5] pour
construire des modles de plus en plus prcis simplement en rajoutant de linformation.
Notre dmarche consiste comparer la moyenne des entropies des diffrents modles. La
valeur dentropie moyenne serait alors maximale pour les modles les plus pertinents.
Maximum de vraisemblance
Pour un modle statistique P donn, et tant donne la squence dobservations X,
la probabilit de son apparition suivant P peut tre mesure par f (X, ) qui reprsente la
densit de X o apparat. Puisque est inconnue, il semble alors naturel de favoriser les
valeurs de pour lesquelles f (X, ) est leve : cest la notion de la vraisemblance de pour
lobservation X, sous la condition dindpendance des observations.
Vb (x1 , . . . , xn ; ). (2.14)
42
2.4 Mthodes de mesures de pertinence de modles
Donc n
X
log(V (x1 , . . . , xn ; )) = log(f (xi ; )). (2.16)
i=1
f (X; ) = P (X = xi ), (2.17)
Dfinition 2.4.3.4 Maximum de vraisemblance pour un chantillon discret P (xi ) qui re-
prsente la probabilit discrte o apparat :
n
X
log(V (x1 , . . . , xn ; )) = log(P (xi )). (2.18)
i=1
Pour notre problmatique de MMC o les tats sont cachs, la fonction de vraisemblance
ne possde pas dexpression analytique simple. Pour rsoudre le problme de recherche de
maxima, nous utilisons lalgorithme Expectation-Maximization (voir 2.4.3, p. 47). Plus
prcisment, nous emprunterons les donnes de cet algorithme calcul dans la thse de Vri-
gnat [177], pour faire des estimations de lois de survie. Ainsi, ce principe de maximum de
vraisemblance sera ncessaire dans la validation des architectures des modles les plus per-
tinents. Ce critre nous aidera dterminer la meilleure topologie, le meilleur algorithme
dapprentissage, la meilleure distribution entre autre.
43
Chapitre 2 : Approches classiques de mesures de pertinence dans la chane de modlisation
Le modle retenir est celui qui montre lAIC le plus faible. LAIC utilise le principe
du maximum de vraisemblance (quation 2.18). Il pnalise les modles comportant trop de
variables, et vite le sur-apprentissage. Hurvich et Tsai, [87] prconisent dutiliser lAIC
corrig lorsque le nombre de paramtres k est grand par rapport au nombre dobservations
n
n ( < 40).
k
2.k.(k + 1)
AICc = AIC + . (2.20)
nk1
Ce critre est souvent prsent avec celui de Schwarz : le BIC, qui pnalise davantage le
sur-paramtrage. Le critre BIC a t introduit dans Schwarz [148] et Kapetanios [102]. La
diffrence entre les deux critres concerne le terme de correction.
BIC = 2. ln V + k. ln n, (2.21)
o k est le nombre de paramtres libres du modle de Markov, n est le nombre de donnes,
k. ln n est le terme de pnalit [10].
Comparaison des deux critres : choisir entre ces deux critres revient choisir entre un
modle prdictif et un modle explicatif [107]. Il permet de vrifier la validit dun modle
mais surtout de comparer plusieurs modles entre eux.
Dfinition 2.4.3.7 ou HQC (Hannan-Quinn information Criterion) est dfini dans [78]
et [39] par :
Critre de Kullback-Leibler
LAIC est reli linformation de Kullback-Leibler [104]. Pour le cas de deux distributions
de probabilits discrtes P et Q, la divergence ou information de Kullback-Leibler est :
n
X Pi
DKL (P k Q) = Pi . log2 . (2.23)
i=1
Qi
Aussi appel entropie relative, ce critre permet de mesurer lcart entre deux distribu-
tions de probabilits. Lobjectif dans notre cas est de mesurer lcart ou divergence dun
modle par rapport un autre. Ce critre nous permettra dtablir un classement entre nos
modles candidats.
44
2.4 Mthodes de mesures de pertinence de modles
Mesure du MDL
En 1978, Jorma Rissanen [140], a dvelopp lide de minimiser lerreur de dveloppement
sur la conception dun modle, en pnalisant celui-ci en fonction de la longueur de sa descrip-
tion. A cette poque, la seule autre mthode qui a russi empcher le sur-apprentissage par
la pnalisation tait le critre dinformation dAkaike (AIC) vu prcdemment. La mesure
choisie pour valuer ce travail de modlisation est une mesure de type Minimum Descrip-
tion Length (MDL) . La mesure MDL est une formalisation du principe du rasoir dOccam 5
dans laquelle la meilleure hypothse pour un ensemble de donnes est celle qui conduit
la plus grande compression des donnes. Le principe est de choisir le modle qui donne la
meilleure compression en tenant compte de lerreur, cest dire de ce qui nest pas expliqu
par le modle ; soit la minimisation de la longueur du modle + la longueur des
erreurs. La longueur se mesure en bits.
Cp de Mallows
Selon Joshi [96], le critre de choix Cp est une mthode de choix du modle de rgression
en fonction du nombre de variables explicatives entrant dans le cas dune rgression linaire.
Un faible Cp correspond un meilleur modle dans le sens quil reprsente la somme des
rsidus (SC rsiduelle) la plus faible et la moins pnalise par le nombre de paramtres
entrant dans le modle. Ce critre permet doptimiser lerreur dapprentissage du modle.
Cest la diffrence entre lerreur de gnralisation (en esprance sur les donnes) et lerreur
dapprentissage (celle du modle choisi). Le Cp de Mallows permet destimer cette erreur
sans utiliser les donnes elles mmes, mais en utilisant de linformation sur la richesse du
modle et le nombre de donnes n.
(SC Rsiduelle)p
Cp = (n 2p), (2.24)
2
Information mutuelle
Dans le cas continu :
Z Z
p(x, y)
I(X, Y ) = p(x, y) log dxdy. (2.25)
R R p(x) p(y)
5. Cest en vain que lon fait avec plusieurs ce que lon peut faire avec un petit nombre
45
Chapitre 2 : Approches classiques de mesures de pertinence dans la chane de modlisation
Dans son tude sur lestimation rapide de modles de Markov semi-continus discriminants,
Linars et al. [110] nous donnent une mthode destimation de SHMM 6 par maximisation de
linformation mutuelle. Le principe gnral est de minimiser le risque derreur en maximisant
lcart de vraisemblance (voir 2.4.3, p. 42) entre la bonne transcription et les mauvaises.
Dans ce manuscrit, nous utilisons cette information mutuelle pour trouver dventuelles
dpendances entre les observations puis entre les tats et symboles.
AICp : Vandewalle [172] propose un nouveau critre AICp, qui cherche valuer les
performances en prdiction dun modle gnratif appris . Ce critre est compos
de la vraisemblance pnalise par une quantit nouvelle qui sinterprte comme la
dimension prdictive du modle considr. Les modles gnratifs consistent en une
modlisation de la vraie distribution de probabilit p par une loi paramtrique ;
CAIC : enfin, le CAIC est un coefficient important, car il tient compte la fois du degr
dajustement du modle et du nombre de degrs de libert. Ceci permet destimer quel
modle semble le plus appropri, i.e. lequel devrait avoir les plus petites valeurs de
CAIC (Bentler [16]).
Critre ICOMP
Le critre ICOMP (Informational Complexity Criterion) (Bozdogan [29]) prsente la
particularit dutiliser une mesure de complexit non linaire. Celle-ci se base sur la matrice
dinformation de Fisher et le nombre de paramtres du modle. Le calcul de ce critre est
nanmoins beaucoup moins vident que celui des critres prcdents : la matrice de Fisher
est difficile obtenir.
6. Semi Continuous Hidden Markov Models
46
2.4 Mthodes de mesures de pertinence de modles
Critres de classification
Ces critres permettent de slectionner des modles avec des composantes distinctes et
des observations bien regroupes. Pigeau [130] prsente un tat de lart de ces critres pour
la slection de modle pour la classification. Ce sont les critres suivants : NEC (Normalized
Entropy Criterion), PC (Partition Coefficient), MIR (Minimum Information Ratio) et LP
(logarithme de la probabilit de la partition). Le critre de BEC (Bayesian Entropy Criterion)
quant lui, est utilis en classification supervise [24].
Critre ICL
Le critre ICL (Integrated Completed Likelihood) est propos par Biernacki [19]. Ici, la
vraisemblance est pnalise par la complexit du modle et le critre de classifiabilit E. Il
est dfini partir du critre BIC :
1
ICL = BIC + E, (2.27)
2
o E est un critre de classifiabilit.
1 log(n!)
U = AIC = n. log() + 2.s. , (2.28)
2 n
o s est le nombre de valeurs aberrantes candidats.
47
Chapitre 2 : Approches classiques de mesures de pertinence dans la chane de modlisation
On utilise ensuite les paramtres trouvs ltape M comme point de dpart dune nouvelle
phase dvaluation de lesprance, etc.
Lalgorithme EM, bien que trs performant et souvent simple mettre en uvre, pose
quand mme parfois quelques problmes qui ont donn lieu des dveloppements com-
plmentaires. Parmi ceux-ci, nous voquerons un dveloppement appel GEM (Generalized
EM) [56] qui permet de simplifier le problme de ltape maximisation. Un autre, appel
CEM (Classification EM) [42] permet de prendre en compte laspect classification lors de
lestimation. Un dernier, SEM (Stochastic EM) [40] et [41] dont lobjectif est de rduire le
risque de tomber dans un optimum local de vraisemblance.
Rcemment amlior, Huda et al. [85] proposent un algorithme hybride bas sur une mta-
heuristique SAS (Simulated Annealing Stochastic). Cette tape stochastique supplmentaire
qui reformule le processus destimation du MMC permet dempcher la convergence vers
un maximum local. Cet algorithme bas sur des MMC, donne une meilleure prcision en
reconnaissance de la parole.
existence dun nombre fixe dattributs pour dfinir les exemples prsents au systme ;
le modle de description dun exemple doit tre une combinaison des valeurs de ces
attributs ;
Avec les techniques prcdentes (apprentissage par analyse des diffrences), le modle
de description tait modifi chaque fois quun nouvel exemple tait prsent au systme.
Pour viter une mauvaise modification, chaque nouvel exemple ne doit tre que lgrement
diffrent du modle. Ainsi, on vite de faire voluer le modle vers des interprtations incer-
taines. Avec la version space, on explore chaque interprtation possible, et ce, tant quelle
7. Espace de versions
8. Iterated Version Space Algorithm
48
2.4 Mthodes de mesures de pertinence de modles
reste viable.
Une version space est une reprsentation qui enregistre toutes les informations utiles des
exemples fournis au systme sans conserver un seul de ces exemples. Une version space est
une reprsentation dans laquelle :
la racine de larbre de gnralisation est un modle qui accepte tous les exemples ;
les liens entre les noeuds dnotent des relations de gnralisation et de spcialisation.
Lide de lapprentissage par version space est que la gnralisation des modles spci-
fiques et la spcialisation des modles gnraux conduisent un modle assurment correct
qui accepte tous les exemples positifs prsents au systme et rejette tous ceux qui sont
ngatifs. Dans ce manuscrit, nous utilisons cette mthode pour tenter de construire un mo-
dle qui accepte les diffrentes instances i.e. les chanes de Markov de diffrents ordres. La
construction de tels arbres va nous permettre de dtecter les futures pannes du systme.
Arbre de dcision
La construction darbre de dcision utilise la notion dattribut le plus discriminant. Les
donnes issues de GMAO industrielle nous donnent les tables de contingence tudier. Nous
pouvons alors appliquer plusieurs critres comme lentropie maximale (voir 2.4.3, p. 42).
Nous utilisons aussi cette technique, qui va nous permettre de faire une classification sur les
attributs (ou observations dans notre cas), les plus pertinents.
donnes dentre et de sortie : ralisation dune analyse de sensibilit (voir 2.3, p. 30).
Dans notre tude, nous nous situons dans le deuxime cas. Nous tudions uniquement les
donnes dentre. Les donnes de sortie que nous ne connaissons pas, correspondent aux tats
49
Chapitre 2 : Approches classiques de mesures de pertinence dans la chane de modlisation
cachs du MMC.
Mthodes de Monte-Carlo
Ces mthodes permettent de calculer une quantit inconnue en utilisant une suite de
nombres alatoires. Son intrt est la convergence plus rapide vers la solution quune ex-
ploration dit systmatique . Elles permettent de quantifier des variables en utilisant des
outils statistiques. Selon Pardoux [126], cette mthode consiste dans un premier temps
mettre sous la forme dune esprance, la quantit que lon cherche calculer. La deuxime
tape consiste faire une simulation de la variable alatoire et calculer E(X), o X est
une variable alatoire. Pour calculer E(X), il faut savoir simuler des variables alatoires in-
dpendantes X1 , . . . , Xn , ayant toutes la loi de X. Pour finir, il faut approcher la valeur de
E(X) par :
1
E(X) (X1 + . . . + Xn ). (2.29)
n
Le thorme de la loi forte des grands nombres permet de justifier la convergence de la
mthode et le thorme de la limite centrale prcise la vitesse de convergence. Pour plus de
dtails, le lecteur pourra se rfrer la loi forte des grands nombres, thorme de la limite
centrale et mthode de Monte-Carlo [126].
Test de Kolmogorov-Smirnov
Ce test permet de comparer les distributions de deux chantillons [60], [181], [182], [91]
et [125]. Cest un test non paramtrique. Il consiste comparer la distribution des frquences
dune variable observe avec la distribution thorique que cette variable aurait si elle tait
distribue normalement. On cherche alors lcart entre la distribution thorique et la distri-
bution observe. On veut tester lhypothse nulle H0 : il ny a pas de diffrence entre les
deux chantillons . Ce test repose sur le fait que si les fonctions de rpartition thoriques
sont gales, les diffrences entre les fonctions de rpartition empiriques sont faibles.
Pour le lecteur curieux, la preuve du thorme de Kolmogorov-Smirnov est dcrite dans
[17].
La fonction de rpartition empirique dun chantillon X1 , . . . , Xn est dfinie par (2.30) :
n
1X
Fn (x) = X 6x (2.30)
n i=1 i
1 si Xi 6 x,
avec Xi 6x =
0 sinon .
Avec lhypothse nulle H0 : les deux chantillons suivent la mme loi.
La distance de Kolmogorov-Smirnov est dfinie en (2.31) :
Nous utilisons ce test afin dvaluer la diffrence entre la fonction de rpartition empirique
tudie et les lois de distributions testes.
50
2.4 Mthodes de mesures de pertinence de modles
Test dAspin-Welch
Un autre test dadquation qui prends en compte les moyennes des deux chantillons.
Lhypothse nulle H0 est la mme que celle du test de Kolmogorov-Smirnov ( il ny a pas
de diffrence entre les deux chantillons ).
Le test dAspin-Welch [184], [185], [79] est dfini par :
x1 x2
t= r , (2.32)
2
1 1
( + )
n1 n2
n1 12 + n2 22
2 = , (2.33)
n1 + n2 2
xi : moyenne de lchantillon,
: la variance des deux chantillons,
i : les variances des chantillons,
ni : la taille de lchantillon,
H0 : les deux chantillons suivent la mme loi.
avec , le nombre de degrs de libert est estim en utilisant lquation de Welch-
Satterthwaite : 2 2
1 22
+
n1 n2
= . (2.34)
14 24
+
n21 (n1 1) n22 (n2 1)
Nous utilisons galement ce test statistique afin dvaluer la diffrence entre la fonction
de rpartition empirique et les lois de distributions.
Bootstrap
Le Bootstrap est une mthode issue des recherches de Bradley Efron [63] la fin des annes
70. Son but est destimer la prcision dun intervalle de confiance ou dune distribution.
Elle consiste re-chantillonner un chantillon de taille limite, sans rajouter de nouvelles
donnes. Il permet dobtenir des informations sur les incertitudes statistiques lies un
chantillon de taille limite.
Thorme 2.4.1 Lorsque n tend vers linfini, la distribution des valeurs moyennes calcules
partir des chantillons de bootstrap est gale la distribution des valeurs moyennes obtenues
partir de tous les chantillons avec des n lments qui peuvent tre construits partir de
lespace complet. Ainsi, la largeur de la distribution donne une valuation de la qualit de
lchantillon (Bradley Efron [63]).
Pour tudier une population donne ( espace complet ), le Bootstrap (voir thorme 2.4.1),
consiste extraire un premier chantillon reprsentatif de cette population puis dchantillon-
ner de nouveau ce premier chantillon (sans recours de nouvelles observations) : cest le
r-chantillonnage. Cela permet de conserver toujours le mme nombre de donnes. Aprs
un certain nombre ditrations (formule 2.35), rsultant de la mthode de Monte-Carlo (voir
51
Chapitre 2 : Approches classiques de mesures de pertinence dans la chane de modlisation
Espace complet
chantillon
initial de n
lments
1
2
Nb chantillons de 3
Bootstrap 4
..
.
Nb
2.4.5), nous obtenons une statistique finale en faisant la moyenne des diffrentes statistiques
obtenues. Cette mthode permet de remplacer les difficults mathmatiques par dimportants
calculs. Le lecteur peut visualiser cette mthode Figure 2.4, p. 52 pour une meilleure com-
prhension.
En pratique, un nombre ditrations minimum est ncessaire pour lestimation des variances
ou des intervalles de confiance de statistique des paramtres du modle.
Nb 1000 : pour estimer lerreur-standard,
Nb 5000 : pour lvaluation dintervalles de confiance.
(2n 1)!
Nombre maximal ditrations pour un n-chantillon : Nmax = . (2.35)
n!(n 1)!
52
2.5 Mesure du caractre stochastique dun modle
n
X
(xi x) (yi y)
x,y = s n i=1 s n . (2.36)
X X
(xi x)2 (yi y)2
i=1 i=1
Les deux courbes ne sont pas corrles si x,y est proche de 0. Les deux courbes sont
dautant plus corrles entre elles que x,y est proche de -1 ou de 1.
La covariance entre x et y est dfinie par :
N
2 1X
xy = (xi x) (yi y). (2.37)
N i=1
Cette technique de comparaison nous permettra de quantifier les diffrences entre les
distributions empiriques et simules. Cela pourra nous donner, dans un deuxime temps,
dventuelles amliorations apporter notre modle de synthse.
53
Chapitre 2 : Approches classiques de mesures de pertinence dans la chane de modlisation
|Sn |
sobs = ,
2 Z +
2 2
erfc(z) = eu du : la fonction derreur complmentaire dite de Gauss,
z
sobs
p-value = erfc .
2
Si la squence est alatoire, les +1 et 1 auront tendance sannuler mutuellement et
la statistique tendra vers 0. Lhypothse nulle (H0 ) considre que la squence est alatoire.
Le test accepte H0 si p-value > 0, 01. La squence est considre comme non alatoire si
p-value < 0, 01.
Sn = X 1 + X 2 + . . . + X n . (2.38)
54
2.6 Discussion sur les mthodes de slection de modles
celui attendu pour une squence alatoire. Ce test est en fait une srie de huit tests (et
conclusions) pour chacun des tats : 4, 3, 2, 1 et +1, +2, +3, +4.
55
Chapitre 2 : Approches classiques de mesures de pertinence dans la chane de modlisation
Consistance et efficacit
Certains critres sont bass sur le principe du maximum de vraisemblance (voir 2.4.3,
p. 42) tels que AIC [3] et BIC [148]. Nous utiliserons par la suite certains de ces critres
comme AIC, BIC et HQC. Le critre de BIC est connu comme consistant, i.e. si le vrai
modle est contenu dans lensemble des modles candidats, alors la probabilit de choisir le
vrai modle est proche de 1. Dautre part, le critre dAIC est optimal pour les cas la fois
paramtriques et non paramtriques. Ce critre donne de bons rsultats dans lestimation
dune fonction de rgression par exemple. Selon Claeskens et al. [46], BIC et HQC sont des
critres fortement consistants. AIC, AICc et le Cp de Mallows sont efficaces (un critre est
efficace lorsque lerreur de prdiction attendue est proche de lerreur de modlisation) [47].
Cependant, nous ne pouvons pas combiner la consistance de BIC avec lefficacit dAIC.
En effet, Yang [189] montre que si le vrai modle est inclu dans lensemble des candidats
alors les points forts des 2 prcdents critres, mentionns ci-dessus, ne peuvent tre partags.
Autrement dit, pour tre consistant, les critres de slection de modles doivent se comporter
de manire optimale par rapport lAIC, en terme derreur quadratique moyenne. Selon [98],
BIC a t conu pour trouver le modle le plus probable. Par contre AIC est meilleur lorsque
les modles candidats sont peu probables, il minimise la distance de Kullback-Leibler (voir
2.4.3, p. 44) qui permet aussi de comparer des modles entre eux.
Sur-apprentissage
Les donnes dapprentissage sont dterminantes dans la construction dun modle. Woo-
droofe [188] tudie le caractre de sur-apprentissage des critres comme lAIC ou le Cp de
Mallows. Il montre linfluence du paramtre k (pour k +) pour la loi de probabilit
Arc Sinus . Par exemple pour k +, la probabilit de sur-aprentissage est de 0,946
alors que la probabilit didentifier correctement le vrai modle est de 0,712 (voir Tableau 2.1,
p. 56)
Cet exemple illustre le fait que ce critre de slection de modle minimise le score si le
nombre de paramtres est trop important.
56
2.7 Conclusion
2.7 Conclusion
Des approches telles que lanalyse de sensibilit dun modle, les mthodes avec score
dintrt ou statistiques, nous offrent de nombreuses possibilits pour trouver les architec-
tures des modles les plus pertinentes. De nombreuses mthodes utilises en mathmatiques
appliqus ne seront pas dveloppes ici cause de leur complexit. Nous utiliserons les m-
thodes dcrites ci-dessus pour tenter de mesurer la pertinence des architectures de MMC
proposes dans Vrignat [177]. De plus, afin de pouvoir comparer les donnes empiriques avec
des donnes issues de simulation, nous allons mettre en place un modle de synthse. Nous
allons alors vrifier dans un premier temps son caractre stochastique (avec un test du NIST).
Ensuite, nous allons dterminer les lments du modle les plus pertinents laide des m-
thodes prcdentes qui ont dj t utilises avec une problmatique similaire. Enfin, dans
un but damliorer les performances de notre modle, nous proposerons des amliorations en
les quantifiant laide de la corrlation linaire de Bravais-Pearson.
57
Chapitre 2 : Approches classiques de mesures de pertinence dans la chane de modlisation
58
Chapitre 3
59
Chapitre 3 : valuation de modles par une approche markovienne
60
3.1 Introduction
Nous dbutons ce chapitre par une description des attentes thoriques de cette tude.
Nous prsentons ensuite quelques approches classiques issues de la littrature qui pourraient
tre utilises dans notre dmarche. Nous dtaillons ensuite les diffrents aspects lis notre
problmatique, notre choix de lapproche markovienne et les diffrentes architectures de mo-
dle que nous utilisons (topologies, algorithmes dapprentissage, algorithmes de dcodage).
Nous introduisons ensuite le modle de synthse utilis pour cette tude, afin dobtenir des
donnes simules proches dun processus industriel. Ce modle tablit ainsi des relations
cohrentes entre les observations de sortie dun processus industriel et ltat cach de
celui-ci. Comme prconis dans les travaux prcdents [177], nous utilisons une modlisa-
tion markovienne quatre tats (S1, S2, S3 et S4). S4 est ltat de fonctionnement optimal
et S1 est ltat critique o le processus est arrt. Enfin, nous prsenterons les lois statis-
tiques utilises dans la production des symboles laide du Principe de Maximum dEntropie
(PME).
3.1 Introduction
Certaines entreprises de la rgion ont mis en place des systmes de GMAO. Des donnes
de maintenance sur des processus industriels ont ainsi pu tre collectes. Ces dernires nous
servent de base pour notre tude empirique. Les comparaisons avec les donnes issues dun
modle de synthse nous permettent dvaluer les diffrentes architectures des modles utili-
ss. Nous prsentons ici les mthodes et donnons les rsultats dans le chapitre suivant. Tous
les calculs sont mens sur deux fronts : donnes empiriques et donnes de simulation.
Nous pouvons dcomposer nos attentes thoriques selon les axes suivants :
(a) Pertinences des observations sans connaissance a priori sur les rsultats :
quels sont les symboles les plus pertinents ? Ils proviennent dune GMAO industrielle,
quelles sont les instances qui napportent aucune ou trop peu dinformation au modle ?
peut-on retrouver ltat dun systme ou dun processus, partir dune squence dins-
tances particulires ?
61
Chapitre 3 : valuation de modles par une approche markovienne
quel est le meilleur chantillonnage des observations pour obtenir une ractivit efficace
des modles ?
quel est le nombre minimal de donnes ncessaire au modle pour quil ait une informa-
tion suffisante ? Est-il possible dtablir une fentre optimale de symboles, de manire
pouvoir rvaluer le modle en fonction de cette fentre glissante ? Le modle se
fonderait donc sur un historique limit.
62
3.3 Approches classiques
Prenons par exemple un modle dtat discret reprsent par lquation dtat suivante :
x(tk+1 ) = Ak x(tk ) + Bk u(tk ) + v(tk ) (quation dtat)
(3.1)
y(tk ) = Ck x(tk ) + (tk ) (quation de mesure).
o :
k > 0 reprsente les instants successifs du temps, tk = kTe o Te est la priode dchan-
tillonnage ;
x(tk ) Rn est le vecteur dtat du systme ;
u(tk ) Rm est le vecteur des entres dterministes ;
v(tk ) Rp est le vecteur bruit sur les entres ;
y(tk ) Rq est le vecteur des mesures ;
(tk ) Rq est le vecteur des signaux stochastiques (erreur de mesure).
Les hypothses suivantes doivent tre vrifies :
les matrices Ak , Bk , Ck ainsi que lentre u(tk ) sont dterministes ;
les bruits de mesure ainsi que les bruits sur les entres sont supposs de moyenne nulle,
non corrls entre eux tk ;
ltat initial x0 desprance x0 , de matrice de covariance P0 est indpendant du bruit
dtat et de mesure.
soit pour linitialisation :
x(t0 ) x0 x(t0 ) T P0 0 0
E v(ti ) = 0 , v(ti ) x(t0 ) v(tj ) (tj ) = 0 Qi ij 0 . (3.2)
(ti ) 0 (ti ) 0 0 Ri ij
.
E reprsente lesprance mathmatique ;
ij est le symbole de Kroknecker 1 ;
P0 , Qi et Ri sont des matrices symtriques dfinies positives.
La mthode consiste prdire ltat suivant en minimisant la variance de lerreur desti-
mation en deux phases :
la phase de prdiction : utilise ltat prcdent pour estimer ltat courant ;
la phase de correction : les observations de linstant courant permettent daffiner ltat
courant.
63
Chapitre 3 : valuation de modles par une approche markovienne
P1 P1 P1
T1 T1 T1
P2 P3 P2 P3 P2 P3
T2 T2 T2
P4 P4 P4
Ce rseau volue aprs chaque transition. Des jetons sont redploys au niveau des entres
et des sorties des transitions.
Notre problmatique est assez proche de celle des rseaux de Petri. En effet, lautomate
reprsent par un rseau de Petri peut aussi bien se reprsenter sous forme dun automate
de Markov. Dans ce manuscrit, nous navons pas choisi cette mthode car les rseaux de Petri
ne supportent pas la couche tats cachs comme peut le faire lapproche markovienne.
Peu dapplications industrielles voient le jour.
celles dun processus markovien qui imposent un dcoupage temporel rgulier [113]. Ce
dcoupage concerne videment lchantillonnage des donnes, quelles soient empiriques
64
3.4 Approche markovienne
ou simules ;
des chanes de Markov pour des processus temps discrets (selon Foata [66]). Connais-
sant ltat prsent, la prdiction du futur nest pas rendue plus prcise par la connais-
sance des tats supplmentaires concernant leur pass ;
les tats inconnus du systme modliser correspondent aux tats cachs dun MMC ;
Soit Xn , n > 0 une suite de variables alatoires valeurs dans lensemble des tats
E. Cette suite est une chane de Markov dordre 1, si pour tout n > 1 et toute suite
(i0 , . . . , in1 , i, j) dlments de E, pour laquelle la probabilit P (X0 = i0 , . . . , Xn1 =
in1 , Xn = i) est strictement positive, on a la relation suivante [66] :
Dfinition 3.4.1.1 La chane de Markov est dite homogne (dans le temps), si la probabilit
prcdente ne dpend pas de n :
Cette probabilit est appele probabilit de passage de ltat i ltat j, en une transition.
65
Chapitre 3 : valuation de modles par une approche markovienne
Les coefficients sont les probabilits de transition pi,j et forment la matrice de passage
(ou de transition) de la chane de Markov. Cest une matrice finie ou dnombrable, suivant
que lensemble des tats est fini ou dnombrable.
Symboles ou observations
1 1 2 1
66
3.4 Approche markovienne
0 1 0 0 0 0 0
1/a 0 (a 1)/a 0 0 0 0
0 2/a 0 (a 2)/a 0 0 0
P = .. .. .. .. .. .. . .. .. (3.7)
. . . . . . . .
0 0 0 0 (a 1)/a 0 1/a
0 0 0 0 0 1 0
67
Chapitre 3 : valuation de modles par une approche markovienne
Fig 3.4 Relations de dpendance entre les variables alatoires dun MMC. Pour chaque
tat qt un instant t, il y a mission dun symbole Vt pris dans lensemble V.
Hypothse de Markov
La prdiction de ltat futur nest pas rendue plus prcise par connaissance supplmentaire
dinformation a priori i.e. toute linformation utile pour la prdiction du futur est contenue
dans ltat prsent du processus :
68
3.4 Approche markovienne
Cest pourquoi des alternatives doivent tre mises en place. Certains algorithmes comme celui
de forward-backward [70] appel aussi algorithme Baum-Welch, avec une complexit de
lordre de N 2 T , ainsi que celui de Viterbi [81] ayant une complexit de T N T , permettent
de pallier ce problme. Ils rduisent ainsi le temps de calcul.
topologie 1 : cet automate de Markov illustre toutes les transitions possibles entre tous
les tats S1 , S2 , S3 et S4 (voir Figure 3.5(a), p. 71) ;
topologie 2 : cette topologie est moins permissive que la prcdente. Pour passer de
ltat S4 (le systme fonctionne et tout va bien) ltat S1 (le systme est larrt
en panne), il faut obligatoirement passer par S3 et S2. Lobjectif du modle tant de
rduire autant que possible le temps de sjour en S2 avant S1, afin que cet tat soit un
indicateur pertinent de larrive imminente de la panne (voir Figure 3.5(b), p. 71) ;
topologie 3 : nous retrouvons ici la topologie 2, une diffrence prs : ltat S1 est un
tat aspirant i.e. cette topologie autorise moins de marge de manuvre pour aller
vers ltat S1, lors de la phase dapprentissage. Le passage de S1 S4 est le redmar-
rage aprs un arrt (voir Figure 3.5(c), p. 71).
Les tats S2 S4 sont des tats o le processus modlis fonctionne. S1 est un tat darrt du
systme. Pour un systme productif, cette situation darrt doit tre minimise. Dans notre
tude, cet tat doit tre prdit au plus juste.
Les symboles mis reprsentent des interventions de maintenance (voir la codification
Tableau 3.1, p. 70).
3.4.5 Apprentissage
Algorithmes dapprentissage et de dcodage
Pour raliser lapprentissage des diffrents modles, nous utilisons les deux algorithmes
suivants :
apprentissage Baum-Welch [14] et [88], dcod par Variables Forward [137] :
estimation du modle de faon itrative = (A, B, ),
avec une squence dobservations O = {o1 , o2 , . . . , oT } VT ,
69
Chapitre 3 : valuation de modles par une approche markovienne
Etat du processus
MARCHE
ARRET
NObs. Symboles Nature des interventions
1 DEP (Dpannage / arrt de la production)
2 RM (Rglage Machine)
3 AU (Autre)
4 OBS (Observation)
5 TEP (Travaux Entretien Prventif)
6 SEC (Scurit)
7 RAN (Remise A Niveau / planifi)
8 NET (Nettoyage Machine)
9 VEP (Visite Entretien Prventif)
10 RAS (pas dintervention)
Q : squence dtats cachs qui a le plus probablement engendr la squence telle que
calcule par lalgorithme de Viterbi (voir annexe A.4, p. 145).
Pour dcoder les informations et ainsi retrouver les donnes de sortie de nos modles,
issues de la phase dapprentissage, nous utilisons les deux algorithmes de dcodage suivants :
70
3.4 Approche markovienne
MMC 1
Production de symboles Production de symboles
1 : SEC
2 : DEP 4 5
3
4
5
:
:
:
NET
OBS
... 4 5
1 2 3
S1 1 S2 2 S3 3 S4
6
6 RUN
!
(a) Topologie 1
MMC 2
Production de symboles Production de symboles
1 : SEC
2 : DEP
3
4
5
:
:
:
NET
OBS
...
5
1 2 3
S1 1 S2 2 S3 3 S4
6
RUN
!
(b) Topologie 2
MMC 3
Production de symboles Production de symboles
1 : SEC
2 : DEP
3
4
5
:
:
:
NET
OBS
...
5
1 2 3
S1 S2 2 S3 3 S4
6
RUN
!
(c) Topologie 3
Fig 3.5 Modles de Markov Cachs, topologies 4 tats. Les k , k sont des aij illustrant les
transitions Si vers Sj . Les k dtriorent ltat et les k amliorent ltat. La matrice dini-
tialisation pointe obligatoirement sur ltat S4 puisque nous supposons dmarrer toujours
dans ltat optimal (S4 est ltat optimal, S1 est ltat du processus arrt).
71
Chapitre 3 : valuation de modles par une approche markovienne
Nous avons cr un modle de synthse afin dobtenir des donnes se rapprochant le plus
possible du cas rel. En effet, ces donnes simules vont nous permettre dprouver les ar-
chitectures des modles tudis, les diffrentes topologies, les algorithmes dapprentissage et
de dcodage ainsi que les deux distributions choisies dans lmission de symboles. Ce modle
de synthse va nous servir de rfrence pour valider le cas rel.
Nous prsentons ici les diffrentes tapes de construction du modle de synthse (un mo-
dle = une topologie, un algorithme dapprentissage et un algorithme de dcodage) :
une topologie,
une matrice de transition A,
une matrice de distribution des observations B et une matrice dinitialisation .
Nous discutons dans un premier temps, le choix du modle de rfrence qui nous a servi
construire notre modle de synthse. Connaissant les probabilits de transition du couple
(Symboles, Etats), nous avons test les diffrentes topologies tudies (voir Figure 3.5, p.
72
3.5 Modle de synthse
71) sur des algorithmes dapprentissage et de dcodage. A la fin de ces essais comparatifs,
nous avons conclu que la topologie 2 (voir Figure 3.6, p. 73) tait la plus pertinente, en terme
de dtection de panne. Elle caractrise au mieux les activits de maintenance.
MMC 2
Production de symboles Production de symboles
1 : SEC
2 : DEP
3
4
5
:
:
:
NET
OBS
...
5
1 2 3
S1 1 S2 2 S3 3 S4
6
RUN
!
Fig 3.6 Modle de Markov Cach 4 tats, topologie 2, rfrence du modle de synthse.
La topologie dun MMC dpend uniquement des lments non nuls de la matrice de tran-
sition note A = {aij }. Un tel modle est dit connectivit totale lorsque sa matrice de
transition ne comporte aucun lment nul (voir Figure 3.5(a), p. 71). Le modle de synthse
gnre des missions de symboles suivant les deux distributions suivantes :
la distribution uniforme : cette loi permet de modliser des variables alatoires uni-
formment rparties sur un intervalle, comme le montre la Figure 3.8(a), p. 76. La
variable alatoire peut prendre n valeurs quiprobables {x1 , x2 , . . . , xn }. La probabilit
est : P (xi )i[1,n] = 1/n. Cette loi est peu reprsentative dun systme rel, car tous les
symboles ont le mme poids. Nous donnons quelques dtails supplmentaires sur cette
loi en annexe B.2, p. 150.
1 1 x 2
(x) = e 2 ( ) . (3.18)
2
Cette loi peut tre une bonne reprsentation dun systme rel, car les symboles ont des
poids diffrents. Nous donnons un exemple pratique utilisant cette loi en annexe B.1, p. 149.
La matrice A (probabilit de passage entre les tats) est le rsultat de calculs issus de
lalgorithme dapprentissage utilis pour le modle considr (topologie dsire a priori). Dans
notre situation, ces rsultats sont fournis par le modle de synthse avec ses caractristiques
topologiques et refltant une distribution des symboles suivant une loi normale (Figure 3.8(b),
p. 76).
73
Chapitre 3 : valuation de modles par une approche markovienne
Nous avons lanc une premire simulation afin de produire 1000 observations. La matrice
A est initialement dfinie comme suit :
0.500 0.250 0 0.250
0.100 0.070 0.500 0.330
A= 0
. (3.19)
0.005 0.495 0.500
0 0 0.001 0.999
74
3.5 Modle de synthse
50
DEP
RM
AU
OBS
Occurence de symboles de chaque squence
40
TEP
SEC
RAN
NET
VEP
RAS
30
20
10
0
seq1 seq2 seq3 seq4 seq5 seq6 seq7 seq8 seq9 seq10 seq11
DEP
RM
AU
OBS
Occurence de symboles de chaque squence
40
TEP
SEC
RAN
NET
VEP
RAS
30
20
10
0
seq1 seq2 seq3 seq4 seq5 seq6 seq7 seq8 seq9 seq10 seq11
Fig 3.7 Squences V des T observations du modle de synthse. La Figure 3.7(a) reprsente
la distribution normale et la Figure 3.7(b) reprsente la distribution uniforme. Sur labscisse,
nous pouvons voir la liste des 11 squences dobservations misent par le modle de synthse.
Pour chaque squence, on trouve les 10 symboles (DEP, RM, AU, OBS, TEP, SEC, RAN,
NET, VEP et RAS). Ces figures illustrent la distribution de chaque squence pour chaque
symbole. Nous remarquons que chaque squence se termine par le symbole darrt DEP.
75
Chapitre 3 : valuation de modles par une approche markovienne
150
S1
Occurrence des symboles pour les 11 squences
S2
S3
S4
100
50
0
S1
Occurrence des symboles pour les 11 squences
S2
S3
S4
100
50
0
Fig 3.8 Distribution des symboles par tat du modle de synthse. La Figure 3.8(a) re-
prsente la distribution normale et la Figure 3.8(b) reprsente la distribution uniforme. Sur
labscisse, nous pouvons voir la liste des 10 symboles. Pour chaque symbole, on trouve les 4
tats (S1, S2, S3 et S4). Ces figures illustrent la distribution de chaque symbole pour chaque
tat. Nous remarquons que le premier symbole nest mis que par ltat S1 (symbole darrt
pour ltat de non fonctionnement). Nous remarquons aussi que ltat S1 nmet aucun des
9 autres symboles.
76
3.5 Modle de synthse
Ces symboles vont donc pouvoir ensuite tre implments dans les trois topologies tu-
dies par lintermdiaire des algorithmes dapprentissage Baum-Welch (dcodage Variables
Forward) et Segmental K-means (dcod par Viterbi). Finalement, nous obtenons des couples
(Etats, Observations) pour chaque sortie dautomates. Nous valuons ainsi la pertinence et
lincertitude de chaque topologie.
Estimation
dgradation
systme
Marche
Estimation avec
niveaux
dgradation de
du dgradation
systme
Arrt
N
Etiquette 1 2 3 4 5 6 7 8 9 10 11 12
N Obs 10 10 9 9 5 5 6 5 5 10 10 1
P
C
S
S
P
Observations
DE
RA
RA
RA
RA
VE
VE
SE
TE
TE
TE
TE
77
Chapitre 3 : valuation de modles par une approche markovienne
La squence est considre comme alatoire pour p-value > 0, 01, et non alatoire pour
p-value < 0, 01. Nous vrifions que les squences Figure 3.8(a) et 3.8(b) sont issues dun
gnrateur alatoire : rsultats Tableau 3.3, p. 78. Les symboles des topologies 1 et 3 sont
gnrs partir du modle de rfrence utilisant la topologie 2. Ces topologies caractrisent
un contexte rel de dgradation et de rparation.
Les rsultats obtenus, Tableau 3.3, p. 78, indiquent que pour tous les modles, les
p-value > 0, 01. Les squences obtenues par le gnrateur sont donc considres comme
alatoires. La diffrence entre les lois uniformes et lois normales se fonde sur un constat
empirique.
Nous ralisons ainsi des mesures de pertinence et dincertitude sur les nouvelles observa-
tions obtenues pour nos trois topologies tudies. Le processus complet est rsum sur la
Figure 3.10, p. 79.
78
3.5 Modle de synthse
Modle de synthse
Modle de
Markov Cach
Modle 2
(rfrence)
Production Production
Symboles g-
de squences Symboles g-
de squences
nrs parEtats)
(Symboles, une nrs parEtats)
(Symboles, une
loi Uniforme
gnrs par une loi Normale
gnrs par une
loi Uniforme loi Normale
Topologies 1, 2 & 3
Variables
BaumWelch
Forward
Segmental
Viterbi
Kmeans
Incertitudes pistmiques.
Fig 3.10 tapes dvaluation de larchitecture des modles, laide dun modle de synthse.
Le modle de synthse utilise la topologie 2 pour gnrer des 2-uplet (Symboles, Etats) en
utilisant les distributions (uniforme et normale). Nous injectons alors ces signatures dans
les 3 topologies tudies. Nous utilisons les 2 algorithmes dapprentissage et de dcodage
pour obtenir de nouvelles squences que nous analysons pour en valuer la pertinence. Nous
essayons ainsi de trouver la meilleure architecture des modles.
79
Chapitre 3 : valuation de modles par une approche markovienne
4 4
3 3
2 2
1 1
15
15
10
10
5
5
0
NET RAS OBS AU TEP VEP RAN SEC RM DEP NET RAS OBS AU TEP VEP RAN SEC RM DEP
4
1
15
10
5
0
Fig 3.11 Distribution des symboles par tat. La Figure 3.11(a) reprsente la distribution
normale des observations mises par le modle de synthse. La Figure 3.11(b) reprsente
la distribution des observations aprs apprentissage Baum-Welch et dcodage par Variables
Forward. La Figure 3.11(c) reprsente la distribution des observations aprs apprentissage
Segmental K-means et dcodage par Viterbi.
80
3.5 Modle de synthse
150
S1 S1
Occurrence des symboles pour les 11 squences
100
50
50
0
0
DEP RM AU OBS TEP SEC RAN NET VEP RAS DEP RM AU OBS TEP SEC RAN NET VEP RAS
1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3
S1 1 S2 2 S3 3 S4 S1 1 S2 2 S3 3 S4 S1 S2 2 S3 3 S4 S1 1 S2 2 S3 3 S4 S1 1 S2 2 S3 3 S4 S1 S2 2 S3 3 S4
6 6 6 6 6 6
6 RUN RUN RUN 6 RUN RUN RUN
! ! ! ! ! !
Fig 3.12 Production des symboles. Cela nous permet de tester diffrentes distributions de
symboles, diffrentes topologies et diffrents algorithmes dapprentissage et de dcodage.
81
Chapitre 3 : valuation de modles par une approche markovienne
Multiplicateurs :
tats de Gibbs :
K
!
1 X
f (x) = exp k xk , x [1, 8]. (3.22)
Z k=1
Constante de normalisation :
Z K
!
1000 X
Z= exp k xk dx. (3.24)
0 k=1
les ai tant les niveaux de contraintes intervenant dans le calcul des moments dordre K.
Exemple
Prenons le cas dune variable X dans R. Nous voulons utiliser les trois premiers moments :
82
3.5 Modle de synthse
Z
1
a1 = xexp(1 x + 2 x2 + 3 x3 )dx
Z x
Z
1
a2 = x2 exp(1 x + 2 x2 + 3 x3 )dx (3.28)
Z x
Z
1
a3 = x3 exp(1 x + 2 x2 + 3 x3 )dx.
Z x
Z est la constante de normalisation dfinie comme suit :
Z K
!
X
Z= exp k x k
dx. (3.29)
x k=1
Nous calculons les moments successifs sur les donnes du modle de synthse. Nous utilisons
le logiciel SCILAB pour rsoudre les quations non linaires du PME. Les algorithmes de
calcul bass sur la mthode hybride de Powell [65] et [132]. Pour optimiser ce calcul, nous
valuons la matrice Jacobienne (voir C, p. 153). Lalgorithme sarrte lorsquil a atteint un
niveau de prcision prdfini.
Nous raliserons ensuite un test dadquation (Kolmogorov-Smirnov par exemple), afin
dvaluer les diffrences entre les frquences empiriques et les frquences estimes par ces
diffrents modles.
Rsultats attendus
Diffrents critres de pertinence nous ont dj fourni des rsultats en adquation avec
ceux de [179] : lalgorithme dapprentissage Baum-Welch / dcodage Variables Forward ainsi
que la distribution normale sur les observations. Avec cette mthode, nous esprons trouver
une nouvelle adquation entre les donnes issues du modle de synthse et les modles issus
du Principe du Maximum dEntropie.
Exemple de rsolution sous Scilab [149] en utilisant lalgorithme de Powell [132] :
def f (z = f 8(l), z = [(x8 )exp(1 x1 + 2 x2 + 3 x3 + 4 x4 + 5 x5 + 6 x6 + 7 x7 + 8 x8 )
a(1), . . .]
y = a.exp(b.x). (3.30)
83
Chapitre 3 : valuation de modles par une approche markovienne
Solutions trouves laide de Scilab (voir graphes 3.13(a), p. 85, 3.13(b), p. 85 et 3.13(c),
p. 85).
Modle de la distribution des symboles pour ltat S2 :
84
3.5 Modle de synthse
0.4
0.4
Densit empirique tat S2 Densit empirique tat S3
Modle moindres carrs Modle moindres carrs
0.3
0.3
densit
densit
0.2
0.2
0.1
0.1
0.0
0.0
AU RM OBS TEP SEC RAN NET VEP RAS SEC TEP RAN NET RM OBS VEP RAS AU
symboles symboles
0.2
0.1
0.0
symboles
(c) tat S4
85
Chapitre 3 : valuation de modles par une approche markovienne
3.6 Conclusion
Notre approche permet de modliser des niveaux de dgradation dun processus quel-
conque. Nous bnficions ainsi de toutes les proprits relatives la thorie de Markov :
le processus de Markov qui impose un chantillonnage rgulier ;
les chanes de Markov pour des processus temps discrets ;
les MMC pour la modlisation dun processus sous la forme dautomates.
Nous avons ainsi tudi trois modles dautomates diffrents. Ils modlisent sur quatre ni-
veaux les tats de dgradation dun processus (S1, S2, S3 et S4). Leurs topologies diffrent
uniquement sur les transitions permises entre tats (forage de la topologie) ; le choix de ces
transitions tant dj tudi dans Vrignat [177].
Nous avons dcompos nos attentes thoriques selon trois axes principaux : tudier la
pertinence des observations ou symboles sans connaissance a priori sur les rsultats, faire
voluer la modlisation (i.e. dterminer les lments des modles qui vont nous permettre
doptimiser nos MMC) et enfin dterminer la pertinence des architectures des modles. Cette
dernire nous donnera des indicateurs sur la meilleure topologie, le meilleur algorithme dap-
prentissage et de dcodage et la meilleure distribution des observations synthtiques.
Nous avons introduit galement un modle de simulation que nous appelons modle de
synthse. Nous avons montr le comportement stochastique de ce modle de synthse. Celui-
ci nous a permis de gnrer des squences dobservations parfaitement dfinis entre niveau
de dgradation et symboles observs. Le choix de la topologie utilise pour la production des
symboles ainsi que la matrice de transition A ont t dmontrs dans Vrignat [177]. Nous
prsentons nos rsultats dans le chapitre suivant.
86
Chapitre 4
Exprimentations et rsultats
87
Chapitre 4 : Exprimentations et rsultats
88
4.1 Rsultats de simulation
Nous donnons dans ce chapitre, les rsultats issus de notre modle de simulation re-
prsentant le fonctionnement dune GMAO industrielle. Nous prsentons dans un premier
temps les caractristiques de ce modle, puis des rsultats sur les trois points suivants : la
pertinence des observations, la pertinence de larchitecture des diffrents modles utiliss et
lvolution de la modlisation afin den amliorer son architecture. Nous ralisons ensuite
deux tudes exprimentales, issues de cas concrets de processus industriel. Nous dbutons
par une prsentation de ces environnements exprimentaux. Nous prsentons ensuite nos r-
sultats sur les trois points prcdemment cits. Nous terminons en donnant des perspectives
damliorations possibles pour la modlisation.
MMC 2
Production de symboles Production de symboles
1 : SEC
2 : DEP
3
4
5
:
:
:
NET
OBS
...
5
1 2 3
S1 1 S2 2 S3 3 S4
6
RUN
!
Fig 4.1 Modle de Markov cach 4 tats, topologie 2, rfrence du modle de synthse.
Nombre dtats
Nous avons choisi dutiliser un modle 4 tats nots S1, S2, S3 et S4 sur la Figure 4.1,
p. 89. Nous retrouvons ces 4 niveaux dalerte dans dautres champs disciplinaires comme le
plan canicule ou vigipirate.
Des tests ont t effectus dans [177] avec 5 tats et plus. Lalgorithme de calcul effectue
alors un talement des probabilits et le modle ne permet plus davoir des tats significatifs.
La dcision de lexpert savrerait alors plus dlicate trancher. A linverse, avec 3 tats,
ltat mdian serait trop rapidement atteint ne permettant pas ainsi lexpert de ragir
efficacement.
Le sens que nous pouvons attribuer chacun des tats est le suivant :
89
Chapitre 4 : Exprimentations et rsultats
Nombre de symboles
Les symboles correspondent aux observations lies au systme modliser i.e. ce que lon
veut ou que lon peut observer. Il faut que ces observations soient significatives a priori. Nous
avons choisi ici un alphabet de 10 symboles (les symboles mis reprsentent des interventions
de maintenance, voir la codification Tableau 3.1, p. 70). Ce nombre est dtermin en fonction
du processus que lon veut modliser et dpend de la politique de maintenance de lentreprise
(une autre tude de cas nous a amen considrer plus de 20 symboles).
et , t 0,
(t; ) = (4.1)
0 , t < 0.
R(t) = et . (4.2)
90
4.1 Rsultats de simulation
Tableau 4.1 Mesure de lentropie, donnes issues du modle de synthse, loi normale.
Tableau 4.2 Mesure de lentropie, donnes issues du modle de synthse, loi uniforme.
RAS, NET, VEP, RAN, OBS, AU, SEC, RM pour la distribution normale,
VEP, NET, RAN, OBS, RM, TEP, RAS, AU pour la distribution uniforme.
91
Chapitre 4 : Exprimentations et rsultats
Ces squences sont obtenues en utilisant lalgorithme dlimination successive des sym-
boles (voir A.5, p. 146).
Algorithmes dapprentissage
La courbe en noire, Figure 4.4, p. 94, correspond lvolution de lentropie de Shannon
sur le modle de synthse en utilisant la topologie 2. Nous avons trouv les mmes genres de
courbes pour les topologies 1 et 3. Les courbes continues sont obtenues partir des donnes
issues de la loi normale et celles en pointills, partir de la loi uniforme.
92
4.1 Rsultats de simulation
0.8
max pour 152 symboles
0.4
0.2
Nombre de symboles
Fig 4.2 Nombre minimal de donnes par entropie de Shannon. Les donnes sont issues du
modle de synthse.
Le but de cette partie tait de trouver une quantit minimale de donnes pour estimer
correctement un modle. En dautres termes : existe-t-il une valeur limite (L) de lentropie
vers laquelle celle-ci converge ? Une telle convergence nous permettra de conclure quun
nombre fini de symboles permettra une modlisation optimale. Cette limite est dfinie par
la limite de la fonction dentropie H lorsque S tend vers + :
93
Chapitre 4 : Exprimentations et rsultats
Modle de
synthse
Modle de
Markov Cach
(Rfrence)
valuation valuation
de lentropie : de lentropie :
(Symb_U ,Etat_U ) (Symb_N ,Etat_N )
valuation du nombre
minimal de donnes
MMC2_Normale MMC2_Uniforme
BW2_Normale BW2_Uniforme
SK2_Normale SK2_Uniforme
0.8
Evolution de lentropie
0.6
0.4
0.2
0.0
Nombre de symboles
Fig 4.4 Nombre minimal de donnes par entropie de Shannon en utilisant les 2 algorithmes
dapprentissage.
94
4.1 Rsultats de simulation
Modle de
Synthse
Modle de
Markov Cach
(Rfrence)
Fig 4.5 valuation du nombre minimal de donnes pour une utilisation optimale des algo-
rithmes dapprentissage.
95
Chapitre 4 : Exprimentations et rsultats
4 4 0 4
3 3 3 3
0 2 2 2 2 0
Stop
1 1
Futurs tats
Estimation de dgradation du systme (tats cachs) (estims)
temps
maintenant
Fig 4.6 La fentre glissante en rouge contient un nombre minimal de symboles. Lentropie
est maximale pour ce nombre de symboles.
les rsultats sont donns Figure 4.7, p. 97. Une fois la phase de transition termine,
lentropie (en noire) reste infrieure celle du modle de synthse (en rouge). Nous
observons galement quune fois lapprentissage de la premire squence termine, len-
tropie rentre dans une phase asymptotique , identique la progression de lentropie
du modle de synthse.
96
4.1 Rsultats de simulation
0.4
0.2
Squence 1
0.0
Squence n
Nombre de symboles
Fig 4.7 volution de lentropie value avec une fentre glissante norme (200 symboles).
Les donnes dapprentissage sont issues du modle de synthse en utilisant la distribution
normale.
97
Chapitre 4 : Exprimentations et rsultats
Discussion
La fentre glissante (voir Figure 4.6) contient le nombre minimal de symboles trouvs
partir de la Figure 4.2, p. 93, o lentropie est maximale. Tous les symboles lintrieur
de cette fentre permettraient de raliser rgulirement une estimation des modles. Ainsi,
dans une phase dexploitation des indicateurs de niveaux de dgradation, les actions enga-
ges vont modifier le comportement du systme (notre but est de repousser la panne).
Les vnements qui ont permis dapprendre les modles ne seront donc plus limage du
nouveau comportement. Nous cherchons alors quel moment sera-t-il pertinent de rajuster
les modles.
Entropie de Shannon
Sans connaissance a priori, nous calculons les entropies des diffrentes architectures tu-
dies. Lentropie de la Topologie 2, MMC 2 (voir Figure 4.17(b), p. 109) est significati-
vement plus leve que celles des autres topologies avec la distribution normale et avec
lalgorithme dapprentissage Baum-Welch dcodage variable Forward (voir Figure 4.8,
p. 99). Les rsultats quantitatifs sont donns dans le Tableau 4.3, p 98.
Maximum de vraisemblance
Les rsultats du Tableau 4.4, p. 99 montrent un minimum pour la topologie 2 avec la
distribution normale.
98
4.1 Rsultats de simulation
Symboles gnrs par le MMC rfrence Symboles gnrs par le MMC rfrence
1.4
1.4
meilleure entropie
meilleure entropie
Entropie moyenne tats / symboles
1.2
1.0
1.0
0.8
0.8
BaumWelch, avec filtre entropique BaumWelch, avec filtre entropique
Segmental Kmeans, avec filtre entropique Segmental Kmeans, avec filtre entropique
0.6
0.6
BaumWelch, sans filtre entropique BaumWelch, sans filtre entropique
Segmental Kmeans, sans filtre entropique
Segmental Kmeans, sans filtre entropique
Fig 4.8 Mesure de lentropie de Shannon des donnes issues du modle de synthse. Fi-
gure 4.8(a) pour la distribution uniforme et Figure 4.8(b) pour la distribution normale.
Le graphe de la Figure 4.9, p 100 montre que la topologie 2 est la plus pertinente en terme
de vraisemblance, pour les 2 algorithmes dapprentissage et pour les 2 distributions tudies.
Malheureusement, concernant la distribution normale, les valeurs de la log-vraisemblance
sont trop proches pour dterminer le meilleur algorithme dapprentissage.
99
Chapitre 4 : Exprimentations et rsultats
800
Apprentissage BaumWelch, loi gaussienne
Apprentissage Segmental Kmeans, loi gaussienne
Apprentissage BaumWelch, loi uniforme
1000
Apprentissage Segmental Kmeans, loi uniforme
1200
Logvraisemblance
1400
1600
1800
2000
3500
0.6
Critre AIC
Critre BIC
3000
0.4
0.2
2500
0.0
BaumWelch, loi gaussienne
2000
Fig 4.10 Ces graphes nous montrent que la topologie 2 est la plus pertinente au vu du
critre dAIC et de BIC, pour les 2 algorithmes dapprentissage et pour les 2 distributions
tudies.
Nous arrivons la mme conclusion que celle du critre de log-vraisemblance, nonobstant
que pour le critre de log-vraisemblance et dAIC, il sagit dun minimum et que pour le
100
4.1 Rsultats de simulation
critre de BIC, il sagit dun maximum (voir Figure 4.10(b), p. 100). En effet, les plus fortes
valeurs du critre de BIC (malgr le terme de pnalit plus important) sont obtenues pour
la topologie 2 (voir Tableau 4.5, p. 101).
101
Chapitre 4 : Exprimentations et rsultats
Tests statistiques
Nous avons ensuite appliqu diffrents tests statistiques sur les 3 topologies tudies (pr-
sentes Figure 3.5, p. 71). Les tests de Kolmogorov-Smirnov et Aspin-Welch sont utiliss pour
valuer si deux distributions sont quivalentes. Notre but est ici de dterminer les meilleurs
lments de larchitecture de nos modles. La Figure 4.11(b), p. 102 nous montre les rsultats
du test Kolmogorov-Smirnov. Ce test dadquation obtient la plus petite p-value pour les
simulations suivantes :
topologie 2 ;
distribution normale ;
Nous prsentons Figure 4.11(a), p. 102 les rsultats du test dAspin-Welch. Nous obte-
nons les mmes conclusions que pour le test de Kolmogorov-Smirnov (Figure 4.11(b)). Les
deux tests nous donnent ainsi les architectures les plus pertinentes de nos modles.Les tests
de Kolmogorov-Smirnov ainsi que celui dAspin-Welch dterminent si deux ensembles de
donnes sont trs diffrents. Un autre avantage de ce test est de ne pas faire dhypothses
sur la distribution des donnes. Il est moins sensible que le test dAspin-Welch et il est conu
pour tre utilis sur des chantillons avec variances diffrentes, ce qui est le cas ici.
0.6
30
0.4
20
0.3
15
0.2
10
0.1
5
B.W. MMC1 S.K. MMC1 B.W. MMC2 S.K. MMC2 B.W. MMC3 S.K. MMC3 B.W. MMC1 S.K. MMC1 B.W. MMC2 S.K. MMC2 B.W. MMC3 S.K. MMC3
Fig 4.11 Nous testons les diffrentes architectures du modle de synthse laide de tests
statistiques dadquation : le test dAspin-Welch Figure 4.11(a) et celui de Kolmogorov-
Smirnov Figure 4.11(b).
102
4.1 Rsultats de simulation
Incertitudes pistmiques
La plus petite incertitude pistmique est obtenue pour la topologie 2 avec lalgorithme
dapprentissage Baum-Welch dcod par variable Forward, en utilisant la distribution
normale, voir Figure 4.12, p. 103.
0.020
0.015
Incertitudes sur la moyenne
0.010
0.005
Fig 4.12 Le calcul de lincertitude sur la moyenne est reprsentatif de lerreur pistmique
dans la phase de modlisation.
Nous calculons les incertitudes moyennes (voir 2.3.4, p. 35) sur les diffrentes topolo-
gies, diffrents algorithmes dapprentissage et diffrentes distributions. Nous observons Fi-
gure 4.12, p. 103 que la plus faible incertitude est de 0.6%. Elle est obtenue sur la topologie
2. Nous pouvons conclure que cette topologie nous donne des rsultats plus prcis que pour
les autres topologies 1 et 3 (Figures 3.5(a), p. 71 et 3.5(c), p. 71), en terme de conception
de modle. Concernant les algorithmes dapprentissage des modles, Baum-Welch / d-
codage Variables Forward nous donne les rsultats ayant le plus faible taux derreur.
Les rsultats nous montrent aussi que la distribution Normale nous donne la plus faible
incertitude. Le lecteur trouvera les rsultats quantitatifs dans le Tableau 4.6, p. 104.
Discussion
Nous avons mesur la pertinence des architectures des modles tudis, sans connais-
sance a priori. Nous avons utilis une batterie de tests pour tenter dvaluer les topologies,
les algorithmes dapprentissage et de dcodage, ainsi que les distributions utilises pour la
modlisation. Lentropie de Shannon, le maximum de vraisemblance, AIC, BIC, les tests
statistiques ainsi que lincertitude pistmique nous indiquent que la topologie 2 est la plus
pertinente. Nous retrouvons bien la topologie ayant servi simuler les donnes (modle de
rfrence bas sur la topologie 2).
En ce qui concerne les algorithmes dapprentissage et de dcodage, les rsultats nous
donnent Baum-Welch dcod par Variables Forward comme le plus pertinent. Seuls
103
Chapitre 4 : Exprimentations et rsultats
La distribution normale apparait comme la plus pertinente avec toutes les mthodes
utilises. En accord avec le second principe (voir 2.4.3, p. 42), nous nous attendions
trouver une meilleure entropie pour la distribution uniforme. Ce rsultat est probablement
d aux valeurs extrmes de la distribution normale comme le montre Payaro dans [127].
Topologie 1
MMC 1
Production de symboles Production de symboles
1 : SEC
2 : DEP 4 5
3
4
5
:
:
:
NET
OBS
... 4 5
1 2 3
S1 1 S2 2 S3 3 S4
6
6 RUN
!
Fig 4.13 Modle de Markov Cach, topologie 1.
104
4.1 Rsultats de simulation
Nous utilisons dans un premier temps la topologie 1 (Figure 4.13, p. 104) pour la produc-
tion des couples (Symboles, Etats) en utilisant la loi normale. Nous prsentons Figure 4.14,
p. 105, les rsultats de lentropie de Shannon. Ces rsultats corroborent le fait que la topologie
utilise pour la modlisation se retrouve bien comme tant la plus pertinente.
1.4
meilleure entropie
Entropie moyenne tats / symboles
1.2
1.0
0.8
Topologie 3
MMC 3
Production de symboles Production de symboles
1 : SEC
2 : DEP
3
4
5
:
:
:
NET
OBS
...
5
1 2 3
S1 S2 2 S3 3 S4
6
RUN
!
Fig 4.15 Modle de Markov Cach, topologie 3.
Dans un deuxime temps, nous utilisons la topologie 3 (Figure 4.15, p. 105) pour la
production des couples (Symboles, Etats). Nous obtenons les mmes conclusions que prc-
demment : la topologie 3 est la plus pertinente (voir Figure 4.16, p. 106).
105
Chapitre 4 : Exprimentations et rsultats
Conclusion
Pour toutes les topologies tudies, nous retrouvons bien la topologie de rfrence comme
la plus pertinente lorsquelle est utilise dans le modle de synthse. Nous pouvons donc en
conclure que nos mthodes de mesures de pertinence redonnent bien la topologie ayant servi
construire le modle.
1.4
meilleure entropie
Entropie moyenne tats / symboles
1.2
1.0
0.8
106
4.2 Rsultats des tudes relles
107
Chapitre 4 : Exprimentations et rsultats
minimiser. Ltude de Vrignat [178] considre deux modles diffrents avec deux corpus
dapprentissage, lun sur lanne 2005 et lautre sur les deux annes 20052006. Les symboles
RAS sont insrs pour avoir un chantillonnage la journe ou toutes les 6 heures. Pour la
suite nous adopterons les dnominations suivantes :
05M1 | 1j : Corpus dapprentissage 2005 modle 1 (topologie 1) / 1 donne par jour ;
0506M1 | 1j : Corpus 20052006 modle 1 (topologie 1) / 1 donne par jour ;
05M2 | 1j : Corpus 2005 modle 2 (topologie 2) / 1 donne par jour ;
0506M2 | 1j : Corpus 20052006 modle 2 (topologie 2) / 1 donne par jour ;
05M1 | 6h : Corpus 2005 modle 1 (topologie 1) / 1 donne toutes les 6 heures ;
0506M1 | 6h : Corpus 20052006 modle 1 (topologie 1) / 1 donne toutes les 6 heures ;
05M2 | 6h : Corpus 2005 modle 2 (topologie 2) / 1 donne toutes les 6 heures ;
0506M2 | 6h : Corpus 20052006 modle 2 (topologie 2) / 1 donne toutes les 6 heures.
Etat du processus
MARCHE
ARRET
NObs. Symboles Nature des interventions
1 DEP (Dpannage / arrt de la production)
2 RM (Rglage Machine)
3 AU (Autre)
4 OBS (Observation)
5 TEP (Travaux Entretien Prventif)
6 SEC (Scurit)
7 RAN (Remise A Niveau / planifi)
8 NET (Nettoyage Machine)
9 VEP (Visite Entretien Prventif)
10 RAS (pas dintervention)
La topologie 3 na pas t teste car elle napportait rien par rapport la topologie
2. En effet, la seule diffrence avec la topologie 2 concerne la transition entre S1 et S2.
Ltat S1 devient alors un tat absorbant. Nous considrons empiriquement, que le modle
redmarre dans tous les cas en S4 et non en S2. Cette transition na de sens quen termes
dapprentissage.
108
4.2 Rsultats des tudes relles
MMC 1 MMC 2
Production de symboles Production de symboles Production de symboles Production de symboles
1 : SEC 1 : SEC
2 : DEP 4 5 2 : DEP
3
4
5
:
:
:
NET
OBS
... 4 5 3
4
5
:
:
:
NET
OBS
...
5
1 2 3 1 2 3
S1 1 S2 2 S3 3 S4 S1 1 S2 2 S3 3 S4
6 6
6 RUN RUN
! !
(a) Topologie 1 (b) Topologie 2
MMC 3
Production de symboles Production de symboles
1 : SEC
2 : DEP
3
4
5
:
:
:
NET
OBS
...
5
1 2 3
S1 S2 2 S3 3 S4
6
RUN
!
(c) Topologie 3
quatre tats sont donnes par la variable Forward et les diffrents niveaux par lalgorithme
de Viterbi. Nous utilisons les donnes issues de ltude de Vrignat [178]. Nous obtenons ainsi
les niveaux de dgradation probables du processus tudi, sur une chelle de 1 4.
Les squences de symboles ainsi produites, nous donnent selon le modle, une estima-
tion du niveau de dgradation du processus (voir Figure 4.18, p. 110). Nous pouvons alors
quantifier ces informations au moyen de diffrents critres et ainsi tablir une valuation des
modles, selon ces critres.
109
Chapitre 4 : Exprimentations et rsultats
Maximum dentropie
Les entropies de chaque symbole (chane de Markov dordre 1) sont calcules par rapport
aux tats S1, S2, S3 et S4 des modles de Markov prsents au 4.2.3, p. 108. Nous tablis-
sons ainsi les entropies pour chaque symbole, en fonctions de tous les tats du modle. Nous
prsentons dans le Tableau 4.11, p. 111, un exemple de rsultat pour 9 squences de dgra-
dations issues du modle de topologie 2 (MMC2 Figure 4.17(b), p. 109). Ce tableau nous
montre que le symbole RAS obtient une entropie maximale de 1,418. Ceci prouve que
ce symbole est le plus utilis dans tous les tats du systme. Nous remarquons aussi que le
symbole DEP a une entropie nulle. Ce symbole est donc totalement discrimin i.e. ltat
S1 correspond toujours lmission du symbole DEP et uniquement ce symbole. Comme
pour le modle de synthse, nous utilisons la notion de filtre entropique vu au 2.4.3, p. 42
pour liminer les symboles ayant une entropie nulle et ceux ayant une entropie maximale.
Nous liminons ainsi les deux symboles DEP et RAS pour les calculs avec ce filtre. Le
symbole RAS est utilis notamment pour combler les champs non renseigns de la base
de donnes. Il permet galement davoir un chantillonnage rgulier ncessaire la thorie
markovienne. Le symbole DEP est totalement discrimin, ces deux symboles napportent
aucune autre information sur la pertinence des observations.
Une fois les symboles prcdents limins du processus dvaluation, nous pouvons tablir
un classement des symboles les plus pertinents par ordre dentropie dcroissante. Ainsi, si lon
classe les symboles du plus pertinent au moins pertinent, nous obtenons la squence suivante :
110
4.2 Rsultats des tudes relles
Cette squence est obtenue en utilisant lalgorithme dlimination successive des symboles
(voir A.5, p. 146).
Tableau 4.11 Mesure de lentropie, donnes empiriques, valuation modle MMC 2 dcodage
Viterbi.
tats
Codage symbolique S1 S2 S3 S4 Total Entropie
AU AU 2 2 0,174
AU DEP 2 2 0,482
OBS VEP 1 1 0,176
RAN RAN 2 2 0,174
RAN RAS 1 1 0,105
RAS AU 3 3 0,229
RAS DEP 5 5 0,471
RAS OBS 1 1 0,176
RAS RAS 2 3 21 26 1,309
RAS SEC 1 2 3 0,350
RAS TEP 1 1 0,105
.. .. ..
. . .
VEP VEP 8 1 9 0,819
Tableau 4.12 Entropie pour les chanes de Markov dordre 2, donnes empiriques, valuation
modle MMC 2 dcodage Viterbi.
111
Chapitre 4 : Exprimentations et rsultats
tats
Codage symbolique S1 S2 S3 S4 Total Entropie
AU AU OBS 1 1 0,107
AU AU RAS 1 1 0,107
AU DEP RAS 2 2 0,176
RAS DEP SEC 1 1 0,107
RAS OBS VEP 1 1 0,176
RAS RAS AU 1 1 0,107
RAS RAS DEP 5 5 0,471
RAS RAS OBS 1 1 0,176
RAS RAS RAS 1 1 13 15 0,969
RAS RAS SEC 2 2 0,176
RAS RAS VEP 2 2 0,176
RAS SEC AU 1 1 0,107
.. .. .. ..
. . . .
VEP VEP DEP 1 1 0,352
VEP VEP RAS 1 1 2 0,475
VEP VEP RM 2 2 0,431
VEP VEP TEP 1 1 0,299
VEP VEP VEP 1 1 2 0,475
Tableau 4.13 Entropie pour les chanes de Markov dordre 3, donnes empiriques, valuation
modle MMC 2 dcodage Viterbi.
tats
Codage symbolique S1 S2 S3 S4 Total Entropie
AU AU OBS OBS 1 1 0,108
AU OBS OBS RAS 1 1 0,108
AU RAS RAS RAS 1 1 0,108
AU RAS VEP VEP 1 1 0,176
AU TEP TEP DEP 1 1 0,352
DEP AU AU OBS 1 1 0,108
DEP RAN RAN RAN 1 1 0,108
DEP RAS AU AU 1 1 0,108
DEP RAS AU RAS 1 1 0,108
DEP RAS RAS AU 1 1 0,108
DEP RAS RAS RAS 2 2 0,178
DEP SEC RAS RAS 1 1 0,108
OBS OBS RAS TEP 1 1 0,108
OBS RAS TEP TEP 1 1 0,176
OBS VEP VEP DEP 1 1 0,352
RAS RAS DEP RAS 2 2 0,178
RAS RAS DEP SEC 1 1 0,108
RAS RAS OBS VEP 1 1 0,176
RAS RAS RAS DEP 2 2 0,482
RAS RAS RAS OBS 1 1 0,176
RAS RAS RAS RAS 1 8 9 0,711
RAS RAS RAS SEC 2 2 0,178
RAS RAS RAS VEP 1 1 0,108
. . . . .
. . . . .
. . . . .
VEP VEP TEP TEP 1 1 0,176
VEP VEP VEP RAS 1 1 0,299
VEP VEP VEP VEP 1 1 0,176
Tableau 4.14 Entropie pour les chanes de Markov dordre 4, donnes empiriques, valuation
modle MMC 2 dcodage Viterbi.
112
4.2 Rsultats des tudes relles
Nous tentons ensuite de calculer de nouveau les entropies de toutes les chanes de Markov
possibles dordre > 1. Nous utilisons les mmes donnes que pour le calcul prcdent pour
lordre 1. Les extraits des rsultats sont donns dans les Tableaux 4.12, p. 111 ; 4.13, p. 112
et 4.14, p. 112.
Les rsultats nous donnent les squences de symboles donnant le plus dinformation selon
le principe du maximum dentropie. Soit une entropie de 1,309 pour la squence RAS -
RAS dordre 2, 0,969 pour la squence RAS - RAS - RAS lordre 3 et 0,711
pour la squence RAS - RAS - RAS - RAS , dordre 4.
Nous avons ensuite recommenc les calculs dentropie en liminant les squences prc-
dentes pour chaque ordre (avec le filtre entropique). Le calcul est effectu indpendamment
du passage dun tat un autre. Malheureusement, ces diffrents ordres nont pas donn de
rsultats significatifs. Il y a trop de valeurs identiques pour en tirer des conclusions intres-
santes.
Nanmoins, si nous nous concentrons sur les observations prcdentes, une situation de
dpannage (i.e. des squences de 4 symboles se terminant par le symbole DEP), nous obte-
nons des rsultats trs intressants pour le cas dune chane de Markov dordre 4. En effet,
si nous calculons de nouveau lentropie aprs passage dans le filtre entropique, nous obte-
nons des entropies maximales pour les squences particulires de symboles. Ces squences
sont illustres dans le Tableau 4.15, p. 113. Nous observons des entropies maximales pour
certaines squences rcurrentes de 4 symboles se terminant par le symbole DEP. Un extrait
des rsultats du 4me ordre est donn dans le Tableau 4.14, p 112.
Tableau 4.15 Squences de symboles (ordre 4) ayant une entropie maximale, aprs passage
dans le filtre entropique.
Nous observons que le symbole DEP apparait uniquement dans toutes les squences
o lentropie est maximale. Nous pouvons en conclure que ces signatures particulires de 3
symboles, induisent un tat darrt de production (DEP = dpannage), soit un tat S1 de
lautomate considr. Certaines squences pourraient nous donner une indication de lordre
des oprations ne pas faire pour ne pas tre dans une situation critique. Une squence
AU - TEP - TEP , OBS - VEP - VEP ou VEP - VEP - AU , peut nous
amener cette situation critique. Daprs lhypothse de Markov prsente au paragraphe
3.4.2 p. 68, la connaissance des 3 tats prcdents peut en effet nous renseigner sur ltat
suivant. En effet, plusieurs actions prventives ( TEP, VEP ) indiquent que le service
maintenance avait pressentis la panne imminente.
113
Chapitre 4 : Exprimentations et rsultats
Nous avons ralis des calculs dindpendance entre les diffrentes variables tudies (sym-
boles et tats). Nous utilisons linformation mutuelle vue au 2.4.3, p. 45. Le Tableau 4.16,
p. 114 prsente ce test dindpendance entre chaque symbole. Les symboles indpendants
ont une information mutuelle nulle. On trouve ainsi que les symboles RM, OBS, TEP et
VEP sont indpendants les uns aux autres. Pour les autres valeurs diffrentes de 0, nous
pouvons conclure dune certaine dpendance entre les symboles. Par exemple, le symbole
AU est en partie dpendant des symboles RAS, TEP et VEP, avec une valeur > 0, 5. Les
valeurs NC sont non calculables (division par zro).
Tableau 4.16 Information mutuelle pour les chanes de Markov dordre 1, donnes empi-
riques, valuation modle MMC 2 dcodage Viterbi.
Nous avons ensuite effectu des tests de dpendance entre tats et symboles. Des ex-
traits des rsultats sont prsents Tableau 4.17, p. 115. Ce tableau ne donne aucun rsultat
exploitable.
Pour terminer, nous avons tent de trouver dautres inter-dpendances entre des s-
quences de symboles. Nous avons ralis les mmes calculs que prcdemment en utilisant
les chanes de Markov dordre 2 4. Nous navons pas prsent ces rsultats car le nombre
de donnes des tableaux de contingence est assez consquent : 6400 pour lordre 2, 18000
pour lordre 3, 33200 pour lordre 4.
Malheureusement, nous navons trouv aucune conclusion pertinente pour ces informations
mutuelles calcules partir des chanes de Markov dordre > 1. Aucune dpendance ou
indpendance entre les 2-uplets, 3-uplets et 4-uplets nont pu tre mises en vidence.
Dans ce paragraphe, nous mettons en uvre les deux approches dapprentissage vues au
2.4.4, p. 48 : larbre de dcision associ la mthode ID3 (voir lalgorithme en annexe
A.1, p. 141) et la gnralisation avec l espace de versions :
larbre de dcision sur des chanes de Markov de diffrents ordres est construit en utili-
sant les proprits de lentropie. Il permet didentifier le symbole ou la suite de symboles
comme tant dclencheur dun tat particulier du systme (o lentropie est minimale) ;
114
4.2 Rsultats des tudes relles
tats tats
05M1-1J S1 S2 S3 S4 05M1-6H S1 S2 S3 S4
AU 0,019 0,065 0,012 AU 0,144
DEP 0,424 DEP 0,233
OBS 0,018 OBS 0,001 0,010
RAN 0,083 0,036 RAS 0,339 0,747 0,018
RAS 0,174 0,038 0,062 RM 0,033 0,031
RM 0,024 SEC 0,006 0,014
SEC 0,035 0,009 TEP 0,001 0,117
TEP 0,072 VEP 0,014 0,037
VEP 0,097
0506M1-1J S1 S2 S3 S4 0506M1-6H S1 S2 S3 S4
AU 0,023 0,063 0,010 AU 0,011 0,004 0,002
DEP 0,424 DEP 0,233
OBS 0,004 0,022 0,022 OBS 0,002 0,010
RAN 0,032 0,076 RAS 0,344 0,040
RAS 0,203 0,035 0,048 RM 0,003 0,021
RM 0,011 0,017 0,016 SEC 0,004 0,027
SEC 0,041 0,007 TEP 0,001 0,117
TEP 0,085 VEP 0,006 0,111
VEP 0,113
05M2-1J S1 S2 S3 S4 05M2-6H S1 S2 S3 S4
AU 0,095 AU 0,005 0,006 0,006
DEP 0,424 DEP 0,233
OBS 0,010 0,020 OBS 0,002
RAN 0,036 RAS 0,159 0,009 0,009
RAS 0,011 0,023 0,347 RM 0,003
RM 0,018 0,108 SEC 0,005
SEC 0,020 0,011 0,038 TEP 0,009
TEP 0,109 0,058 0,013 VEP 0,012
VEP 0,223 0,005 0,014
0506M2-1J S1 S2 S3 S4 0506M2-6H S1 S2 S3 S4
AU 0,014 AU 0,004 0,006
DEP 0,424 DEP 0,233
OBS 0,005 OBS 0,001
RAN 0,005 RAS 0,109 0,007
RAS 0,073 RM 0,002
RM 0,007 SEC 0,003
SEC 0,012 TEP 0,006
TEP 0,021 VEP 0,008
VEP 0,028
Tableau 4.17 Information mutuelle pour les chanes de Markov dordre 1 - Modle MMC 2
115
Chapitre 4 : Exprimentations et rsultats
Nous avons ralis des arbres de dcision partir des diffrents corpus dapprentissage.
Nous utilisons les 3 modles tudis, pour des chanes de Markov dordre 1 4. Au del
de lordre 4, les donnes sont dilues et les rsultats ne prsentent que peu dintrt. En
effet, la probabilit de retrouver plusieurs fois une mme srie de 5 symboles sur lensemble
des donnes est trs faible. Nous dtaillons les calculs jusqu lordre 3 (3-uplets) dans les
tableaux 4.18, p. 116, pour le corpus dapprentissage 20052006 / modle MMC 1 et dans
le Tableau 4.19, p. 117, pour le corpus dapprentissage 20052006 / modle MMC 2. Nous
voyons que plus lordre augmente, plus le nombre de n-uplets dont lentropie est minimale
augmente. De plus, sur le modle MMC 2, les entropies minimales montrent que ltat S2 est
le plus discriminant pour lensemble de ces n-uplets. Contrairement au modle 1, o ltat
S3 est le plus discriminant.
Corpus 2005-2006 Modle 1 Entropie min tats Entropie min Entropie max tats Entropie max
Symboles 1-uplet (ordre 1) DEP S1 VEP S2,S3
Symboles 2-uplet (ordre 2) OBS RAS S2 RAS RAS S2,S4
OBS VEP S2
RAS OBS S2
Symboles 3-uplet (ordre 3) AU AU RAS S2 RAS RAS RAS S2,S4
AU OBS RAS S2
OBS RAS RAS S2
RAS AU AU S2
RAS OBS VEP S2
RAS RAS OBS S2
RAS RM RAS S2
RAS SEC RAS S2
RM RM RAS S2
SEC RAS AU S2
SEC RAS RAS S2
SEC SEC RAS S2
Tableau 4.18 Exemple darbre de dcision pour une chane de Markov dordre 1, 2 et 3 /
Corpus 20052006 Modle MMC 1.
116
4.2 Rsultats des tudes relles
Corpus 2005-2006 Modle 2 Entropie min tats Entropie min Entropie max tats Entropie max
Symboles 1-uplet (ordre 1) DEP S1 AU S3,S4
Symboles 2-uplet (ordre 2) AU OBS S3 DEP AU S4
OBS RAS S3
OBS VEP S3
RAS OBS S3
RM RM S3
RM SEC S3
SEC TEP S3
SEC VEP S3
TEP VEP S3
VEP RM S3
VEP TEP S3
Symboles 3-uplet (ordre 3) AU AU OBS S3 RAS RAS RAS S3
AU AU RAS S3
AU OBS RAS S3
DEP AU AU S3
OBS RAS RAS S3
OBS VEP VEP S3
RAS AU AU S3
RAS OBS VEP S3
RAS RAS OBS S3
RAS RM RAS S3
RAS RM SEC S3
RAS SEC RAS S3
RAS SEC SEC S3
RAS SEC TEP S3
RM RM RAS S3
RM SEC SEC S3
SEC RAS AU S3
SEC RAS RAS S3
SEC SEC RAS S3
SEC SEC VEP S3
SEC TEP TEP S3
SEC VEP VEP S3
TEP TEP VEP S3
TEP VEP VEP S3
VEP RM RM S3
VEP TEP TEP S3
VEP VEP RM S3
VEP VEP TEP S3
Tableau 4.19 Exemple darbre de dcision pour une chane de Markov dordre 1, 2 et 3 /
Corpus 20052006 Modle MMC 2 .
nest pas nulle (1,236) nous ne pouvons donc pas donner de conclusion sur cet tat. Par
ailleurs, nous avons des entropies leves sur les tats S2 et S3. Ces tats sont donc reprsents
par un maximum de symbole (voir dfinition de lentropie 2.4.3, p. 41).
117
Chapitre 4 : Exprimentations et rsultats
tats
Codage symbolique S1 S2 S3 S4 Total Majoritaire Entropie
AU 6 1 1 8 6 0,532
OBS 1 1 2 1 0,247
RAS 182 24 206 182 0,320
RM 2 2 4 2 0,389
SEC 3 3 6 3 0,436
TEP 2 8 10 8 0,597
VEP 5 9 14 9 0,656
Codage symbolique S1 S2 S3 S4 Total Majoritaire Entropie
AU 6 1 1 8 6 0,540
RAS 182 24 206 182 0,314
RM 2 2 4 2 0,399
SEC 3 3 6 3 0,436
TEP 2 8 10 8 0,595
VEP 5 9 14 9 0,651
Codage symbolique S1 S2 S3 S4 Total Majoritaire Entropie
AU 6 1 1 8 6 1,244
RM 2 2 4 2 0,684
SEC 3 3 6 3 0,742
TEP 2 8 10 8 0,881
VEP 5 9 14 9 1,032
Codage symbolique S1 S2 S3 S4 Total Majoritaire Entropie
AU 6 1 1 8 6 1,262
SEC 3 3 6 3 0,764
TEP 2 8 10 8 0,895
VEP 5 9 14 9 1,024
Codage symbolique S1 S2 S3 S4 Total Majoritaire Entropie
AU 6 1 1 8 6 0,746
TEP 2 8 10 8 0,935
VEP 5 9 14 9 1,030
Codage symbolique S1 S2 S3 S4 Total Majoritaire Entropie
TEP 2 8 10 8 1,028
VEP 5 9 14 9 0,832
118
4.2 Rsultats des tudes relles
Discussion
Nous avons appliqu lentropie de Shannon sur les symboles isols, sur les chanes de
Markov dordre 2, 3 et 4 (bigrammes, trigrammes, etc.). Nous avons trouv que le symbole
DEP, ayant une entropie nulle, tait totalement discrimin. Dans le mme ordre dide,
le symbole RAS est reprsentatif de tous les tats S2, S3 et S4 car il possde une entropie
maximale. Nous avons ainsi dcid dliminer ces deux symboles pour la mesure de pertinence
des autres symboles. Nous avons pu ainsi trouver une liste de symboles du plus pertinent
au moins pertinent. Nous avons mis en vidence des squences 3-uplet de symboles donnant
suite au symbole DEP. Ces squences sont donc surveiller car elles ont une probabilit plus
leve de produire une situation de panne.
Les calculs de linformation mutuelle entre les symboles nous ont donn des rsultats de
dpendance entre symboles. Le symbole AU est en partie dpendant des symboles TEP et
VEP. Les symboles RM, OBS, TEP et VEP sont indpendants entre eux.
Les calculs de graphes de gnralisation/spcialisation ou les arbres de dcision ne nous
ont pas permis dobtenir des conclusions exploitables sur la pertinence des observations.
119
Chapitre 4 : Exprimentations et rsultats
Entropie moyenne
chantillonnage Ordre 1 Ordre 2 Ordre 3 Ordre 4
1 jour 0,292 0,112 0,084 0,072
6 heures 0,158 0,074 0,060 0,051
Tableau 4.22 Entropie moyenne des modles de Markov sur les 2 types dchantillonnage.
Le Tableau 4.23, p. 120, prsente les rsultats des mesures dentropies moyennes des
modles avant et aprs le filtre entropique. Nous effectuons un filtrage de niveau 1 i.e. nous
liminons un seul symbole dont lentropie est maximale ainsi que toutes les entropies nulles
au travers de ID3 [135]. Le modle le plus pertinent apparat alors : 0506M1 | 1 jour o
lentropie moyenne est maximale.
chantillonnage Modles Entropie moy sans filtre Entropie moy avec filtre
1 jour 05M1 0,586 0,695
1 jour 0506M1 0,699 0,881
1 jour 05M2 0,698 0,857
1 jour 0506M2 0,268 0,365
6 heures 05M1 0,524 0,741
6 heures 0506M1 0,397 0,828
6 heures 05M2 0,264 0,393
6 heures 0506M2 0,200 0,394
Sur la Figure 4.19 (a), p. 121, nous voyons que le filtre entropique permet de mettre en
valeur un maximum pour le modle 0506M1 sur la base de temps de 1 jour. La Figure 4.19 (b),
p. 121, nous montre de manire beaucoup plus flagrante que le modle 0506M1 sur la base de
temps de 6 heures est le plus pertinent aprs application du filtre entropique. Daprs [178],
cest bien le modle 0506M1 qui fournit les meilleurs rsultats de prdiction de pannes.
120
4.2 Rsultats des tudes relles
1.0
1.0
0.8
0.8
Mesure de l'Entropie
Mesure de l'Entropie
0.6
0.6
0.4
0.4
0.2
05M1 0506M1 05M2 0506M2 05M1 0506M1 05M2 0506M2
Modles Modles
Pour tenter de valider la fentre norme prcdemment trouve, nous avons utilis des
squences de 200 symboles dune GMAO industrielle. Nous avons ensuite rvalu ces sym-
boles en utilisant lalgorithme Baum-Welch avec un dcodage variable Forward. Nous
tudions ainsi de nouveau lentropie, en utilisant cette quantit minimale de symboles pour
des donnes empiriques :
les rsultats sont donns Figure 4.22, p. 123. La courbe en rouge reprsente lentropie
des donnes empiriques et celle en noire, lentropie issue de lapprentissage (prsente
121
Chapitre 4 : Exprimentations et rsultats
Vraisemblance 1 jour
4000
Vraisemblance 6 heures
3000
Log Vraisemblance
2000
1000
Modles
160 observations
0.20
Evolution de l'entropie
0.15
180 observations
0.10
0.05
Presse (2 ans)
Peseuse (2 ans)
0.00
Nombre d'observations
Fig 4.21 Nombre minimal de donnes par entropie de Shannon, donnes issues dune GMAO
industrielle.
122
4.2 Rsultats des tudes relles
ci-dessus) en utilisant une fentre glissante norme de 200 symboles. Nous observons
une phase de transition qui correspond lapprentissage de la premire squence des
symboles. En effet, au fur et mesure que la base de donnes senrichit de nouveaux
symboles, lentropie de la squence augmente. Une fois cette phase termine, lentropie
reste suprieure lentropie issue des donnes empiriques. De plus, elle ne se stabilise
pas et oscille dans lintervalle [0, 12; 0, 27]. Nous remarquons galement une importante
diminution de lentropie entre 500 et 700 symboles. En effet, les squences [400; 600]
comportent beaucoup de symboles RAS (186 sur 200) ce qui engendre un appauvris-
sement en symboles, de la squence dapprentissage.
0.1
Squence 1
0.0
Squence n
0 200 400 600 800 1000 1200 1400 1600 1800 2000
Nombre de symboles
Fig 4.22 volution de lentropie value avec une fentre glissante norme (200 symboles).
Les donnes dapprentissage sont issues dune GMAO industrielle.
Conclusion
Le principe du maximum de vraisemblance nous donne comme modle le plus pertinent :
0506M1 | 6 heures. Les rsultats concernant 0506M1 | 1 jour ne sont pas loquents. Comme
pour lentropie, le principe du maximum de vraisemblance est intressant pour la slection
de modle dans la mesure o le nombre de donnes est suffisamment important.
123
Chapitre 4 : Exprimentations et rsultats
8.0
14
60
7.5
13
55
7.0
12
HQC
AIC
BIC
50
6.5
11
6.0
10
5.5
9
05M1 0506M1 05M2 0506M2 05M1 0506M1 05M2 0506M2 05M1 0506M1 05M2 0506M2
(a) Mesure du critre AIC (b) Mesure du critre BIC (c) Mesure du critre HQC
Nous voyons que les 3 critres nous amnent aux mmes conclusions que prcdemment
pour le modle 0506M1 | 6 heures. Cest donc le plus pertinent au sens des critres AIC,
BIC et HQC. Les rsultats de [178] montrent que ce modle fonctionne. Par contre, il na
pas t retenu car il est trop sensible dans la dtection des pannes. En effet, le passage dun
niveau de dgradation un autre se fait avec plusieurs rebonds.
124
4.2 Rsultats des tudes relles
4.2.7 Conclusion
Nous avons tudi la pertinence des diffrents dcoupages temporels. De la mme faon,
lentropie a t value selon les tats des modles afin de vrifier que le plus pertinent ob-
tient galement un bon score entropique . Nous illustrons ainsi que sans connaissance a
priori, le modle 0506M1 avec un dcoupage temporel de 6 heures est le plus pertinent. Les
autres mthodes dvaluation utilisant le principe de maximum de vraisemblance prsentes
ici, identifient aussi le modle 0506M1 comme le plus pertinent. Par contre, lchantillonnage
de 6 heures est prfr lchantillonnage la journe. Vrignat et al. [180] montrent que le
modle 0506M1 | 6 heures fonctionne mais il est trop ractif (par rapport aux contraintes
fixes dans [180]) et a donc une forte propension dans la prdiction de fausses pannes. Un
sous-chantillonnage apporte une certaine stabilit dans les changements dtats et diminue
donc le risque de converger trop vite dans un tat S1. Ceci engendre alors des rebonds
lors du passage dun tat un autre. La mthode par la mesure de lentropie ragit comme
un filtre anti-rebond et donne comme le plus pertinent le modle prconis par [180]. Par
contre, les mthodes utilisant le principe de maximum de vraisemblance nous dsignent le
125
Chapitre 4 : Exprimentations et rsultats
Dans un deuxime temps, nous avons montr que lon peut trouver une quantit mini-
male de donnes pour estimer correctement un modle. Il faudra valider ce nombre minimal
dobservations avec de nouveaux tests sur le modle de synthse. Ainsi, dans une future phase
dexploitation, nous pourrons donc rvaluer le modle rgulirement. Dans ces conditions,
lexpert pourra bnficier dinformations lui permettant deffectuer une programmation dy-
namique des interventions de maintenance puisque les actions programmes par la mthode
vont modifier le comportement du systme.
Tableau 4.26 Comparaison du modle de synthse, avec les donnes de maintenance pro-
venant dune GMAO dun sous-systme pour lagro-alimentaire (anne 2005-2006).
126
4.3 Comparaison du modle de synthse avec le cas industriel
En effet, les noms des symboles sont affects alatoirement au dpart. Il sagit alors de
raffecter les noms pour amliorer les correspondances avec les donnes empiriques.
Nous donnons Figure 4.25, p. 128 (courbe en pointills rouges), le nouveau modle de
synthse aprs lajustement propos prcdemment. Le coefficient de corrlation savre tre
meilleur aprs ajustement (0,9611). Le modle est donc plus proche des donnes empiriques.
0.15
Donnes Peseuse
Modle de synthse, loi gaussienne
Modle de synthse, loi uniforme
0.10
Densits
0.05
0.00
Symboles
Nous raffectons ainsi chaque action chacun des symboles afin que le modle de synthse
ressemble la situation industrielle. Ce rajustement nous permettra davoir un modle de
synthse plus proche de la ralit de terrain. Si le modle de synthse ressemble la situation
industrielle alors on peut supposer que le systme rel se dgrade comme nous lavons dfini
dans le modle de synthse.
127
Chapitre 4 : Exprimentations et rsultats
0.15
Donnes Peseuse
Modle de synthse, loi gaussienne
Modle de synthse, loi uniforme
Ajustement du Modle de synthse
0.10
Densits
0.05
0.00
Symboles
Fig 4.25 Comparaison du modle de synthse ajust, avec les donnes de maintenance
provenant dune entreprise du secteur de lagro-alimentaire.
128
4.3 Comparaison du modle de synthse avec le cas industriel
Donnes Peseuse
Topologie 1
Topologie 2
Topologie 3
0.10
Densits
0.05
0.00
Symboles
129
Chapitre 4 : Exprimentations et rsultats
4.4 Conclusion
Les tudes sur les squences dobservations les plus pertinentes nous ont donn des s-
quences trs diffrentes entre le modle de simulation et ltude de cas rels. Ce qui parait
normal pour un modle de simulation de type stochastique.
Les rsultats sur la fentre glissante nous amnent aux mmes conclusions pour le modle
de simulation ainsi que pour le cas concret. En effet, nous trouvons une entropie maximale
pour un nombre fini de symboles. Cette fentre permettra destimer en temps rel les modles
sans utiliser lhistorique complet de la base de donnes de lentreprise. Nous pourrions ainsi
faire voluer la modlisation en utilisant dsormais 200 observations pour lestimation des
tats du systme.
Nous avons galement dtermin la pertinence de larchitecture des modles laide
doutils issus de la littrature. Des critres comme lentropie de Shannon, le maximum de
vraisemblance, AIC ou des tests statistiques, ont permis de mesurer la pertinence sur les
topologies, les algorithmes dapprentissage et de dcodage, ainsi que sur les distributions.
Le lecteur trouvera le rsum des rsultats dans le Tableau 4.28, p. 130. La croix ()
indique la meilleure topologie, le meilleur algorithme dapprentissage ou la meilleure distri-
bution, en fonction des critres prsents.
Tableau 4.28 Rsum des rsultats sur les diffrents critres de selection de modles.
Ainsi, la topologie 2 savre tre celle qui donne le meilleur score avec de nombreux cri-
tres ou tests statistiques. Lalgorithme dapprentissage Baum-Welch dcod par Variables
Forward donne les meilleurs rsultats. Enfin, la distribution normale, par rapport la dis-
tribution uniforme est la plus pertinente.
Nous avons ensuite tent dajuster les donnes du modle de synthse afin que celui-
ci puisse sidentifier le mieux possible la situation industrielle. Les donnes issues de la
loi uniforme ne refltant pas la situation relle, nous avons propos des raffectations de
symboles pour le modle utilisant la loi Gaussienne. Cela nous permet de supposer
que le processus industriel se dgrade de la mme manire que le processus de
synthse fond sur la topologie 2.
130
Conclusion gnrale et perspectives
131
Conclusion gnrale et perspectives
132
Conclusion gnrale et perspectives
Conclusion
Nous avons prsent dans un premier temps, les principes gnraux de la maintenance
dans le domaine industriel. En se basant sur des normes, nous avons dfini les objectifs,
les politiques de maintenance ainsi que les diffrentes typologies adoptes dans ce domaine.
Nous avons ensuite introduit les outils de GMAO ainsi que les avancs technologiques r-
centes utilises dans ce secteur de lindustrie. Enfin, nous avons prsent les travaux initis
par Pascal Vrignat dans sa thse [177], sur une modlisation de la maintenance en utilisant
des Modles de Markov Cachs, point de dpart de ce manuscrit. Ces travaux ont montr quil
tait possible de modliser la dgradation dun processus industriel quelconque. Au travers
de cas concrets, il a pu donner lexpert une nouvelle approche de sa gestion de la main-
tenance prventive laide dindicateurs de niveaux de dgradation du processus maintenir.
Dans un second temps, nous avons ralis un tat de lart sur les approches classiques de
mesures de pertinence de modles. Au travers des mthodes danalyse de sensibilit ou des
mthodes de mesures de pertinence de modles dont dispose la littrature, nous avons dfini
une stratgie dutilisation de certaines de ces mthodes dans notre problmatique.
Nous avons ensuite dfini les attentes thoriques de nos travaux, ainsi que plusieurs ap-
proches classiques visant valuer des modles selon une approche Markovienne. Aprs avoir
dfini les diffrents types de modlisation que nous avons choisis, nous avons prsent un mo-
dle de synthse ainsi que les architectures utilises (topologies, algorithmes dapprentissage,
algorithmes de dcodage). Ce dernier nous a permis de comparer les donnes empiriques avec
les donnes simules.
Enfin, les rsultats obtenus nous ont renseigns sur les architectures les plus pertinentes
des MMC tudis. Celles-ci nous ont donn dans un premier temps, les symboles les plus
pertinents ainsi que ceux qui napportent aucune information supplmentaire la construc-
tion dun modle. Nous avons pu trouver dans un second temps, des squences pertinentes
(notamment pour des chanes de Markov dordre 4) annonant une panne probable. Nous
avons ainsi propos un ajustement du modle de synthse (loi Gaussienne), afin quil se
comporte comme celui de la situation industrielle. Cela nous permet alors de supposer que le
processus rel se dgrade comme nous lavons dfini avec ce modle de synthse, amliorant
ainsi les probabilits de prdiction des pannes.
Des tudes sur les caractristiques de la modlisation nous ont montr quune priode
dchantillonnage des observations toutes les 6 heures tait plus pertinente quun chantillon-
nage la journe. Elles nous ont aussi montr que nous pouvions utiliser un nombre minimal
de symboles pour que le modle puisse donner une information la plus pertinente possible.
Ainsi, dans une future phase dexploitation de ces indicateurs de niveaux de dgradation,
cette quantit minimale de donnes nous permettra de rajuster les modles utiliss.
Les tudes sur la pertinence de larchitecture dun modle nous ont permis de choisir
la topologie, les algorithmes dapprentissage et de dcodage ainsi que la distribution des
observations la plus en adquation avec notre problmatique industrielle.
133
Conclusion gnrale et perspectives
optimiser les performances en fonction du risque donn et les stratgies de fiabilit i.e.
tablir une politique de surveillance drastique sur les quipements les plus sensibles
aux risques de dfaillances ;
utiliser des techniques comme l Asset Management pour obtenir lefficacit maxi-
male dun quipement en optimisant toute la chane humaine et matrielle lie cet
quipement.
Notre dmarche tente dapprhender ce pronostic de panne en prsentant des outils de
choix et doptimisation de modlisations markoviennes. Ainsi ces outils pourront aider lex-
pert en fiabilit (qui est devenu de nos jours expert en statistiques), denrichir la panoplie
doutils disponibles.
utilisation dindicateurs de disponibilit par MMC : les quatre niveaux utiliss (S1
S4), nous permettent de visualiser trs facilement la situation de dgradation dun
processus industriel. Lapproche par MMC nous donne accs aux proprits dun pro-
cessus de Markov ainsi qu celles des tats cachs que nous avons dveloppes dans ce
manuscrit ;
134
Conclusion gnrale et perspectives
nous avons ensuite dtermin un chantillonnage optimal pour la gestion des donnes
en maintenance industrielle. Nous avons aussi trouv quun nombre fini de donnes
tait ncessaire et suffisant afin dobtenir des rponses pertinentes de la part de nos
modles. Nous avons ainsi pu dterminer une fentre glissante optimale de symboles
qui permet de rvaluer le modle dynamiquement ;
enfin, par des tudes de pertinence sur les diffrentes architectures des MMC, nous
avons dvelopp des techniques de mise en vidence du meilleur MMC. La validation
de ces architectures de modle, a permis de dterminer le modle de synthse le plus
raliste par rapport un processus industriel rel.
Dveloppement durable :
Dans nos travaux sur la prdiction des pannes industrielles, la dtermination du meilleur
modle devrait permettre dabaisser significativement le taux de pannes du matriel de pro-
duction. Ce qui veut dire dans un premier temps, moins dintervention humaine. En ef-
fet, dans le cas dune fonderie industrielle, ces interventions ncessitent la manipulation de
produits haute temprature par les techniciens de maintenance et peuvent savrer trs
dangereuses. Dans un deuxime temps, dans le cadre du dveloppement durable, nos tudes
pourront engendrer une baisse de CO2 rejet dans latmosphre. Toujours dans notre exemple
dindustries possdant des fours, larrt dun four pour cause de panne, est une perte dner-
gie considrable. La minimisation des pannes pour la presse basse pression permettra dviter
la refonte de laluminium. La consommation lectrique ainsi que les rejets de CO2 seraient
donc diminus.
135
Conclusion gnrale et perspectives
les rseaux baysiens dynamiques, avec les travaux de Philippe Weber [183]. Il utilise ce
procd pour des applications en sret de fonctionnement et danalyse de fiabilit de
systmes. Nous pourrions ainsi modliser lvolution des variables alatoires en fonction
des vnements de maintenance.
136
Conclusion gnrale et perspectives
137
Conclusion gnrale et perspectives
138
Annexe A
Algorithmes
139
Chapitre A : Algorithmes
140
A.1 Apprentissage Interactive Dichotomizer 3 (ID3)
[Crer un noeud]
Si (Fob est gale une seule valeur) Alors
Etiquette = valeur ;
Sinon
Soit A Attributs, lAttribut le plus discriminant ;
Etiquette = A ;
Pour chaque valeur possible de A faire
Si (set(A,Valeur) 6= ) Alors
Etiquette-arc = Valeur ;
Fils = ID3(set(A,Valeur),Fob ,Attributs /A)
Fin Si
Fin Pour
Fin Si
Renvoyer le noeud ;
Algorithme 1: ID3
141
Chapitre A : Algorithmes
Algorithme 2: Lempel-Ziv-Welch
142
A.3 Itratif dEspace de Version (IVSA)
Rpter
Pour i = 1, 2, . . . faire
CH :=Generateur(I ) ;
(H, Acci ) :=Assembler(I, H, Acci1 , CH) ;
I :=Incorrect(I, H) ;
Fin Pour
jusqu ce que (I = ou (i > max et Acci = Accimax ))
Algorithme 3: IVSA
143
Chapitre A : Algorithmes
144
A.4 Viterbi
A.4 Viterbi
Entre : M M C, e1 , . . . , en ;
Sortie : V iterbi_path, pmax ;
[Initialisation]
(P aths, P robas) initialize(e1 , M M C) ;
E {e1 , e2 , . . . , e1 , . . . , en } ;
Pour e1 , . . . , ei E faire
Pour sl S faire
(p(ei )sl , sm )
maxsK S(p(e1 , . . . , ei1 )sk .p(sk ; sl ).p(sl ; ei )) ;
update_path (sl , sm , P aths, N ew_P aths) ;
update_proba (sl , P robas, N ew_P robas) ;
Fin Pour
P atch N ew_P aths ;
P robas N ew_P robas ;
Fin Pour
(V iterbi_path, pmax ) most_probable(P aths, P robas) ;
return V iterbi_path, pmax
145
Chapitre A : Algorithmes
146
A.5 Algorithme de calcul de lentropie moyenne
147
Chapitre A : Algorithmes
148
Annexe B
1 1 x 2
(x) = e 2 ( ) . (B.1)
2
Nous donnons Figure B.1(a), p. 149 un exemple dajustement de modle laide dune
loi normale.
0.4
1.0
= 3, 2 = 1
= 3, 2 = 2 = 3, = 1
2
= 3, 2 = 3 = 3, 2 = 2
0.8
= 3, 2 = 3
0.3
0.6
(x)
(x)
0.2
0.4
0.1
0.2
0.0
0.0
5 0 5 10 5 0 5 10
x x
(a) Loi Normale, densit de probabilit. (b) Loi Normale, fonction de rpartition.
Nous donnons Figure B.1(b), p. 149 la fonction de rpartition de la loi de Gauss. Elle est
dfinie comme suit :
149
Chapitre B : Principales lois de probabilits
Z x Z x
1 12 ( x 2
) dt.
(x) = (t) dt = e (B.2)
2
Nous donnons Figure B.2(a), p. 150 un exemple dans le cas discret dun d non biais
( = 1, = 6) :
0.20
1.0
Cas discret
Cas continu
0.8
0.15
0.6
(x)
0.10
(x)
0.4
0.05
0.2
0.00
0.0
0 2 4 6 8 0 2 4 6 8
x x
(a) Loi Uniforme, densit de probabilit. (b) Loi Uniforme, fonction de rpartition.
0 pour x < ,
x
(x) = pour 6 x < , (B.4)
1 pour x > .
150
B.3 Loi Exponentielle
x
e , x 0,
(x; ) = (B.5)
0 , x < 0.
1 ex , x 0,
(x; ) = (B.6)
0 , x < 0.
1.0
1.5
= 1, 5
=1
= 0, 5
= 0, 25
0.8
1.0
0.6
(x)
(x)
0.4
0.5
= 1, 5
=1
0.2
= 0, 5
= 0, 25
0.0
0.0
0 2 4 6 8 10 0 2 4 6 8 10
x x
(a) Loi exponentielle, densit de probabilit. (b) Loi exponentielle, fonction de rpartition.
151
Chapitre B : Principales lois de probabilits
152
Annexe C
Matrice Jacobienne
Dfinition
Soit F une fonction vectorielle de Rn dans Rm (i.e. F est dfinie par m fonctions valeurs
dans R) :
x1 f1 (x1 , . . . , xn )
F : ... 7 ..
. , (C.1)
xn fm (x1 , . . . , xn )
la matrice Jacobienne (du mathmaticien Charles Jacobi) JF (M ) est la matrice aux drives
partielles suivante :
f1 f1
x1 xn
. .. ..
JF (M ) = .
. . .
. (C.2)
fm fm
x1 xn
Cette matrice intervient dans la rsolution de problmes non-linaires, notamment pour
rsoudre des systmes dquations de Principe de Maximum dEntropie.
Exemple
La matrice Jacobienne de la fonction F : R3 R4 dfinie par :
F (x, y, z) = x, 2y + 5z, 3x2 4y + 10z, z sin (x) , (C.3)
est :
1 0 0
0 2 5
JF (x, y, z) =
6x
. (C.4)
4y 10
z cos (x) 0 sin (x)
153
Chapitre C : Notions de mathmatiques utilises
154
Bibliographie
155
BIBLIOGRAPHIE
156
BIBLIOGRAPHIE
157
BIBLIOGRAPHIE
158
BIBLIOGRAPHIE
159
BIBLIOGRAPHIE
160
BIBLIOGRAPHIE
[94] Jaynes, E. Information theory and statistical mechanics. Physical Review, vol. 16,
no. 4 (1957), pages 620630.
[95] Jin, F. et Ding, S. An improved pca algorithm based on wif. In IJCNN08 (2008),
pages 15761578.
[96] Joshi, A., James, S., Meckl, P., King, G. et Jennings, K. Information-theoretic
feature selection for classification. In American Control Conference, 2007. ACC 07
(2007), pages 20002005.
[97] Juang, B. H. et Rabiner, L. R. The segmental k-means algorithm for estimating
parameters of hidden Markov models. Acoustics, Speech and Signal Processing, IEEE
Transactions on 38, 9 (Sept. 1990), pages 16391641.
[98] Kadane, J. B. et Lazar, N. A. Methods and criteria for model selection. Journal
of the American Statistical Association 99 (2004), pages 279290.
[99] Kadota, K. et Takahashi, K. Detection of genes with tissue-specific patterns using
akaikes information criterion. Genome Informatics 14 (2003), pages 308309.
[100] Kalman, R. E. A new approach to linear filtering and prediction problems. ASME
Journal of Basic Engineering, Srie D, VOL. 82 (1960), pages 3445.
[101] Kans, M. An approach for determining the requirements of computerised maintenance
management systems. Comput. Ind. 59, 1 (Jan. 2008), pages 3240.
[102] Kapetanios, G. Information criteria, model selection uncertainty and the deter-
mination of cointegration rank. NIESR Discussion Papers 166, National Institute of
Economic and Social Research, 2000.
[103] Kleijnen, J. P. C. Verification and validation of simulation models. European Journal
of Operational Research 82 (1995), pages 145162.
[104] Kullback, S. et Leibler, R. A. On information and sufficiency. The Annals of
Mathematical Statistics 22, 1 (1951), pages 7986.
[105] Labadi, K., Chen, H. et Amodeo, L. Modeling and performance evaluation of
inventory systems using batch deterministic and stochastic petri nets. IEEE Transac-
tions on Systems, Man, and Cybernetics, Part C 37, 6 (2007), pages 12871302.
[106] Le Duy, T. D. Traitement des incertitudes dans les applications des tudes proba-
bilistes de sret nuclaire. Thse de doctorat, Universit de technologie (Troyes),
2011.
[107] Lebarbier, E. et Mary-Huard, T. Le critre BIC : fondements thoriques et
interprtation. Research Report RR-5315, INRIA, 2004.
[108] Lebold, M. et Thurston, M. Open standards for Condition-Based Maintenance
and Prognostic Systems. In 5th Annual Maintenance and Reliability Conference (2001).
[109] Li, F., Qi, F., Shi, G. et Zhang, L. Optimization-based particle filter for state and
parameter estimation. Journal of Systems Engineering and Electronics (2009), pages
479484.
[110] Linars, G., Lvy, C. et Plagniol, J.-C. Estimation rapide de modles semi-
continus discriminants. In Journes dtudes de la Parole, JEP (Dinard, France, 2006).
161
BIBLIOGRAPHIE
162
BIBLIOGRAPHIE
163
BIBLIOGRAPHIE
[142] Rosen, R. Life Itself : A Comprehensive Inquiry into the Nature, Origin, and Fabri-
cation of Life. Columbia University Press, 1991.
[143] Roucoules, L., Yannou, B. et Eynard, B. Ingnierie de la conception et cycle
de vie des produits. Trait IC2. Hermes science publ. Lavoisier, Paris, 2006.
[144] Rukhin, A., Soto, J., Nechvatal, J., Barker, E., Leigh, S., Levenson, M.,
Banks, D., Heckert, A., Dray, J., Vo, S., Rukhin, A., Soto, J., Smid, M.,
Leigh, S., Vangel, M., Heckert, A., Dray, J. et Iii, L. E. B. A statistical test
suite for random and pseudorandom number generators for cryptographic applications,
1 dition. Wiley, 2010.
[145] Saltelli, A., Chan, K. et Scott, E. M. Sensitivity Analysis, 1 dition. Wiley,
2000.
[146] Sargent, R. G. Verification and validation of simulation models. In Winter Simula-
tion Conference (2010), pages 166183.
[147] Scalas, E., Martin, E. et Germano, G. The ehrenfest urn revisited : Playing the
game on a realistic fluid model. Physical Review E - Statistical, Nonlinear and Soft
Matter Physics 76, 1 Pt 1 (2007).
[148] Schwarz, G. Estimating the dimension of a model. The Annals of Statistics 6 (1978),
pages 461464.
[149] Scilab Enterprises et Consortium Scilab. Scilab : Le logiciel open source
gratuit de calcul numrique. Scilab Enterprises et Consortium Scilab, Digiteo, Version
5.3.0, Paris, France, 2010.
[150] Sergent, M., Dupuy, D., Corre, B. et Claeys-Bruno, M. Comparaison de
mthode criblage pour la simulation numrique. In 41mes Journes de Statistique,
SFdS, Bordeaux (Bordeaux, France, 2009).
[151] Serir, L., Ramasso, E. et Zerhouni, N. Time-Sliced temporal evidential net-
works : the case of evidential HMM with application to dynamical system analysis. In
Prognostics and Health Management. (Denver - Colorado, tats-Unis, 2011), I. C. N. .
CPF11PHM-CDR, diteur, volumesur CD ROM, page 10.
[152] Shafer, G. A mathematical theory of evidence. Princeton university press, 1976.
[153] Shang, J. et Cavanaugh, J. E. Bootstrap variants of the akaike information crite-
rion for mixed model selection. Comput. Stat. Data Anal. 52 (2008), pages 20042021.
[154] Shannon, C. E. A mathematical theory of communication. Bell system technical
journal 27 (1948).
[155] Shi, P. et Tsai, C. L. A note on the unification of the akaike information criterion.
Statist. Soc. B 60 (1998), pages 551558.
[156] Shorack, G. R. et Wellner, J. A. Empirical Processes With Applications to
Statistics. Society for Industrial & Applied Mathematics, 2009.
[157] Smarandache, F. et Dezert, J. Advances and applications of DSmT for informa-
tion fusion (Collected works). Vol. 1-3, American Research Press, 2009.
[158] Smets, P. et Kennes, R. The transferable belief model. Artificial Intelligence 66(2)
(1994), pages 191234.
164
BIBLIOGRAPHIE
[159] Sobol, I. M. Sensitivity analysis for non linear mathematical models. Mathematical
Modeling and Computational Experiment, 1 (1993), pages 407414.
[160] Steinebach, J., Lehmann, E. L. et Romano, J. P. Testing statistical hypotheses.
Metrika 64 (2006), pages 255256.
[161] Stoica, P. et Arye, N. Music, maximum likelihood, and cramr-rao bound. IEEE
Transactions on Acoustics, Speech, and Signal Processing 37, 5 (Mai 1989), pages 720
741.
[162] Stoica, P. et Babu, P. On the proper forms of BIC for model order selection. IEEE
Transactions on Signal Processing 60, 9 (2012), pages 49564961.
[163] Sudret, B. Uncertainty propagation and sensitivity analysis in mechanical models
Contributions to structural reliability and stochastic spectral methods, 2007. Habilita-
tion diriger des recherches, Universit Blaise Pascal, Clermont-Ferrand, France.
[164] Sugiura, N. Further analysts of the data by akaike s information criterion and
the finite corrections further analysts of the data by akaike s. Communications in
Statistics - Theory and Methods 7, 1 (1978), pages 1326.
[165] Tacnet, J.-M., Batton-Hubert, M. et Dezert, J. A two-step fusion process for
multi-criteria decision applied to natural hazards in mountains. CoRR abs/1005.0896
(2010).
[166] Tarantola, S., Saltelli, A. et Annoni, P. Sensitivity analysis. A coming of age.
In 41mes Journes de Statistique, SFdS, Bordeaux (Bordeaux, France France, 2009).
[167] Tobon-Mejia, D., Medjaher, K., Zerhouni, N. et Tripot, G. Hidden Markov
models for failure diagnostic and prognostic. In Prognostics and System Health Ma-
nagement. (Shenzhen, Chine, 2011), IEEE Catalog Number : CFPII6IH-PRT, pages
18.
[168] Tobon-Mejia, D., Medjaher, K., Zerhouni, N. et Tripot, G. A data-driven
failure prognostics method based on mixture of gaussians Hidden Markov Models.
Reliability, IEEE Transactions on 61, 2 (june 2012), pages 491503.
[169] Turnyi, T. Sensitivity analysis of complex kinetic systems. tools and applications.
Journal of Mathematical Chemistry 5 (1990), pages 203248. 10.1007/BF01166355.
[170] Ueda, T. Simple method for the detection of outliers. Japanese J. Appl. Stat. (2009),
pages 6776.
[171] Vallisneri, M. A User Manual for the Fisher Information Matrix. Jet Propulsion
Laboratory, California Institute of Technology, Pasadena, CA 91109, 2007.
[172] Vandewalle, V. Slection prdictive dun modle gnratif par le critre AICp. In
41mes Journes de Statistique, SFdS, Bordeaux (Bordeaux, France, 2009).
[173] Venditti, V. Aspects du principe de maximum dentropie en modlisation statistique.
Thse de doctorat, Universit Joseph Fourier - Grenoble 1, 1998.
[174] Vidyasagar, M. Bounds on the kullback-leibler divergence rate between Hidden
Markov Models. Decision and Control, 2007 46th IEEE Conference on (2007), pages
61606165.
165
BIBLIOGRAPHIE
[175] Viterbi, A. Error bounds for convolutional codes and an asymptotically optimum
decoding algorithm. IEEE Transactions on Information Theory 13, 2 (Apr. 1967),
pages 260269.
[176] Vrignat, P. Modlisation des dysfonctionnements dun systme dans le cadre dac-
tivits de maintenance. Mmoire de D.E.A., Universit dOrlans - LVR, 2007.
[177] Vrignat, P. Gnration dindicateurs de maintenance par une approche semipara-
mtrique et par une approche Markovienne. Thse de doctorat, Universit dOrlans,
2010.
[178] Vrignat, P., Avila, M., Duculty, F. et Kratz, F. Modlisation des dysfonc-
tionnements dun systme dans le cadre dactivits de maintenance. 16me Congrs de
Matrise des Risques et de Sret de Fonctionnement, Avignon, Communication 4A-1
(2008).
[179] Vrignat, P., Avila, M., Duculty, F. et Kratz, F. Use of HMM for evaluation
of maintenance activities. IJAIS, International Journal of Adaptive and Innovative
Systems, Vol. 1, Nos. 3/4 1 (2010), pages 216232.
[180] Vrignat, P., Avila, M., Duculty, F., Robls, B. et Kratz, F. Utilisation des
chanes de Markov caches pour une valuation des activits de maintenance dans le
cadre dun processus industriel pour lagroalimentaire. CNRIUT (2009).
[181] Wang, J. et Schaalje, G. B. Model selection for linear mixed models using predic-
tive criteria. Communications in Statistics - Simulation and Computation 38 (2009),
pages 788801.
[182] Weber, M. D., Leemis, L. M. et Kincaid, R. K. Minimum kolmogorov-smirnov
test statistic parameter estimates. Journal of Statistical Computation and Simulation
76 (2006), pages 196206.
[183] Weber, P. et Jouffe, L. Complex system reliability modelling with dynamic object
oriented bayesian networks (doobn). Rel. Eng. Sys. Safety 91, 2 (2006), pages 149162.
[184] Welch, B. L. The generalization of students problem when several different popu-
lation varlances are involved. Biometrika 34, 1-2 (1947), pages 2835.
[185] Welch, B. L. Welchs k-sample test. Biometrika 38 (1951), pages 330336.
[186] Welch, T. A. A technique for high-performance data compression. Computer 17
(June 1984), pages 819.
[187] Wolsztynski, E., Thierry, E. et Pronzato, L. Minimum-entropy estimation in
semi-parametric models. Signal Process. 85 (May 2005), pages 937949.
[188] Woodroofe, M. On model selection and the arc sine laws. The Annals of Statistics
10 (1982), pages 11821194.
[189] Yang, Y. Can the strengths of AIC and BIC be shared ? BIOMETRICA 92 (2003),
pages 937950.
[190] Ying, J., Kirubarajan, T., Pattipati, K. R. et Patterson-Hine, A. A hidden
Markov model-based algorithm for fault diagnosis with partial and imperfect tests.
Trans. Sys. Man Cyber Part C 30, 4 (Nov. 2000), pages 463473.
[191] Yu, D. et Yau, K. K. W. Conditional akaike information criterion for generalized
linear mixed models. Comput. Stat. Data Anal. 56, 3 (Mar. 2012), pages 629644.
166
BIBLIOGRAPHIE
[192] Zhou, J. et Zhang, X.-P. Hidden Markov model framework using independent
component analysis mixture model. In Acoustics, Speech and Signal Processing, 2006.
ICASSP 2006 Proceedings. 2006 IEEE International Conference on (may 2006), vo-
lume5, page V.
[193] Zhou, Z.-J., Hu, C.-H., Xu, D.-L., Chen, M.-Y. et Zhou, D.-H. A model for real-
time failure prognosis based on hidden Markov model and belief rule base. European
Journal of Operational Research 207, 1 (2010), pages 269283.
[194] Zwingelstein, G. La maintenance base sur la fiabilit : guide pratique dapplica-
tion de la RCM. Collection Diagnostic et maintenance. Herms, Paris, 1996. RCM :
Reliability centered maintenance.
167
BIBLIOGRAPHIE
168
Communications
Robls, B., Avila, M., Duculty, F., Vrignat, P., Bgot, S. et Kratz, F.
HMM Framework, for Industrial Maintenance Activities, Proceedings of the Institution
of Mechanical Engineers, Part O : Journal of Risk and Reliability 2014.
Robls, B., Avila, M., Duculty, F., Vrignat, P., Bgot, S. et Kratz, F.
Quantit minimale dobservations pour lestimation de Modles de Markov Cachs,
dans le cadre dune politique de maintenance prventive, 5mes Journes Doctorales /
Journes Nationales MACS, 1112 Juillet 2013 Strasbourg, (prsentation orale).
Robls, B., Avila, M., Duculty, F., Vrignat, P., Bgot, S. et Kratz, F. Eva-
luation of Minimal Data Size by Using Entropy, in a HMM Maintenance Manufacturing
Use, MIM2013 IFAC (International Federation of Automatic Control) Manufacturing
Modelling, Management and Control, 1921 Juin 2013 Saint Petersburg (Russie).
Robls, B., Avila, M., Duculty, F., Vrignat, P., Bgot, S. et Kratz, F.
Mise jour dynamique de Modles de Markov Cachs : Application dans lAide
la Dcision pour une Maintenance Prventive Industrielle. CNRIUT 1214 Juin 2013
Cort, (prsentation orale).
Robls, B., Avila, M., Duculty, F., Vrignat, P., Bgot, S. et Kratz, F.
HMM Framework, for Industrial Maintenance Activities, QUALITA2013 10me Congrs
International Pluridisciplinaire Qualit et Sret de Fonctionnement (Qualit, Suret
de Fonctionnement, Dveloppement Durable), 2022 Mars 2013 Compigne, page 43,
(prsentation orale en Anglais).
Vrignat, P., Duculty, F., Bgot, S., Millet, J.F., Robls, B., Avila, M.
Solution Bluetooth : utilisation dune architecture logicielle dans le cadre dune mise
en place dune solution multi-clients partir dun serveur OPC, CETSIS, 2022 Mars
2013 Caen.
Vrignat, P., Avila, M., Duculty, F., Robls, B., Bgot, S., Kratz, F. G-
nration dindicateurs dans le cadre dune politique de maintenance prventive condi-
tionnelle, , 18me Congrs de Matrise des Risques et de Sret de Fonctionnement,
1618 Octobre 2012 Tours.
Robls, B., Avila, M., Duculty. et Kratz, F. Study of the relevance of stochas-
169
BIBLIOGRAPHIE
Robls, B., Avila, M., Duculty, F., Vrignat, P., Bgot, S. et Kratz, F.
Incertitudes Stochastiques sur des Modles de Markov Cachs : Application dans lAide
la Dcision pour une Maintenance Prventive Industrielle. CNRIUT 68 Juin 2012
Tours, (prsentation orale).
Robls, B., Avila, M., Duculty, F., Vrignat, P., Bgot, S. et Kratz, F.
Methods to choose the best Hidden Markov Model topology for improving maintenance
policy. MOSIM 2012, the 9th International Conference on Modeling, Optimization and
SIMulation (Bordeaux, France), 68 June 2012, (prsentation orale en Anglais).
Robls, B., Avila, M., Duculty, F., Vrignat, P., Bgot, S. et Kratz, F.
Mesures de pertinence par les critres du maximum de vraisemblance de BIC et
d AIC appliqus lvaluation des paramtres stochastiques de Modles de Markov
Cachs. Journal National de la Recherche en IUT N3 (2012).
Vrignat, P., Avila, M., Duculty, F., Robls, B. et Kratz, F. Decison sup-
port with a markovian approach for maintenance context activities. In Advances in
Safety, Reliability and Risk Management, European Safety and Reliability Conference
(ESREL), ISBN : 978-0-415-68379-1 (Troyes, France, Sept. 2011), Taylor & Francis
Group, page 66.
170
BIBLIOGRAPHIE
171
BIBLIOGRAPHIE
172
Liste des figures
173
LISTE DES FIGURES
3.8 Distribution des symboles par tat du modle de synthse. La Figure 3.8(a)
reprsente la distribution normale et la Figure 3.8(b) reprsente la distribution
uniforme. Sur labscisse, nous pouvons voir la liste des 10 symboles. Pour
chaque symbole, on trouve les 4 tats (S1, S2, S3 et S4). Ces figures illustrent
la distribution de chaque symbole pour chaque tat. Nous remarquons que le
premier symbole nest mis que par ltat S1 (symbole darrt pour ltat de
non fonctionnement). Nous remarquons aussi que ltat S1 nmet aucun des
9 autres symboles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
3.9 Dgradation dun processus. . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
3.10 tapes dvaluation de larchitecture des modles, laide dun modle de
synthse. Le modle de synthse utilise la topologie 2 pour gnrer des 2-uplet
(Symboles, Etats) en utilisant les distributions (uniforme et normale). Nous
injectons alors ces signatures dans les 3 topologies tudies. Nous utilisons
les 2 algorithmes dapprentissage et de dcodage pour obtenir de nouvelles
squences que nous analysons pour en valuer la pertinence. Nous essayons
ainsi de trouver la meilleure architecture des modles. . . . . . . . . . . . . . 79
3.11 Distribution des symboles par tat. La Figure 3.11(a) reprsente la distri-
bution normale des observations mises par le modle de synthse. La Fi-
gure 3.11(b) reprsente la distribution des observations aprs apprentissage
Baum-Welch et dcodage par Variables Forward. La Figure 3.11(c) reprsente
la distribution des observations aprs apprentissage Segmental K-means et
dcodage par Viterbi. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
3.12 Production des symboles. Cela nous permet de tester diffrentes distributions
de symboles, diffrentes topologies et diffrents algorithmes dapprentissage
et de dcodage. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
3.13 Modlisation Newton de la densit des tats. . . . . . . . . . . . . . . . . . . 85
174
LISTE DES FIGURES
4.10 Ces graphes nous montrent que la topologie 2 est la plus pertinente au vu du
critre dAIC et de BIC, pour les 2 algorithmes dapprentissage et pour les 2
distributions tudies. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
4.11 Nous testons les diffrentes architectures du modle de synthse laide de
tests statistiques dadquation : le test dAspin-Welch Figure 4.11(a) et celui
de Kolmogorov-Smirnov Figure 4.11(b). . . . . . . . . . . . . . . . . . . . . . 102
4.12 Le calcul de lincertitude sur la moyenne est reprsentatif de lerreur pist-
mique dans la phase de modlisation. . . . . . . . . . . . . . . . . . . . . . . 103
4.13 Modle de Markov Cach, topologie 1. . . . . . . . . . . . . . . . . . . . . . 104
4.14 Mesure de lentropie de Shannon avec la topologie 1 comme rfrence. . . . . 105
4.15 Modle de Markov Cach, topologie 3. . . . . . . . . . . . . . . . . . . . . . 105
4.16 Mesure de lentropie de Shannon avec la topologie 3 comme rfrence. . . . . 106
4.17 Modles de Markov Cachs, topologies 4 tats . . . . . . . . . . . . . . . . 109
4.18 Exemple de dgradation dun processus [178]. . . . . . . . . . . . . . . . . . 110
4.19 Entropies moyennes des modles . . . . . . . . . . . . . . . . . . . . . . . . . 121
4.20 Mesures de la vraisemblance. . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
4.21 Nombre minimal de donnes par entropie de Shannon, donnes issues dune
GMAO industrielle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
4.22 volution de lentropie value avec une fentre glissante norme (200 sym-
boles). Les donnes dapprentissage sont issues dune GMAO industrielle. . . 123
4.23 Critres AIC, BIC et HQC. . . . . . . . . . . . . . . . . . . . . . . . . . . 124
4.24 Modles de synthse non ajusts. . . . . . . . . . . . . . . . . . . . . . . . . 127
4.25 Comparaison du modle de synthse ajust, avec les donnes de maintenance
provenant dune entreprise du secteur de lagro-alimentaire. . . . . . . . . . . 128
4.26 Comparaison des topologies aprs rajustement des symboles. . . . . . . . . 129
175
LISTE DES FIGURES
176
Liste des tableaux
1.1 volution des valeurs et des grands ratios de la maintenance. Source : lOb-
servatoire Rseau Maintenance 2012. . . . . . . . . . . . . . . . . . . . . . 10
1.2 Proportion dutilisation des logiciels de Gestion de la Maintenance Assiste
par Ordinateur , dans les diffrents secteurs conomiques. . . . . . . . . . . 16
1.3 Exemple dune base de donnes utilise dans une Gestion de la Maintenance
Assiste par Ordinateur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
177
LISTE DES TABLEAUX
178
LISTE DES TABLEAUX
179
Bernard ROBLES
tude de la pertinence des paramtres stochastiques sur
des Modles de Markov Cachs.
Rsum :
Le point de dpart de ce travail est la thse ralise par Pascal Vrignat sur la modlisation de ni-
veaux de dgradation dun systme dynamique laide de Modles de Markov Cachs (MMC), pour une
application en maintenance industrielle. Quatre niveaux ont t dfinis : S1 pour un arrt de production
et S2 S4 pour des dgradations graduelles. Recueillant un certain nombre dobservations sur le terrain
dans divers entreprises de la rgion, nous avons ralis un modle de synthse base de MMC afin de
simuler les diffrents niveaux de dgradation dun systme rel. Dans un premier temps, nous identifions la
pertinence des diffrentes observations ou symboles utiliss dans la modlisation dun processus industriel.
Nous introduisons ainsi le filtre entropique.
Ensuite, dans un but damlioration du modle, nous essayons de rpondre aux questions : Quel est lchan-
tillonnage le plus pertinent et combien de symboles sont ils ncessaires pour valuer au mieux le modle ?
Nous tudions ensuite les caractristiques de plusieurs modlisations possibles dun processus industriel
afin den dduire la meilleure architecture. Nous utilisons des critres de test comme les critres de lentropie
de Shannon, dAkaike ainsi que des tests statistiques. Enfin, nous confrontons les rsultats issus du modle
de synthse avec ceux issus dapplications industrielles. Nous proposons un rajustement du modle pour
tre plus proche de la ralit de terrain.
Mots cls : Modles de Markov Cachs, slection de modles, test statistique, algorithmes dappren-
tissage et de dcodage, entropie de Shannon, incertitudes de modlisation, maintenance prdictive.
Summary :
As part of preventive maintenance, many companies are trying to improve the decision support of their
experts. This thesis aims to assist our industrial partners in improving their maintenance operations (produc-
tion of pastries, aluminum smelter and glass manufacturing plant). To model industrial processes, different
topologies of Hidden Markov Models have been used, with a view to finding the best topology by studying
the relevance of the model outputs (also called signatures). This thesis should make it possible to select a
model framework (a framework includes : a topology, a learning & decoding algorithm and a distribution)
by assessing the signature given by different synthetic models. To evaluate this signature , the following
widely-used criteria have been applied : Shannon Entropy, Maximum likelihood, Akaike Information Criterion,
Bayesian Information Criterion and Statistical tests.
Keywords : Hidden Markov Models, model selection, statistical test, learning and decoding algorithms,
Shannon entropy, uncertainties, predictive maintenance.