Vous êtes sur la page 1sur 271

Diagnostic de d

efauts par les Machines `


a Vecteurs
Supports : application `
a diff
erents syst`
emes
mutivariables nonlin
eaires
Nassim Laouti

To cite this version:


Nassim Laouti. Diagnostic de defauts par les Machines a` Vecteurs Supports : application a`
differents syst`emes mutivariables nonlineaires. Autre. Universite Claude Bernard - Lyon I,
2012. Francais. <NNT : 2012LYO10161>. <tel-00985437>

HAL Id: tel-00985437


https://tel.archives-ouvertes.fr/tel-00985437
Submitted on 29 Apr 2014

HAL is a multi-disciplinary open access


archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from
teaching and research institutions in France or
abroad, or from public or private research centers.

Larchive ouverte pluridisciplinaire HAL, est


destinee au depot et `a la diffusion de documents
scientifiques de niveau recherche, publies ou non,
emanant des etablissements denseignement et de
recherche francais ou etrangers, des laboratoires
publics ou prives.

N dordre: 161-2012

Anne 2012

THSE DE L'UNIVERSIT DE LYON


Dlivre par
L'UNIVERSIT CLAUDE BERNARD LYON 1
Prsente pour obtenir le grade de docteur en automatique
COLE DOCTORALE EEA DE LYON
(arrt du 7 aot 2006)

Par

M. Nassim LAOUTI

Diagnostic de dfauts par les Machines


Vecteurs Supports : application
diffrents systmes multivariables
non linaires
Soutenue le 21 septembre 2012, devant le jury compos de
Dr. Mazen ALAMIR
Professeur Christophe AUBRUN
Professeur Michel KINNAERT
Dr. Sami OTHMAN
Dr. Isabelle QUEINNEC
Dr. Nida SHEIBAT-OTHMAN

GIPSA-Lab, Grenoble
CRAN, Universit de Lorraine
Universit Libre de Bruxelles
LAGEP, Universit de Lyon
LAAS, Universit de Toulouse
LAGEP, Universit de Lyon

Rapporteur
Rapporteur
Examinateur
Co-encadrant
Prsident
Directeur de thse

Ddicaces
Je ddie cette thse mes trs chers parents qui je dois tout ce que je suis, et qui m'ont
donn un vritable modle de travail, et qui m'ont appris le respect de lautre, la gentillesse
et la persvrance. J'espre qu'ils trouveront dans ce travail toute ma reconnaissance et tout
mon amour.
A mes chers frres et surs et qui ont toujours t l pour moi: Leila, Mehdi, Sihem,
Mohamed, Hafid, Rayane Yasmine
Je ddie cette thse au directeur de lcole doctorale EEA de Lyon monsieur Grard Scorletti.
A tous mes amis : Kamel, Kamel, Reda, Bassem, Sidali, Belkacem, Amine, Aziz, Sofiane et
tous les autres qui mont encourag finir ce travail
Je ddie cette thse

Nassim

Remerciements
Je remercie Dieu de mavoir donn la volont et le courage qui mont permis de raliser ce
travail, veuille-t-il me guider dans le droit chemin.

Je remercie Madame Nida Othman et Monsieur Sami Othman, pour leurs gentillesses
ainsi que leurs encouragements rguliers face la difficult.

Je remercie ma sur Leila pour son aide depuis toujours

Je remercie aussi les membres du jury pour avoir accept de juger ce travail. Je suis trs
honor de prsenter mes travaux de thse devant un tel jury.

Ce travail a t ralis au sein du Laboratoire dAutomatique et de Gnie des Procds de


luniversit Claude Bernard Lyon1 (LAGEP-UMR 5007). Mes remerciements s'adressent
tous les membres du laboratoire LAGEP que ce soit les doctorants, les enseignants,
ingnieurs ou les chercheurs pour mavoir accueilli parmi eux.

Table des matires


Introduction gnrale ................................................................................................................... 1
CHAPITRE I : Diagnostic de dfauts et thorie des Machines Vecteurs de Supports ....... 5
I.1. Gnralits ............................................................................................................................ 7
I.1.1. Terminologie en matire de diagnostic.......................................................................... 7
I.1.2. Le principe de dtection de dfaut ................................................................................. 9
I.1.3. FDI en boucle ouverte et en boucle ferme ................................................................. 10
I.1.4. Domaines concerns par la FDI ................................................................................... 11
I.1.5. Performances des techniques FDI ............................................................................... 12
I.2. Les mthodes de diagnostic ................................................................................................ 12
I.2.1. Mthodes base de modle explicite .......................................................................... 13
I.2.2. Mthodes bases sur les donnes ................................................................................. 18
I.2.3. Etapes de mise en uvre des mthodes bases sur les donnes .................................. 28
I.3. Les Machines Vecteurs de Supports ................................................................................ 39
I.3.1 Thorie de l'apprentissage statistique ........................................................................... 40
I.3.2. Les machines Vecteurs de Support pour la classification (SVM) ............................ 41
I.3.3. Les machines Vecteurs de supports pour la rgression (SVR) ................................. 56
CHAPITRE II : Systme de traitement des eaux uses ........................................................... 67
II.1. Description du systme .................................................................................................... 69
II.1.1. Le procd de traitement des eaux uses par boues actives ..................................... 70
II.1.2. La modlisation .......................................................................................................... 71
II.1.3. Le modle BSM1........................................................................................................ 73

II.1.4. Variables composites/mesures ................................................................................... 84


II.2. Commande des systmes de traitement des eaux uses ................................................... 86
II.3. Revue des mthodes de diagnostic du procd WWTP ................................................... 87
II.3.1. ACP (PCA en anglais) et dautres mthodes statistiques........................................... 88
II.3.2. La Projection aux Structures Latentes ( PLS ) ........................................................... 90
II.3.3. SVM ........................................................................................................................... 91
II.4. Stratgie SVR/SVM propose pour le diagnostic du procd WWTP ............................. 92
II.4.1. Schma SVR/SVM propos ....................................................................................... 92
II.4.2. Rcapitulatif des variables dtat/ dentre/ et de sortie............................................. 94
II.4.3. Les variables superviser........................................................................................... 95
II.5. Implmentation de SVR pour la modlisation .................................................................. 97
II.5.1. Gnration de donnes pour lapprentissage et la validation ..................................... 97
II.5.2. Prtraitement des donnes (normalisation, filtrage) ................................................... 99
II.5.3. Analyse de corrlation/Information mutuelle........................................................... 100
II.5.4. Rsultats de la modlisation SVR ............................................................................ 103
II.6. Implmentation de SVM pour le diagnostic de dfauts ................................................. 116
II.7. Conclusion ...................................................................................................................... 129
CHAPITRE III : Diagnostic de dfauts dans les oliennes ................................................... 131
III.1. Introduction ................................................................................................................... 133
III.1.1. Revue des mthodes de diagnostic sur les oliennes ............................................. 135
III.1.2. Revue sur la commande des oliennes ................................................................... 138
III.2. Description du systme olien ...................................................................................... 139
III.2.1. Modle des pales et pitch ........................................................................................ 141

III.2.2. Modle convertisseur et gnratrice ....................................................................... 141


III.2.3. Modle du systme dentranement ........................................................................ 142
III.2.4. Le systme de contrle ............................................................................................ 143
III.2.5. Dfauts considrs dans ce modle olien .............................................................. 144
III.3. Diagnostic de dfauts dans une olienne ...................................................................... 146
III.3.1. Les vecteurs des caractristiques pour chaque dfaut ............................................ 148
III.3.2. Rsultats de lapproche de diagnostic .................................................................... 151
III.4. Comparaison entre diffrentes mthodes de diagnostic ................................................ 157
III.5. Combinaison entre lapproche base sur SVM et un observateur ................................ 159
III.5.1. Conception de lobservateur de type Kalman ......................................................... 161
III.5.2. Lapproche base SVM pour la dtection/isolation de dfaut actionneur sur le
systme pitch ....................................................................................................................... 162
III.6. Conclusion .................................................................................................................... 166
CHAPITRE IV : Racteur chimique parfaitement agit ...................................................... 169
IV.1. Revue bibliographique ................................................................................................... 171
IV.2. Prsentation du systme ................................................................................................. 174
IV.2.1. Le procd............................................................................................................... 174
IV.2.2. Le modle ............................................................................................................... 175
IV.3. Implmentation du diagnostic de dfauts ...................................................................... 176
IV.3.1 Implmentation des SVMs....................................................................................... 176
IV.3.2 Implmentation de lobservateur de grand gain ...................................................... 178
IV.3.3. Rsultats et discussion ............................................................................................ 180
IV.4. Implmentation de SVR................................................................................................. 189
IV.4.1. Identification d'une drive de temprature par rgression SVM ............................ 190

IV.4.2. Identification des U par rgression SVM ............................................................... 193


IV.5. Conclusions .................................................................................................................... 196
Conclusion gnrale .................................................................................................................. 197
Notations .................................................................................................................................... 201
Annexes ...................................................................................................................................... 209
Annexe A ................................................................................................................................ 211
Annexe B................................................................................................................................. 219
Annexe C................................................................................................................................. 223
Bibliographie ............................................................................................................................. 227

Table des Figures


Figure I.1 Architecture du fonctionnement dun systme avec une commande tolrante aux
dfauts ............................................................................................................................................. 9
Figure I.2

Schma classique de dtection des dfauts ............................................................... 10

Figure I.3

Schma de classification des mthodes de diagnostic de dfauts bases sur le modle

....................................................................................................................................................... 13
Figure I.4

Mthodes de diagnostic diriges par les donnes..................................................... 19

Figure I.5

Taux de reprsentativit des composantes principales dans le modle .................... 21

Figure I.6

Lhyperplan sparateur pour des donnes bidimensionnelles .................................. 41

Figure I.7

Sparation linaire .................................................................................................... 42

Figure I.8

Sparation linaire avec des erreurs ......................................................................... 45

Figure I.9

Marge souple ............................................................................................................ 46

Figure I.10 Exemple de projection .............................................................................................. 48


Figure I.11 Vecteurs support et surface de dcision calcule par la mthode noyau ............... 49
Figure I.12 La fonction de perte insensible dans la rgression SVR linaire ........................ 58
Figure I.13 Structure de type Hammerstein ................................................................................ 61
Figure I.14 Structure de type Wiener .......................................................................................... 62
Figure II.1

Prsentation gnrale du procd BSM1..74

Figure II.2

La matire organique dans le modle BSM1 ........................................................... 79

Figure II.3

Les composs azots dans le modle BSM1............................................................ 79

Figure II.4

Stratgie SVR suivi par SVM pour le diagnostic de dfauts ................................... 93

Figure II.5

Concentration de nitrites/nitrates dans la 2me cuve utilise pour lapprentissage et le

test du modle SVR....................................................................................................................... 98


Figure II.6 Concentration doxygne dissous dans la 5 me cuve utilise pour lapprentissage et
le test du modle SVR ................................................................................................................... 98
Figure II.7

Bote moustache des variables du procd WWTP non normes ......................... 99

Figure II.8

Bote moustache des variables du procd WWTP normalises avec la mthode

min/max ...................................................................................................................................... 100


Figure II.9

Analyse des relations entre variables avec linformation mutuelle ....................... 102

Figure II.10 Analyse des relations entre variables avec linformation mutuelle (pour COD e et
TSSe) ........................................................................................................................................... 102

Figure II.11 Evolution temporelle des variables dentre/sortie des matires en suspension ... 104
Figure II.12 Densit de probabilit Qin ..................................................................................... 105
Figure II.13 Concentration SNH,in et sa densit de probabilit .................................................. 106
Figure II.14 L'volution de la variable So5 par rapport Kla5 ................................................... 106
Figure II.15 Lvolution de la variable Sno2 par rapport Qa ................................................... 107
Figure II.16 Trac de Sno2 et son estime .................................................................................. 109
Figure II.17 Zoom sur le trac de Sno2 et son estim................................................................. 110
Figure II.18 Trac de TSSe et son estim .................................................................................. 110
Figure II.19 Zoom sur le trac de TSSe et son estim ............................................................... 111
Figure II.20 Trac de CODe et son estim ................................................................................ 111
Figure II.21 Trac de So5 et son estim ..................................................................................... 112
Figure II.22 Rsidu So5.............................................................................................................. 112
Figure II.23 Rsidu Sno2 ............................................................................................................ 113
Figure II.24 Rsidu filtre de Sno2 ............................................................................................. 113
Figure II.25 Densit de probabilit Sno2 .................................................................................... 114
Figure II.26 Autocorrlation du rsidu TSSe ............................................................................ 114
Figure II.27 Rsidu sur TSSe .................................................................................................... 115
Figure II.28 Densit de probabilit TSSe .................................................................................. 115
Figure II.29 Rsidu CODe ......................................................................................................... 115
Figure II.30 volution du rsidu Kla5 ........................................................................................ 119
Figure II.31 Zoom sur le rsidu Kla5 ......................................................................................... 119
Figure II.32 volution du rsidu Qa .......................................................................................... 120
Figure II.33 volution du rsidu So5 ......................................................................................... 120
Figure II.34 Trac de la mesure de loxygne dissous (So5) et son rsidu ................................ 121
Figure II.35 Zoom sur de la mesure de So5 et son rsidu .......................................................... 121
Figure II.36 volution du rsidu Sno2 ........................................................................................ 122
Figure II.37 La mesure de Sno2 et son rsidu............................................................................. 122
Figure II.38 Mesure TSSe et son rsidu .................................................................................... 123
Figure II.39 Rsultat de dcision sur le dfaut Qa .................................................................... 124
Figure II.40 Zoom sur le rsultat du dfaut Qa ......................................................................... 125
Figure II.41 Rsultat de dcision sur le dfaut Kla5 .................................................................. 126
Figure II.42 Zoom de dcision sur le dfaut Kla5 ...................................................................... 126
Figure II.43 Rsultat de dcision sur le dfaut Sno2 .................................................................. 127
Figure II.44 Zoom sur la dcision du dfaut Sno2...................................................................... 127

Figure II.45 Rsultat de la dcision sur dfaut TSSe ................................................................ 128


Figure II.46 Rsultat de la dcision sur dfaut So5.................................................................... 129
Figure III.1

Eoliennes offshore.133

Figure III.2

Destruction dune olienne par prise de feu ......................................................... 134

Figure III.3

Coupe transversale dune nacelle dolienne ....................................................... 140

Figure III.4

Une vue d'ensemble du modle de rfrence de lolienne .................................. 140

Figure III.5

Puissance de lolienne en fonction de la vitesse du vent .................................... 143

Figure III.6

Squence vitesse du vent ...................................................................................... 144

Figure III.7

Schma de diagnostic de dfaut pour les oliennes .............................................. 146

Figure III.8

Stratgie de diagnostic de dfaut classique avec SVM ........................................ 147

Figure III.9

Schma de diagnostic de dfauts propos ............................................................ 147

Figure III.10 Stratgie propose de diagnostic de dfaut base sur SVM ................................. 147
Figure III.11 Vitesse du vent mesure ...................................................................................... 152
Figure III.12 Puissance lectrique gnre ............................................................................... 152
Figure III.13 Dtection et isolation du dfaut 2 de type gain (1b) sur le capteur de la position
pitch E2, m2 ................................................................................................................................... 153
Figure III.14 Dtection et isolation du dfaut 4 valeur fixe (type 2a) sur la vitesse du rotor ... 154
Figure III.15 Dtection et isolation du dfaut 5 de type gain (2b) sur le capteur de la vitesse
rotationnelle du rotor wr ,m2 ......................................................................................................... 155
Figure III.16 Dtection et isolation du dfaut 5 de type gain (3b) sur le capteur de la vitesse
rotationnelle de la gnratrice wg ,m1 ........................................................................................... 156
Figure III.17 Dtection et isolation du dfaut 8 de type offset (4a) sur le convertisseur .......... 156
Figure III.18 Dtection et isolation du dfaut 9 (6) sur le systme dentrainement ................. 157
Figure III.19 Schma de combinaison SVM et observateur ..................................................... 161
Figure III.20 Dtection et isolation du dfaut 6 (5a) sur lactionneur2 et estimation du coefficient
damortissement ] 2e et de la pulsation naturelle wn 2 avec lobservateur .................................... 164
Figure III.21 Dtection et isolation du dfaut 7 (5b) sur lactionneur 3 et estimation du
coefficient damortissement ] 3e et de la pulsation naturelle wn3 avec lobservateur .................. 164
Figure IV.1 Schma simplifi du racteur parfaitement agit du laboratoire (Tr1, Tr2, Tj1, Tj2
et THC sont des sondes de temprature P1, P2, P3 et P4 sont des pompes)...174
Figure IV.2

Schma de diagnostic de dfauts par SVM en ligne ............................................ 180

Figure IV.3

Drive dans Tj,in 55min ...................................................................................... 181

Figure IV.4 Classification des dfauts de THC. Effet de V (variance du noyau gaussien) sur les
hyperplans optimaux (avec C=100) ............................................................................................ 182
Figure IV.5 Cas dtude par simulation (avec C=100) et diffrentes valeurs de V: Occurrence de
dfaut dans THC (objective de commande Trd=70C) ................................................................. 183
Figure IV.6 Classification des defaults de THC. Effet de C (paramtre de rgularisation) sur les
hyperplans optimaux (avec V=10) .............................................................................................. 184
Figure IV.7 Dfaut dans le systme de chauffe/refroidissement (HC : un actionneur) en
changeant les paramtres du PID afin dcarter THC de Tjd (Tjd=70C) ..................................... 185
Figure IV.8 Drive dans Tr1 33 min dans le racteur du laboratoire ...................................... 186
Figure IV.9 Erreur de calibration de -5C est considre dans la sonde Tr2 dans le racteur pilote
de 250 L ...................................................................................................................................... 187
Figure IV.10 Une valuation exprimentale de la mthode SVM et de lobservateur dans un
racteur pilote de 250 L .............................................................................................................. 188
Figure IV.11 Evolution des tempratures dans le racteur pilote sans dfaut .......................... 188
Figure IV.12 Schma de SVR pour lestimation de U et lidentification de niveaux de dfauts
pendant la priode la chauffe du racteur ................................................................................... 189
Figure IV.13 Validation exprimentale de lidentification dune drive dans la sonde de
temprature Tr1 avec diffrentes valeurs de V (H=0.01, C=100, objectif de commande Tjd=70C)
..................................................................................................................................................... 191
Figure IV.14 Identification de la drive dans la sonde Tr1 avec diffrentes valeurs de H (V=60,
C=100, objectif de commande Trd=60C) ................................................................................... 192
Figure IV.15 Identification de la drive du capteur Tr1 avec diffrentes valeurs de C (H=0.01,
V=60) ........................................................................................................................................... 193
Figure IV.16 Estimation du coefficient dchange thermique U pendant la chauffe du racteur
(simulation avec diffrentes valeurs de U, paramtre de lobservateur T=0.04) ........................ 195
Figure IV.17 Estimation exprimentale du coefficient dchange thermique U pendant la chauffe
du racteur ................................................................................................................................... 195

Liste des tableaux


Tableau II.1

Les concentrations intervenant dans le modle BSM1.......................................... 75

Tableau II.2

Paramtres du modle BSM1 ................................................................................ 77

Tableau II.3 Paramtres de dcantation ..................................................................................... 83


Tableau II.4

Corrlation des variables avec CODeff ................................................................ 101

Tableau II.5

Performances des modles SVR .......................................................................... 109

Tableau II.6

Les diffrents dfauts considrs......................................................................... 109

Tableau II.7

Rsultats de dtection de dfauts ......................................................................... 117

Tableau III.1 Paramtres du modle de rfrence de lolienne ............................................... 143


Tableau III.2 Dfauts considrs dans le modle olien de rfrence ...................................... 145
Tableau III.3 Rsultats de diagnostic du dfaut 1 ..................................................................... 158
Tableau III.4 Rsultats de diagnostic du dfaut 2 ..................................................................... 159
Tableau III.5 Rsultats de dtection des dfauts ....................................................................... 166

Tableau IV.1 Vecteurs dentrs SVM (xi), (i est linstant de temps) ........................................ 177
Tableau IV.2 Correspondance entre rsidu de la temprature de la double enveloppe et du bain
thermost (R=rsidu)................................................................................................................... 178

Introduction gnrale
Tout ce que je sais, :c'est que je ne sais rien Socrate
La socit actuelle est trs oriente vers la technologie et dpend ainsi de la disponibilit, la
scurit et la fiabilit de technologies de plus en plus complexes. Cependant, la matrise parfaite
de ces systmes reste un sujet important et ouvert. Afin de satisfaire le bon fonctionnement, le
diagnostic de dfaut Fault detection and isolation FDI apparat ainsi comme une ncessit
qui consiste identifier les causes du dfaut partir des symptmes ou signaux perus afin
d'viter toute propagation de ce dfaut. Ce dernier peut occasionner notamment :
1. Un arrt de fonctionnement du systme,
2. Des dgts matriels,
3. La pollution de lenvironnement,
4. Des dangers pour l'utilisateur.
Le diagnostic de dfauts est, en fait, lensemble des actions mises en uvre pour dtecter,
localiser et identifier tout dysfonctionnement sur un systme. Ceci peut se faire partir des
informations pouvant tre rcupres du systme, telles que les mesures fournies par les
capteurs, les sorties calcules par les contrleurs, et les connaissances sur la structure ou le
modle du systme. Parmi les intrts du diagnostic de dfauts figure l'optimisation des
oprations de maintenance, la minimisation de larrt du service, lassurance dune bonne qualit
du produit, ainsi que la reconfiguration de la commande.
La conception d'un systme de diagnostic performant n'est, cependant, pas une tche facile
raliser, puisque la majorit des systmes rels sont de nature non-linaire faisant intervenir un
grand nombre de variables et travaillant dans un environnement entach de bruit, et affect par
diffrents types de perturbations. Depuis des annes, un grand nombre de chercheurs se sont
intresss la rsolution du problme de diagnostic des dfauts. On trouve ainsi plusieurs tudes
dans la littrature qui proposent diffrentes techniques de diagnostic de dfauts. Dune faon
gnrale, on peut dcomposer les mthodes de diagnostic en deux grandes familles : des
mthodes bases sur le modle, et des mthodes bases sur les donnes rcupres partir du
systme. Cependant, la complexit des systmes industriels rend difficile, voire impossible,
lobtention dun modle fondamental exact et prcis reprsentant le systme dans toutes les
conditions de fonctionnement afin de lutiliser pour raliser un diagnostic de dfaut par modle.
Dun autre ct, la technologie moderne nous offre un grand bnfice puisquelle fournit un
grand nombre dinformations (donnes) mais dont lanalyse nest pas vidente, ce qui explique
1

le recours des mthodes de diagnostic de dfauts bases sur les donnes. En plus la nature des
signatures(ou symptmes) de dfauts qui sont des grandeurs alatoires rend la dtection dune
diffrence ventuelle entre la signature nominale et celle mesure ne peut pas se faire facilement
avec les mthodes dterministes.
Pour ces raisons, lintrt des industriels pour les mthodes de diagnostic de dfauts diriges par
des donnes notamment celle de lintelligence artificielle (rseaux de neurones, systmes
experts,..) prend de plus en plus dampleur. Lintelligence artificielle a pour but dlaborer des
systmes ayant des capacits intellectuelles comparables lhomme capable de prendre des
dcisions dune manire automatique dans lenvironnement peru. Dans ce vaste domaine, on
trouve un axe de recherche assez important qui est lapprentissage automatique Machine
Learning (Ao et al., 2010) qui permet de bien comprendre un phnomne ou un systme
illustr par un nombre limit dexemples de donnes afin de construire des modles pouvant tre
appliqus des nouvelles observations (exemples). Dans cette thse, la mthode dintelligence
artificielle stochastique Machines Vecteurs Supports (ou Sparateur Vaste Marge, Support
Vector Machines, SVM) est utilise pour la conception des mthodes de diagnostic avances.
La mthode SVM est issue de la thorie de lapprentissage statistique (Vapnik, 1998) introduite
par Vapnik dans les annes 90 (Boser et al., 1992). Elle a t conue au dpart pour trouver un
discriminateur optimal entre deux classes de donnes, et a t ensuite tendue pour le cas de la
rgression. La capacit de gnralisation, et l'aspect stochastique ont favoris l'utilisation de cette
mthode d'apprentissage statistique pour le diagnostic de dfauts. Dans ce cas, le diagnostic de
dfaut est assimil un problme de classification (en deux classes : normale et anormale). Dans
cette mthode, le choix et lextraction des caractristiques reprsentatives de chaque dfaut
reprsentent l'tape la plus importante afin dtre sensible aux symptmes du dfaut et dobtenir
ainsi un systme de diagnostic ractif et prcis.
Ce travail contribue dvelopper une nouvelle approche originale de diagnostic de dfauts assez
performante en termes de prcision, temps de dtection et permettant un pourcentage quasi nul
des fausses alarmes. La mthode SVM est utilise en premier choix pour la dtection et
lisolation de dfaut. Dans certains cas, la modlisation par SVM pour la rgression SVR est
ralise en parallle afin dajouter des estimations au vecteur de mesure. Dans dautres cas, une
combinaison avec des mthodes bases sur le modle (principalement lobservateur grand
gain) a t ncessaire afin de garantir une bonne isolation de dfaut. Cette stratgie est applique
aux systmes rels lchelle de laboratoire/pilote dans le cas dun racteur chimique, et en
simulation dans le cas de procd de traitement des eaux uses et du systme olien.
2

Ce mmoire est organis comme suit :


Le premier chapitre est ddi la revue des mthodes de diagnostic et leurs applications suivie
dune prsentation de la thorie des mthodes utilises dans cette thse, savoir la mthode
SVM, SVR, et quelques observateurs non linaires.
Le deuxime chapitre concerne la premire application de cette thse qui est le systme de
traitement des eaux uses Waste Water Traitement Process WWTP . Ce chapitre prsente
tout dabord le procd et son modle utilis pour la simulation. Ensuite, la mthode SVR est
utilise pour la modlisation (entre/sortie) de certaines variables cls. La mthode SVM est
galement utilise pour le diagnostic de dfaut dans ce systme en utilisant les variables estimes
par SVR en plus des variables mesurs en ligne. Enfin, quelques rsultats de simulation sont
discuts.
Le troisime chapitre est consacr au systme olien Wind Turbine en appliquant la
mthode SVM et un observateur de type Kalman pour le diagnostic de dfaut. On utilisera un
benchmark disponible sur internet pour cette application. La stratgie propose dans ce chapitre
par lauteur de cette thse (Laouti et al., 2011a) a dmontr son efficacit en se classant premire
par rapport 12 autres mthodes lors dune comptition internationale, organise par la socit
kk-electronic, sur le diagnostic de dfaut dans les oliennes .
Le quatrime chapitre prsente lapplication de la mthode SVM (classification et rgression)
aux racteurs chimiques parfaitement agits Continuous Stirred Tank Reactor, CSTR .
Dans chaque application, une revue des mthodes de diagnostic employes dans le domaine en
question est prsente ainsi que le systme et son modle. Par la suite la manire choisie pour
appliquer les SVM est dfinie et les rsultats de simulation sont discuts.
Le mmoire se termine par une conclusion gnrale rsumant les contributions de la thse et
prsentant les perspectives de recherche que je souhaite poursuivre dans lavenir ainsi que
quelques rflexions sur ces prochaines voies de recherches.
Parmi les contributions de cette thse on cite :
1. Une revue de la mthode SVM et ses applications pour le diagnostic de dfauts.
2. La combinaison entre une mthode de diagnostic base sur les donnes SVM avec une
mthode base sur le modle Observateur afin de tirer profit des avantages de chaque
mthode.
3

3. Lapplication de la mthode SVM dans trois procds diffrents : un racteur parfaitement


agit, un systme olien et un systme de traitement des eaux uses.
4. Un capteur logiciel bas sur SVM rgression SVR est dvelopp et sa capacit de
prdiction et de gnralisation face un environnement bruit et assez perturb est tudie.

CHAPITRE I : Diagnostic de dfauts et


thorie des Machines Vecteurs de
Supports

Dans ce chapitre, nous prsentons dune manire simplifie les concepts basiques de diagnostic
de dfauts, et les fondements thoriques des mthodes utilises dans cette thse telles que les
Machines Vecteurs Supports SVM, Observateurs, Analyse en Composantes Principales, etc.

I.1. Gnralits
La recherche constante dune meilleure comptitivit pousse les entreprises produire des
machines ayant une grande fiabilit et disponibilit. Cependant, un systme quelle que soit sa
modernit et sa robustesse, est affect par des dysfonctionnements qui peuvent compromettre son
bon fonctionnement. Il apparat donc ncessaire didentifier rapidement les changements
inattendus (dfauts).
Dans cette premire partie, nous allons d'abord prsenter les principes de diagnostic de dfauts et
quelques dfinitions de la terminologie dans ce domaine.

I.1.1. Terminologie en matire de diagnostic


Partant du fait que le diagnostic de dfaut est rparti sur plusieurs domaines technologiques, un
comit technique SAFEPROCESS de la Fdration internationale de contrle automatique IFAC
a essay de proposer une terminologie unifie (Isermann and Ball, 1997). La terminologie
dfinie par ce comit sera utilise dans ce mmoire :
Dfaut : cart non autoris d'au moins une proprit caractristique ou variable du systme
partir du comportement acceptable / habituelle /standard du systme.
Panne : Linterruption permanente d'une capacit du systme pour effectuer une fonction requise
dans des conditions de fonctionnement spcifies.
Dysfonctionnement : Lirrgularit intermittente dans l'accomplissement de la fonction
souhaite du systme.
Dtection de dfauts : Dtermination de dfauts prsents dans un systme et l'heure de
dtection.
Isolation des dfauts : Dtermination du type, de l'emplacement et du temps de dtection d'un
dfaut. Cette tape suit ltape de dtection de dfauts.
Identification de dfauts : Dtermination de la taille et variation dans le temps du
comportement d'un dfaut. Cette tape suit ltape de lisolation de dfaut.
7

Diagnostic des dfauts : Dtermination du type, de la taille, de l'emplacement et du temps de


dtection d'un dfaut. Cette tape suit la dtection de dfaut et inclut lisolation et l'identification
de dfaut.
Rsidu : Lindicateur de dfaut, bas sur les carts entre les mesures et un modle bas sur des
calculs d'quations.
Symptme : Le changement d'une grandeur observable du comportement normal.
Surveillance : Cest une tche continue en temps rel dterminant les conditions possibles d'un
systme physique, tout en reconnaissant et en indiquant des anomalies du comportement.
Supervision : La surveillance d'un systme physique tout en prenant des actions appropries
pour maintenir le fonctionnement dans le cas de dfauts.
Scurit : Aptitude d'un systme ne pas causer de danger pour les personnes, le matriel ou
pour l'environnement.
Modle quantitatif : Utilise des relations statiques et dynamiques entre les variables du systme
et des paramtres afin de dcrire le comportement d'un systme en terme quantitatif
mathmatique.
Modle qualitatif : Utilise des relations statiques et dynamiques entre les variables du systme
et des paramtres pour dcrire le comportement du systme en termes qualitatifs tels que les
causalits ou les rgles.
Pour plus de dtails voir (Isermann, 2011, Isermann, 2006).
En rsum, le diagnostic de dfaut consiste dtecter, isoler et estimer le dfaut. La dtection
du dfaut dtermine linstant dapparition dun mauvais fonctionnement dans le systme, tandis
que lisolation du dfaut consiste cerner (identifier) les causes ou les sources de dfaut afin de
dire s'il s'agit d'un dfaut de type capteur, actionneur ou procd, et lidentification du dfaut
donne une estimation de certaines caractristiques du dfaut telle que son amplitude.
Le rle de diagnostic de dfaut est dassurer la scurit et le fonctionnement optimal du systme
par lindication de tout tat non dsir (ou statu hors contrle) permettant ainsi dviter tout
dommage ou accident. Gnralement, le diagnostic de dfauts se fait en ligne. Les tches de
dtection et de localisation sont accomplies paralllement ou bien une tche dclenche l'autre.

Nous pouvons souligner que le terme diagnostic a une origine mdicale, qui signifie trouver
les causes de la maladie (dfaut) partir des symptmes perus (les signes observables).

I.1.2. Le principe de dtection de dfaut


La Figure I.1 montre un schma global du fonctionnement dun systme pouvant tre affect par
diffrents types de dfauts. Comme cest le cas dans la plupart des systmes industriels, ce
procd est rgul en boucle ferme avec un contrleur dont lobjectif est de maintenir la sortie
Y le plus proche possible de la consigne Yref. Des instruments de mesure transmettent les
donnes acquises englobant les entres et les sorties mesures ainsi que la sortie du contrleur
vers l'organe de dtection et de diagnostic de dfauts. En plus de ces donnes, le module de
diagnostic de dfaut utilise un modle (fondamental ou statistique) pour raliser la surveillance
du systme et informer le module de reconfiguration de la prsence de dfauts.

Figure I.1 Architecture du fonctionnement dun systme avec une commande tolrante aux
dfauts
Le bloc de reconfiguration permet de garder le systme dans ltat dsir par le rglage des
paramtres du contrleur ou par une adaptation dune nouvelle loi de commande (Blanke et al.,
2006, Blanke et al., 2003, Prakash et al., 2002). On note quil existe plusieurs mthodes de
reconfiguration, toutefois elles ne seront pas discutes dans ce mmoire. Le but de la
reconfiguration est de continuer faire fonctionner le systme tout en maintenant les
performances/conditions de scurit requises malgr la prsence de dysfonctionnement dans
l'attente d'une opration de maintenance (Patton, 1997).
Afin de raliser le diagnostic des dfauts, une premire approche consiste dupliquer les
composants d'instruments de mesure pour augmenter la fiabilit. Cela nous permet de choisir la
mesure saine partir des mesures disponibles. Cette approche sappelle la redondance
9

matrielle. Elle est utilise dans le diagnostic, surtout dans le domaine aronautique, mais elle
entrane une augmentation des cots et une rduction de lautonomie du systme. La deuxime
approche, qui est la redondance analytique, est trs intressante la fois sur le plan financier et
technique puisquelle se base uniquement sur lexploitation de relations existantes entre les
diffrentes variables mesures ou estimes. Aprs la collection des donnes, on essaie dextraire
les informations utiles partir de ces donnes, en dautres termes, de convertir ces donnes
brutes en quelque chose de significatif pour des objectifs bien prcis. Le processus de dtection
de dfauts proprement dit est donc compos essentiellement de deux phases (Chow et al., 1982) :
gnration de rsidus suivie par lanalyse de rsidus, comme le montre la Figure I.2

Figure I.2 Schma classique de dtection des dfauts


Gnration des rsidus : Cette tape consiste crer un signal calculant la diffrence entre la
sortie relle et celle estime. Le rsidu est nul (ou ngatif dans certaines mthodes) dans le cas
du fonctionnement normal, et en cas de dysfonctionnement, il sera proportionnel la gravit du
dfaut.
valuation des rsidus : Cette phase permet d'analyser les indicateurs de dfaut gnrs et de
dfinir un seuil (fixe, adaptatif, ou statistique) qui va dcider de l'instant de changement d'tat de
fonctionnement du systme. En effet, dans le cas rel, les bruits de mesure, les imprcisions de
modlisation et les perturbations ne sont pas des grandeurs dterministes mais de nature alatoire
car ils vont introduire des variations imprvisibles sur le systme. Cette tape est donc capitale
afin de diminuer les taux de fausse alarme ou de non dtection.

I.1.3. FDI en boucle ouverte et en boucle ferme


Un dfaut agit dune manire diffrente sur le systme dpendamment si le fonctionnement (de
la commande) est en boucle ouverte ou en boucle ferme. Il influence les sorties et/ou les entres
mesurables et/ou les paramtres internes du systme ou les variables dtats non mesurables.

10

Lorsquun systme ou procd fonctionne en boucle ouverte et quun dfaut apparat, ce dernier
va influencer la sortie Y par un cart (offset) 'Y. Par contre, dans le cas de procd fonctionnant
en boucle ferme, la sortie risque de ne montrer quune faible dviation qui disparat
rapidement, surtout si un contrleur de type intgral est utilis pour asservir cette sortie
(contrleur PI). En revanche, la variable dentre manipule U va montrer un offset permanent
'U. Il est souligner que la sortie est galement affecte par des bruits, perturbations et des
variations dans U. Cela rend la tche de diagnostic trs difficile.
On note galement que les dfauts peuvent apparatre de diffrentes faons, dune manire
brusque (cest le cas dune coupure de phase dans un moteur lectrique), dune faon progressive
(on parle dune drive lente, cest le cas dencrassement) ou dune faon intermittente qui
apparat selon les conditions de fonctionnement (temprature, pression, concentration).

I.1.4. Domaines concerns par la FDI


La communaut de l'automatique a tabli un cadre thorique bien fond pour le diagnostic de
dfaut pour les systmes linaires (Nyberg, 1999, Chow et al., 1982) et non linaires (Ding,
2008). Une revue dtaille des techniques dveloppes pour le diagnostic de dfauts est donne
dans (Venkatasubramanian V. et al., 2003) et un grand nombre d'applications en ingnierie
jusqu'en 1996 est fourni dans (Isermann and Ball, 1997) .
Dans cette littrature, nous pouvons citer les applications suivantes :

Procds chimiques : (Caccavale et al., 2011, Verron, 2007, Pierri et al., 2008a,
Chetouani, 2006, Ram Maurya et al., 2004)

Moteurs, machines et roulements : (Verucchi et al., 2008, Ding, 2008, Isermann,


2005)

Eoliennes : (Wei, 2010, Dolan, 2010), Donders, 2002)

Procd de traitement des eaux uses : (Baggiani and Marsili-Libelli, 2009,


Wimberger and Verde, 2008, Tharrault, 2008)

Turbine gaz industrielle : (Simani et al., 2003)

Systme hydraulique : (Ding, 2008, Hammouri et al., 2002)

Industrie automobile : (Arnanz et al., 2011,Saludes Rodil et al., 2009, Svard and
Nyberg, 2010)

Rseau de distribution lectrique : (Mohamed and Rao, 1995)

Robot manipulateurs : (Paviglianiti et al., 2010)


11

Circuit lectronique analogique : (Mohsen and El-Yazeed, 2004)

Systme de contrle du vol davion : (Hajiyev, 2012)

On peut trouver aussi une revue dtaille sur le diagnostic de dfauts appliqu sur les
systmes de chauffage, ventilation, et climatisation : (Katipamula and Brambley,
2005).

I.1.5. Performances des techniques FDI


Afin d'valuer la performance d'une technique de diagnostic de dfauts ou la comparer avec
dautres mthodes, il faut dfinir certains critres de performances respecter:
1. La rapidit de dtection du dfaut.
2. La minimisation de fausses alarmes
3. La robustesse de la mthode face la prsence de bruit, perturbation et erreur de
modlisation.
4. Ladaptation face aux variations du procd.
5. La capacit identifier des dfauts multiples.
6. La capacit manipuler diffrents types de dfauts (actionneur, capteur, procd).
7. La diagnosticabilit ou la capacit de distinction entre les diffrents dfauts.
8. La sensibilit face des petits dfauts.
9. La prcision de la localisation.
10. La convenance par rapport aux systmes rels gnralement non linaires.
11. Laptitude inclure la commande tolrante aux dfauts.
12. La simplicit d'implmentation et d'utilisation.

I.2. Les mthodes de diagnostic


Des chercheurs de domaines varis ont essay de raliser la tche de diagnostic pour diffrents
systmes en apportant leur connaissance et outils de certains domaines de recherche. Cela
conduit l'enrichissement de mthodes de diagnostic.
Certains chercheurs dcomposent les mthodes de diagnostic en 3 catgories (Isermann, 2011,
Ping, 2011, Verron, 2007, Frank et al., 2000). Dans cette thse, les approches de diagnostic de
dfauts sont dcomposes en deux grandes catgories, comme propos par (Zhang and Jiang,
2008) et (Venkatasubramanian V. et al., 2003a) :

12

1. Schmas

bass

sur

le

modle

(Venkatasubramanian

V.

et

al.,

2003a,Venkatasubramanian et al., 2003b)


2. Schmas bass sur les donnes (sans modle a priori) (Venkatasubramanian, 2003c)
Ces approches sont brivement discutes dans les paragraphes suivants.

I.2.1. Mthodes base de modle explicite


Les mthodes bases sur un modle explicite utilisent un modle dcrivant les relations
fondamentales gouvernant le systme afin de gnrer des symptmes de dfauts (Simani et al.,
2003). Ces mthodes ont de nombreux avantages car elles permettent didentifier le type du
dfaut et de remonter la source du dfaut pour diffrentes classes de systmes. La plupart des
mthodes base de modle reposent sur le concept de redondance analytique qui consiste
vrifier la cohrence entre le comportement simul du modle et celui rellement observ, do
la ncessit davoir un modle dtaill et suffisamment prcis du systme afin d'avoir des
rsultats satisfaisants. Ceci est ralis en gnrant des rsidus qui permettent leur tour de
dtecter un cart entre le comportement dfectueux et le comportement normal du systme.
Plusieurs mthodes sont envisageables pour lobtention de rsidus partir de modles
analytiques (Figure I.3). On peut citer par exemple les mthodes par estimation de paramtres,
par estimation d'tat, ou par espace de parit.

Figure I.3 Schma de classification des mthodes de diagnostic de dfauts bases sur le
modle
13

Approche par estimation de paramtres :

Partant de l'ide qu'un dfaut se reflte dans les paramtres physiques du systme, des mthodes
d'estimation paramtriques sont utilises pour estimer la valeur actuelle de ces paramtres. Le
rsidu est ainsi calcul partir de l'cart entre la valeur des paramtres estims et celle de
rfrences obtenue dans le cas sans dfaut (Simani et al., 2003, Gertler, 1998, Fuente et al.,
1996).
x

Approche par espace de parit :

Cette technique se base sur la rcriture des quations d'tat et de mesure de telle sorte que seules
les variables connues (entres et sorties) sont autorises apparatre. Ces variables connues sont
ensuite utilises afin de construire un rsidu indicateur de dfaut.
Soit le modle G M

A z
dcrivant le systme G p
B z

A z
. Ainsi le rsidu peut tre dfini
B z

comme suit :

A z

r z


B
z

A z
u z
B z

(I.1)

Plusieurs travaux ont utilis cette mthode pour le diagnostic de dfauts (Gustafsson, 2007,
Gertler, 1998) ou ont combin cette mthode avec la mthode destimation de paramtre
(Isermann, 2005).
x

Approche par estimation d'tat (observateur)

La construction des observateurs dtat reprsente une des techniques les plus employes dans
lapproche base sur le modle (Ding, 2008, Pierri et al., 2008b, Li et al., 2008, Isermann, 2006,
Simani et al., 2003, Venkatasubramanian V. et al., 2003a, Lootsma, 2001, Lootsma, 1999). La
redondance analytique est obtenue grce aux tats estims partir dun modle adquat et dun
ensemble de mesures appropries. En comparant les variables estimes et mesures, un ensemble
de signaux (rsidus) sensibles aux dfauts est gnr. Ces rsidus sont ensuite analyss pour
dtecter et/ou isoler le dfaut.
Diffrents types dobservateurs ont t proposs dans la littrature pour les systmes linaires et
non linaires. Parmi les techniques les plus utilises, on peut citer les observateurs entre
inconnue (Sotomayor and Odloak, 2005); les observateurs bass sur le placement de structure
propre The eigen structure assignment approach (Patton and Chen, 2000), les observateurs
14

mode glissant (Edwards et al., 2000) , le filtre de Kalman tendu qui a t initialement appliqu
pour la dtection et lisolation des dfauts des systmes non linaires par (Huang et al., 2003).
Le problme fondamental de dtection et disolation des dfauts de systmes non linaires a t
introduit initialement par Frank (Frank, 1990). Depuis lors, plusieurs techniques ont t utilises
pour les systmes non linaires. Une revue sur les principales approches bases sur les
observateurs pour les systmes non linaires a t donne par (Alcorta Garca and Frank, 1997) .
Les auteurs dans (Hammouri et al., 2002), (De Persis and Isidori, 2001), (Kabore et al., 2000) et
(Hammouri et al., 1999) ont propos une solution pour la dtection et lisolation des dfauts des
systmes non linaires en combinant une approche gomtrique de dcouplage avec les
techniques des observateurs non linaires, notamment le grand gain.
Tout l'art de ces approches rside dans le choix du terme correctif et plus particulirement la
synthse de gain qui a pour objectif non seulement de s'assurer de la convergence de l'estimation
vers la sortie relle du procd mais aussi le dcouplage par rapport aux autres dfauts.
Dans cette thse on sintresse deux types dobservateurs ; un observateur grand gain et un
autre de type Kalman cause de leur convergence exponentielle. Lobservateur grand gain
sera appliqu dans lestimation dtat d'un racteur chimique alors que lobservateur de type
Kalman trouvera son application dans le systme olien. Un bref rappel de ces types
dobservateurs est donn ci-dessous.

I.2.1.1. Observateur grand gain


Ce type dobservateur peut sappliquer une large classe de systmes non linaires qui
scrivent sous la forme suivante :
x1 (t ) A1 (u (t ), s (t )) x2  \ 1 (u (t ), s(t ), x1 (t ))  H 1 (t )

xq1 (t ) Aq1 (u (t ), s(t )) xq  \ q1 (u (t ), s (t ), x1 (t ),, xq1 (t ))  H q1 (t )



xq (t ) \ q (u (t ), s(t ), x(t ))  H q (t )

y (t ) x1 (t ) Cx

O x

>x , , x @

R n est le vecteur dtat, xi

matrice carre de dimension k u k (q.k

[ xi1, , xik ]T , u t est lentre, Ai u, s est une

n) , s(t) est un signal connu, \

15

(I.2)

[\ 1 ,,\ q ]T sont des

fonctions non linaires et supposs diffrentiables, H


born, C

[H 1 , , H q ]T est un vecteur non connu

I k , 0,, 0 .

Un observateur grand gain peut tre construit pour le systme prcdent en se basant sur les
hypothses suivantes:
H1) \ est globalement Lipschitz par rapport x.
H2) Les matrices Ai (u(t ), s(t )) et leurs drives sont inversibles et bornes
H3) Les matrices Ai (u(t ), s(t )) sont diffrentiables par rapport au temps et leurs drives sont
bornes.
Dans ce cas, lobservateur grand gain du systme (I.2) est donn par:

x

A(u (t ), s(t )) x \ (u (t ), s(t ), x (t ))  /1'T K (Cx  y)

(I.3)

O K est une matrice de taille nu k tel que A  KC est une matrice Hurwitz,




0 Aq 1(u (t ), s (t ))

0
0

0
0 A1(u (t ), s (t ))

0
A2 (u (t ), s (t ))
0
A(u (t ), s (t )) 
0


0

\1(u , s, x1)


, '

\ (u , t )
T
\ q 1(u , s, x1,  , xq 1)

\ q (u , s, x )

Ik

0
/ (t ) 
0

A1 (u (t ), s (t ))


T 0

2
0 T
 0
0 

 

 0
q
0 T


(I.4)

A1 (u (t ), s (t )) u  u Aq1 (u (t ), s (t ))

(I.5)

0 Ik 0  0

0 0 Ik  0
A     
0 0 0  I
k

0 0 0  0

T est un paramtre de rglage positif, Ik est la matrice identit de taille k u k .

16

(I.6)

(I.7)

Thorme: (bas sur les rsultats donns dans Farza et al., 1997, Gauthier et al., 1992)
Supposons que le systme (I.2) satisfait les hypothses H1), H2) and H3), alors:

x (t )  x(t ) d Ke Pt x (0)  x(0)  JH f


O H f est la norme infinie ( Lf ) de H (t ) ; K ! 0 , P ! 0 et J ! 0 sont des constantes. Cela
implique que, si H

0 , alors, le systme (I.3) est un observateur exponentiel du systme (I.2).

I.2.1.2. Observateur du type Kalman


Lobservateur de type Kalman a t initialement propos par (Bornard et al., 1989) et
(Hammouri and de Leon Morales, 1990) pour une classe de systmes non linaires o la matrice
dtat peut dpendre du signal dentre, du signal de sortie ou du temps et toutes les entres sont
rgulirement persistantes. Ce systme peut se mettre sous la forme :

x A(u ) x  M (u )

y Cx

(I.8)

O y ; x n ; u m et M(u) est un vecteur qui dpend non linairement de u.


Notons par Iu (s, t0 ) , la matrice de transition, la solution unique de lquation :
dIu ( s, t0 )
ds

A u ( s ) .Iu ( s, t0 )

(I.9)

Notons par G(u, t0 , t0  t1 ) le Grammien dobservabilit relatif lentre u sur lintervalle


[t0, t0+ t1] :
G u, t0 , t0  t1

t0 t1

*
u

(t , t0 )C *CIu (t , t0 )dt

(I.10)

t0

O C* reprsente la transpose de C.
Dfinition :
Lentre uRm est dite rgulirement persistante pour le systme (I.8) si  t1 > 0,  D1 > 0,  D2
> 0 and  t0 t 0 tels que ttt0 :

Omin G u, t0 , t0  t1 t D1
Omax G u, t0 , t0  t1 d D 2

17

(I.11)

O O min et O max reprsentent la plus petite et la plus grande valeur propre respectivement.
Thorme: (Bornard and Hammouri, 1991)
Si u est rgulirement persistante, alors pour tout T > 0, le systme suivant :

x


A(u ) x  G (u )  R 1C T Cx  y
T .R  AT (u ) R  R. A(u )  C T C

(I.12)

est un observateur exponentiel pour (I.8). Le paramtre de rglage T dtermine la vitesse de


convergence de lobservateur qui est garantie si la matrice R est symtrique dfinie positive.
La particularit de lobservateur de type Kalman est son gain variable donn par la rsolution de
lquation algbrique de Riccati.

I.2.2. Mthodes bases sur les donnes


La disponibilit dune grande quantit des donnes ainsi que les inconvnients des mthodes
bases sur le modle (dus la ncessit davoir un modle prcis par exemple), ont encourag la
croissance des mthodes de diagnostic bases sur les donnes. Ces mthodes peuvent permettre
des dveloppements rigoureux des donnes disponibles (mesures historiques ou en temps rel)
mme dans le cas de systmes complexes, do leur succs dans les applications industrielles.
Elles font appel des procdures d'apprentissage et de reconnaissance de forme, la logique
floue ou lintelligence artificielle (Frank and Kppen-Seliger, 1997) afin de gnrer les
symptmes de dfaut qui seront analyss pour fournir la dcision de diagnostic de dfaut (Reiter,
1987).
Les mthodes bases sur les donnes sont appropries pratiquement pour n'importe quel type de
problme pour lequel d'importantes quantits de donnes mesures reprsentatives du
fonctionnement du systme sont disponibles. Elles sont dautant plus intressantes lorsque le
modle mathmatique du systme nest pas disponible, ce qui rend inutilisables les mthodes de
diagnostic bases sur le modle. Lapplication de ces mthodes est ralise en diffrentes tapes
dacquisition et prtraitement des donnes, de modlisation/apprentissage et de validation. La
Figure I.4 rpertorie les diffrentes mthodes de diagnostic de dfauts bases sur les donnes. Un
aperu des mthodes bases sur des donnes est donn dans (Venkatasubramanian, 2003).

18

Figure I.4 Mthodes de diagnostic diriges par les donnes

Vrification de limites et tendances

La mthode la plus simple de supervision dans le cas dabsence de modle est mono variable et
se base sur la vrification de limites (seuils) de la valeur de certaines variables mesurables telles
que : la pression, la temprature, la force, la vitesse et la position. Si cette valeur dpasse la zone
de tolrance ( Ymin  Y  Ymax et

dY
dYmin
 Y  max ), une alarme se dclenche. Loprateur doit
dt
dt

ensuite cerner le dfaut (le localiser) afin de prendre les mesures ncessaires pour le retour
ltat normal.
Certes, cette mthode est simple et facile mettre en uvre, mais elle a des limites. En effet, si
une variable mesure dpasse la zone de tolrance, le procd est probablement dj dans un tat
critique. En plus, malgr que ces mthodes fonctionnent quand le procd est ltat dquilibre,
la situation devient plus complique si la variable contrle change de dynamique avec les points
de fonctionnement. Aussi, un dfaut important dans un procd complexe peut dclencher
plusieurs alarmes en mme temps. Cela rend la tche de loprateur qui supervise le procd
difficile pour identifier le dfaut en question afin de ragir immdiatement par les actions
requises.

Mthodes statistiques

Les mthodes statistiques font partie des mthodes bases sur les donnes. En tudiant les
caractristiques dun ensemble dobjets ou dobservations, elles donnent un moyen essentiel
pour la connaissance. A partir de ces donnes, elles fournissent un outil graphique facilement
19

manipulable et interprtable par loprateur. Malheureusement, cela demande la connaissance


complte de la population, ce qui rend ces mthodes coteuses, voire impossibles dans certains
cas (comme dans le cas des systmes rgis par des perturbations inconnues). La solution est donc
dutiliser les statistiques infrentielles qui consistent utiliser la thorie de probabilits afin
dinduire les caractristiques inconnues dune population partir de certains chantillons tirs de
cette population avec une certaine marge derreur, autrement dit la dtermination dune loi de
probabilit partir dune srie dexpriences.
Parmi les mthodes statistiques, on cite lAnalyse en Composantes Principale (ACP), Partial
Least Square (PLS) et Support Vector Machines (SVM). Les mthodes ACP et PLS ont t
utilises dans cette thse titre comparatif avec la mthode de rfrence qui est la mthode
SVM. Dans les deux paragraphes suivants, on propose donc de rappeler la thorie et les
applications de ces deux mthodes.

I.2.2.1. LAnalyse en Composantes Principales (ACP)


Lanalyse en composantes principales (ACP) Principal Component Analysis PCA est une
mthode gomtrique et statistique qui permet de transformer lespace multivariable dentres
corrles en un espace plus petit non corrl tout en conservant le maximum de variance des
donnes dentres. Elle permet de voir les donnes dune manire diffrente (dans un autre
repre) par la rotation des axes des variables originales vers des nouveaux axes, qui sont
orthogonaux et compltement dcorrls pour viter davoir des informations redondantes. Cest
donc une mthode danalyse et de rduction de dimension de donnes. Elle gnre un nouveau
jeu de donnes appel Composantes Principales (CP) (variables latentes, ou facteurs) partir
desquelles le modle va tre construit, et chaque composante a un taux de reprsentation du
modle, comme on peut le voir sur la Figure I.5 . Chaque composante est une combinaison
linaire des variables originales. Donc chaque variable peut contribuer la cration du modle
contrairement la slection des caractristiques (voir section I.2.3.3) qui utilisent juste un sousensemble des variables originales pour la cration du modle (Ramaswami and Bhaskaran,
2009). Plus le nombre de composantes est important, plus la sensibilit au bruit va augmenter.
On se limite gnralement 2 ou 3 composantes, o le maximum dinformation (variance) est
compress.

20

Variabilit
Composantes
Principales

Explique %
1

2 3 4 5

6 7 8

9 10 11 12 13

Figure I.5 Taux de reprsentativit des composantes principales dans le modle


Le champ dapplication de cette mthode est trs vari allant de la rduction de dimension ,
rduction et suppression de bruit, visualisation, la compression de donnes, dtection des
dfauts (Sun et al., 2005, Dunia et al., 1996), et aussi au prtraitement des modles empiriques.
Fondement thorique de la mthode ACP
Soit X une matrice de donnes de taille n u m constitue de n observations ou chantillons et m
variables : X

x11  x1m
  

x n1  x nm

L'ACP cherche laxe (utilis dans la projection des chantillons) qui va maximiser la capture de
variabilit ou variance (information) des nuages de points. Ceci est fait en utilisant une matrice
de transformation P mun , qui projette les donnes dans un espace de dimension rduit :
X

TPT et E

(I.13)

X  X

Pi est nomm le vecteur poids loading , qui contient linformation qui concerne la relation
entre les variables. X est la nouvelle matrice de donnes qui estime X . E est la matrice des
rsidus et reprsente la source de bruit. Les lments de T sont appels scores, et ils contiennent
la relation entre les chantillons. Les scores reprsentent les valeurs des variables originales
mesures et transformes dans lespace de dimension rduit. Lespace des donnes dorigine
peut tre calcul comme :
X

TPT  E X

t p
i

T
i

(I.14)

E

i 1

O ti est le vecteur score. Ceci donne la mthode ACP la possibilit denlever le bruit et de
laisser seulement linformation pertinente. La matrice de variance-covariance R est obtenue par
la dcomposition en valeurs singulires :
R U/1/ 2U T

>

XTX
1
X T X  ET E
n  1 n  1

21

(I.15)

O / est la matrice diagonale contenant les valeurs propres dans un ordre dcroissant de la
matrice de corrlation R. Les colonnes de la matrice U sont les vecteurs propres de R. La matrice
P est gnre par le choix des vecteurs propres de U.
Le choix du nombre a (a<m) des variables latentes (composantes principales, vecteurs colonnes
de P) est important puisquil permet de construire la matrice P, et par la suite X qui reprsente
la source de variabilit dans le procd. Il dtermine donc la qualit du modle ACP afin de
garder la plupart de linformation dorigine (Valle et al., 1999). Ces variables doivent respecter
trois proprits : elles sont non corrles, elles ont des variances squentiellement maximales et
lerreur dapproximation quadratique entre les vecteurs dorigines et les premires CP est
minimale.
Une des mthodes qui permet de dterminer le nombre de composantes a, est la Variance
Cumulative en Pourcentage Cumulative Percent Variance : Dans cette mthode, le choix se
fait de telle sorte que les premires a composantes doivent avoir une VCP suprieure 90% :
a

VCP (a)

i 1

trace R

u 100

(I.16)

O R est la matrice de variance-covariance, et Oi sont les valeurs propres.


Diagnostic de dfaut par ACP
Afin dutiliser la mthode ACP pour la dtection de dfaut, on analyse les deux distances
complmentaires dfinies ci-dessous qui sont utilises comme indicateurs de dfauts. Cependant,
ces deux indices dtectent trs souvent des situations anormales, ce qui provoque une confusion
pour les oprateurs de procds qui effectuent l'analyse des dfauts. En effet, si loccurrence
dun vnement produit un changement dans la covariance du modle, il sera dtect par une
grande valeur de T2 et Q qui dpasse les limites de confiance.
Lisolation de dfaut par ACP peut se faire par la mthode de calcul des contributions
approximatives des diffrentes variables la valeur de lindicateur de dtection. Les variables
avec une forte valeur de contribution sont considres comme responsables du dfaut.

22

1. La carte de contrle T2 de Hotelling statistique


La carte de contrle T est dfinie comme la majeure partie de variation des donnes lintrieur
du modle (lespace principal). Le processus est considr tant en fonctionnement normal pour
un seuil de confiance D donn, et une distribution du F :

T 2 (k ) t (k )/a1t T (k )

x(k ) P/1PT xT (k ) d G T2
(I.17)

a (n 2  1)
FD a, n  a
n( n  a )

2
a , n ,D

O n est le nombre dchantillons, a est le nombre de composantes principales, FD a, n  a est la


valeur de la distribution de Fisher-Snedecor. / a est la matrice forme par les premires lignes et
colonnes de / , D reprsente le niveau appropri de l'importance pour la ralisation du test qui
prend gnralement la valeur de 0,05 ou 0,01 pour les limites de confiance.
2. Indice Squared Prediction Error SPE
Lindice SPE est dfini comme la somme des carrs de chaque ligne de E. Il est perpendiculaire
l'espace construit par le modle ACP :

SPE (k )

x (k )  x (k )
n

e(k )e(k )T

X I  Pa PaT X T d G T2

(I.18)

d G T2

(I.19)

j 1

x (k )  t (k ) p
n

ET E

T 2
j

j 1

La limite suprieure, ou les seuils de confiance de Q statistique, peuvent tre calculs par sa
distribution approximative comme suit :
1

QD

h .c . 2T1 T 2 h0 h0  1 h0

T1 0 D

T1
T12

Ti

i
j

, h0 1 

j a 1

(I.20)

2T1T3
3T 22

O cD est l'cart type normal correspondant la partie suprieure (1-D) centile, Oj est la valeur
propre associe au jme vecteur poids. Q statistique reprsente lerreur de prdiction quadratique
dcrivant le bruit dans les donnes et la variation lextrieur du modle. Q est utilis pour
surveiller et suivre de prs la corrlation entre les variables du procd. Une augmentation de sa
valeur signifie un changement dans les corrlations qui gouvernent les variables ce qui
23

indiquerait un dfaut. Cependant, la distance SPE est sensible aux incertitudes de modlisation
provoquant de nombreuses fausses alarmes si les systmes sont non-linaires.
Des travaux ont t faits utilisant lACP avec les cartes de contrle Q et T2 statistiques afin de
diffrencier entre loccurrence dun dfaut et une condition de fonctionnement normale largie
(Humberstone et al., 2012, Humberstone, 2010). Nanmoins, ces cartes de contrle prsentent
certaines restrictions puisqu'elles font des suppositions sur la distribution des donnes. (Camci et
al., 2008) proposent une carte de contrle base sur la distance noyau utilisant les principes de
SVM et dmontre quil est sensible tous les types de donnes en hors contrle quels que soient
leurs distributions et permet aussi de bnficier et dapprendre de ces donnes.

I.2.2.2. Moindres carrs partiels (PLS)


La mthode de Moindres Carrs Partiels (MCP) ou Projection aux Structures Latentes (PSL)
Partial Least Squares PLS est un algorithme danalyse statistique multivariable propos par
Wold la fin des annes 60 qui combine les fonctionnalits de lACP et la rgression multiple
(Wold, 1966). Il tait destin au dbut pour lconomtrie. Il a trouv un grand succs et pris de
lampleur en chimiomtrie o il est devenu un outil standard danalyse et de calibrage du spectre
pour choisir les longueurs donde appropries. Maintenant, cette technique est applique dans
plusieurs disciplines telles que la mdecine, la modlisation des procds, les sciences
pharmaceutiquesetc. La notation PLS est utilise par la suite dans cette thse pour dsigner
cette mthode.
La PLS cherche les composantes latentes qui maximisent la covariance entre X et Y, afin de
trouver une relation entre les variables indpendantes (entre X) et les variables dpendantes
(sortie Y) en les dcomposant en variables latentes non corrles avec un processus itratif. La
structure latente correspond lextraction du maximum de variation de Y qui explique au mieux
la structure latente de X. Cette mthode est similaire lanalyse de corrlation canonique, et
est lie aux autres mthodes de rgression telles que la rgression en composantes principales.
La PLS a surmont les problmes de colinarit (qui mnent une mauvaise interprtation des
coefficients de rgression E), et les problmes de limitation du nombre de variables prdites par
rapport aux mthodes de rgression standards des moindres carrs. Elle permet danalyser des
donnes avec plus de variables que dobservations et produit des modles avec une grande
stabilit de prdiction car le risque de sur-apprentissage est minimis. Elle est trs efficace dans
la gestion des valeurs manquantes et donc produit des modles trs robustes face aux dfauts
capteurs par exemple. Elle est aussi capable de dtecter les valeurs aberrantes avec une analyse
24

plus soigne des donnes amliorant ainsi la qualit des modles dajustement. Cette mthode
permet de manipuler plus facilement le bruit et les donnes redondantes et corrles et de raliser
une marginalisation des valeurs anormales pour amliorer la robustesse du systme. Elle
reprsente aussi une faon trs propre dinverser des matrices, la diffrence de lanalyse en
composantes principales qui cherche trouver les composantes principales qui expliquent le
maximum de variance dun seul bloc X ou Y sans tenir compte des autres blocs. Enfin, elle a
lavantage de pouvoir prdire soit plusieurs variables rponse la fois (PLS2) soit juste une seule
variable rponse (PLS1). En gnral, plus les variables rponses sont corrles meilleure sera la
performance de PLS2 par rapport PLS1 en termes dinterprtation et de prcision de prdiction.
Les algorithmes PLS sont numriquement stables, leur simplicit dimplmentation et de calcul
leur donne un aspect fort. Une des difficults de rglage du PLS est le choix du nombre de
valeurs latentes qui permet une bonne gnralisation. Cela peut se faire avec une validation
croise.
La PLS est un outil trs polyvalent qui peut raliser plusieurs tches : la rgression (Melssen et
al., 2007, Kim et al., 2005), la rduction de dimension (Tenenhaus et al., 2007), la classification
(Barker and Rayens, 2003, Nguyen and Rocke, 2002), la supervision et le contrle des procds
(Kourti, 2005), la surveillance des procds (Zhou et al., 2010), et la modlisation (Shinzawa et
al., 2011). Elle a aussi t utilise avec succs dans la surveillance et la dtection des dfauts
pour les donnes chimiques (Wise and Gallagher, 1996). La PLS est mieux adapte au
diagnostic de dfauts que l'ACP sur le plan thorique et pratique (Chiang et al., 2000) car lACP
sintresse seulement la capture du maximum de variance sans tenir compte de la relation qui
existe entre les donnes et les dfauts. La performance et lefficacit de la mthode PLS a t
montre dans plusieurs travaux et articles (Ferrer et al., 2008,Yin et al., 2011), et elle a t
combine aussi avec dautres mthodes telles que les SVMs (Rosipal and Trejo, 2003, Lu and
Wang, 2008).
Diffrentes mthodes ont t proposes pour tendre la mthode PLS au cas non linaire. En
utilisant la force des mthodes noyau, la PLS peut tre tendue dune manire simple et efficace
au cas des systmes non linaires. Il y a aussi plusieurs variantes de PLS qui diffrent selon la
faon avec laquelle elles extraient les vecteurs latents. Un des algorithmes les plus lgants qui
reprsentent la faon standard du PLS est le PLS itratif non linaire (Geladi and Kowalski,
1986) qui est le plus appropri pour la supervision des procds par rapport la mthode
SIMPLS (Li et al., 2010). Lalgorithme SIMPLS a cependant lavantage de calculer les facteurs
PLS directement comme une combinaison linaire des variables dorigine en maximisant un
25

critre de covariance et donc vite de calculer des matrices dgonfles comme cest le cas dans
lalgorithme NIPALS (de Jong, 1993).
Fondement thorique de la mthode PLS
Soit un ensemble de donnes compos des deux matrices X des mesures (entres) et Y des
rponses (sorties). La PLS dtermine la relation entre ces deux blocs, en essayant de garder le
maximum de covariance entre eux, par les quations suivantes :

X TPT  E

T
Y UQ  F

(I.21)

X est la matrice prdicateurs de donnes de taille num o chaque ligne reprsente une
observation ou les mesures un chantillon donn, et chaque colonne reprsente les mesures
dune variable. T est la matrice de scores de X, P la matrice de chargement de X, Y la matrice de
rponse de taille numy , U la matrice des scores de Y, Q la matrice de chargement de Y, E et F
sont les matrices rsiduelles.
La modlisation de X et Y de cette faon suppose que les deux sont observs avec une erreur
(rsidu). Le chargement se fait travers les vecteurs latents T qui peuvent tre choisis de
diffrentes faons, condition quils soient orthogonaux (dcorrls) couvrant lespace des
colonnes de X. Des conditions additionnelles sont requises afin de spcifier T pour que les
vecteurs de T soient orthogonaux, telle la cration dune combinaison linaire des colonnes de X
et Y en multipliant ces dernires par les poids w et c respectivement de telle sorte que leur
covariance soit maximale (Geladi and Kowalski, 1986, Rosipal and Krmer, 2006) :

Xw, u Yc, wT w 1, t T t 1

tel que t T u soit maximale

(I.22)

t, u sont les vecteurs scores de X et Y respectivement. w et c sont les coefficients de rgression


de X et Y sur u, t respectivement (vecteurs poids de X et Y). Quand les premiers vecteurs latents
(t et u) sont trouvs, ils sont soustraits de X et Y et la procdure est ritre jusqu' ce que X
devienne une matrice nulle.

w (uT u)1 X T u

et

(t T t )1Y T t

(I.23)

Avant de commencer le processus itratif, le vecteur u est initialis dune faon alatoire par le
choix dune colonne de Y (celle avec la plus grande variance).

26

X Tu
, w o 1, t
uT u

Y Tt
, c o 1, u Yc
tT t

Xw, c

(I.24)

On rpte ces tapes jusqu' la convergence. La PLS est une mthode itrative, qui dtermine
chaque itration les vecteurs poids w, c ou les vecteurs scores t, u et les chargements p sont
calculs, ainsi X et Y seront ajusts par ces rsultats :

X  t. pT
Y  u.qT

X  t tT X
Y  t tTY

(I.25)

O p et q sont les coefficients de rgression de X et Y sur t, u respectivement

p (tT t )1 X T t

(I.26)

q (uT u)1Y T u

et

Aprs chaque itration les vecteurs w, t, p et q sont enregistrs dans les matrices W, T, P, et Q
respectivement. On peut voir w comme le vecteur propre droite de la matrice S

X T Y , et le

problme devient :
X T YY T Xw Ow
t Xw

(I.27)

Dans PLS rgression le but est de prdire Y en utilisant X et leur structure commune :
Y

(I.28)

XE  H

Daprs (Rosipal and Krmer, 2006), la structure commune est donne par la relation suivante :

E W ( PTW )1CT

(I.29)

X TU (T T XX TU )1T TY

(I.30)

ce qui donne :

PLS noyau : (KPLS) est une extension non linaire du PLS linaire. Lutilisation de fonction
noyau (Kernel) permet de transformer (mapper) les donnes complexes non linaires de lentre
dans un espace de caractristiques de plus grande dimension dans lequel la modlisation linaire
peut se faire facilement (Rosipal and Trejo, 2002). Cette notion de noyau va tre dtaille par la
suite dans la thorie des SVMs. La fonction noyau est donne comme suit :

K x xi , x j

\ xi ,\ x j

(I.31)

Avant de commencer le processus itratif, le vecteur u est initialis dune faon alatoire :

1) t \\ T u

Kx u

2) t o 1

3) c Y T t

4) u Yc

5) u o 1

En utilisant lquation (I.27) en multipliant les deux termes par X on obtient :

27

(I.32)

XX T YY T t

Ot

(I.33)

u YY T t
Considrons K y

MM la matrice noyau du Gram (Kernel Gram matrix) de la sortie Y et M la

transformation de lespace de sortie de Y vers lespace de caractristique, do :


KxK y t
u

Ot

(I.34)

Ky t

Pour centrer les donnes transformes dans lespace des caractristiques, cela revient :

1
1
K x m ( I n  1n1Tn ) K x ( I n  1n1Tn )
n
n
1
1
K y m ( I n  1n1Tn ) K y ( I n  1n1Tn )
n
n

(I.35)

O I n est la matrice identit de taille n, et 1n est le vecteur unit de taille n. Aprs le calcul des
nouveaux scores t et u, on soustrait des matrices K x et K y leurs approxims calculs partir de t
et u :

K x m ( I n  tt T ) K x ( I n  tt T )
Y

Y  tt T Y

(I.36)

Et donc on obtient :

E \ TU (T T K xU ) 1T T Y
Y \E

K xU (T T K xU ) 1T T Y

TT T Y

(I.37)

I.2.3. Etapes de mise en uvre des mthodes bases sur les donnes
Malgr le fait quon sintresse principalement lutilisation des mthodes bases sur les
donnes pour le diagnostic de dfaut, il est important de noter que ces mthodes peuvent
galement tre utilises pour la modlisation, donc avec un objectif diffrent
x

Dans lobjectif de diagnostic, les mthodes statistiques permettent de relier les entres et
sorties du systme au type de situation (dfectueuse ou normale pour diffrents dfauts).

Dans lobjectif de modlisation (rgression), on cherche par ces mthodes trouver une
relation empirique entre les entres et les sorties.

Lapplication des mthodes bases sur les donnes pour le diagnostic de dfaut est ralise en
plusieurs tapes : lacquisition et prtraitement des donnes, lextraction des caractristiques
28

importantes, la modlisation (soit entre-sortie soit donnes-type de dfaut) et la validation du


modle. Selon lobjectif vis (modlisation ou diagnostic), ces tapes sont adapter.

I.2.3.1. Acquisition des donnes


Cette tape concerne laccueil (collection) et la prparation (prtraitement) des donnes. Ces
donnes peuvent tre chantillonnes dans le domaine temporel ou frquentiel avec un intervalle
dchantillonnage adapt la dynamique du procd. Des donnes riches et reprsentatives des
diffrentes situations sont ncessaires pour lapprentissage de la dynamique du procd.
On distinguera deux approches de collections des donnes :
x

pour la modlisation (entres-sorties), la rponse transitoire est ncessaire. Dans ce cas,


il est intressant dexciter le procd par une entre de spectre convenable (par exemple
signal pseudo alatoire) afin de capter le maximum dinformation. La rponse transitoire
dun systme (la sortie face une entre transitoire, tel un chelon ou une impulsion) est
souvent utilise pour la modlisation. Elle permet de comprendre le comportement
dynamique du systme, tel que le retard et les chelles de temps.

pour le diagnostic (relation mesures-type de dfaut), des donnes dans les situations
normale et dfectueuse sont ncessaires.

Supposons X une matrice de donnes (contenant les entres U et les sorties mesures Y) de taille
n u m constitue de n rcurrences de mesures (observations, ou encore chantillons) et m

variables caractristiques ( X j ) (facteurs ou encore proprits) dans les colonnes de la matrice:

>U ,Y @

x11  x1m
  

xn1  xnm

>X ,, X
1

, , X m

Les donnes acquises sont gnralement spares en deux groupes : donnes dapprentissage et
donnes de test. Les donnes dapprentissage sont utilises pour le dveloppement du modle
(slection des caractristiques et dveloppement du modle). Les donnes de test sont utilises
pour la validation (valuation ou jugement) du modle et des caractristiques choisies.

29

I.2.3.2. Prtraitement des donnes


Un prtraitement des donnes est ncessaire pour rduire le bruit, la suppression des valeurs
aberrantes, le traitement des valeurs manquantes et la normalisation des donnes.
x

Normalisation des donnes

La normalisation est trs utile lorsque le systme a plusieurs variables dont les amplitudes et
variances varient dans des plages diffrentes. Elle consiste mettre lchelle la matrice de
donnes X en rendant les variables de la nouvelle matrice XN comparables (la mme plage de
variation). Parmi les mthodes de normalisation de donnes, on peut citer :
1. La mthode min/max : met les valeurs de chaque colonne de X selon le maximum et le
minimum de cette colonne, de telle sorte avoir les valeurs de la matrice normalis XN
dans lintervalle [bas-haut] :

XN

haut  bas u

X  minimum ( X )
 bas
maximum ( X )  minimum ( X )

O minimum ( X ) et maximum ( X ) remplace respectivement chaque colonne de X par son


minimum et maximum. Ce type de normalisation avec haut=1 et bas=0 est utilis dans cette
thse au chapitre II.
2. La mthode Z-scores : permet de ramener la moyenne de chaque variable de X zro et sa
variance lunit par lapplication de la formule suivante : X N

X  moyenne ( X )
cart type ( X )

3. La mthode de mise l'chelle dcimale decimal scaling


4. La mthode de fentre coulissante ou glissante.
x

Manipulation des donnes manquantes

Dans le monde rel, les donnes ne sont pas toujours propres et compltes. Souvent elles sont
censures et corrompues. Plusieurs techniques existent pour traiter les donnes manquantes, mais
la mthode la plus simple et la plus utilise consiste dterminer la ligne de la matrice o des
donnes sont corrompues puis la supprimer. Malgr sa simplicit, cette mthode rduit la taille
de la matrice de donnes. Cela conduit une perte de puissance (informations) du rsultat. En
plus, il y a des cas o la ligne corrompue contient des donnes importantes quon ne peut pas
supprimer, ou des cas o la matrice de donnes a beaucoup de valeurs manquantes et donc la
suppression de toutes ces lignes mne une matrice avec peu de donnes. Dans ce cas, on a
recours la mthode de substitution qui remplace les donnes manquantes par une
30

approximation raisonnable en supposant que ces donnes sont faciles modliser. Parmi les
mthodes de substitution se trouve linterpolation ou la substitution par rgression, avec une
moyenne ou avec la mdiane. La prcision de cette mthode dpend de la prcision du modle de
donnes.
x

Valeurs aberrantes

Les bases de donnes peuvent galement contenir des donnes errones ou fausses. La
manipulation et la dtection des valeurs aberrantes est ncessaire toute modlisation car leur
prsence dtriore llaboration dun bon modle. Parmi les techniques de dtection des valeurs
aberrantes dans les bases de donnes on cite la distance de Mahalanobis et lanalyse de rsidu de
la rgression PLS avec les rseaux de neurones (Hugo and Sbarbaro, 2011).

I.2.3.3. Slection et extraction des variables pertinentes


Un problme srieux se pose lorsquon utilise toutes les variables (caractristiques ou encore
facteurs) pour raliser le diagnostic ou la modlisation. Lutilisation de toutes les caractristiques
peut rendre le modle de classification moins prcis et non robuste au bruit et donc diminuer ses
performances. Les variables qui sont incluses dans un modle et qui ne lui sont pas bnfiques
ajoutent de la variance aux prdictions. De lautre ct, les variables qui sont utiles et qui ne sont
pas incluses dans le modle vont causer un biais dans les estimations. La slection et lextraction
des caractristiques est donc une tape trs importante la fois pour amliorer la qualit et les
performances de la modlisation (ou la classification, ex. viter le surapprentissage du bruit) et
pour surmonter la difficult de la dimensionnalit (gain du temps de calcul et de mmoire
utilise). En effet, certains algorithmes peuvent mme chouer si le nombre de caractristiques
est plus grand que le nombre dobservations.
La premire approche pour lextraction des variables pertinentes consiste utiliser lanalyse et
la fouille de donnes (Witten et al., 2011) pour lexploration des donnes afin de trouver et
interprter les relations entre les variables pour une meilleure comprhension et utilisation. Cette
discipline est le fruit dinteractions de plusieurs domaines : statistique, intelligence artificielle, et
informatique. Elle est utilise dans de nombreux secteurs dactivits comme par exemple la
dtection des comportements anormaux (diagnostic de dfauts), lanalyse de comportement des
consommateurs (finance), ou la prdiction de temps de rponse, etc. Lanalyse ou la fouille des
donnes essaie danalyser et dextraire des informations (ou des connaissances, ou des variables)
les plus importantes, utiles et pertinentes et leur relation les unes avec les autres partir dune
grande quantit de donnes pour des objectifs prcis. La rduction du nombre de caractristiques
31

se fait par une des deux faons suivantes : La slection des caractristiques ou la
transformation des caractristiques.
1. La slection des caractristiques :
La slection de caractristiques joue un rle important dans la classification. Elle permet de
simplifier le modle en rduisant le cot de calcul et en facilitant son implmentation. On
sintresse seulement aux mesures qui sont pertinentes en cartant les caractristiques
insignifiantes de lensemble de donnes. Cela rend le modle plus lisible et comprhensible et
plus robuste au bruit et aux incertitudes, ce qui amliorera les performances (prcision, erreur
quadratique, etc.) de classification/rgression des diffrents modles. La slection de
caractristiques permet de contourner la maldiction de la dimensionnalit et dviter le surapprentissage.
Les algorithmes de slection choisissent un sous-ensemble de caractristiques (appels
prdictifs) partir des caractristiques originales afin de construire un modle optimisant les
erreurs prdictives. Ces algorithmes se dcomposent en deux catgories :
x

Mthodes de filtre : Elles reposent sur les caractristiques gnrales des donnes afin
dvaluer et de slectionner les sous-ensembles de caractristiques sans impliquer
lalgorithme dapprentissage.

Mthodes denveloppe ou demballage (Wrapper) : Elles utilisent les performances de


lalgorithme dapprentissage choisi pour valuer chaque sous-ensemble de caractristique
candidat.

Dans (Mahadevan and Shah, 2009) une mthode de slection de caractristiques appele
limination rcursive de caractristiques par SVM a t utilise pour la slection des
caractristiques pour la discrimination dans le cas de la classification et dans (He et al., 2008)
elle a t utilise pour la prdiction dans le cas de rgression.
La slection et l'extraction des caractristiques peuvent tre ralises aussi par un algorithme
gntique (AG). Cest une approche doptimisation stochastique utilisant la thorie de Darwin
de la slection naturelle et les travaux de Mendel dans la gntique pour simuler lvolution
biologique (Chakraborty, 2008). Elle cherche trouver une solution optimale sans le besoin
davoir des connaissances thoriques sur le problme rsoudre. Contrairement aux modles
gradients qui peuvent se coincer sur un optimum local, lalgorithme gntique tente via plusieurs
points de recherche de trouver dautres parties de lespace de recherche et de surpasser
32

loptimum local pour atteindre un optimum global. LAG cherche maximiser une fonction
Fitness J T qui mesure laptitude dun individu T survivre, saccoupler et produire une
descendance (progniture) dans une population dindividus pour un environnement donn.
Lefficacit de lapplication de lalgorithme gntique dpend essentiellement de la faon de
codage du problme et le choix de la fonction objective (fitness). Plusieurs travaux ont utiliss
des algorithmes gntiques pour loptimisation et la slection des caractristiques en gnral
(Khushaba et al., 2011) ou les caractristiques dans lapprentissage des SVR (He et al., 2008).
La slection des caractristiques peut se faire aussi dans le domaine frquentiel (voir annexe A.3)
On note quon peut utiliser les poids wi dans les SVM comme des poids de caractristiques pour
obtenir leur classement respectif. Quelques indices peuvent aider la slection de caractristiques
dans les problmes de classification en maximisant la dpendance entre deux quantits ou
variables tous en minimisant la redondance :
A. Lintercorrlation pour lestimation du temps de retard :
Une valeur dinter-corrlation proche de zro indique une absence de relation linaire entre ces
deux variables, alors quune valeur proche de 1 signifie une forte relation entre les deux
variables.
(t)

(I.38)

u(t  D)  (t)

Ou w est un bruit, D le retard, u signal dentre et D le facteur dattnuation. Donc,


lintercorrlation entre deux signaux ou variables est donne par :

R vu E^v t u t  ` E^> u t  D  w t @u t  `
E^ u t  D u t   w t u t  ` R uu  D  R wu

(I.39)

Par la supposition que le bruit et lentre sont non corrls, c..d. Rwu W 0 , on obtient

R vu  D R uu  D
Donc il y aura un seul pic dans Rvu qui correspond W

(I.40)

D.

B. Information mutuelle :
Linformation mutuelle rentre dans le cadre de la thorie dinformation et la thorie des
probabilits. Dans cette thorie, on calcule I X , Y , une quantit qui mesure la dpendance au
sens probabilistique (linformation apporte par une ralisation de X sur Y) de deux variables

33

alatoires X et Y. Cette mesure permet de rduire au maximum linformation incertaine qui relie
X et Y.

I X,Y  p x,y log


x,y

p x,y
p x p y

(I.41)

O p(x), p(y) et p(x,y) sont les densits de probabilit de x, y et de (x,y) respectivement. La


connaissance disponible sur le procd, ou sur un dfaut donn, ou sur tout phnomne alatoire
peut tre reprsente par la distribution de probabilit :

I X,Y H X  H X  H X,Y
H X  H X/Y H Y  H Y/X

(I.42)

O H(X) et H(Y) sont des entropies, H(X,Y) lentropie conjointe, et H(X/Y) et H(Y/X) sont les
entropies conditionnelles (voir lannexe A.2).
Linformation mutuelle peut tre applique plusieurs domaines, comme par exemple le
diagnostic de dfaut dans un procd Tennessee Eastman (Verron et al., 2007). Nanmoins,
l'application principale reste la slection de caractristiques dans les problmes de classification
(Peng et al., 2005), o le but est de maximiser la dpendance entre deux quantits ou variables.
Dans cette thse, linformation mutuelle et lintercorrlation sont proposs dans le chapitre II
pour aider dans le choix des variables caractristiques dans un problme de rgression.
2. La transformation des caractristiques, fonctionnalits, attributs ou prdicteurs
La famille des transformations des caractristiques concerne la cration de nouvelles variables
prdictives partir des variables initiales, ce qui rduit la dimension de lespace dentre par
transformation. Ces mthodes comprennent la technique danalyse en composantes principales
(ACP), Partial least square (PLS), analyse factorielle, etc.
Aprs plusieurs essais de ces mthodes de transformation et slection de caractristiques pour le
problme de diagnostic de dfauts sur trois procds diffrents (olien, procd de traitement des
eaux, racteur chimique CSTR), jai constat que parfois ce nest pas suffisant dutiliser
seulement les caractristiques dorigine (ou leurs transforms) car elles peuvent tre non
informatives, redondantes et ayant des interactions entre elles. La solution est de crer de
nouvelles caractristiques qui dcrivent au mieux un dfaut donn.

34

La gnration des caractristiques Feature Generation : (GC)


Cest un nouveau domaine de recherche tabli dans lapprentissage automatique. Cette tape
conduit des amliorations significatives des performances et une meilleure comprhension du
problme (Pachet and Roy, 2009) avec un moins de cot dans plusieurs tches de lapprentissage
statistique dans la modlisation (rgression) ou la classification.
Dans cette thse, le schma de diagnostic propos est bas sur la gnration de caractristiques
descriptives des dfauts parmi lesquelles se trouve le rsidu. Cette gnration a amen un
rsultat plus performant et prcis et a contribu une meilleure comprhension de la notion
dapprentissage.
La construction manuelle des caractristiques peut donner des rsultats intressants (ralise
dans les applications de lolienne et du racteur parfaitement agit dans ce travail). Mais elle
demeure une procdure laborieuse, coteuse et bien spcifique. Par consquence, les
caractristiques trouves sont dpendantes du domaine.

I.2.3.4. Modlisation
Les mthodes bases sur les donnes sont utilises dans cette thse pour deux finalits :
1. Le diagnostic de dfaut, o on attend de ces mthodes de relier les entres + sorties
X=[U,Y] au type de situation (Z) (dfectueuse ou normale pour diffrents dfauts). Un
modle comportemental (ou empirique) est attendu, contrairement aux mthodes bases
sur les modles qui utilisent le modle fondamental du systme.
2. La modlisation, o on attend de ces mthodes de trouver une relation empirique entre
les entres + sorties X=[U,Y] et quelques tats du systme (mesurs ou non mesurs). L
encore, un modle comportemental (empirique) est obtenu. Cette modlisation donne une
estime qui servira enrichir les donnes dans lobjectif de diagnostic de dfauts.
Ce paragraphe discute la modlisation entres-sorties du systme par des modles empiriques
data driven modeling (Solomatine and Ostfeld, 2008, Niska, 2011).
De manire gnrale, les modles (fondamentaux ou empiriques) amliorent la comprhension
intrinsque du systme et son comportement. Ils peuvent tre utiliss pour lanalyse de la
scurit, la conception, la simulation et le contrle du systme, ainsi que pour lapprentissage des
oprateurs et le diagnostic de dfauts. Un modle doit tre prcis, simple et gnral, et il est

35

prfrable quil soit facile construire, comprendre et tester. On note que tous les modles
(mme fondamentaux) sont faux puisquils donnent juste une image de la ralit (systme).
Le choix de la structure du modle dpend des connaissances a priori du systme. Sans
connaissance a priori, le modle de type bote noire (black box model) est choisi. Il a une
structure flexible et une bonne puissance dapproximation. Avec des connaissances sur la
physique dcrivant la dynamique du systme, on choisit la structure bote grise (grey box model)
qui incorpore les connaissances a priori avec une structure dquations diffrentielles en plus de
certains paramtres ou constantes inconnues. La structure du modle dpend galement du type
de la relation entre entres et sorties, linaire ou non linaire. On peut galement choisir
dintroduire linfluence des perturbations sur les entres/sorties. En effet, la connaissance de la
nature des perturbations est trs utile pour prdire les sorties futures du systme par la
comprhension des corrlations qui existent entre ces perturbations.
La technique la plus courante dans lajustement et la modlisation est probablement la
rgression. Elle cherche trouver une fonction f qui explique la relation entre deux variables y
et x de telle sorte avoir :

f x  ,

x p

(I.43)

O p est le nombre des variables explicatives et H est le bruit. Minimiser lerreur au sens des
moindres carrs veut dire minimiser lerreur entre la donne relle y et son estime y :
rsidu

y  y

(I.44)

La rgression requiert des hypothses que lutilisateur doit spcifier pour construire le modle
dcrit par la relation entre les entres et les sorties. Le choix du modle est bas sur les
connaissances sur les dynamiques du procd. Cela est raisonnable lorsque ces hypothses sont
bases sur les lois physiques ou des dtails connus dans le domaine concern.
La rgression linaire consiste trouver la droite qui passe au mieux (au sens des moindres
carrs) travers le nuage de points reprsentant les donnes. Par lutilisation des fonctions
noyaux (Kernel), la rgression peut apprhender une fonction non linaire. Les mthodes de
rgression conventionnelles, comme la rgression linaire multiple, souffrent de plusieurs
dfauts, comme lincapacit de dterminer un modle si le nombre dobservations est infrieur
aux variables explicatives, lincapacit de prendre en compte les donnes manquantes et
lincapacit de manipuler les variables colinaires. Ces problmes peuvent tre rgls par des
mthodes telles que lorthogonalisation des prdicateurs (Rgression sur les composantes

36

principales), les mthodes de rgularisation (Ridge regression), la rgression PLS (partial least
square) ou la rgression par machines vecteurs supports.

I.2.3.5. Validation du modle


Le critre de choix du modle dpend de sa capacit dajustement sur les donnes
dapprentissage (estimation) et de test (validation). Un modle avec un grand aspect de
gnralisation est capable de reprsenter le mieux la ralit. Et si deux modles ont presque les
mmes performances dajustement, on choisit celui dont la structure est la plus simple.
Construire un modle intgrant trop de paramtres (sur-paramtrisation) conduit une mauvaise
gnralisation. Lvaluation de la capacit de gnralisation dun nouveau modle peut tre
ralise en utilisant la mthode de validation croise. Une fois le modle dvelopp, sa
robustesse (incertitude, ajustement) peut tre valu en dterminant les intervalles (bandes) de
confiance. Cela peut se faire par la mthode Bootstarp (Efron, 1988) par exemple. Aussi, une
analyse des rsidus comparant la sortie du modle avec la sortie relle peut confirmer la
reprsentativit du modle.
Lannexe A (A.4 et A.5) dcrit plus en dtail les mthodes validation crois et Bootstrap. Ces
deux mthodes slectionnent le modle en se basant sur certains critres qui valuent la
performance du modle comme le compromis biais-variance, lindice de sensibilit standard
dune variable sur la sortie, le critre dInformation dAkaike ou le critre de la longueur de
description minimale. Dans le chapitre suivant les indices de performances de (I.45) jusqu'
(I.53) sont utiliss pour le choix du meilleur modle :
1. Erreur quadratique moyenne (MSE) Mean Squared Error :

MSE

1
N

z  z
i

(I.45)

i 1

zi , et zi sont respectivement la sortie et son estime de lchantillon i


2. Erreur quadratique moyenne (MAE) Mean Absolute Error :

MAE

1
N

(I.46)

 zi

i 1

3. Erreur quadratique moyenne normalise (NMSE) Normalized Mean Squared Error :

NMSE

1 1
V2 N

zi  zi
i 1

Il faut que NMSE<1


37

(I.47)

4. Racine de lerreur quadratique moyenne(RMSE) Root Mean Squared Error :

1 N
zi  zi 2

N i1

RMSE

(I.48)

5. Racine normalise des erreurs quadratiques moyennes (NRMSE) Normalized Root


Mean Squared Error :
2

zi  zi
i 1

NRMSE

(I.49)

2
i

i 1

6. La somme relative des erreurs quadratiques (RSSE) Relative Sum of Squared Error :
2

 zi

i 1

RSSE

(I.50)

zi2
i 1

7. Le coefficient de dtermination R2 :
zi  zi
N

1

i
N

zi  z

(I.51)

8. Le critre dAkaike (AIC) : (Akaike, 1974), (Bozdogan, 2000) Le degr optimal est dfini
comme le degr qui minimise AIC :
AIC 2 u k  2 log L(T)

(I.52)

O k est le nombre de paramtres libres dans le modle, L(T) est la fonction de maximum de
vraisemblance
9. Rapport ou ratio des vecteurs supports (SV) dans les SVM : Le rapport entre le nombre
des points supports divis par le nombre total des donnes dapprentissage. Une valeur
importante de ce ratio indique que le problme est difficile rsoudre :
Ratio SV

NSV
N

(I.53)

10. Compromis biais-variance : Un biais dsigne un cart systmatique entre une grandeur (P)
et son estimation (prdiction) ( P ) :
Biais E[P ]  P

(I.54)

Les performances dun modle sont mesures par la valeur de lerreur quadratique moyenne :

EQM Variance( P )  Biais( P )2

38

(I.55)

L'incertitude peut tre dfinie comme la racine carre de la somme des carrs du biais et la
variance (V) :

2  biais 2

(I.56)

Pour avoir une erreur minimale et donc un bon modle, il faut diminuer le biais. Cela peut
conduire laugmentation du nombre de paramtres (ou degr) du modle, ce qui entrane
laugmentation de la variance, puisque le modle va suivre trop de dtails des chantillons
(observations). Une grande variance augmente lerreur quadratique. Il est ncessaire donc de
faire un compromis biais-variance de telle sorte augmenter la prcision du modle sans trop
augmenter son degr de faon minimiser le biais et la variance en mme temps.

I.3. Les Machines Vecteurs de Supports


La mthode des machines vecteurs supports (SVM) Supports Vector Machines fait partie
des mthodes bases sur les donnes. Elle dcoule de la thorie dapprentissage statistique. Elle
est utilise dans cette thse pour la dtection de dfaut, et galement pour la rgression
(modlisation).
Depuis plus dun demi-sicle, les chercheurs essayent de rsoudre le problme de lapprentissage
automatique supervis et plus particulirement celui de la reconnaissance de formes (motifs)
avec la meilleure faon possible. En 1956, Frank Rosenblatts a construit la premire machine
dapprentissage appele Perceptron o il a dcrit le modle comme un algorithme capable dtre
utilis par des ordinateurs. Ce modle reoit en entre une somme pondre de signaux dentre
plus un seuil appel biais, et fournit une sortie qui dpend de lentre. Parmi les caractristiques
du Perceptron est sa capacit de gnralisation sur dautres donnes non utilises dans
lapprentissage.
Malgr que les annes 60 70 naient pas donn un rsultat rvolutionnaire, elles constituent
nanmoins les annes de la construction des fondements et bases de la thorie dapprentissage
statistique. Dans les annes 80, il y a eu lmergence des rseaux de neurones ou multicouches
perceptron inspirs par le systme nerveux biologique. Ce type de mthodes est bas sur la
minimisation du risque empirique (voir section I.3.1).
La mthode des machines vecteurs supports (SVM) est un nouvel estimateur non linaire des
fonctions, dont les fondements reposent sur la Thorie Statistique de lApprentissage (Vapnik,
2000, Vapnik, 1999b, Vapnik, 1998, Gunn, 1998). Le SVM est le classifieur le plus populaire,
39

efficace et sophistiqu des algorithmes dapprentissage automatique introduit par Vapnik dans le
dbut des annes 1990 (Boser et al., 1992), conu pour trouver un sparateur optimal (reprsent
par les paramtres dune fonction de dcision) qui maximise la marge entre les frontires de
chaque classe, par lutilisation dun ensemble limit dentranement. Lalgorithme a t construit
au dbut pour rsoudre les problmes de discrimination (classification) et de reconnaissance de
formes. Il a t ensuite tendu pour le cas de rgression.
Dans cette thse, le terme SVMs est utilis pour dcrire la fois la classification et la rgression
en utilisant les mthodes vecteurs de support. Le terme SVM sera utilis pour dcrire la
classification par les machines vecteurs de Supports tandis que le terme SVR sera utilis pour
dcrire les mthodes de rgression vecteurs de supports.

I.3.1 Thorie de l'apprentissage statistique


La thorie Statistical Learning Theory a t introduite par Vladimir Vapnik (Vapnik,
2000,Vapnik, 1999b, Vapnik, 1998).
Soit lensemble dapprentissage D tir suivant une loi de probabilit de distribution conjointe
inconnue 5 x, y :

^ x i , z i `,

i 1,...N

Le but de lapprentissage est de trouver une fonction f qui estime au mieux les sorties zi partir
dun nombre limit dentres xi. Les approches traditionnelles cherchent minimiser la mesure
de cots sur les N donnes dapprentissage, en dautres termes minimiser les erreurs sorties zi et
leurs estimes zi

f ( xi ) . Cela sappelle la minimisation du risque empirique (MRE) :


Remp > f @

1 N
zi  zi
N i1

1 N
L zi , f ( xi )
N i1

(I.57)

Le risque rel (ou fonctionnel) R qui reprsente lesprance des cots sur des nouvelles
observations (tous les observations possibles) est donn comme suit :

R> f @

z  z P x, z dxdz

(I.58)

x,z

Vapnik a cherch trouver une relation qui lie le risque empirique mesur (Remp) et le risque rel
R, et a dmontr que :
R> f @ d Remp > f @  M dVC

40

(I.59)

O dVC est la dimension de Vapnik-Chervonenkis correspondant la capacit d'un algorithme


de classification, qui est li sa complexit. Le terme droite de l'ingalit appel le risque
garanti est compos de deux termes : le risque empirique et une quantit qui dpend du rapport
dVC appele intervalle de confiance M(dVC) puisqu'elle reprsente la diffrence entre le risque
empirique et le risque rel. La MRE nest pas suffisante pour minimiser le risque rel. Vapnik et
Chervonenkis proposent alors une nouvelle mesure appele la Minimisation du Risque Structurel
(MRS) base sur la minimisation conjointe des deux causes d'erreur, le risque empirique et
l'intervalle de confiance. Le but de Vapnik est de trouver la valeur optimale de la dVC afin de
minimiser le risque rel.

I.3.2. Les machines Vecteurs de Support pour la classification (SVM)


Considrons le problme de sparer lensemble D compos de N paires de donnes/classes
dapprentissage appartenant deux classes :1 ,:2 :
D

^ x1,z1 ,..... xi ,zi ,......., xN ,zN `,

^x z
i

1`,

^x z

i 1....N , xi p , zi ^ 1,  1`

1`

Chaque exemple dentre xi (nomm aussi chantillon, observation, forme ou encore motif) est
caractris par un ensemble de p variables descriptives. Ainsi, le vecteur x est donn comme
suit : xi

x ,x
i1

i2

,...,xip

La sortie zi dfinit la classe (ou ltiquette, la cible ou encore la marque) du vecteur xi.

Figure I.6 Lhyperplan sparateur pour des donnes bidimensionnelles

41

Lobjectif des SVMs est de trouver un hyperplan optimal f (x) permettant de sparer les donnes
dapprentissage de sorte que tous les points dune mme classe soient du mme ct de
lhyperplan. Donc, cet hyperplan dun point de vue gomtrique divise lespace en deux comme
illustr dans la Figure I.6. Deux cas se prsentent : cas des donnes linairement sparables, et
cas des donnes non linairement sparables, que nous dtaillons dans la section suivante.

I.3.2.1 Cas de donnes linairement sparables


Supposons la situation la plus simple lorsque les donnes sont linairement sparables comme
indiqu par la Figure I.7.

w, xi

b

w, xi

b

1

Classe +1
w

w, xi

b

1

w
Hyperplan
canonique

Vecteurs de support

2
w

Hyperplan
sparateur

Hyperplan
canonique

Classe -1

Figure I.7 Sparation linaire


Il est clair quil existe une infinit dhyperplans sparateurs permettant de sparer lensemble D
en deux classes sans erreurs, mais la question qui se pose est comment trouver le meilleur
sparateur. Dans le cas de sparation linaire, lhyperplan sparateur est dfini par une fonction
discriminante linaire des exemples x, qui scrit sous la forme suivante :

f x

w,x  b

(I.60)

w et b sont les paramtres de lhyperplan sparateur, o w est le vecteur poids qui dfinit la
direction perpendiculaire lhyperplan sparateur et b est le terme de biais (un scalaire). Ces
paramtres sont calculs partir des donnes formant lensemble D.
42

Cet hyperplan sparateur permet de mettre les points dune mme classe dans un mme ct :

zi w, xi  b t 1

pour i 1, 2,..., N. w p et b

(I.61)

Vapnik a montr quil existe une capacit optimale du classifieur qui est obtenue lorsque la
distance entre lhyperplan et les points les plus proches de chaque classe sera maximise. Cette
distance dfinie comme

1
est appele Marge. L'hyperplan optimal spare donc bien les deux
w

classes de l'ensemble d'apprentissage, mais tout en minimisant la norme w . Par le choix de


lhyperplan qui maximise la marge, les SVM minimisent le risque de surapprentissage. La
minimisation de ce critre permet ainsi l'estimation des paramtres de l'hyperplan f w (x) .
Note : Lalgorithme SVM est aussi appel classifieur Marge optimale (maximum) (Boser et al.,
1992).
Le problme de minimisation est formul comme un problme quadratique convexe sous sa
2

forme primale par la minimisation de w tout en respectant des contraintes linaires :

1
2

min 2 w

sous les contraintes


z f ( x ) t 1 i 1......N
i
i

O f ( xi )

(I.62)

w, x i  b est la sortie prdite. Ce problme peut tre rsolu en utilisant les

multiplicateurs de Lagrange D i et le dual lagrangien de ce problme devient :

L( w, b,D )

N
1 2
w  D i > w, x i  b z i  1@
2
i 1

(I.63)

Le lagrangien doit tre minimis par rapport w et b et maximis par rapport :

wL
ww
wL
wb

0 o w

zi

(I.64)

i 1

0 o

z
i

i 1

On obtient ainsi le problme dual suivant :

43

(I.65)

1 N N

z
z
x
,x
i
min

i j i j i j

2
i
j
i
1
1
1

sous les contraintes


N
i zi 0 et i t 0 i 1, .....,N
i 1

(I.66)

Cette formulation du problme peut recevoir une solution efficace qui laisse peu de paramtres
libres choisir. La fonction de dcision est alors :

f(x) sgn

w,x

 b
(I.67)

avec w

z ixi

i 1

La classe dun nouveau point x est ensuite donne par le signe de f(x). La fonction de dcision
est donc influence uniquement par un petit sous ensemble de D correspondant aux points
(exemples) ayant i non nuls. Ces points sont appels les vecteurs de support ou Support
Vectors (SVs) . La solution f(x) dans ce cas peut se traduire comme une combinaison linaire
des motifs supports.
Note : Les Supports Vectors (SVs) sont les points qui se trouvent exactement une distance
gale la marge dont les i sont non nuls.
Il sagit l dune proprit trs intressante des SVMs : seuls les SVs sont ncessaires pour
dcrire la dcision. Le nombre des SVs pour le modle optimal est gnralement petit devant le
nombre des donnes dapprentissage N. Les poids w dfinissant la fonction de dcision
discriminante sont calculs partir de tous les vecteurs de support.
La rsolution Lagrangienne qui permet de trouver les diffrents paramtres, est ralise de
manire satisfaire les conditions de Karush-Kuhn-Tucker (KKT) qui dcrivent quau point de
la solution, le produit entre les variables duales et les contraintes est nul.

Conditions de KKT : jouent un rle essentiel dans la thorie et la pratique d'optimisation sous
contraintes. Si on considre le problme (I.63), et en posant :

Ri

z i w.x i  b - 1

si les conditions de KKT sont vrifies alors :


1. D i

0 o Ri t0
44

2. 0 D i C o R i
3. D i

C o Ri d 0

Les conditions de KKT sont violes dans les deux cas suivants :
1. D i C et R i 0
2. D i 0 et R i 0
O C est un paramtre de rglage.

I.3.2.2. Cas de donnes non linairement sparables


Dans la plupart des problmes rels, les donnes ne sont pas linairement sparables cause de
la nature des systmes gnralement non linaires et la prsence de bruit dans ces donnes
mesures, comme indiqu par la Figure I.8 . Pour surmonter ces difficults, les SVMs ont t
gnraliss grce deux outils : la marge souple et les fonctions noyaux.

Classe +1

w
1
w

Exemples mal
classs

Vecteurs de support

Classe -1

Figure I.8 Sparation linaire avec des erreurs


1. Marge souple (ou marge douce, Soft Margin)
Pour permettre de rsoudre certaines limitations pratiques, il y a eu l'ide dajouter des variables
ressorts dans la maximisation de la marge (Cortes and Vapnik, 1995). Ce principe de la marge
souple consiste autoriser des erreurs de classification, ce qui donne aux SVMs la capacit de
manipuler des valeurs aberrantes. Le nouveau problme de sparation optimale est reformul
comme suit : lhyperplan optimal sparant les deux classes est celui qui spare les donnes avec
le minimum derreurs, et qui satisfait les deux conditions suivantes :

45

La distance entre les vecteurs bien classs et lhyperplan doit tre maximale.

La distance entre les vecteurs mal classs et lhyperplan doit tre minimale.

Classe +1

1
w

Vecteurs de support

Classe -1

Figure I.9 Marge souple


Des variables de pnalit non-ngatives sont introduites, ]i pour i = 1.N, appeles variables
dcart (voir Figure I.9) afin de dtendre un peu les contraintes sur la marge :

z i w, x i  b t 1  i pour i

1, 2,..., N

(I.68)

Avec lintroduction dun terme de pnalit, on obtient le problme dual suivant :


N

1
2
min
w
C
i , C t 0


i 1

sous les conctraintes


z > w,x  b@ t 1  et t 0 pour i 1,....N
i
i
i
i

(I. 69)

Le paramtre C ( C t 0 ) est interprt comme un paramtre de rgularisation qui rgit la


tolrance de mauvaise classification. Laugmentation de la valeur de C augmente le cot port
sur les points ou les vecteurs mal classs (on autorise plus de points mal classs sur les donnes
dapprentissage) et en mme temps on rduit limportance donne la minimisation de la
complexit du modle (minimiser w 2 ). Donc par consquent ce paramtre doit tre choisi dune
manire judicieuse afin de garder toujours laspect de gnralisation des SVMs tout en rejetant
les donnes mal classes.

46

En introduisant les multiplicateurs de Lagrange ( et P), le Lagrangien associ au nouveau


problme doptimisation devient :

L w,b,,b,

N
N
1 2
w  C i - i zi w,xi
2
i 1
i 1

 b  i  1 )  i i

(I.70)

i 1

Le Lagrangien doit tre minimis par rapport w, b, ] et maximis par rapport et P.

wL
ww
wL
wb
wL
w i

0 o w

z x
i

(I.71)

i 1

0 o

z
i

(I.72)

i 1

0 o i C - i  i

(I.73)

Ceci conduit un problme dual lgrement diffrent de celui du cas sparable :

N
1 N N
i - i j zi z j xi ,x j
max

2i1 j1
i 1
sous les contraintes

0 d i d C i 1,...,N
N
et i z i
0
i 1

(I.74)

La seule diffrence avec le cas linairement sparable est lintroduction dune borne suprieure
pour les paramtres duaux Di ( Di  C ). Ces multiplicateurs de Lagrange reprsentent une sorte
de forces virtuelles dcoulant des contraintes poses sur le problme rsoudre.

2. Fonctions noyaux
Dans le cas de donnes non linairement sparables, plus la dimension de lespace de description
est grande, plus la probabilit de pouvoir trouver un hyperplan sparateur entre les exemples et
les contre-exemples est leve. En transformant lespace dentre en un espace de redescription
(appel aussi espace de caractristique) dune plus grande dimension, ventuellement infinie, il
devient possible dutiliser la mthode des SVMs (Figure I.10).

47

x2

g3

)
g2

x1

g1

Figure I.10 Exemple de projection


Notons une transformation non linaire ou mappage mapping de lespace dentre x en un
espace de redescription x . Voici un exemple de projection :

x 1,....x P T

o x

1 x ,....n x

(I.75)

O <,> dnote le produit scalaire dans le nouvel espace. Le problme doptimisation se transcrit
dans ce cas par :

N
1 N N
i - i j z i z j x i , x j
max

2i1 j1
i 1
sous les contraintes

0 d i d C
N
et i z i
0 avec i 1,.......N
i 1

(I.76)

Et la fonction de dcision est donne par :


N

f(x)

z x , x 
i

(I.77)

i 1

xi . x j devient rapidement impossible calculer quand la dimension de ) xi augmente

(sans parler du cas de la dimension infinie). Ceci est dautant plus difficile si on utilise des
transformations non linaires des descripteurs dentre. On peut dans certains cas sarranger pour
court-circuiter le passage par les calculs dans lespace de redescription. Il existe des fonctions
bilinaires symtriques positives K(xi , x j ) , appeles fonctions noyaux (Kernel functions),
faciles calculer et dont on peut montrer quelles correspondent un produit scalaire
xi , x j dans un espace de grande dimension :

48

K x i , xj

x i , x j

(I.78)

La Figure I.11 ci-dessous, illustre le calcul dune surface de dcision par la mthode noyau
dans le cas des donnes non linairement sparables.

Vecteurs
Supports

Sparateur

Figure I.11 Vecteurs support et surface de dcision calcule par la mthode noyau
On peut utiliser nimporte qu'elle fonction noyau K ( xi , x j ) valide satisfaisant la condition de
Mercer sans avoir besoin de connatre des informations sur la transformation non linaire quil y
a derrire. La condition de Mercer nous indique si une fonction est un noyau mais ne fournit
aucune information sur la fonction ) (et donc sur lespace des caractristiques) induite par ce
noyau.
Condition de Mercer : Sachant que la matrice contenant les similarits entre tous les exemples
de lentranement est appele la matrice de Gram (G), la condition ou le thorme de Mercer
snonce comme suit :
La fonction K ( xi , x j ) : X u X o est un noyau si est seulement si matrice de Gram
G

K x

, x j , avec i, j

1,.....N (N est le nombre dexemples dentranement) est une

matrice dfinie positive.


Notons quune fonction K : X u X o gnrant une matrice dfinie positive G possde les
trois proprits fondamentales du produit scalaire suivantes :  x i , x j X
1. Positivit : K x i , x i t 0
2. Symtrie : K x i , x j K x j , x i
3. Ingalit de Cauchy-Schwartz : K x i , x j d x i . x j

49

En pratique, la fonction noyau va dterminer la structure du modle et donne un aspect de


flexibilit la mthode SVM.
Le problme de classification supervise donne par le systme (I.76) peut scrire dune autre
faon :

T 1 T
D I - D .G.D
max
N
D
2

sous les contraintes


D T z 0 et 0 d D d C i 1,..., N
i

Avec D T

>D1,...,D N @ ,

>z1,..., z N @ , I est un vecteur unitaire de taille N, et

zT

(I.79)

zi z j K xi , x j

est la matrice dinfluence par paires du terme gnral. Cette matrice est carre symtrique dfinie
positive de taille N u N . Pour dcider quelle classe appartient une donne x, il suffit de prendre
le signe de la fonction de dcision donn par (I.77) :

f x sgn ziD i K x i , x  b
i1

(I.80)

Si le signe de f(x) est positif alors la donne x appartient la classe +1, sinon elle appartient la
classe 1. Cette fonction est une somme pondre de fonction noyaux. Elle dpend juste des
Nsup, car Di=0 ailleurs. Donc, on peut remplacer N par Nsup :

Nsup
f x sgn ziD i K x i , x  b

i1

(I.81)

La valeur du biais b peut tre calcule par lutilisation de deux supports opposs x A et xB tels
que f x A 1 et f x B 1 :

1 N
b  zi i >K xA,xi  K xB ,xi @
2i1
3. Exemples de noyaux
1. Noyau linaire
K xi , x j

xi , x j

avec ) xi xi

50

(la fonction identit)

(I.82)

2. Noyau polynomial

K xi , x j

xi , x j

O d est le degr du polynme. Ce noyau ralise implicitement un produit scalaire dans lespace
des descripteurs correspondant tous les produits d dimensions.
3. Noyau gaussien (ou noyau RBF)
Cette fonction noyau est typique et trs largement utilise puisqu'elle permet avec un rglage
appropri de reprsenter nimporte quelle fonction. Le noyau gaussien reprsente une mesure de
similarit entre les chantillons ( xi , x j ) et scrit sous la forme suivante
K xi , x j

x x
i
j
exp 
2
2V

O est la variance, qui devient un paramtre de rgulation.


4. Noyau sigmode

K xi , x j tanh xi .x j  1

Dautres variantes de SVM existent. On cite par exemple SVM une classe, Q  SVM (voir
lannexe A.6 pour plus de dtails)

I.3.2.3. Extension des SVM binaires au cas multi classe


Lexpression (I.81) de SVM peut rsoudre des problmes de classification binaire. Or, les
problmes les plus rencontrs en pratique sont ceux o lon a plusieurs classes. Lextension de
SVM aux problmes de plus de deux classes est donc ncessaire. Un travail de synthse
intressant concernant la thorie et les applications des SVM multi classe est donn dans
(Guermeur, 2007).
Considrons un ensemble D de N donnes dapprentissage sparables en k classes

:1 , : 2 ,...,: K , tel que

^ x1, z1 , x 2 , z2 ,........, x N , z N `,

xi p , zi z

^1,..., k`

Dans ce cas, il ne sagit plus de trouver une seule sparatrice entre deux classes mais il faudra
classer les exemples en plusieurs classes, ce qui revient construire k hyperplans linaires
dquations donnes comme suit :
51

wkT x  bk

(I.83)

0 avec k z

Gnraliser les SVMs dans le cas multi classes revient rsoudre le problme de programmation
quadratique suivant :
N

1
2

min
w
ik


i 1
wk ,bk , 2 kz

sous les contraintes


w T x  b - w T x  b t 1 - k avec k t 0 , i
zi
k
i
k
i
i
zi i

(I.84)
1,..., N et k z

La fonction de dcision est alors :

f x argmax f K x o f k x wkT  bk k z
kz

(I.85)

Donc, un nouvel individu aura comme classe, la classe zi tel que :


f z i x t f k x

k z

(I.86)

Plusieurs mthodes ont t proposes pour rsoudre ce problme, les plus utilises sont les
suivantes :
1. Un Contre tous (OAA pour One Against All)
Pour chaque classe, on dtermine un hyperplan sparant celle-ci de toutes les autres, en
considrant cette dernire comme la classe +1 et les autres classes comme tant la classe 1, ce
qui rsulte en k SVMs binaires (pour un problme k classes) (Liu and Zheng, 2005) .
2. Un contre un (OAO pour One Against One)
Dans ce cas, on construit un SVM pour chaque paire de classes. Ainsi, on sera amen calculer
k k  1
SVMs binaires. Cette approche est associe en gnral une opration de vote
2

majoritaire pour la fusion des dcisions des

k k  1
sous-classifieurs SVMs.
2

3. Arbre ou graphe de dcision


Dans un arbre de dcision, chaque nud fait la dcision si une donne appartient un certain
ensemble de classes (Platt et al., 2000). La succession de dcisions par dautres nuds fait
rduire le nombre de classes jusqu ce quon arrive une seule classe. Chaque nud de larbre
52

contient un classifieur SVM destin distinguer entre deux classes seulement parmi les autres. A
chaque niveau, on limine une classe jusqu ce quune seule classe reste.

I.3.2.4. Les algorithmes doptimisation pour SVM


Lentranement par SVM consiste rsoudre un problme doptimisation quadratique convexe
sous contraintes. En raison de son immense taille, le problme rsultant de lapproche SVM ne
peut tre rsolu facilement par lintermdiaire des techniques standards de programmation
quadratique. La forme quadratique du problme implique une matrice qui a un nombre
dlments gale au carr du nombre dexemples dentranement. A cause de sa taille, cette
matrice ne peut pas tre traite correctement.
Les algorithmes doptimisation sont ncessaires afin de rduire le temps de calcul lors de
lapprentissage, mais dautres peuvent galement servir pour loptimisation paramtrique tel que
Differential evolution, Artificial immune algorithm, Genetic algorithms . Parmi les mthodes
les plus efficaces utilises pour lentranement des SVMs, on trouve :
x

Les multiplicateurs de Lagrange.

La mthode doptimisation squentielle minimale Sequential Minimal Optimisation,


SMO , la plus recommande.

La mthode d'Optimisation par essaims particulaires (PSO) Particle Swarm


Optimization based on chaos searching .

La mthode Chunking.

La mthode de dcomposition.

De la mme manire que la rsolution lagrangienne, toutes ces mthodes doivent vrifier les
conditions de KKT. La mthode SMO est considre comme une des plus efficaces mthodes
dcrites ci-dessus, elle est la base de plusieurs algorithmes tels que la librairie LIBSVM (Chang
and Lin, 2001) qui va tre utilise dans cette thse pour la construction des modles de prdiction
par SVR dans le chapitre II.
x

Mthode doptimisation squentielle minimale (SMO)

En 1999, John Platt (Platt, 1999) proposa un nouvel algorithme pour lentranement des SVMs
quil appela algorithme dOptimisation Squentielle Minimale (SMO). Cet algorithme
53

dcompose le problme de (I.62) mais choisit de rsoudre le plus petit sous-problme possible
chaque tape doptimisation de la fonction objectif. Cela est ralisable en choisissant
doptimiser, non pas un ensemble de multiplicateurs de Lagrange la fois, mais deux seulement.
De ce fait, lalgorithme SMO ne ncessite aucun stockage supplmentaire de matrice. Du ct
des performances en temps de rponse, lalgorithme SMO est plus efficace. En effet, il ncessite
plus ditrations pour converger, mais chaque itration effectue moins doprations.
Lalgorithme SMO est bas sur trois lments :
1. Une mthode analytique pour rsoudre les deux multiplicateurs de Lagrange.
2. Deux heuristiques pour choisir quels sont les multiplicateurs optimiser.
3. Une mthode pour le calcul du paramtre b utilis dans la fonction de dcision.

I.3.2.5. Avantages / applications des SVMs


Les SVMs ont un nombre davantages sur les autres mthodes statistiques ou les rseaux de
neurones :
x

Capacit de gnralisation induite par la thorie statistique dapprentissage et le concept


de minimisation du risque structurel.

Pas de problme avec une grande dimension des donnes. Faire face des situations
complexes lorsque le nombre de variables est plus grand que celui dobservations.

La solution est parcimonieuse, unique et loptimum est global.

Peu de paramtres de rglage.

Implmentation facile, pas de problme dinstabilit numrique et la rapidit de calcul.

Capacit dobtenir un rsultat prcis mme dans le cas de taille rduite de lensemble
dapprentissage.

Manipulation des valeurs aberrantes, et du bruit.

Elimination des donnes non significatives par la concentration de linformation utile sur
les vecteurs supports.

Robustesse face aux variations des paramtres du systme.

Construction de modle non linaire grce aux fonctions noyaux.

Grce ces avantages, les SVMs ont montr leur efficacit dans plusieurs domaines et
applications, surtout dans les problmes de grande taille grce leur solide fondement thorique
qui cherche minimiser la borne suprieure de lerreur de gnralisation permettant de rcuprer
54

juste linformation utile partir des donnes dapprentissage. Parmi ces applications, on peut
citer :
x Reconnaissance de chiffres manuscrits (Vapnik, 1998, Cortes and Vapnik, 1995, Boser et
al., 1992)
x Reconnaissance et classification d'image
x Catgorisation du texte (Dumais et al., 1998, Basu et al., 2003)
x Classification de la couverture des terres (Huang et al., 2002)
x Classification des donnes audio (Aggarwal and Aggarwal, 2011)
x Applications en chimie (Li et al., 2009, Ivanciuc, 2007),
x Estimation de densit (Mukherjee and Vapnik, 1999)
x Prdiction: sries temporelles financires (Gestel et al., 2001), capacit thermique (Xue et
al., 2004)
x Surveillance des variations des procds (Cheng and Cheng, 2008, Camci et al., 2008)
x Classification des dfauts : ex. analyse du transformateur de gaz dissous (Tang and Wu,
2011), o lalgorithme gntique extrait les caractristiques des dfauts et la mthode
Bootstrap aide amliorer le prtraitement par lgalisation des nombres d'chantillons
pour diffrents types de dfauts. Ensuite, un classifieur comme le SVM est utilis pour le
diagnostic de dfauts.
(Widodo and Yang, 2007) prsente une revue de la littrature utilisant les SVM dans la
surveillance et le diagnostic des machines roulements, moteur induction, HVAC, machine,
boite vitesse, pompe, vanne, compresseurs. Dans la littrature, plusieurs travaux se sont
intresss lutilisation de SVM pour rsoudre le problme de diagnostic de dfauts :
x

Bote vitesse (Saravanan et al., 2010, Saravanan and Ramachandran, 2009,


Saravanan et al., 2008, Davy et al., 2006, Samanta, 2004, Samanta et al., 2003)

Roulement (Sugumaran et al., 2008, Abbasion et al., 2007)

Turbo compresseur et pompe rotor (Yuan and Chu, 2007)

Les machines (Yang and Widodo, 2008)

Moteur induction (Baccarini et al., 2011, Pyhnen et al., 2005)

Turbine vapeur (Salahshoor et al., 2010)

Transmission de puissance (Samantaray et al., 2007, Ravikumar et al., 2008, Ganyun


et al., 2005)

Procd de traitement des eaux uses (Laouti et al., 2011b, Zeng et al., 2006)

Procd Tennessee Eastman (Monroy et al., 2010, Zhang, 2009, Ylamos et al., 2007)
55

Traitement de minraux (Jemwa and Aldrich, 2006)

Moteur induction (Baccarini et al., 2011)

Turbine vapeur (Salahshoor et al., 2010)

Ligne de transmission de puissance (Samantaray et al., 2007)

Les systmes de chauffage, ventilation et de conditionnement (Liang and Du, 2007)

Systme rfrigrateur (Ren et al., 2008)

Les accidents de la circulation (Chen et al., 2009)

Il existe plusieurs programmes et progiciels qui implmentent les SVMs avec plusieurs langages
de programmation comprenant des routines doptimisation numriques trs efficaces. Parmi ces
logiciels on trouve :
x

SVMlight : limplmentation des SVMs la plus connue ralise par Thorsten Joachims
(Joachims, 1999) (http://svmlight.joachims.org/).

La boite outils SV : crite compltement dans Matlab par Stphane Canu et al.
(2005), elle est une implmentation facile manipuler pour les gens familiariss avec
Matlab. [http://asi.insa-rouen.fr/enseignants/~arakotom/toolbox/index.html].

LIBSVM : reprsente une bibliothque complte des SVMs prsente par Chang et Lin
(Chang and Lin, 2011 (Chang and Lin, 2001) crite dans le langage C/C++ et Java
utilisant la mme mthode de dcomposition du problme quadratique que celle de
lalgorithme SMO. Ce package effectue la fois les tches de classification et de
rgression, et propose plusieurs interfaces pour les autres langages tel que : Phyton,
Matlab. Cette bibliothque peut tre tlcharge sur :
http://www.csie.ntu.edu.tw/~cjlin/libsvm/

Pour plus de dtails sur dautres packages, voir le lien ci-dessous :


http://www.support-vector-machines.org/SVM_soft.html.

I.3.3. Les machines Vecteurs de supports pour la rgression (SVR)


Lobtention des modles de fonctionnement des procds complexes savre une tche difficile
qui ncessite des comptences et du temps. Lutilisation des Sparateurs vastes marges tendue
au cas de la rgression constitue une alternative prometteuse pour la modlisation de ces

56

systmes. Linformation de la modlisation sera utilise dans cette thse afin denrichir les
donnes dans lobjectif de dtection de dfauts.

I.3.3.1. Thorie
Soit lensemble D2 de N paires donnes, ayant un vecteur de donnes xi comme entre et
ltiquette zi de ce vecteur comme sortie, qui peut maintenant prendre nimporte quelle valeur
relle.

^ x1,z1 ,..., xi ,zi ,..., xN ,zN ` ,

D2

pour i 1,..,N avec:xi R p , zi R

Comme prcdemment, habituellement dans une rgression le but est trouver une fonction
pouvant mettre en relation les entres xi et les sorties zi :

f ( xi )

zi

Les tapes ncessaires pour raliser une rgression classique sont :


-

Choisir un modle qui reprsente au mieux ces donnes, par exemple une droite:

f ( xi ) a.xi  b
-

Optimiser un critre pour trouver les paramtres a et b de ce modle, par exemple


moindres carrs : min

 f ( xi ) , o zi est la sortie relle.

i 1

Avec une fonction de cot de type quadratique (moyenne des erreurs quadratique MSE), on
obtient la solution de maximum de vraisemblance quand le bruit est gaussien ou normalement
distribu. Mais, la prsence dune valeur aberrante risque de biaiser le modle obtenu reprsent
par la fonction f. Lide qui permet de gnraliser lutilisation des SVMs de la classification a la
rgression est ladoption dune nouvelle fonction de perte (cot) perte de Vapnik qui inclut la
notion de distance. Cette fonction de perte ignore les erreurs qui se trouvent une certaine
distance de la vraie valeur. Ce type de fonction est considr comme une fonction de perte insensible. Elle a lavantage de diminuer ainsi le surapprentissage.

57

Perte

H


i

H

[i  H

z  f (x)

f ( x)  z H
f ( x)  z H

f ( x)  z 0

[ j
x

Figure I.12 La fonction de perte insensible dans la rgression SVR linaire


Donc lobjectif de SVR est de trouver une fonction plate z

f ( x)

w, x  b qui rapproche

toutes les paires ( xi , zi ) avec une prcision de (voir Figure I.12), ou en dautres termes une
fonction qui estime les cibles bruits zi avec au maximum un cart . Une faon pour assurer la
platitude de la fonction f (x) est de minimiser w .
Afin dautoriser certaines erreurs (plus grande de ), des variables dcart ( ]  , ]  ) peuvent tre
introduites pour adoucir la marge avec le paramtre de rgulation C qui fait le compromis entre
les erreurs et le terme de rgularisation

Minimiser

1 2
w .
2

l
1 2
w  C (] i , ] i )
2
i 1

zi  w,I ( xi )  b d H  ] i

sujet w,I ( xi )  b  zi d H  ] i

] i , ] i t 0

(I.87)

C est un paramtre dquilibrage qui permet de contrler implicitement le niveau de bruit du


problme et donc la rgularit de la solution. Lintroduction dun tube de largeur mne la
fonction de perte appele Vapnik insensible donn par :

58

si ] d H

]  H

(I.88)

sinon

En introduisant les multiplicateurs de Lagrange ( D i , D i , Pi , Pi t 0 ), le Lagrangien associ au


nouveau problme doptimisation devient :

N
N
1 2
w  C ] i  ] i - Pi] i  Pi ] i
2
i 1
i 1

 D i H  ] i  zi  w, xi  b
i 1
N

 D i H  ] i  zi  w, xi  b


(I.89)

i 1

Comme pour le cas de classification, le problme peut se rsoudre par lutilisation du dual
lagrangien qui conduit :
Nsup

f ( x)

(D

 D i* ) K ( xi , x)  b

(I.90)

i 1

N sup

Avec, w

 D i* I ( xi )

(I.91)

i 1

O D i ,D i* sont les multiplicateurs de Lagrange. Seules les valeurs non nulles des multiplicateurs
de Lagrange sont utiles pour la dtermination de la courbe de rgression. Les points de donnes
associs ces coefficients (qui se trouvent sur ou l'extrieur du tube rH) sont appels les
vecteurs de support.
Le fait dajouter des variables dcart et de manipuler le paramtre de rgularisation C donne aux
SVR un aspect flexible et rigoureux la fois. Pour voir linfluence des diffrents paramtres
dune manire visuelle, voir le tutorial sur les SVM et SVR donn dans (Brereton and Lloyd,
2010).
La mthode classique de moindres carrs bien quelle soit considre comme le meilleur
algorithme destimation polynomiale, reste inferieure en termes de performances (R2, erreur
quadratique) par rapport lapproche SVR, Ceci a t dmontr dans (Wang et al., 2007), ou
dans (Maalouf et al., 2008) pour la prdiction du module dlasticit des matriaux de chausse
dans le domaine de gnie civil.
La comparaison de SVR avec dautres mthodes en termes de prcision et robustesse a balanc
en faveur du SVR dans la quasi- totalit des cas :

59

SVR par rapport la mthode processus gaussien (Deswal, 2011)


SVR par rapport filtre de Kalman, moindres carrs et H infinie (Zhang et al., 2007).
SVR par rapport la mthode de calcul de la dynamique de fluide (Varol et al., 2008)
SVR par rapport la mthode de moyenne mobile et la mthode des modles
autorgressifs (Bermolen and Rossi, 2009)
SVR par rapport la mthode rgression linaire multiple, et aussi face au rseau
neuronal base dune fonction radiale (Xue et al., 2004)
LSVR par rapport rgression linaire et rgression non linaire (Baylar et al., 2009)

I.3.3.2. Implmentation de SVR


La rgression par machines vecteurs de supports est utilise pour lestimation (Lahiri and
Ghanta, 2008, Varol et al., 2008, Smola et al., 1996), la prdiction des sries temporelles (Crone
and Kourentzes, 2010, He et al., 2008, Gestel et al., 2001), lidentification des systmes (Yu et
al., 2005) dans diffrents types dapplications, comme par exemple :
-

Prdiction de charge de liaison d'un rseau (Priyadarshin et al., 2011, Bermolen and Rossi,
2009).

Modlisation de type bote noire du comportement dun bras de robot hydraulique (Gretton et
al., 2001).

Prdiction du coefficient global de transfert doxygne (Deswal, 2011).

Prdiction de la force de compression du bton haute rsistance en gnie civil (Gupta,


2007).

Estimation du dcalage vers le rouge photomtrique (Wang et al., 2007).

Estimation des champs thermiques et d'coulement dus la convection naturelle (Varol et al.,
2008)

Estimation de la vitesse critique de lcoulement de suspension solide-liquide (Lahiri and


Ghanta, 2008)

Estimation en ligne de la concentration de la biomasse dans un procd de fermentation


(Wang,Yu et al., 2006)

Prdiction de la capacit thermique (Xue et al., 2004) .

Prdiction des proprits mcaniques des matriaux en acier (Wang, Mu et al., 2006).

Prdiction de lhybridation croise avec lutilisation de la teneur en nuclotide des sondes


ADN comme variables dentre (Sun et al., 2006).

60

Capteur logiciel dindices de fusion melt indices pour deux applications : processus de
neutralisation de pH en simulation et un procd dextrusion de polymre chelle de
laboratoire (Chitralekha and Shah, 2010).

Identification des dfauts (Cheng et al., 2011) et a montr sa supriorit par rapport aux
rseaux de neurones et la mthode de carte de contrle des sommes cumules CUSUM
(Cumulative Sum Control chart)

Parmi les algorithmes dentranement les plus populaires et efficaces des SVR, on trouve
lalgorithme classique SMO. Nanmoins, ce dernier prsente une source dinefficacit due au
fonctionnement avec une valeur de seuil unique en plus de sa vitesse de convergence lente.
Ainsi, plusieurs travaux proposent une amlioration de lalgorithme SMO (Shevade et al., 2000),
(Flake and Lawrence, 2002).
(Wang et al., 2009) ont propos un algorithme SVR en ligne crit sur Matlab pour modliser la
fonctionnalit dynamique du processus de fermentation. Cet algorithme prsente un inconvnient
puisquil est inadapt aux grandes dimensions. (Ma et al., 2003) ont dvelopp et implment un
algorithme SVR en ligne capable dtre appliqu pour la prdiction de sries temporelles et la
validation croise sans le besoin de refaire lapprentissage quand un nouvel chantillon est ajout
ou supprim. Un autre algorithme SVR en ligne a t dvelopp pour prdire les tensions
ncessaires appliquer pour compenser la charge de gravit du bras d'un robot (Parrella, 2007).
Dans lidentification des systmes non linaires, le systme peut tre reprsent comme une srie
de blocs lis entre eux. On cite par exemple :
x

Le modle Hammerstein : qui est compos dun bloc non linaire statique suivi dun
bloc ou lment linaire dynamique comme le montre la Figure I.13. Lobtention du
modle Hammerstein peut se faire par lalgorithme didentification sous-espace N4SID
qui utilise SVR moindres carrs LS-SVR (Goethals et al., 2005), et dans (Mujahed and
Westwick, 2011) un modle SVR pour capter la non linarit.
Entre : u(t)

NL

w(t)

Figure I.13 Structure de type Hammerstein


x

Le modle de type Wiener : constitu dun lment dynamique linaire suivi dun

61

lment non-linaire statique comme le montre la Figure I.14. Dans (Ttterman and
Toivonen, 2009), le composant linaire du modle Wiener est reprsent par un filtre
tendu basis filter expansion et le bloc non linaire est dtermin par un modle SVR
noyau.
Entre : u(t)

v(t)

NL

Sortie : y(t)

Figure I.14 Structure de type Wiener


x

La variante LS-SVM : a t galement utilise pour lidentification o un algorithme


bas sur les SVM moindres carrs pondrs identifie les paramtres structurels et leur
variations afin de suivre les changements soudains ou lents et dtecter la gravit du
dommage sil y a lieu (Tang et al., 2006).

Modles de prdiction (sries temporelles) :


- Filtre rponse impulsionnelle finie (FRIF) : ce filtre est stable et est caractris par une
rponse uniquement base sur les valeurs du signal d'entre.
-

Processus autorgressif (AR) : Modle de rgression pour sries temporelles dans


lequel la srie est explique par ses valeurs passes plutt que par d'autres variables
(Zhang et al., 2007).

Modle ARMA : est un outil pour comprendre et prdire les valeurs futures dune srie
temporelle. Il est compos de deux parties : une part autorgressive (AR) et une part
moyenne-mobile (MA). Le modle est gnralement not ARMA(p,q), o p est l'ordre de
la partie AR et q l'ordre de la partie MA (Zhang et al., 2007, Mohsen and El-Yazeed,
2004).

- Lastuce noyau dans SVR : transforme les donnes dentres non linairement sparables
en un espace o elles pourraient tre sparables : espace de Hilbert noyau reproduisant
(EHNR), ce qui permet au SVR de capter les non linarit du systme dans un modle de
type ARMA par exemple (Martnez-Ramn et al., 2006) .
- Modle ARX : Autorgressif avec entres exognes. Une mthode de rseaux de neurones
ARX adaptatives utilisant une fentre mobile qui a t propose pour prdire des
variables. Il a montr une capacit pour capter les changements dynamiques lents du
procd de filtration anarobie pleine chelle de traitement des eaux uses (Lee et al.,
2005). (Adachi et al., 2001) ont propos un modle de rgression linaire de type ARX
et FIR qui a montr sa robustesse contre les valeurs aberrantes.
62

- Modle NARX: non linaire autorgressif avec entres exognes

I.3.3.3. Rglage des paramtres SVM et SVR


La qualit du modle et la performance de la prdiction du SVR dpend de plusieurs
paramtres :
1- Paramtres lis au procd : tels que la dimension des variables du procd, les chelles du
temps, lincertitude et la variabilit.
2- Paramtres dapprentissage : C, la tolrance H, la variance du noyau gaussien V, le nombre
dchantillons N.
Lanalyse de sensibilit consiste faire varier ces paramtres et valuer la rponse du modle.
Il y a deux faons dapprocher la question : par intervalles (valeur basse et valeur haute du
paramtre en cause) et par la mthode de Monte Carlo (voir annexe A.1), en supposant que les
valeurs prises par le paramtre en cause peuvent tre reprsentes par une distribution de
probabilit (normale, log-normale, uniforme...) :
o Construction dune grille doptimisation : on change les paramtres de C, V et H 1000 fois
afin de voir leffet sur lerreur.
o Mesurer galement limpact du changement de la taille de donnes N utilises dans
lapprentissage, de

1
1
N jusqu' N .
32
2

o Calculer lintervalle de confiance 95%. Si de nombreuses prdictions sortent de


lintervalle de confiance, cela veut dire quil faut corriger le modle (prcision
insuffisante).
C et V sont des paramtres continus et donc cest difficile, voire impossible, de tester toutes leurs

valeurs. Une solution pratique sur le choix de ces paramtres consiste en une recherche de grille
avec des squences en croissance exponentielle.
Jusqu aujourdhui, ny a pas une mthode dfinitive qui permet de calculer les paramtres
optimaux de SVMs. Nanmoins, plusieurs travaux ont t effectus dans ce sens afin de proposer
des valeurs pratiques (Schittkowski, 2005, Shitong et al., 2004, Cherkassky and Ma, 2002,
Schlkopf et al., 1999, Smola et al., 1998)
(Mjalli et al., 2007) et (Gunter and Zhu, 2007) ont propos un algorithme qui calcul le chemin de
la solution complte de la rgression par SVR. Une estimation non biaise pour le degr de
63

libert du modle SVR permettant de slectionner le paramtre C a t propos. Une version


amliore de lalgorithme gntique appele algorithme volution diffrentielle est utilise
pour le choix des meilleurs paramtres dapprentissage de SVR (Lahiri and Ghanta, 2008).
Paramtre C :
Le paramtre C borne les multiplicateurs de Lagrange. Il permet de crer un compromis entre la
pnalisation dune mauvaise classification et la minimisation de la complexit de fonction. Donc
il influence le degr de tolrance face aux valeurs aberrantes outliers . Par contre, il a un effet
ngligeable sur la performance de gnralisation sil dpasse un certain seuil.
Lobtention de la valeur optimale de C par lutilisation de la mthode validation croise est
prsente dans (Shawe-Taylor and Cristianini, 2004). Lalgorithme gntique connu comme un
optimiseur optimal et plus particulirement lalgorithme volution gntique a t utilis pour
choisir la meilleur valeur du paramtre C (Lahiri and Ghanta, 2008). (Smola et al., 1996)
prsente une mthode efficace pour estimer des fonctions relles qui demandent moins defforts
de calcul en utilisant les donnes. Cette mthode peut tre vue comme une faon de compression
des donnes. (Cherkassky and Ma, 2004) ont propos une mthodologie pour choisir ces mtaparamtres bass sur lensemble dapprentissage au lieu des mthodes classiques bases sur les
approches de rechantillonnage telles que la validation croise. Une des faiblesses des approches
de rechantillonnage est le cot de calcul assez consquent.
(Cherkassky and Ma, 2004) ont propos une relation pour calculer analytiquement C partir des
donnes et le niveau de bruit (X) qui est la suivante: C

max z  3Xz , z  3Xz

O z est la moyenne des rponses de lensemble dapprentissage. X z est lcart type des
rponses de lensemble dapprentissage. Cette prescription permet aussi de manipuler les valeurs
aberrantes.
Paramtre V (variance de la distribution gaussienne) :
Cest lunique paramtre du noyau gaussien. Le paramtre V permet de rgler la largeur de la
gaussienne, et donc va contrler la capacit de gnralisation des SVMs. (Cherkassky and Ma,
2004) ont propos cette relation pour calculer V :

V 2 1.5

1
N

z  z

i 1

64

Paramtre H (la largeur du tube en SVR)


Ce paramtre nintervient pas dans le cas de la classification SVM, mais seulement dans le cas
de la rgression SVR. Il influence la complexit et la rgularit de la fonction de rgression, le
nombre de points supports (NSV), la capacit de gnralisation et la prcision du modle SVR.
Une valeur trop faible de H risque de donner un surapprentissage. (Mattera and Haykin, 1999)
propose de choisir une valeur de H qui permet davoir NSV gal la moiti du nombre de donnes
dapprentissage N. (Smola et al., 1998) montre quil y a une dpendance linaire entre H et la
variance de bruit sur les donnes dapprentissage, et propose de prendre H proportionnel la
variance de bruit (X) comme un choix asymptotiquement optimal. (Kwok and Tsang, 2003,
Cherkassky and Ma, 2002, Vapnik, 1999, et Smola et al., 1998) proposent galement de choisir
H proportionnel la variance de bruit en correspondance avec la formulation dorigine de SVR.
Mais cette proposition ne tient pas compte de la taille des donnes dapprentissage N.
(Cherkassky and Ma, 2004) ont propos une quation empirique pour calculer H partir de N et
X (la variance du bruit). Pour des grandes valeurs de N, cette relation est H
constante

65

WX

ln N
, avec la
N

66

CHAPITRE II : Systme de traitement


des eaux uses

67

68

Dans ce chapitre, la stratgie de diagnostic de dfaut propose dans cette thse est applique au
procd de traitement des eaux uses (station dpuration) Waste Water Treatment Process
WWTP . Dans la premire section, nous prsentons le procd et son modle. La deuxime
section prsente une revue bibliographique des mthodes bases sur les donnes qui ont t
utilises pour la modlisation et la dtection de dfaut dans le procd WWTP. Dans la troisime
section, nous considrons lapplication de la mthode SVR pour la modlisation de certaines
variables du procd (oxygne dissous So5, azote oxyd Sno2, Matires En Suspension la sortie
MES (TSSe en anglais) . ) et ensuite la mthode SVM pour le diagnostic de dfauts de
capteurs (So5, Sno2,..) et aussi dactionneurs (dbit de recyclage interne Qintr , coefficient de
transfert doxygne Kla5).

II.1. Description du systme


La vie de lhomme, des plantes et des animaux ncessite obligatoirement la prsence dune
ressource importante qui est leau. Les besoins de cette matire ne cessent daugmenter avec la
croissance de la population mondiale. Cependant, cette ressource est de plus en plus rare cause
des changements climatiques provoquant la scheresse et la diminution des nappes. La bonne
gestion et la revalorisation de leau constitue ainsi un enjeu majeur afin de protger ce
patrimoine.
La complexit croissante des pollutions provenant de diffrentes natures, mnagres (urbaines),
agricoles, industrielles et pharmaceutiques nocives l'environnement et la diffusion de ces
pollutions, nous amne rechercher des mthodes de dpollution plus efficaces avec le moindre
cot. En effet, la pollution peut tre due des structures chimiques organiques (carbone,
protines, matires grasses, huiles, pesticides, azote organique, ...) ou inorganiques (mtaux
lourds, azote ammoniacal, nitrates et nitrites, phosphates, sulfates, ...) prsentes dans leau. Le
traitement des eaux uses permet dconomiser cette ressource et de prserver lcologie et les
milieux aquatiques en liminant la majeure partie des diffrents dchets et pollutions carbones,
azotes et phosphores ainsi que les matires en suspension contenues dans ces eaux (Pons et al.,
2008). On note que dans le modle utilis par la suite le traitement du phosphore nest pas
considr.
Les normes europennes ont tabli une rglementation stricte et rigoureuse des limites de rejet
des eaux uses dans lenvironnement. Plusieurs paramtres appels variables composites sont
dfinis pour valuer la qualit de leau. En plus de ces variables, il faut respecter dautres
paramtres tels que la transparence, la couleur, lodeur et la saveur de leau.
69

Le traitement des eaux uses se fait dans les stations dpuration. Ces stations font intervenir
un ensemble dinstallations et dquipements qui permettent denlever la pollution et de rendre
leau conforme selon les normes environnementales avant son rejet dans le milieu naturel, sa
rutilisation pour lirrigation ou son recyclage. Ce sont des systmes complexes, non linaires,
soumis des perturbations/incertitudes importantes dans les dbits influents (ou affluents) et
dans la composition des eaux (la charge polluante) (Belia et al., 2009). En plus de la difficult
lie la composition de lentrant, ces ractions ont lieu dans des conditions considres non
optimales (produits toxiques, faible temprature, oxygne insuffisant, cart de pH, faible
concentration en biomasse ...) et il y a une ncessit de fonctionner dune manire continue.

II.1.1. Le procd de traitement des eaux uses par boues actives


Le procd dit boues actives ou cultures libres est le procd le plus employ
actuellement. Il est bas sur le principe d'une culture bactrienne en suspension et are qui
permet d'oxyder la matire organique (Hauduc, 2010). Dans ce systme, le traitement des eaux
rsiduaires seffectue sur plusieurs tapes de traitements physico-chimiques et biologiques. Les
eaux uses collectes subissent initialement une tape de prtraitement dont le but est de
faciliter la tche de traitement et dviter tout dommage dquipement. Le prtraitement se fait
dans un premier temps par une opration de dgrillage/dessablage. Cette opration consiste en
lexclusion des lments grossiers difficiles traiter par les bactries et llimination des sables,
pierres et toute matire assez lourde. En deuxime lieu vient lopration de dgraissage qui a
pour objectif denlever les graisses et huiles qui se trouvent dans leau.
Ensuite, lorsque leau arrive au bassin daration, elle suit une puration biologique par contact
avec la masse bactrienne (biomasse) puratrice par brassage et aration afin denlever les
pollutions organiques, azotes et le phosphate qui se trouve dans leau reue. Il existe diffrentes
dispositions possibles pour le bassin daration suivant les critres respecter. Un ou plusieurs
bassins sont utiliss, en parallle ou en sries, ars ou non, ou avec une aration cadence. En
effet, la dnitrification (transformation des nitrates en diazote) ncessite un milieu anoxique
tandis que llimination de phosphore a besoin dune zone anarobie. Laration a pour but de
permettre lactivit biologique des bactries et de faciliter ainsi la dgradation de la matire
organique et des agents polluants (la prsence de loxygne permet que la matire organique soit
avale par la biomasse qui va ainsi grandir,(Heymann, 2010)). Lazote ammoniacal et les
phosphates sont aussi utiliss en tant que nutriments.

70

Aprs un sjour suffisant dans le racteur biologique, leau traiter est ensuite envoye vers un
clarificateur ou un dcanteur qui va permettre de sparer la biomasse (solide) de leau pure
(liquide) par leffet de gravitation. Une dcantabilit convenable des boues signifie une eau de
bonne qualit assez claire avec une faible turbidit. Leau pure se trouve en haut du dcanteur
et se dverse lextrieur par effet de dbordement, tandis que la biomasse (boue) se trouve en
bas du clarificateur. Une partie de biomasse est enleve et jete comme dchets et la partie qui
reste va tre recycle afin de maintenir une concentration assez leve de boue dans le bassin
daration qui permet une intensification des processus biologique. Il faut noter que le stockage
et le transport des boues produites comme des dchets constituent une charge importante dans les
stations dpuration.

II.1.2. La modlisation
La modlisation des procds de traitement des eaux est devenue une tape importante utilise
en ingnierie (Jeppsson, 1996 , Gernaey et al., 2004, Rieger et al., 2010). La connaissance des
cintiques biologiques mises en jeu sont essentielles pour assurer une bonne gestion des
installations, la supervision et la commande (Sprandio et al., 2007). Par exemple, ceci permet la
prdiction de la quantit ncessaire doxygne et la production de la biomasse qui sont des
informations importantes pour la gestion du procd. La modlisation a permis de raliser des
simulations ralistes du procd de traitement boues actives qui ont t appliques pour :
- L'optimisation du traitement (Rivas et al., 2008) et de la consommation dnergie
(Jonasson, 2007)
- La conception douvrage dassainissement (Artan et al., 2004)
- Le dveloppement et le test de nouvelles commandes (David, Vande Wouwer, et al., 2009),
(Mulas, 2006)
- Le test des schmas de surveillance et de diagnostic de dfauts (Caccavale et al., 2010)
Parmi ces modles, on peut citer le modle ASM1 (Activated Sludge Modelno1) qui dcrit les
processus importants qui se produisent dans les procds de traitement des eaux uses boues
actives (Henze et al., 1987). Il a t ralis par le groupe de travail sur la modlisation
mathmatique pour la conception et le fonctionnement du procd des boues actives appel en

anglais Task Group on Mathematical Modelling for Design and Operation of the Activated
Sludge Process dans le cadre de lassociation IWA en 1986. Ce Modle est considr comme
la base de plusieurs modles de rfrence et il est encore largement utilis dans les logiciels de
71

simulation dynamique. Par la suite, diffrents modles ont t dvelopps ASM2, ASM2d,
ASM3 (Henze et al., 2000).
Par rapport ASM1(Nelson and Sidhu, 2009) qui a pour objectif dliminer lazote et le carbone,
les modles ASM2 et ASM2d dcrivent en plus les processus lis l'limination biologique du
phosphore (Henze et al., 1995). Le modle ASM3 est une version amliore de ASM1, il a t
labor par lintroduction de nouveaux processus comme lincorporation des processus de
stockage de la matire organique, et des simplifications comme le changement du processus de
mort et rgnration

par un processus de respiration endogne (Gujer et al., 1999). Des

tentatives pour construire un guide pour la modlisation boues actives ont t faites comme
par exemple celle du groupe de travail "Good Modeling Practice" (GMP-TG) de l'International
Water Association (IWA) (https://iwa-gmp-tg.cemagref.fr/).
Le dveloppement des modles reprsentant les procds de traitement des eaux uses reste une
tche assez dlicate car ils intgrent un grand nombre de paramtres et variables. La
dtermination de la valeur de ces paramtres pose un problme en raison de leur dpendance aux
conditions de fonctionnement (temprature, climat), (Hauduc, 2010). La manipulation de ces
modles, pour lautomatisation du procd est galement difficile, comme ASM1 par exemple,
puisquils sont complexes et de nature non linaire. La linarisation de ces modles est souvent
ralise afin dobtenir des modles linaires temps variant plus facilement commandable et
interprtable (Benhalla et al., 2010). Lutilisation du modle rduit (plus simple mais assez
reprsentatif du systme, (Costa et al., 2008, Queinnec and Gmez-Quintero, 2009) est
galement courante dans le traitement des eaux uses boues actives, pour des fins de
commande (Chachuat et al., 2003, Ekman, 2003), ou de construction de capteur logiciel (Mulas,
2006), et destimation de variables dtats non mesures (Queinnec and Gmez-Quintero, 2009),
(Theilliol et al., 2003). La rduction du modle peut se faire par la suppression des dynamiques
lentes, comme les concentrations des composantes azotes (Chachuat et al., 2003).
D aux incertitudes et perturbations lies ces systmes, les modles mcanistiques ont
cependant des difficults reprsenter le comportement du systme. Pour ces raisons,
lutilisation des mthodes de modlisation diriges par des donnes comme les rseaux de
neurones (Jeppsson et al. 2002, Lee, Joung, et al., 2005, Mjalli et al., 2007, Rduly et al., 2007),
les moindres carrs partiels PLS (Lee et al., 2007), ou la combinaison des deux (Lee, Lee, et al.,
2006a) devient intressante pour lautomatisation du systme.
Le modle utilis dans ce travail est le modle de simulation BSM1 (Copp, 2002), appel en
anglais the Benchmark Simulation Model No 1 . Il a t dvelopp au sein du groupe de
72

travail COST action 682 et 624 et le groupe de travail sur l'analyse comparative des stratgies
de contrle des installations de traitement des eaux uses de lassociation internationale de leau
(IWA), appel en anglais Task Group on Benchmarking of Control Stratgies for Wastewater
Treatment Plants . Ce modle dcrit le fonctionnement du systme et particulirement le
racteur biologique et le clarificateur intgrant le contrle et les critres dvaluation de
performances de ces systmes. Pour plus de dtails voir les liens suivants:
http://www.benchmarkwwtp.org/
http://www.primodal.com/iwa_taskgroup_bsm.htm
Une extension du modle BSM1 pour une implmentation complte des systmes de
management deaux uses est ralise par Jeppsson dans (Jeppsson et al., 2007).
Ces diffrents modles sont programms dans plusieurs logiciels commerciaux utiles pour la
modlisation, lanalyse, laide la conception des procds ou les tests des stratgies de contrle,
on cite par exemple :
BIOWIN: http://www.envirosim.com/products/bw32/bw32intro.php
GPS-X:

http://www.hydromantis.com/GPS-X.html

SIMBA:

http://www.ifak-system.com/services/dynamic-simulation.html

Dans cette thse, nous avons programm le modle BSM1 dans Matlab afin dy incorporer le
bloc FDI, sans lutilisation des logiciels commerciaux.

II.1.3. Le modle BSM1


II.1.3.1. Le procd
Le procd de rfrence BSM1 est constitu dun racteur biologique et dun clarificateur
(Figure II.1). Le bassin de boues actives (racteur biologique) est trait comme une succession
de cuves en nombre ajustable, gale 5 par dfaut (Copp, 2002). Ces compartiments sont diviss
en deux zones comme suit :

Une section anoxique : constitue de deux cuves/compartiments non ares (absence


doxygne) mais avec la prsence de nitrate. Chaque compartiment a un volume gal

V1 V2 1000 m3 .

73

Une section arobie : constitue de trois cuves ares dun volume gal
V3

V4

V5

1333 m3 . Les cuves 3 et 4 sont excites par un coefficient de transfert

doxygne fixe gal K La

240 j 1 . En revanche, sa valeur est variable pour la cuve 5,

car on va manipuler K La afin de rguler la concentration de loxygne dissous


2 g.(DCO)/m3.
O DCO reprsente la Demande Chimique en Oxygne.
Afin de compenser la perte de biomasse ncessaire dans lopration dpuration qui est
provoque par le dbit de sortie du 5me compartiment du racteur biologique Q5= Qf, une partie
de la boue du clarificateur est recycle par pompage vers le racteur avec un dbit Qr. Cette
opration sappelle le recyclage extrieur. Lautre partie de boue en excs est purge, avec un
dbit de purge gal Qw, qui est ensuite dshydrate ou stocke. Les taux de recyclage et de
purge permettent de matriser lge des boues cest--dire le temps au bout duquel la biomasse
sera entirement renouvele. Ce temps caractrise la forme physiologique de la biomasse dans le
racteur mais aussi, indirectement, la composition de celle-ci.

Qf

Figure II.1 Prsentation gnrale du procd BSM1


Le pilotage de ce procd est fait par la rgulation des deux variables suivantes :
1. La concentration SNO,2 de nitrates dans le 2me compartiment une valeur gale
1 g.(N).m-3 par la manipulation dun dbit de recyclage interne Qintr (ou Qa).
2. La concentration SO,5 de loxygne dissous dans le 5me compartiment une valeur gale
2 g. (DCO).m-3 par la manipulation du coefficient du transfert doxygne Kla5.

74

Dans le modle BSM1, la dsignation X signifie particulaire et S soluble, lindice i signifie inerte
et lindice s (exemple XS) caractrise la biodgrabilit (Dispan, 2003) (Tableau II.1).
Tableau II.1 Les concentrations intervenant dans le modle BSM1

Particulaire

Dfinition
Alcalinit
Matire soluble inerte
Oxygne dissous
Azote sous forme de nitrites (NO2-) et de nitrates (NO3-)
Azote ammonium (NH4+) et ammoniac (NH3)
Azote organique soluble et biodgradable
Substrat soluble facilement biodgradable
Biomasse active htrotrophe
Biomasse active autotrophe
Matire organique particulaire inerte
Azote organique particulaire et biodgradable
Produits particulaires rsultant de dcomposition de la biomasse
Substrat lentement biodgradable

Notation
SALK
SI
SO
SNO
SNH
SND
SS
XB,H
XB,A
XI
XND
XP
XS

Dans ce modle, la pollution organique est classe en plusieurs types :


-

Substrat soluble facilement biodgradable dtrior et assimil directement par les


microorganismes comme les bactries,

Substrat lentement biodgradable ncessitent des processus intermdiaires tels que


lhydrolyse afin dtre assimil par les bactries,

Substrat particulaire.

II.1.3.2. Termes de croissances/mortalit


Les processus biologiques sont modliss par des quations de type Monod (relation empirique)
afin dexprimer les taux de croissance de microorganismes (Monod, 1949):
dX
S
P. X avec P Pm
(II.1)
K  S
dt
O P reprsente le taux de croissance des microorganismes, K la constante de demi-saturation en

substrat au dessous de laquelle le taux de croissance devient trs dpendant de la concentration


en substrat et exprime la facilit dassimilation du substrat par la biomasse, Pm le taux de
croissance spcifique maximal des microorganismes et S est la concentration du substrat limitant
la croissance.

75

Le processus est modlis selon lhypothse de la reconstitution et du dcs. Les organismes


dcdent un certain taux et une partie de la matire organique est considre comme non
biodgradable et sajoute au produit particulaire inerte XI. Le reste sajoute la quantit du
substrat biodgradable. Les ractions biologiques et biochimiques ayant lieu dans le bioracteur
peuvent tre rsumes en 8 processus basiques dcrits par les termes de vitesse de ractions
(cintique), (i=1,,8) :
1. Croissance arobie des htrotrophes
Les bactries htrotrophes ncessitent la prsence dun substrat organique pour se dvelopper.
Elles sont incapables de fabriquer leur propre nourriture organique :

S S
SO

K O,H  SO K S  S S

X B,H

(II.2)

2. Croissance anoxie des htrotrophes

K O ,H S S
S NO

K g X B,H

H
(II.3)

K NO  S NO K O ,H  SO K S  S S
Les bactries htrotrophes sont en grande partie responsables de la dcomposition des matires
2

organiques telles que la matire carbone en arobie ou en anoxie. En anoxie elles utilisent les
nitrates ( NO3 ) ou nitrites ( NO 2 ) comme source doxygne. Les processus anoxies sont inhibs
par loxygne.
3. Croissance arobie des autotrophes
Les bactries autotrophes sont capables de se multiplier en utilisant la matire minrale
(oxygne, hydrogne, carbone, azote et sels minraux divers) dans un milieu ar (arobie) afin
de produire un composant organique complexe qui reprsente leur nutriment.
3

SO
S NH

K O,A  SO K NH  S NH

X B,A

(II.4)

Les quations des processus de croissance de (II.2) (II.4) sont reprsentes par un modle
classique de Monod coupl des fonctions de commutation de type Michaelis-Menten. Ces
fonctions vont permettre plus au moins dactiver ou dsactiver la croissance (ajout des conditions
de limitation) suivant les conditions environnementales concernant la prsence de certains
lments ncessaires la croissance.

76

4. Mortalit des htrotrophes


4

(II.5)

bH X B,H

5. Mortalit des autotrophes


(II.6)

5 bA X B,A
6. Ammonification de l'azote organique soluble
6

(II.7)

ka S ND X B,H

7. Hydrolyse des composs organiques absorbs

KO,H

X S /X B,H
S NO
SO

 h

kh
(II.8)
K  S K  S K  X /X X B,H

KO,H  SO
O,H
O
NO
NO
S
B,H
X

O le ratio X S / X B,H traduit labondance de matire enzymatique qui va faciliter la raction


7

dhydrolyse.
8. Hydrolyse de lazote organique absorb

KO,H

X S /X B,H
SO
S NO
X ND
 h

kh
X B,H

KO,H  SO K NO  S NO K X  X S /X B,H X S
KO,H  SO
(II.9)
X ND
7
XS
Les paramtres du modle BSM1 dpendent de la temprature. Par exemple le taux de croissance
8

des bactries (PA, PH) et leurs taux de mortalit (bA, bH) varient suivant la temprature. Les
valeurs donnes dans le Tableau II.2 correspondent une temprature aux alentours de 15C.

Tableau II.2 Paramtres du modle BSM1

Paramtres Stchiomtrique

Description

Symbole

Valeur

Rendement de croissance autotrophe

YA

0.24

Rendement de croissance htrotrophe

YH

0.67

fP

0.08

Fraction dazote dans la biomasse

iXB

0.08

gN
g DCO

Fraction dazote dans les produits de lyse

iXP

0.06

gN
g DCO

Fraction de biomasse recycle en produits


particulaires

77

Unit
g DCO x B,A
gN
g DCO x B,H
gN

Paramtres cintiques

Taux de croissance maximal de la biomasse


htrotrophe
Constante de demi-saturation htrotrophe
Constante de demi-saturation de loxygne
pour la biomasse htrotrophe
Constante de demi-saturation du nitrate pour
la biomasse htrotrophe
Taux de dcs htrotrophe
Facteur de correction pour la croissance
anoxique des htrotrophes
Facteur de correction pour lhydrolyse sous
condition anoxie
Taux dhydrolyse spcifique maximal
Constante
de
demi-saturation
pour
lhydrolyse
du
substrat
lentement
biodgradable XS
Taux de croissance maximal de la biomasse
autotrophe
Constante de demi-saturation de lazote
ammoniacal pour la biomasse autotrophe
Taux de dcs autotrophe de la biomasse
autotrophe
Constante de demi-saturation de loxygne
pour la biomasse autotrophe
Taux dammonification

PH

j-1

KS

10

g DCO. m-3

KO,H

0.2

g O2 .m-3

KNO

0.5

g NO3-N .m-3

bH

0.3

j-1

Kg

0.8

Kh

0.8

kh

KX

0.1

PA

0.5

j-1

KNH

g (NH4-N) .m-3

bA

0.05

j-1

KO,A

0.4

g (O2) .m-3

ka

0.05

m3 (g (DCO) j)-1

g DCO x
g DCO x B,H . j-1

g DCO x s
g DCO x B,H

Le traitement des diffrents types de pollution (organique, azote) se fait par des mthodes
distinctes, dcrites dans les sections suivantes. On note que lorsque les matires organiques
(Figure II.2) sont abondantes, cela va causer le dpassement de la capacit dautopuration
naturelle du milieu rcepteur. En effet, la dgradation de ces substances (oxydation par des
microorganismes) provoque une consommation excessive doxygne au dtriment des
organismes aquatiques qui vont tre asphyxis.
La reproduction des microorganismes intervient en conditions favorables en favorisant le
mtabolisme des bactries. Lorsque leur croissance est importante et que les bactries se mettent
se diviser, un floculant est ajout leur permettant de s'accumuler en flocs dcantables
produisant des boues. Cette floculation va permettre dliminer les composantes carbones
(graisses, sucres, protines, etc.) et les lments polluants qui se trouvent dans leau reue.

78

Matire organique
Composs particulaires
Organique(MVS)

DCO biomasse
Rsidus de
dcomposition
XP

Biomasse
autotrophe XBA

Composs solubles

Minrale(MM)

Oxygne dissous

Facilement
biodgradable SS

DCO particulaire
Particulaire
inerte XI

DCO soluble
Soluble
inerte SI

Lentement
biodgradable
XS

Biomasse
htrotrophe XBH

Figure II.2 La matire organique dans le modle BSM1

II.1.3.3. Traitement de la pollution azote


La grande partie de lazote qui se trouve dans leau rsiduaire est prsente sous forme dazote
ammoniacal (ammoniac NH3 , ion ammonium NH4 , nitrates NO3 ou nitrites NO2 , Figure II.3).
On note que l'ammoniac et les nitrites sont des produits toxiques.
Les formes azotes
Azote
Azote en
ammoniacal SNH Nitrate/Nitrite SNO

Azote organique
soluble SND

Azote organique
particulaire XND

Figure II.3 Les composs azots dans le modle BSM1


Lazote est supprim par les oprations de nitrification et dnitrification (Gujer, 2010) :
1. Nitrification biologique: cest le processus de transformation de lammonium par
oxydation. Cela seffectue en deux tapes en nitrite dabord ( NO2 ) puis rapidement en
nitrate ( NO3 ) :
NH3  O2 o NO2  3H   2e 
NO2  H 2O o NO3  2 H   2e 

1
NH 4  O2 o NO2  H 2O  2 H 
2
1
NO2  O2 o NO3
2
79

2. Dnitrification biologique: cette opration survient dans un environnement anoxique, et a




comme but dliminer les nitrates ( NO3 ) en produisant le gaz dazote :

2 NO3  2H  o N 2  H 2O  2.5O2

II.1.3.4. Traitement de la pollution phosphorique


La prsence de phosphates dans les eaux rsiduaires provoque laugmentation de la turbidit et la
multiplication des algues et dautres espces qui dsquilibre totalement le milieu et gne
beaucoup le passage de la lumire aux couches infrieures, entranant ainsi le phnomne
deutrophisation. Llimination de phosphore dans les stations dpuration modernes est assez
neuve. Cette opration peut se faire de deux faons, soit chimique ou biologique :
x Traitement chimique : cette mthode se fait par un dosage dun produit chimique (sel

daluminium par exemple) qui permet la prcipitation des molcules de phosphates qui se
mettent en liaison, ensuite une coagulation se cre et enfin des flocs se forment. Ces
derniers peuvent tre enlevs par sdimentation. Ce type de traitement a plusieurs
inconvnients, par exemple la salinisation de leau, laugmentation de la quantit de
boues, sans oublier le prix des prcipitants qui augmente.
x Traitement biologique : ce type de traitement ncessite la prsence dune zone anarobie

appele digestion anarobie afin de librer les phosphates, ensuite les phosphates sont
absorbs dans des conditions anoxiques ou arobies. Comme l'absorption est plus grande
que la libration, elle conduit une absorption nette de phosphore.

II.1.3.5. Hydrolyse
Dans certains cas, quand le substrat (par exemple XS) nest pas assimilable par les
microorganismes, une opration dhydrolyse seffectue laide des exoenzymes afin de le rendre
plus facilement assimilable par les microorganismes et donc dgradable.
HYDROLYSE
LYSE
X S 

o S S CROISSANCE
 
o X BH 
o X P
HYDROLYSE
AMONIFICAT ION
NITRIFICAT ION
Dnitrific ation
X ND 

o S ND 
o S NH 

o NO3 
o N 2

80

II.1.3.6. Vitesses des ractions


Les vitesses des ractions rj (j=113) pour chaque lment sont une combinaison des 8
processus prcdents :
Pour Si ( j 1) : r1 0

Pour S s ( j 2) : r2  1 U1  1 U 2  U 7
YH
YH

Pour X I ( j 3) : r3 0

Pour X S ( j 4) : r4 1  f p U 4  1  f p U 5  U 7

Pour X B ,H ( j 5) : r5 U1  U 2  U 4

Pour X B , A ( j 6) : r6 U 3  U 5

Pour X ( j 7) : r
f p U 4  f p U5
7
P

Pour SO ( j 8) : r8  1  YH U1  4.57  YA U 3
YH
YA

Pour S NO ( j 9) : r9  1  YH U 2  1 U 3
2.86 YH
YA

1
Pour S ( j 10) : r
i XB U1  i XB U 2  i XB  U 3  U 6
10
NH

YA

Pour S ND ( j 11) : r11  U 6  U8

Pour X ND ( j 12) : r12 i XB  f P i XP U 4  i XB  f P i XP U 5  U8

i
1  YH
i
i
1
1
Pour S ALK ( j 13) : r13  XB U1 
U 3  U 6
 XB U 2  XB 
14
14

14 7YA
14.2.86YH 14

Avec r j

ij

(II.10)

U i , avec i 1...8, et j 1...13

Qij sont les coefficients stchiomtriques, impliquant chaque variable dans chaque raction.
Leurs valeurs sont ngatives pour les composs consomms et positives pour ceux produits.
Les quations de ractions prcdentes montrent que ce modle fait intervenir des relations de
liaison entre les diffrentes composantes qui crent ainsi une sorte de comptition entre ces

81

composantes. Certaines vont se dvelopper plus aisment au dtriment dautres qui deviennent
une minorit ou vont disparatre. Tout ceci donne un modle complexe et non linaire.

II.1.3.7. Bilans de matire


Le modle mathmatique du procd de traitement des eaux uses est tabli partir des bilans de
matire pour chaque composante sur lensemble des bassins :
Accumulation = Flux dentre + Terme de raction - Flux de sortie
Les concentrations des diffrentes composantes sont runies dans un vecteur dtat C de 13
T
variables : C

>S , S
I

, X I , X S , X B ,H , X B , A , X P , SO , S NO , S NH , S ND , X ND , S ALK @

Les quations dynamiques de ces concentrations font intervenir les vitesses des ractions
dtailles plus haut. Pour le premier compartiment k=1 (ou 1er unit) :
dC1
dt

1
Qin Cin  Qr Cr  QaCa  r1V1  Q1C1
V1

avec

Q1

Qin  Qr  Qa

(II.11)

avec

Qk

Qk 1

(II.12)

Pour k=2 5 :
dCk
dt

1
Qk 1Ck 1  rkVk  Qk Ck
Vk

Et :
Qf

Q5  Qa

Qe  Qw  Qr

Ca

C5 , C f

C5 , Cw

Qe  Qu

Cr

(II.13)

Il faut noter que lquation diffrentielle de loxygne dissous reprsente un cas spcial dans le
sens o cest la seule variable dtat dont la dynamique dpend dun terme de transfert qui
caractrise le couple racteur/systme daration. Son expression est donne comme suit :
dS O ,k
dt

Avec SO

1

Qk 1S O ,k 1  rkVk  Qk SO ,k  K L a k Vk S O  S O ,k S O ,k
Vk

(II.14)

8 g.m 3 la concentration de saturation pour loxygne.

II.1.3.8. Dynamique du clarificateur


Le clarificateur ou dcanteur secondaire a pour rle de sparer les matires en suspension de
leau pure sans raction, juste par effet de sdimentation ou dcantation. Il est modlis de 10
couches par dfaut dune hauteur totale de 4 m avec un volume de 6000 m3 et une surface
82

circulaire de 1500 m2. Le modle de simulation du clarificateur utilis est un modle


unidimensionnel qui dcrit le processus de dcantation le long de l'axe vertical avec lhypothse
dun bon mixage dans chaque couche (Takcs, 2008), (Takcs et al., 1991), (David, Saucez, et
al., 2009). Dautres faons de modliser le dcanteur existent, par exemple la stratgie base sur
les quations non linaires drivs partielles (Diehl and Jeppsson, 1998).
Tableau II.3 Paramtres de dcantation
Paramtre
Vitesse maximale de dcantation
Vitesse maximale de dcantation
Vesilind)
La dcantation freine

Symbole

Valeur
250

Unit
m.j-1

Q0

474

m.j-1

rh
rP
f ns

0.000576

m3/g de TSS

0.00286

m3/g de TSS

0.00228

Q
(Vitesse

de

La dcantation de particules isoles

'
0

Fraction non dcantable


Flux de particules qui dcantent de la couche j vers la
couche j+1
Concentration en solides non dcantables

J s, j

m3.j-1

X min

g.m-3

Vitesse de dcantation dans la couche j

Q s, j

m.j-1

Le flux solide d la pesanteur est donn par :

Js

v s X X

(II.15)

O X est la concentration totale des boues. Suivant (Takcs et al., 1991) la vitesse du
clarificateur peut scrire sous la forme suivante :

>

vs X max 0, min v0' ,v0 e rh X  X min  e

rp X  X min

`@

avec X min

f ns X f

(II.16)

0.4 m . Sur chaque couche, un bilan de matire

La hauteur de chaque couche m est gal zm

est tabli afin de dduire la concentration des matires en suspension. Pour la couche du fond
(m=1) :

dX 1 vdn X 2  X 1  min J s,2  J s,1


dt
z1
Pour les couches intermdiaires infrieures (m entre 2 et 5) :

(II.17)

dX m vdn X m1  X m  min J s,m  J s,m 1  min J s,m  J s,m 1


dt
zm
Pour la couche dalimentation (m=6) :

(II.18)

Qf X f
dX m
dt

 J clar,m 1  vup  vdn X m  min J s,m  J s,m 1


zm

83

(II.19)

Pour les couches intermdiaires suprieures (m entre 7 et 9) :

dX m
dt

vup X m1  X m  J clar,m 1  J clar,m


zm

min vs,j X j ,vs,j 1 X j 1 si X j 1 ! X seuil


J clar,j
si X j 1 d X seuil
vs,j X j
Xseuil est la concentration seuil en solides en suspension qui est gale 3000 g.m-3.

(II.20)

Pour la couche suprieure (m=10) :


dX 10 vup X 9  X 10  J clar,10
(II.21)
dt
z10
Pour plus de dtails sur le modle de rfrence BSM1, le lecteur est conseill de voir (Alex et al.,

2008).

II.1.4. Variables composites/mesures


II.1.4.1. Les normes
Les normes de rejet sont bases sur certaines mesures qui dterminent la qualit de leau de
leffluent.
-

DCO (kg.j-1) : La Demande Chimique en Oxygne (Chemical Oxygen Demand (COD) en


anglais)
Elle reprsente la quantit doxygne ncessaire pour loxydation (classiquement par
dichromate de potassium) de la totalit des matires (susceptibles de consommer de
loxygne) contenues dans leau par voie chimique, en milieu acide et chaud. DCO doit
tre infrieure 100 g.m-3 doxygne dissous :
DCO X B, A  X B,H  X P  X S  X I  SS  S I

(II.22)

DBO5 (kg.j-1) : Demande Biologique en Oxygne sur 5 jours (Biological Oxygen Demand
after five days (BOD5) en anglais)
Elle reprsente la quantit d'oxygne ncessaire pour oxyder les matires organiques
(biodgradables) par voie biologique (par des bactries). Cette quantit indique la teneur en
matires organiques biodgradables de la charge polluante carbone des eaux uses. DBO5
doit tre infrieure 10 g.m-3 doxygne dissous au bout de 5 jours.
DBO5

0.25 u X S  SS  (1  f p )( X B, A  X B,H )

84

(II.23)

MES (kg.j-1) : Les Matires En Suspension (Total Suspended Solids (TSS) en anglais)
Il sagit de lensemble des particules solides fines non dissoutes visibles l'il nu qui se
trouvent en suspension dans leau. Ces matires augmentent la turbidit, empchent la
bonne pntration de la lumire et affectent ngativement le milieu aquatique, les animaux
et les plantes. MES doivent tre infrieurs 30 g.m-3 pour satisfaire les normes de rejet.
MES 0.75 u X P  X I  X S  X B, A  X B,H

(II.24)

NTK (kg.j-1) : Azote total (ammoniacal et organique) (Total Kjeldahl Nitrogen (TKN) en
anglais)
Pour lazote, 5 formes peuvent tre trouves dans le procd de traitement deau use :
L'azote organique (constitue les cellules vivantes vgtales ou animales principalement
composes dure et dacides amins), l'azote ammoniacal ( N H 4 ), les nitrites ( NO 2 ), les
nitrates ( NO3 ) et lazote gazeux (N2). NTK correspond la somme de lazote sous forme
ammoniacale et organique. Elle doit tre infrieure 18 g.m-3.
NTK

S NH  S ND  X ND  i XB u X B , A  X B ,H  i XP u X P  X I

NTotal

S NO  NTK

(II.25)

Dans cette thse, ces variables sont notes COD, BOD5 , TSS et TKN par la suite.

II.1.4.2. Les capteurs de mesures


Les grandeurs gnralement mesures en ligne sont les suivantes : la temprature, la pression, le
pH, les dbits, le potentiel doxydo-rduction (Oxidation Reduction Potential (ORP) en anglais)
pour la raction, les concentrations doxygne, dazote total, dazote ammoniacal, des
nitrites/nitrates, et de phosphore, Les Matires Volatiles en Suspension (TSS), la demande
chimique en oxygne (COD), la demande biologique (ou biochimique) en oxygne sur 5 jours
(BOD5), etc. (Vanrolleghem and Lee, 2003, Ingildsen, 2002). Ces mesures ont une grande
importance pour la commande et lamlioration de la performance de fonctionnement qui peut
aller jusqu la suppression de lazote, carbone de 20 50% (Olsson, 2007). Elles permettent
dvaluer lefficacit de lpuration, de sassurer du respect des limites de rejet, et daider
cerner les dfauts ou dysfonctionnements possibles dans les quipements de la station
dpuration.
Les capteurs pour la surveillance du processus dlimination des nutriments de procd WWTP
se dcomposent en trois catgories (Gernaey et al., 1998): sondes directes (oxygne dissous DO,
pH, Potentiel dOxydo-Rduction qui mesure la ractivit des espces chimiques, turbidit)
85

sondes indirectes (exemple analyseurs N H 4 et N H 3 en ligne) et biocapteurs (exemple: la


demande d'oxygne rapide et le testeur de toxicit (Rapid Oxygen Demand and Toxicity tester
RODTOX), NITRification tOXicity tester (NITROX), DEnitrification CArbon source DOsage
System; patent pending (DECADOS), ...). Par exemple, afin de sauvegarder les microorganismes
responsables de lpuration contre des influents toxiques, un pH-mtre ou mieux un capteur de
toxicit par respiromtrie peut tre install sur leau traiter. Laration peut tre rgule par
sonde oxygne dissous ou encore mieux par potentiel redox.

II.2. Commande des systmes de traitement des eaux uses


Le contrle des procds de traitement des eaux uses est important pour satisfaire les
performances dsires, rduire les missions de gaz effet de serre, amliorer la qualit de
leffluent, protger l'environnement et optimiser les cots dnergie et des produits chimiques
utiliss. On trouve plusieurs travaux dans la littrature tels que (Mulas, 2006), (Ekman,
2003),(Ingildsen, 2002).
x

Trois lments sont ncessaires pour dfinir la stratgie de contrle :


1- Les variables manipules : variables affectes par les actionneurs permettent de
manipuler le systme.
2- Les variables mesures : obtenues partir des capteurs.
3- Lalgorithme de contrle.

Les informations concernant le procd sont transmises par les capteurs, qui sont comme les
yeux et les oreilles chez l'homme. Ces donnes transmises sont ncessaires pour raliser un bon
contrle en ligne du procd de traitement des eaux (Schtze et al., 2004).
La commande des procds WWTP consiste commander laration (Ekman et al., 2006),
pompage de boues et les aliments chimiques par les manipulations dactionneurs (vanne, pompe,
etc..) et le contrle par le dbit de purge permet de rgler le temps de sjour des boues dans le
procd.
Parmi les stratgies de contrle, on cite le correcteur PID qui est la faon la plus simple et en
mme temps efficace pour rguler des systmes sans avoir connatre des informations autres
que la mesure de la variable contrler sur ces derniers. Cependant, cette commande prsente
des inconvnients tels que la limite rejeter des perturbations et rencontre des problmes face
des procds de grande constante de temps. Autre stratgie, la commande anticipatrice
86

(feedforward control) qui permet d'entreprendre une action corrective avant mme que les
perturbations n'affectent les sorties du systme. Cette commande est utile pour les procds lents
comme c'est le cas dans le procd WWTP. Une commande adaptative base sur architecture en
rseau de neurones est applique la rgulation de l'oxygne dissous dans un procd WWTP
(Han and Qiao, 2011), une approche combinant un rseau neuronal avec une commande floue
(Waewsak et al., 2010). Un bon rapport qui discute les mthodes de contrle des procds
WWTP municipales peut tre revu dans (Haimi et al., 2009)
Le maintien des objectifs de contrle quand le procd de traitement des eaux est affect par
un dfaut est fondamental. Cette tche se ralise par une commande tolrante aux dfauts
(Blanke et al., 2006) qui consiste soit accommoder le dfaut si ce dernier n'est pas trs
dangereux par l'adaptation des paramtres de contrleur aux proprits dynamique du procd
dfectueux, ou carrment par la reconfiguration de la loi de commande ainsi que la structure du
contrleur. Une stratgie de commande tolrante au dfaut a t propose par (Zumoffen and
Basualdo, 2008a). Celle-ci est base sur une commande prdictive en ligne et est applique un
procd WWTP.

II.3. Revue des mthodes de diagnostic du procd WWTP


Afin d'augmenter la robustesse et la sensibilit de la surveillance du procd WWTP, il faut un
systme de diagnostic prcis, puissant et efficace qui permet la dtection rapide des dfauts. Le
bloc de diagnostic de dfaut (FDI en anglais) et le bloc de la commande doivent tre conus de
faon rduire la vulnrabilit face aux dfauts, liminer les fausses alarmes, diminuer les cots,
conomiser lnergie et la consommation de produits chimiques, amliorer llimination des
nutriments et de la pollution en gnral et amliorer la scurit et protger les cosystmes
aquatiques, lenvironnement et les eaux.
Limmersion de grandes quantits de donnes obtenues par la modernisation des systmes et
lapparition de nouveaux capteurs facilitent la tche de la surveillance du procd WWTP. Les
donnes accueillies partir du procd sont cependant de nature non linaires, non stationnaires,
souvent corrles et bruites, et multi chelles dues aux variations journalires, hebdomadaires et
saisonnires. Ceci rend la tche de diagnostic de dfaut plus difficile.
Diffrentes mthodes ont t appliques pour le diagnostic de dfaut dans le procd WWTP.
Notre revue bibliographique ne considrera que les mthodes bases sur les donnes qui
reprsentent le sujet de cette thse, sachant quun nombre important de travaux concerne les

87

mthodes bases sur les modles (ex. l'estimation de paramtres (Fuente et al., 1996), les
observateurs adaptatifs (Fragkoulis et al., 2011)).
Parmi les outils bass sur les donnes qui ont t utiliss dans le traitement des eaux uses, nous
pouvons citer les rseaux de neurones (Lee et al., 2008), (Caccavale et al., 2010)) le rseau
Baysien ((Chong and Walley, 1996), les modles Bonds graphs (Zhang and Hoo, 2011) et les
mthodes statistiques (ex. ACP (PCA en anglais), PLS et SVM).
La construction de modles de prdiction de certaines variables du procd WWTP comme les
concentrations de leffluent (CODeff, BODeff, TSS,TKN ,) est intressant pour surveiller le
comportement du procd WWTP. Cette estimation peut se faire par lutilisation soit dun
Rseau de Neurones Artificiel (ANN en anglais) ((Rduly et al., 2007), (Mjalli et al., 2007)) ou
par lapplication de mthodes de rgression telles que lAnalyse Factorielle Parallle et la
Projection en Structures Latentes non linaire (Singh et al., 2009). Dans cette thse on sintresse
aussi la construction de modle de prdiction par SVR.

II.3.1. ACP (PCA en anglais) et dautres mthodes statistiques


Diffrentes mthodes statistiques ont t appliques dans le diagnostic de dfaut dans le procd
WWTP. Parmi ces approches on peut citer :
-

Analyse en composantes principales Principal Components Analysis (PCA) en anglais


appliqu l'analyse d'un procd WWTP dans (Yoo et al., 2008), (Yoo, Villez, et al.,
2006), (Tomita et al., 2002).

Analyse en composantes principales dynamique Dynamic principal components


analysis (DPCA) en anglais , applique au diagnostic de dfaut dans un procd WWTP
comme (Lee, Choi, et al., 2004), (Yoo et al., 2002).

Analyse en composantes principales dynamique noyau Dynamic Kernel Principal


Components Analysis (DKPCA) en anglais applique la surveillance et la dtection
de dfauts dans un procd WWTP (Choi and Lee, 2004).

Analyse en Composantes Indpendantes (ACI) Independent Component Analysis (ICA)


en anglais applique la surveillance d'un procd WWTP (Lee, Yoo, et al., 2004).

Analyse en Composantes Indpendantes Dynamique (ACID) Dynamic Independent


Component Analysis (DICA) en anglais (Stefatos and Ben Hamza, 2010).

Analyse en Composantes Indpendantes noyau Kernel Independent Component


Analysis (KICA) en anglais (Wang and Shi, 2010).
88

Analyse en Composantes Indpendantes modifie (ACIM) Modified Independent


Component Analysis (MICA) en anglais appliqu pour la dtection, lisolation, et la
surveillance du procd WWTP (Lee, Qin, et al., 2006)

Analyse canonique (AC) canonical variate analysis (CVA) en anglais (Juricek et al.,
2004), (Russell et al., 2000).

Analyse Discriminante de Fisher noyau (ADFN) Kernel Fisher's Discriminant


Analysis (KFDA) en anglais utilise pour dterminer les variables qui permettent une
discrimination entre deux ou plusieurs groupes naturels (Li and Cui, 2009).

Analyse Factorielle des Correspondances (AFC) Correspondence Analysis (CA) en


anglais (Pusha et al., 2009), (Detroja et al., 2007).

Ces approches multivariables ont t appliques sur diffrentes systmes, mais leur principe
se ressemble puisqu'il se base sur:
1. Construire un modle sans dfaut dans les conditions normales de fonctionnement
2. Choix dune mtrique et dun seuil
3. Projeter une donne de test sur ce modle, le calcul de la distance mtrique et
convenablement la classer comme une donne normale ou dfectueuse
4. Dans le cas d'un dfaut, l'identification des variables qui sont associes au dfaut en
utilisant des mesures de contribution
Dautres varits ont aussi t utilises pour ce systme telles que lICA multidimensionnelle
"multi-way en anglais" (Yoo, Vanrolleghem, et al., 2006), une mthode combinant la
dformation temporelle dynamique "Dynamic Time Warping (DTW) en anglais" avec l'analyse
discriminante (Jun, 2011).
Une volution intressante des mthodes statistiques concerne lutilisation de noyaux non
linaires. En effet, les mthodes classiques statistiques multivariables comme lACP et lACI
peuvent rencontrer des difficults lors de la manipulation des donnes relles dynamiques
cause des changements saisonniers comme dans le cas WWTP et des non linarits. Des tudes
comparatives ont montr que lutilisation dun modle non linaire avec un noyau gaussien rend
de meilleurs rsultats par rapport lACI dans le diagnostic de dfaut d'un procd WWTP (Yu,
2012). Dautres limitations de la mthode ACP sont lies au fait quelle ne permet pas d'analyser
des procds qui admettent des variations sur plusieurs chelles de temps. Dans ce cas,
lutilisation de l'approche ACP multi-chelles, qui utilise la transforme dondelettes (par
89

exemple) peut tre utile pour la surveillance du procd de traitement des eaux (Rosen and
Lennox, 2001). La transforme dondelettes est souvent utilise comme tape de prtraitement
des signaux afin de dterminer les caractristiques et les singularits de transitions (Zhang and
Hoo, 2011), (Saravanan et al., 2008), (Abbasion et al., 2007), (Ruiz et al., 2000). Cette mthode
permet de dcomposer le signal en plusieurs chelles de temps, ce qui aide analyser le signal
localement et ainsi faire face aux perturbations. Ceci est ralis en multipliant le signal original
par les ondelettes de diffrentes tailles et diffrents intervalles de temps, une autre difficult
surgie lors de lutilisation de lACP est lie au non stationnarit du procd. Cette difficult peut
tre surmonte en utilisant l'ACP adaptative qui met jour les proprits statistiques (variance,
moyenne, covariance..) du modle ACP initial. Cette approche est applique la surveillance du
procd WWTP dans (Rosen and Lennox, 2001). On note que la transforme de Fourier est
incapable de traiter de faon globale les signaux non-stationnaires et perd aussi le comportement
temporel du signal. Enfin, la mthode ACI est utilise pour la transformation d'espace dans
lobjectif de projeter les donnes dans un espace de caractristique de faible dimension construit
par des variables latentes qui sont la fois non gaussiennes et aussi indpendantes
statistiquement entre elles (Zhang, 2008).

II.3.2. La Projection aux Structures Latentes ( PLS )


L'approche PLS Partial Least Square est trs utilise en traitement des eaux pour construire
des modles pour le suivi de plusieurs paramtres de rejet tels que COD, BOD et TSS (ex.
procd de traitement dun parc de carburant, Loureno et al., 2008). Elle a t utilise pour
quantifier les incertitudes des capteurs (Rieger et al. 2005). Elle a galement t utilise afin de
construire un modle non paramtrique en utilisant un rseau neuronal combin avec un modle
mcanistique dans une configuration parallle qui a t applique pour la dtection et l'isolation
de dfauts dans un procd WWTP (Lee, Vanrolleghem, et al., 2005). Afin de surmonter les
difficults lies la rigidit des modles statistiques et au manque de souplesse face aux
changements du procd, une PLS adaptative robuste a t dveloppe pour la prdiction et la
surveillance du procd WWTP (Lee et al., 2007). Afin de prendre en compte les nonlinarits et
les dynamiques du procd, une approche hybride (NDPLS) combinant PLS nonlinaire,
ralise par rseaux de neurone NN avec une mthode de modlisation dynamique (rponse
impulsionnelle finie (RIF)), a t propose pour la prdiction de variables dans un procd
WWTP (Lee, Lee, et al., 2006b). La rduction de la complexit de lanalyse du procd WWTP
et la dcentralisation de la surveillance et du diagnostic de dfaut dune manire hirarchique

90

peuvent tre faites par PLS multi-blocs qui a t utilise pour lestimation du COD en utilisant
les cartes de contrle Q et T2 pour dtecter les dfauts (Choi and Lee, 2005).

II.3.3. SVM
Les approches de base de SVM sont la classification (SVM) et la rgression (SVR). Lapproche
SVR est applique pour la modlisation (prdiction, estimation ou identification) alors que
lapproche SVM est applique pour le diagnostic de dfauts. On cite par exemple lutilisation de
SVR pour la prdiction du coefficient global de transfert doxygne (Deswal, 2011) et
lestimation en ligne de la concentration de la biomasse dans un procd de fermentation
(Wang,Yu et al., 2006). Un modle SVR a galement t dvelopp pour estimer la qualit de
leau travers la prdiction des concentrations COD, NH4+ , TN et TP de leffluent (Fang et al.,
2011).
Une variante de SVM appele SVM moindres carrs (Least square SVM en anglais, aussi
LSSVR) a t utilise afin de prdire le taux dentranement dair dans les bassins (Baylar et al.,
2009). Cette approche diffre un peu dans la formulation de lapproche SVM classique dans les
considrations faites sur les contraintes choisies (Des contraintes de type galit sont choisies
pour rsoudre des quations linaires au lieu des contraintes dingalit qui gnrent un
problme de programmation quadratique). Cette mme approche LSSVM a t applique avec
succs dans un procd de traitement des eaux uses pour lestimation de la concentration du
nitrite-nitrate dans leffluent (SNO) (Yang, 2006, Yang, 2005). Dans ces travaux, des
connaissances sur le procd et plus particulirement sur le processus dlimination de lazote
ont t utilises pour choisir les variables dentre pour entraner lalgorithme LSSVR afin
destimer la concentration SNO de leffluent. Les variables choisies ont t COD, TSS, TKN, TN
de linfluent, Kla5 et Sno2.
La premire approche propose par lauteur de cette thse applique au procd de traitement
des eaux est base uniquement sur SVM classification (Laouti et al., 2011b). Cependant, cette
tude ntait pas trs pousse puisqu'elle demande un effort assez consquent pour le rglage des
paramtres dapprentissage C et V sans garantir lannulation des fausses alarmes, en plus elle t
appliqu sur une variante simpliste du modle ASM1. Afin damliorer ce rsultat une deuxime
approche originale est propose qui va tre dtaille par la suite de ce chapitre.

91

II.4. Stratgie SVR/SVM propose pour le diagnostic du procd


WWTP
II.4.1. Schma SVR/SVM propos
Dans cette stratgie, la mthode SVR est utilise pour la modlisation du procd WWTP due
sa solide base thorique et ses nombreux avantages tels que sa robustesse face aux incertitudes
(aspect de gnralisation face de nouvelles donnes et nouveaux modes de fonctionnement), sa
tolrance au bruit, le traitement des valeurs aberrantes et la capacit capter la non linarit du
systme. En deuxime temps, la mthode SVM est utilise pour la dtection et lisolation de
dfauts.
Limplmentation de la mthode de diagnostic peut tre divise en deux parties : utilisation de
SVR pour la modlisation de certains variables du systme et ensuite utilisation de SVM pour le
diagnostic (dtection et isolation) de dfaut en utilisant les rsultats de prdiction obtenus par
SVR. Ces deux tapes sont prcdes par une tape de prtraitement des donnes et suivies
dune tape de validation.
Acquisition et raffinage des donnes
1. Gnration des squences de variables dentres alatoires sans dfauts pour
SVR, et sans et avec dfaut pour SVM.
2. Recueil des donnes entres/sorties (X=[U Y]).
3. Filtrage et normalisation des donnes.
4. Dfinition des groupes des donnes dapprentissage et de validation.
Construction des modles de prdiction SVR pour quelques variables cls (des variables
cls dont lestimation est suppose ncessaire dans le diagnostic de dfauts).
1. Choix des variables/caractristiques pertinentes (rgresseurs x). La slection de
variables dentre permet de choisir les meilleures variables explicatives, et
dtudier lintercorrlation entre une variable prdire (de sortie) et une variable
prdicateur ou rgresseur permettant ainsi de dterminer sil ya une dpendance
entre ces variables. Dans le cas de liaison positif, elle permet de calculer la valeur
du retard temporel.
2. Choix du noyau, et rglage des paramtres C et V.
92

3. Evaluation du modle (ajustement + analyse des rsidus et incertitudes, par


exemple par la matrice de la covariance).
Ralisation de modles de dcision SVM pour chaque dfaut
1. Dtermination des caractristiques descriptives du dfaut (choix du vecteur x pour
SVM classification). Elles peuvent contenir des estimations obtenues par SVR.
2. Rglage des paramtres du modle SVM (noyau, C, V)
3. Validation du modle SVM.
Mise en uvre en ligne de la stratgie.
Soit Nc le nombre de capteurs, et Na le nombre dactionneurs dans le systme en question, Nd le
nombre de dfauts tudis, et Em les entres choisies comme prdicteurs ou rgresseurs utiliss
par lalgorithme SVR pour construire le capteur logiciel (modle de prdiction). La Figure II.4
montre la stratgie de SVR suivie par SVM pour le diagnostic de dfauts.

Figure II.4 Stratgie SVR suivi par SVM pour le diagnostic de dfauts
93

Lide dans cette stratgie est donc de crer des caractristiques, observations spcifiques ou
signaux symptmes du dfaut, et ne pas se contenter des entres/sorties disponibles. Une de ces
caractristiques les plus importantes est le rsidu qui est la diffrence entre un signal mesur et
celui estim. Par la suite, les caractristiques sont utilises comme entres de SVM classification
afin de construire une fonction de dcision claire et prcise permettant de spcifier ou de prdire
la nature de la nouvelle observation. Le fait dutiliser la mme thorie pour la modlisation et le
diagnostic est un des points forts de notre stratgie. Le dveloppement dun estimateur pour
prdire les valeurs de diffrentes variables de sortie Y par SVR est simple et rapide en termes de
temps de calcul en ligne puisque il utilise un nombre rduit de donnes qui sont les supports.
Malgr les avantages du SVR, et sa robustesse face aux variations des paramtres et la proprit
de flexibilit, lutilisation des SVR dans la communaut des automaticiens reste en grande partie
peu explore, c'est pour cela, cette thse apportera mon avis un plus la communaut des
automaticiens.

II.4.2. Rcapitulatif des variables dtat/ dentre/ et de sortie


Les variables dtat sont les diffrentes concentrations dans les 5 cuves (13 tats par cuve) plus
la concentration totale des boues dans les 10 couches du clarificateur (Xm, m=1:10) :

CT

>S , S
I

, X I , X S , X B,H , X B, A , X P , SO , S NO , S NH , S ND , X ND , S ALK , X 1 , X 2 ,, X 10 @

Les entres U ou variables manipules (ou commande) du systme sont :


Kla5 : le coefficient de transfert doxygne pour la 5me cuve
Sno2 : azote sous forme de nitrates-nitrites dans la 2me cuve.
Lentre de perturbation est linfluent Qin , Cin
Les sorties mesures (Y) du systme considres dans ce travail sont : Qin, SNH,in, CODin, TKNin,
TSS2, COD2, BOD2, Kla5, Sno2, Qintr, So5, Snhe, Snoe, TSS4, TSS5, Snhe, TSSu, CODu
Les sorties rgules sont : y1=Sno2 et y2=So5
On note que les variables dtat ne sont pas toutes mesurables.

94

II.4.3. Les variables superviser


Plusieurs variables doivent tre supervises dans les procds de traitement des eaux uses afin
de sassurer du bon fonctionnement et de la scurit des procds de traitement des eaux et
rendre ainsi une eau propre en sortie (ex. lactivit des microorganismes, la temprature et
linfluent). Toute erreur dans les capteurs de mesures ou les actionneurs doit galement tre
dtecte rapidement afin dviter la propagation derreurs et la dtrioration de matriels et la
diminution de la qualit du rendement.
On peut dnombrer les dfauts qui peuvent avoir lieu dans ce procd (ou les paramtres
superviser) comme suit :
1. La concentration doxygne : Loxygne reprsente une condition fondamentale de la
vie des microorganismes afin de permettre de maintenir une concentration leve de la
biomasse dans le racteur biologique. Cela nest pas toujours facile puisque ce systme
subit constamment des perturbations dentre variables qui peuvent empoisonner les
microorganismes quand leau contient certains mtaux. La provision doxygne se fait
par aration des bassins. Le maintien d'une aration adquate permet damliorer
lactivit biologique en encourageant le contact entre les microorganismes et la matire
organique, ce qui permet doptimiser la consommation d'nergie (Jianxu, 2011). Dans ce
travail, on a choisi de superviser la concentration doxygne dissous dans le 5me
compartiment car c'est une variable importante dans le bon fonctionnement du procd
WWTP.
2. Le coefficient du transfert doxygne Kla5 : des dfauts peuvent surgir dans cet
actionneur qui permet de contrler la concentration SO5 de loxygne dissous dans le 5me
compartiment la valeur dsire de 2 g.m-3. Le suivi de ce coefficient est donc aussi
important que les concentrations doxygne dissous.
3. La concentration dazote sous forme de nitrites et de nitrates Sno2 : ce capteur qui
nous informe sur le bon droulement de lopration de dnitrification (dgradation de
lazote) peut tre affect par un dysfonctionnement.
4. Le Dbit de recyclage interne Qa : important pour la suppression des polluants azots
par la rgulation de Sno2 1g.m-3, cet actionneur aussi peut subir des pannes.
5. Choc de toxicit : ce dfaut est d la prsence de matires toxiques dans leau comme
les pesticides, ce qui va influencer ngativement la croissance des organismes
htrotrophies ( P h max ) qui sont responsables de llimination de la pollution.
95

6. Inhibition : ce dfaut est plus violent que le premier, produit par les dchets hospitaliers
ou mtallurgiques. Il va non seulement rduire la croissance des organismes
htrotrophies ( P h max ), mais aussi acclrer la mort de ces organismes (bh ) . Inhibition de
la nitrification et toxicit sont causes par les mmes composs (l'inhibition produit des
effets des concentrations faibles tandis que la toxicit se produit des concentrations
plus leves).
7. Gonflement ou prise de masse des boues (bulking en anglais) : ce phnomne est d
la croissance de microorganismes filamenteux dans les boues actives, ce qui provoque
l'impossibilit de dcantation dans le dcanteur. Il concide avec les priodes d't : haute
temprature et faible dbit 266 j et 567 j. Cet vnement est reprsent dans le modle
par les paramtres de dcantation de la fonction double-exponentielle et plus prcisment
la vitesse de sdimentation de 250 200 m.d-1.
Les dfauts procd (choc de toxicit, inhibition, gonflement de la masse des boues) ne sont pas
considrs dans ce travail, nanmoins il est envisag de les traits dans un futur proche.
Dautres capteurs savoir TSSe et CODe sont dune importance capitale puisqu'ils permettent de
caractriser les performances de traitement de leau de ce systme.
En fonction de cette analyse, les dfauts considrs ( superviser) dans cette thse sont les
dfauts de capteurs de mesures de :
1. TSSe : les matires en suspensions de l'effluent en sortie
2. Sno2 : la concentration de l'azote sous forme de nitrites-nitrates dans le 2me compartiment.
3. So5 : la concentration doxygne dissous dans le 2me compartiment
On considrera des dfauts de type : offset, drive, dfaut fixe (blocage de mesure) et arrt
complet pour ces diffrents capteurs.
Ainsi que des dfauts dactionneurs
4. Qa ou Qintr : dbit de recyclage interne
5. Kla5 : le coefficient du transfert doxygne Kla5 dans le 5me compartiment
Avec les types de dfauts suivants : offset, retard, blocage de lactionneur et arrt ou
fermeture complte.
Les variables modliser :

96

En fonction de ces dfauts, nous avons choisi destimer (modliser) les variables suivantes qui
sont susceptibles dapporter plus dinformation concernant certains dfauts :
Sno2, Sno5, CODeff et TSSe.

II.5. Implmentation de SVR pour la modlisation


II.5.1. Gnration de donnes pour lapprentissage et la validation
Le modle de rfrence BSM1 est programm et simul sous Matlab. Ltat quasi stationnaire
est atteint dans ce modle au bout de 100 j (Gernaey et al., 2006). Les donnes dapprentissage et
de test sont obtenues en injectant un ensemble de donnes dinfluent de 609 j rcupr sur le site
du benchmark BSM1 http://www.benchmarkwwtp.org/. Les multiples donnes (entres/ sorties/
variables de commande) qui caractrisent le procd sont rcupres partir du programme avec
une priode dchantillonnage de 15 min et dcomposes en deux parties. Une premire partie de
245 j est utilise pour lapprentissage et la construction des diffrents modles. La partie restante
de 364 j est utilise pour le test des modles de prdiction.
Plusieurs paramtres peuvent affecter srieusement les rsultats de lapprentissage (Lauer and
Bloch, 2006). Par exemple, le fonctionnement en commande en boucle ouverte ou en boucle
ferme ne donne pas les mmes rsultats. On a fait le choix de recueillir des donnes qui
ressembleront aux donnes en ligne, et donc le fonctionnement en boucle ferme est maintenu.
Les tests avec apprentissage du modle SVR en boucle ouverte nont pas donn de bons
rsultats, ce qui sexplique par le fait qu'une erreur faible dans le modle en boucle ouverte peut
devenir assez consquente en boucle ferme par l'effet de bouclage.
On se pose galement la question de savoir sil faut recueillir des donnes ltat stationnaire
ou transitoire. Le risque en prenant des donnes stationnaires est que les drives de cet tat
stationnaire peuvent tre interprtes comme des dfauts. En mme temps, le fonctionnement
transitoire est plus difficile modliser (ncessitant plus de donnes).
Il convient galement dtablir des rgles de gestion des valeurs manquantes et aberrantes, des
perturbations mesures SNH,in et Qin, de normalisation, et le choix des variables pertinentes pour
la rgression (rgresseurs).
Une dernire condition afin dobtenir une relation entre/sortie assez robuste, consiste choisir
une entre suffisamment riche en information. La frquence et lamplitude de cette entre
sont choisir de manire exciter le systme suffisamment pour capter la relation entre/sortie
97

(ce qui revient choisir lentre de manire rendre le systme observable). En effet,
l'observabilit des systmes non linaires dpend gnralement de l'entre du systme. Lentre
doit permettre davoir un bon suivi de trajectoire et en mme temps dtre continuellement
excitante (ou excitation persistante) pour obtenir une bonne identification qui permet dextraire
les dynamiques du systme.
Les entres dans ce systme sont la concentration doxygne dissous dans le 5me compartiment
et la concentration de nitrites/nitrates dans le 2me compartiment. Ces concentrations sont
considres comme entre puisquelles sont les variables rguls. La Figure II.5 montre la
concentration de nitrites/nitrates dans la 2me cuve (Sno2) pour les priodes dapprentissage et de
test (et la Figure II.6 montre celle de So5).

Consigne Sno2 (g.m3)

Apprentissage

Test

1.5
1
0.5
0

100

200

300

400

500

600

Temps(jours)

Figure II.5 Concentration de nitrites/nitrates dans la 2me cuve utilise pour


lapprentissage et le test du modle SVR

Consigne So5(g.m3)

3.5

Test

Apprentissage
3
2.5
2
1.5
1

100

200

300

400

500

Temps(jours)

Figure II.6 Concentration doxygne dissous dans la 5me cuve utilise pour
lapprentissage et le test du modle SVR
98

600

Ces mmes donnes sont galement utilises pour limplmentation de SVM pour le diagnostic
de dfauts, la diffrence que des situations dfectueuses sont galement considres en plus des
situations saines. Chaque dfaut (de capteur, dactionneur ou de procd) a lieu sur un intervalle
de temps bien distinct des intervalles des autres dfauts.

II.5.2. Prtraitement des donnes (normalisation, filtrage)


Lobtention dun bon modle dpend fortement de la qualit et la reprsentabilit de la base de
donnes utilise pour lapprentissage. Premirement, la normalisation des donnes (Ogasawara
et al., 2010) joue un rle important dans la rgression (modlisation) et dans le diagnostic de
dfauts car elle permet de bien conditionner les matrices contenant les signaux du systme avec
une distribution uniforme.
Les donnes mises lchelle (normalises) peuvent tre analyses statistiquement plus
facilement. La Figure II.7 montre un exemple de gnration dune bote moustache dans le cas
de donnes non normes. Les donnes sont rsumes en 3 composantes : une ligne centrale
indiquant la tendance centrale, une case pour indiquer la variabilit autour de la tendance
centrale et les moustaches montrant la porte. Aprs l'essai des diffrentes mthodes de
normalisation mentionnes en chapitre I, le choix a t port sur la normalisation min/max qui a
permis d'obtenir les meilleurs rsultats (distribution uniforme) comme le montre la Figure II.8 .
4

x 10
8
6
4
2

TS
Su
C
O
Du

Sn
he

Ss
5

TS
S4
TS
S5

So
5

Kl
a5

a
Q

in
SN
H
in
C
O
Di
n
TK
N
in
TS
S2
C
O
D2
BO
D
2
Sn
o2

Figure II.7 Bote moustache des variables du procd WWTP non normes
Les donnes ont aussi parfois besoin de filtrage afin de diminuer limpact du bruit et de pouvoir
dcrypter les tendances. Le lissage peut tre fait par exemple en utilisant une moyenne mobile
afin dliminer les pics au courts du temps. La suppression des valeurs aberrantes peut tre faite
par la suppression des mesures qui sont en dehors de r 3V par exemple et reconstituer ou
99

supprimer les valeurs manquantes. SVR peut tre utilise pour estimer les valeurs manquantes
comme cest le cas pour les donnes dexpression gniques (Wang et al., 2006). Dans ce travail,
un filtre passe bas est utilis pour diminuer le bruit.

1
0.8
0.6
0.4
0.2

TS
Su
C
O
Du

Sn
he

Ss
5

TS
S4
TS
S5

So
5

Kl
a5

a
Q

in
SN
H
in
C
O
Di
n
TK
N
in
TS
S2
C
O
D2
BO
D
2
Sn
o2

Figure II.8 Bote moustache des variables du procd WWTP normalises avec la
mthode min/max

II.5.3. Analyse de corrlation/Information mutuelle


Pour lapprentissage SVM ou SVR, il faut dfinir le vecteur d'entre x. Le choix de ce vecteur
peut provenir des connaissances a priori sur le procd. Ainsi, on va chercher la solution dans
une direction bien prcise ou dans un domaine plus restreint ce qui permet dobtenir un bon
modle de rgression. Ces connaissances peuvent provenir du modle fondamental (modle
mcanistique, hydraulique, chimique, physico-chimique, aronautique, biochimique, mcanique,
hydrodynamique, etc.) qui gouvernent le procd.
Dans ce travail, le choix du vecteur x est fait simplement partir de cette connaissance a priori
pour SVM classification alors que pour SVM rgression (SVR), le vecteur des rgresseurs x est
dtermin en ralisant des analyses de corrlation et dinformation mutuelle (dcrites dans le
chapitre I).
On cherche modliser les variables CODeff, TSSe, So5 et Sno2. Il convient donc de trouver les
relations entre ces variables et chaque lment dans le vecteur de mesures et dentres du
systme.
Ltude de linter-corrlation est une faon qui permet davoir une ide sur la dpendance et
linteraction entre deux variables. Par contre lautocorrlation dtermine la dpendance
temporelle entre les observations dun mme signal du procd. Cela peut aider dans le choix des
100

rgresseurs. Dans le cas du procd WWTP, ltude de linter-corrlation entre les


concentrations dinfluents en entre et les concentrations deffluents de sortie permet de
quantifier la relation entre entres et sorties et elle donne une information sur le dcalage
temporel (le temps que prend lentre pour affecter une sortie donne). Une forte corrlation un
dcalage spcifique peut indiquer un temps de retard dans le procd. Ce genre dinformation
peut tre utile pour indiquer un dysfonctionnement dans le procd. Quand le procd WWTP
fonctionne normalement, linfluent subit des transformations qui peuvent sobserver sur
leffluent avec un certain retard (effet tampon) d aux grands volumes de liquide qui sentassent
dans le racteur biologique et clarificateur, ce qui donne des concentrations deffluent un peu
lisses par rapport aux dynamiques des influents.
Daprs lanalyse de corrlation, il ressort que les variables qui influent le plus sur CODeff sont
celles donnes dans le tableau II.4. Les coefficients prennent des valeurs entre 0 et 1 dans la
mthode inter-corrlation. Le tableau prsente galement le dcalage temporel qui donne la
corrlation maximale entre les diffrentes variables et CODeff. On note que pour un nombre de
variables le retard est gal zro par rapport CODeff, ce qui signifie que leffet de lentre ne
se fait pas significativement sentir sur la sortie (CODeff) dans le temps de simulation.
Tableau II.4 Corrlation des variables avec CODeff
Variables
Corrlation
avec CODeff
Retard
(chantillons)

Qin

Kla5

TKNin

TNin

BODin

CODin

SNH,in

TSSin

0.5

0.47

0.44

0.44

0.41

0.4

0.39

0.36



96

96



96



Pour la variable Sno2 elle est affecte le plus par : TSS1, COD1, BOD1, TN1, TSS2, COD2,
BOD2, TSS3, COD3, BOD3. Et les corrlations maximales avec TSSe, Sno2 et Sno5 sont donnes
pour un retard de :
2 chantillons entre TSSe et Qin. 16 chantillons entre Sno2 et Kla5. 22 chantillons entre Sno2 et
SNH,in. 12 chantillons entre So5 et Kla5. 20 chantillons entre So5 et SNH,in
On remarque que lanalyse de linter-corrlation na pas permis de trouver une dpendance
linaire entre Sno2 et Qa, alors que daprs la connaissance du procd on sait quil existe une
relation entre ces deux variables puisque Qa est la variable manipule permettant la rgulation de
Sno2, Ceci est d au fait que ltude de la corrlation et de linter-corrlation informe uniquement
sur les relations de dpendance linaire entre les variables. Cependant, le procd de traitement
des eaux uses est un systme complexe et fortement non linaire. Afin de raliser une
101

investigation plus pousse pour lextraction et la slection des meilleures caractristiques


(rgresseurs, prdicteurs ou entres susceptibles dtre utilises pour construire la modle SVR),
on propose de raliser ltude de la dpendance travers linformation mutuelle.
La Figure II.9 montre la relation entre Sno2 et quelques variables mesures, obtenue par lanalyse
dinformation mutuelle. On remarque que contrairement lanalyse de linter-corrlation,
lanalyse de linformation mutuelle montre une dpendance entre les variables Sno2 et Qa. La
Figure II.9 et la Figure II.10 montrent la relation entre Sno2, So5, CODe et TSSe et les autres
variables du procd. Plus la valeur de relation est grande plus la liaison est forte. Les variables
les plus influentes seront utilises dans le schma de prdiction SVR de chaque variable
considre.

Relation avec Sno2

1.6

0.8

Relation avec SSno5


O5

1.4

0.6

1.2

0.4

0.8

0.6

0.2

0.4
0.2

0
So5
Qa_app
Qa
Qin
Kla5
Kla5_app
CODu
TSSu
TSSu
Sno5
Snoe
COD2
COD3
COD4
COD5

Figure II.9 Analyse des relations entre variables avec linformation mutuelle
(pour Sno2 et Sno5)

Relation avec CODe

Relation avec TSSe

0
TSSe
Qin
Qa_app
Qa
CODu
TSSu
TKN
BODu
COD2
COD3
TSS2
COD1
TSS3
TSS1
Sno5

Figure II.10 Analyse des relations entre variables avec linformation mutuelle (pour CODe
et TSSe)
102

II.5.4. Rsultats de la modlisation SVR


En fonction de lanalyse de corrlation et dinformation mutuelle, le vecteur dentre Em du
modle SVR a t choisi comme montr par la suite pour les 4 variables modliser :
Les sries temporelles des diffrentes variables du procd WWTP sont visualises dans les
figures suivantes. Ces figures permettent de visualiser les dynamiques et la variabilit assez
consquente qui se trouvent dans le procd WWTP, et montrent ltendue temporelle
importante utilise dans ce travail qui est de 609 jours avec une priode entre deux observations
gale 15 minutes ce qui fait un total de 58464 chantillons. Cela permet de tester des situations
multiples rencontres dans les diffrentes saisons (t, hiver, printemps,). Lapproche base
sur les SVMs utilise dans ce chapitre permet de mieux valuer les performances destimation et
de diagnostic de dfauts dans le procd WWTP par rapport des mthodes testes juste sur une
faible priode de temps comme (Wang and Shi, 2010), (Lee, Qin, et al., 2006) avec 1400
chantillons, (Baggiani and Marsili-Libelli, 2009) test sur 32 jours, (Zumoffen and Basualdo,
2008b) tests sur 14 jours, etc..
Plusieurs travaux utilisent un modle simple du procd WWTP. Par contre, le modle de
rfrence BSM1 pour les systmes de traitement des eaux uses utilis dans cette tude est trs
proche de la ralit et inclut beaucoup de variables ce qui rend la tche de surveillance et de
diagnostic un vrai dfi relever par rapport dautres articles.
La Figure II.11 illustre le rle (traitement) du procd WWTP. Ainsi, TSSin qui constitue les
matires en suspension lentre ayant une grande valeur va tre trait pour donner la sortie du
procd dans la couche suprieure du clarificateur TSSe effluent une faible valeur de
concentration par rapport lentre, tandis que dans la couche basse du clarificateur leffet de
sdimentation est bien clair avec la valeur de TSSu. La courbe de dbit lentre illustre bien la
variabilit assez importante de dbit qui varie suivant les saisons (t, hiver)

103

400

30

350
25

TSS e (g.m-3)

TSS in (g.m-3)

300
250
200
150
100

20

15

10

50
0

100

x 10

200
300
400
Temps (jours)

500

600

200
300
400
Temps (jours)

500

600

500

600

10000
9000

8000

TSS u (g.m-3)

Qin (m3.j-1)

100

3
2

7000
6000
5000

4000

100

200
300
400
Temps (jours)

500

3000

600

100

200
300
400
Temps (jours)

Figure II.11 Evolution temporelle des variables dentre/sortie des matires en


suspension
Le zoom ci-dessous sur la figure du dbit d'entre Qin du procd WWTP montre que cette
perturbation est trs oscillatoire. Qin a une dynamique avec plusieurs chelles de temps. Ceci est
d au fait que le dbit des eaux uses diminue la nuit et pendant la priode estivale mais
augmente en journe et pendant la priode hivernale avec l'arrive d'eau de pluie.
4

x 10

Qin (m3.j-1)

5
4
3
2
1
0

105

110

115

120

125

130

Temps(jours)

104

135

140

145

150

-5

x 10

Qin
Ajustement

Densit

4
3
2
1
0

3
Qin (m3.j-1)

6
4
x 10

Figure II.12 Densit de probabilit Qin


La distribution log normal reprsente bien les donnes de Qin comme illustr dans la Figure
II.12. L'tude de cette distribution montre l'tendue de la variation de cette variable. Cette
distribution peut tre utilise par la suite pour la gnration de squences alatoires du Q in avec
la mthode de Monte Carlo.
Linterprtation de ces figures de sries temporelles nest pas tellement facile. Cependant,
quelques remarques peuvent tre tires non seulement sur la variabilit, mais aussi sur les pics
dans les priodes de (jour, hiver) pour les variables, mais aussi des minimas dans les priodes
(t, nuit).
60

SNH,in (g.m3)

50
40
30
20
10
0

100

200

300

Temps(jours)

105

400

500

600

0.05
SNHin
Ajustement

Densit

0.04
0.03
0.02
0.01
0

10

20

30

40

50

60

SNHin (g.m3)

Figure II.13 Concentration SNH,in et sa densit de probabilit


La distribution normale reprsente bien les donnes de SNH,in . Les variables Sno2 et So5 sont des
variables rguler choisies cause de leur importance dans le bon fonctionnement du procd
WWTP.
2.1

So5(g.m3)

2
1.9
1.8
1.7

105

110

115

120

125

130

135

140

145

150

135

140

145

150

Temps(jours)
250

Kla5 (j-1)

200
150
100
50
0

105

110

115

120

125

130

Temps(jours)

Figure II.14 L'volution de la variable So5 par rapport Kla5

106

Linterprtation des figures ci-dessus nest pas facile, d la variabilit du procd et la grande
priode dvaluation. Un zoom (Figure II.14) montre bien que la variable KLa5 permet de bien
rguler loxygne dissous So5 la valeur 2 g.m-3 (sa valeur varie entre 1.78 et 2.1).
Un zoom sur le graphe de Sno2 permet de mieux voir les dynamiques sur cette variable (Figure
II.15), et la difficult lie la rgulation de cette variable puisque le but est de stabiliser la valeur
de la concentration Sno2 1 g.m-3.
2

Sno2 (g.m3)

1.5
1
0.5
0

105

110

115

120

125

130

135

140

145

150

135

140

145

150

Temps(jours)
4

10

x 10

Qa(m3.j-1)

8
6
4
2
0

105

110

115

120

125

130

Temps(jours)

Figure II.15 Lvolution de la variable Sno2 par rapport Qa


Au dpart, jai effectu plusieurs essais afin de tester la possibilit de modliser lentre SNH,in et
les entres de commande Kla5 et Qa partir des sorties. Cela na pas donn de bons rsultats. On
peut expliquer ceci par le fait que SNH,in est une perturbation de nature alatoire.
Dautres tentatives sur le choix automatique des caractristiques dentre de SVM par
lutilisation de lACP nont pas donn les rsultats attendus. Cela peut se comprendre puisque
lACP cherche seulement choisir de nouvelles composantes qui maximisent la rcupration
dinformation sur les donnes de dpart sans se soucier de la relation de ces derniers avec un
dfaut donn. Lapproche PLS peut tre vue comme un bon candidat pour le choix des
107

caractristiques grce sa capacit de mise en relation entre deux quantits (entre/sortie). Jai
choisi la matrice de donnes comme entre et un dfaut donn comme sortie. PLS classique
linaire na pas permis de modliser cette relation non linaire entre le dfaut et les donnes du
procd. Par la suite, PLS noyau a t utilise et a permis de capter la relation non linaire.
Cependant, les rsultats obtenus taient loin dtre satisfaisants, dus au nombre lev de fausses
alarmes et dtection manques.
Des tudes de Monte Carlo peuvent-tre envisages dans un futur proche afin de mieux
caractriser les incertitudes avec des gnrations alatoires de diffrentes variables dentre
comme SNH,in, Qin utilisant leurs distributions respectives, changement des valeurs nominales des
paramtres du modle ainsi que des changements sur le bruit.
Les vecteurs d'entres des diffrents modles SVR sont donns comme suit:
Le vecteur dentre pour modliser Sno2 par SVR
Lincorporation de dcalages temporels des variables dentres et sorties a permis damliorer la
qualit du modle de prdiction.
Em1

TSS

, TSS 4 , COD 2 , BOD2 , S NH ,in , K la 5 , Qa , Qa (t  1), Qa (t  2), TSS u , CODu , S no 2 (t  12.Te )

Le vecteur dentre pour modliser So5 par SVR


Em 2

in

, S NH ,in , S no 2 , S no 2 (t  1), K la 5 , K la 5 (t  1), TSS 5 , S NH 5 , S NHe , S noe , So 5 (t  50.Te )

Le vecteur dentre pour modliser TSSe par SVR


Em 3

in

, Qin (t  1), Qin (t  2), S NH ,in , S NH ,in (t  1), Qa

Aprs une multitude d'essais, le tableau II.5 suivant donne les valeurs des diffrents indices de
performances concernant les meilleurs modles de prdiction construit par SVR. Ces
performances dmontrent bien lefficacit de la mthode de modlisation propose. Deux
modles sont construits pour estimer Sno2. Le 2me modle est plus performant que le premier car
son coefficient de dtermination R2 qui dtermine la qualit de lajustement du modle est plus
lev (R2 doit tre le plus proche de 1), ses erreurs (MSE, MAE, NMSE, RMSE, NRMSE,
RSSE) sont plus petites que celles du premier modle Sno2.

108

Tableau II.5 Performances des modles SVR


Modle
R2

Modle1
Sno2
0.9044

Modle2
Sno2
0.9270

Modle2
TSSeff
0.9982

Modle1
So5
0.8492

Modle3
So5
0.8626

Modle
CODeff
0.8450

MSE
AIC
MAE
NMSE
RMSE
NRMSE
RSSE
RatioSV

0.0206
-105
0.1039
0.0956
0.1434
0.1474
0.0217
0.0378

0.0157
-1.1 105
0.0885
0.0730
0.1253
0.1288
0.0166
0.0587

0.0171
-1.1 105
0.0942
0.0018
0.1306
0.0357
0.0013
0.0413

0.0176
-105
0.0437
0.1508
0.1326
0.0939
0.0088
0.0329

0.0160
-1.1 105
0.0413
0.1374
0.1266
0.0897
0.0080
0.0613

2.8139
1.85 105
1.1628
0.1550
1.6775
0.2456
0.0603
0.0650

II.5.4.1. Modle de prdiction SVR de Sno2


La Figure II.16 montre que le modle de rgression SVR construit pour estimer la concentration
Sno2 effectue un bon travail sur une grande priode de temps de 609 jours. Cependant, ce modle
SVR donne quelques valeurs infrieurs zro, ce qui nest pas vrai puisque la concentration est
une mesure positive ou nulle. Lajout d'information la sortie de lalgorithme peut amliorer la
qualit du modle.
3

relle
estime

Sno2 (g.m3)

2
1
0
-1

100

200

300
Temps(jours)

400

500

600

Figure II.16 Trac de Sno2 et son estime


La Figure II.17 est un zoom sur la figure prcdente qui montre le bon suivi de l'estimation de
Sno2 (construit par SVR) la mesure Sno2 dans une partie de zone de test allant de 300 jusqu'
320 jours.

109

2.5
relle
estime

Sno2 (g.m3)

2
1.5
1
0.5
0

302

304

306

308
310
312
Temps(jours)

314

316

318

320

Figure II.17 Zoom sur le trac de Sno2 et son estim

II.5.4.2. Modle de prdiction SVR de TSSe de l'effluent


30
relle
estime

TSSe(g.m3)

25
20
15
10
5

100

200

300
Temps(jours)

400

500

600

Figure II.18 Trac de TSSe et son estim


La Figure II.18 illustre bien la parfaite concordance entre TSSe et son estime. Un zoom sur cette
figure permet de mieux voir le bon travail d'estimation ralis par l'approche propose base sur
SVR, dans une partie de zone de test allant de 300 jusqu' 350 jours.

110

TSSe(g.m3)

25

relle
estime

20
15
10
5

305

310

315

320
325
330
Temps(jours)

335

340

345

350

Figure II.19 Zoom sur le trac de TSSe et son estim

II.5.4.3. Modle de prdiction SVR de COD de l'effluent


relle
estime

60

CODe(g.m3)

55
50
45
40
35
30

305

310

315

320
325
330
Temps(jours)

335

340

345

350

Figure II.20 Trac de CODe et son estim

La Figure II.20 montre bien l'adquation entre CODe et son estime sur une priode de test allant
de 300 jusqu'a 350 jours.

111

II.5.4.4. Modle de prdiction SVR de So5


3

relle
estime

So5(g.m-3)

2.5
2
1.5
1
0.5

100

200

300
Temps(jours)

400

500

600

Figure II.21 Trac de So5 et son estim


L'estimation de la variable So5 est bien ralise par l'approche propose comme le montrent la
Figure II.21 ainsi que la Figure II.22 du rsidu avec sa faible valeur. Il faut noter que dans cette
simulation la consigne So5,ref nest pas fixe 2 g.m-3 mais variable afin de bien vrifier laspect
prdictif du modle SVR de So5.
1.5
Rsidu So5
1

0.5

100

200

300

400

500

600

Temps(jours)

Figure II.22 Rsidu So5

II.5.4.5. Analyse de rsidus


Cette tude aussi permet lvaluation de la qualit du modle de prdiction. Si les rsidus
admettent une certaine tendance ou quils sont ngatifs ou positifs dune faon systmatique dans
une grande partie de la plage de donnes. Cela indique que le modle ajuste mal les donnes, si
par contre les rsidus sont petits et alatoirement distribus autour de zro, cela indique que le
modle dcrit parfaitement les donnes.
112

Rsidus Modle Sno2


2
Rsidu Sno2
1.5
1
0.5
0
-0.5
-1

100

200

300
Temps(jours)

400

500

600

Figure II.23 Rsidu Sno2


1
Rsidu Sno2 filtr
0.8
0.6
0.4
0.2
0

100

200

300
Temps(jours)

400

500

600

Figure II.24 Rsidu filtre de Sno2


Lutilisation de filtre passe-bas permet dattnuer leffet des valeurs aberrantes et d'obtenir ainsi
un rsidu plus faible comme montr dans la Figure II.24.

113

5
residu
Ajustement

Densit

4
3
2
1
0
-1

-0.5

0.5
rsidu Sno2

1.5

Figure II.25 Densit de probabilit Sno2


Lhistogramme de rsidus est une faon de voir la forme de la distribution, et si elle est
normalement distribue ou non.
Rsidus modle TSSeff
Le trac de la structure d'autocorrlation suivant montre bien qu'il existe une faible priodicit de
phnomnes volution lente dans le procd WWTP. Aussi cela permet de dire, si on sloigne
du zro du point de vue dcalage temporel, que la corrlation entre les rsidus est assez faible, ce
qui montre quil nya pas trop de dpendance entre les rsidus et donc le modle est bien ralis.
Auto corrlation modle TSSe

Coefficient de corrlation

1.2
1
0.8
0.6
0.4
0.2
0
-0.2
-6

-4

-2

0
2
dcalage temporel

6
4

x 10

Figure II.26 Autocorrlation du rsidu TSSe


La Figure II.27 trace le rsidu filtr en fonction d'une grande priode de temps qui a une valeur
faible. Cela indique que le modle SVR ddi l'estimation de TSSe ralise un bon travail.

114

0.8
Rsidu TSSe filtre
0.6
0.4
0.2
0

100

200

300
Temps(jours)

400

500

600

Figure II.27 Rsidu sur TSSe


On peut encore vrifier la normalit de la distribution des rsidus TSSe
Moyenne: -0.000437909 ; Variance: 0.0170659; cart-type: 0.130636
4
rsidu
Ajustement

Densit

3
2
1
0
-1

-0.5

0.5

1.5

rsidu TSSe

Figure II.28 Densit de probabilit TSSe


Rsidus modle CODe
8
Rsidu CODe filtre
6
4
2
0

100

200

300
Temps(jours)

400

Figure II.29 Rsidu CODe


115

500

600

La Figure II.29 montre une valeur infrieure 8. Cependant, malgr quelle reste une valeur
convenable par rapport l'ordre de grandeur de CODe (50 g.m-3), une amlioration peut tre
envisage dans un futur proche.
Malgr la difficult rencontre avec ce type de procd, et par rapport d'autres approches qui
dpendent des conditions initiales, les rsultats obtenus sont assez satisfaisants du point vue
prcision mais aussi de simplicit de la mise en forme de ce type d'approche de modlisation.

II.6. Implmentation de SVM pour le diagnostic de dfauts


Dans ce travail, diffrentes situations de dfauts ont t intgres dans les modles d'actionneurs
et capteurs afin de raliser une simulation trs raliste. Des travaux on t raliss dans ce sens
en se basant par exemple sur des chanes de Markov (Rosen et al., 2008).
Tableau II.6 : Les diffrents dfauts considrs

Description du
Type
dfaut
Capteur TSSe
Offset

2
3
4
5

Capteur TSSe
Capteur TSSe
Capteur TSSe
Capteur Sno2

Drive
Fixe
complet
Offset

6
7
8
9

Capteur Sno2
Capteur Sno2
Capteur Sno2
Capteur So5

Drive
Fixe
complet
Offset

10
11
12
13

Capteur So5
Capteur So5
Capteur So5
Capteur Qa

Drive
Fixe
complet
Offset

14
15
16

Actionneur Qa
Actionneur Qa
Actionneur Qa

17

Actionneur Kla5

Retard
Blocage
Fermeture
complte
Offset

18

Actionneur Kla5

Retard

Numro
du
dfaut

Occurrence du dfaut (j)

Valeur du dfaut

apprentissage
[62:63]
[63.5:64.5]
[65:66.5]
[72:80]
[68.5 :70]
[67:68]
[82:83]
[83.5:84.5]
[85:86.5]
[92:100]
[88.5 :90]
[87:88]
[102:103]
[103.5:104.5]
[105:106.5]
[112:120]
[108.5 :110]
[107:108]
[122:123]
[123.5:124.5]
[125:126.5]
[132:140]
[128.5 :130]
[127:128]

Test
[260:262]
[265:267]
[285.5:287]
[270:280]
[310:315]
[300:305]
[320:322]
[325:327]
[345.5:347]
[330:340]
[370:375]
[360:365]
[370:372]
[375:377]
[375.5:377]
[380:400]
[410:415]
[400:405]
[420:422]
[425:427]
[445:447]
[430:440]
[460:465]
[450:455]

apprentissage
-2 g.m-3
2 g.m-3
5 g.m-3
0.2 j-1
-0.5 g.m-3
0.5 g.m-3
1 g.m-3
0.2 g.m-3j-1
-0.5 g.m-3
0.5 g.m-3
1 g.m-3
0.2 g.m-3j-1
-800 m3.j-1
800 m3.j-1
1600 m3j-1
0.2 j
-

test
2 g.m-3
5 g.m-3
10 g.m-3
0.2 j-1
0.5 g.m-3
1 g.m-3
2 g.m-3
0.2 g.m-3j-1
-1 g.m-3
1 g.m-3
2 g.m-3
0.2 g.m-3j-1
1000 m3j-1
-1000 m3j-1
2000 m3j-1
0.2 j
-

[142:143]
[143.5:144.5]
[145:146.5]
[152:160]

[470:472]
[475:477]
[495:497]
[480:490]

-5 j-1
5 j-1
10 j-1

5 j-1
15 j-1
-10 j-1

116

19
20

Actionneur Kla5
Actionneur Kla5

Blocage
Fermeture
complte

[148.5 :150]
[147:148]

[510:515]
[500:505]

Les valeurs de dfauts montrs dans le Tableau II.6 correspondent un seul scnario, sachant
que d'autres scnarios ont t tests par le changement des valeurs de dfauts.
Dans les procds rels, il ya plusieurs retards normaux dus au transport longue distance ou
associ au retard des mesures. Dans ce travail, en plus des autres dfauts supposs sur les
actionneurs Kla5 et Qa, j'ai considr que c'est intressant d'ajouter le dfaut retard supplmentaire
qui se produit souvent en pratique et qui peut provoquer un changement du comportement du
systme command en boucle ferme dgradant ainsi les performances de rgulation et peut
mme causer une instabilit.
Les variables manipules Kla5 et Qa pour la rgulation du procd WWTP sont contraints par des
valeurs limites: Kla5=[0-240 j-1] et Qa=[0-92230 m3j-1]
Le problme dvaluation de performances des mthodes de diagnostic de dfaut dans les
procds WWTP a t trait dans (Corominas et al., 2011), o un indice a t propos pour
examiner, dterminer les limites et comparer entre des mthodes de diagnostic dans le modle de
rfrence dun procd de traitement des eaux uss BSM1. Dautres indices de comparaison de
performance ont t proposs dans (Ylamos et al., 2006).
Les critres de dtection du dfaut considrs dans ce travail sont :
Temps de dtection du dfaut (TD), fausses alertes(FA)
Tableau II.7 Rsultats de dtection de dfauts
Dfaut

Type

Capteur TSSe

Offset

Capteur TSSe
Capteur TSSe
Capteur TSSe

Drive
Fixe
Complet

Capteur Sno2

Offset

Capteur Sno2
Capteur Sno2

Drive
Fixe

Valeur
2 g.m-3
5 g.m-3
10 g.m-3
0.2 g.m-3.j-1
0.5 g.m-3
1 g.m-3
2 g.m-3
0.2 g.m-3.j-1
117

Temps
d'occurrence

260
265
285.5
270
310
300
320
325
345.5
330
370

j
j
j
j
j
j
j
j
j
j
j

TD ( j )
260.1
265.04
285.021
275.5
310.333
300.021
345.8
334.6
-

FA
0
0
0
0
0
0
0

Capteur Sno2

Complet

Capteur So5

Offset

Capteur So5
Capteur So5
Capteur So5

Drive
Fixe
Complet

Actionneur Qa

Offset

Actionneur Qa
Actionneur Qa
Actionneur Qa

Retard
Blocage
Fermeture complte

Actionneur Kla5

Offset

Actionneur Kla5
Actionneur Kla5
Actionneur Kla5

Retard
Blocage
Fermeture complte

-1 g.m-3
1 g.m-3
2 g.m-3
0.2 g.m-3.j-1
1000 m3j-1
-1000 m3j-1
2000 m3j-1
0.2 j
5 j-1
15 j-1
-10 j-1
0.2 j
-

360
370
375
375.5
380
410
400
420
425
445
430
460
450
470
475
495
480
510
500

j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j

361.1
385.2
410.6
400.4
430.137
460.19
450.073
470.8
475.187
495.2
480.1
510.2
500.1

0
0
0
0
0
0
0
0
0
0
0
0
0

Il est difficile de dtecter des dfauts offset sur Sno2 et aussi sur So5 puisque ces concentrations
sont rgules par un PID qui va masquer l'effet de ce dfaut.
Les types de dfauts considrs ou suspects dans ce travail sont montrs dans le Tableau II.7
ci-dessus.

III.6.1. Rsultats de diagnostic par la stratgie propose base sur les SVMs
Afin dvaluer la capacit de lapproche propose, plusieurs dfauts sont introduits diffrents
moments sur une large priode de temps (609 jours).
Le rsidu reste parmi les caractristiques principales utilises comme entre par la dcision
SVM, elle est la plus importante mon avis. La Figure II.30 trace le rsidu filtr de Kla5 en bleu
qui est sensible seulement ltat de dfaut sur lactionneur Kla5 prsent par une valeur non
nulle dans la courbe rouge en pointills.

118

400
Rsidu Kla5 filtre
tat de l'actionneur Kla5

300
200
100
0

100

200

300

400

500

600

Temps(jours)

Figure II.30 volution du rsidu Kla5


Un zoom sur la figure prcdente permet de mieux voir la sensibilit face lapparition du
dfaut Kla5 (voir Figure II.31)

Rsidu Kla5
tat de Kla5

80
60
40
20

470

480

490

500

510

520

530

Temps(jours)

Figure II.31 Zoom sur le rsidu Kla5


Comme pour le rsidu Kla5, la Figure II.32 ci-dessous montre bien que le rsidu Qa filtr est
sensible uniquement lapparition du dfaut Qa .

119

10

x 10

Rsidu Qa
tat de l"actionneur Qa

8
6
4
2
0

100

200

300

400

500

600

Temps(jours)

Figure II.32 volution du rsidu Qa


La Figure II.33 suivante montre bien que le dfaut capteur So5 a bien t dtect mais pas isol
dans la zone dapprentissage mais aussi dans la zone de test. Le rsidu filtr So5 est sensible
plusieurs dfauts dont le dfaut So5, rappelant que la courbe rouge en pointills dfinit ltat de
capteur. Elle prend la valeur zro si le capteur est dans son tat normal ou une valeur diffrente
zro dans le cas dun dfaut sur So5.
4
Rsidu So5
tat du capteur So5

3
2
1
0

100

200

300

400

500

600

Temps(jours)

Figure II.33 volution du rsidu So5


La Figure II.34 suivante trace le rsidu de So5 ainsi que la mesure So5. Il apparat bien que la
variable So5 est affecte non seulement par les bruits, perturbations et du dfaut capteur So5 ainsi
que dautres dfauts. Cela est d au fait que cette variable rguler est importante puisqu'elle
indique la quantit doxygne qui est ncessaire la survie de l'cosystme dans le procd
WWTP.

120

So5 (g.m -3)

6
4
2

Rsidu S o5

0
3

100

200

300

400

500

600

100

200

300
Temps(jours)

400

500

600

2
1
0

Figure II.34 Trac de la mesure de loxygne dissous (So5) et son rsidu


La Figure II.35 du zoom permet de bien voir leffet des diffrents types de dfauts capteur S o5
savoir valeur fixe, drive, biais et dfaut complet.

So5 (g.m -3)

6
4
2

Rsidu S o5

0
3

380

400

420

380

400

420

440

460

480

500

520

440
460
Temps(jours)

480

500

520

2
1
0

Figure II.35 Zoom sur de la mesure de So5 et son rsidu


La Figure II.36 suivante trace le rsidu Sno2 qui est affect par dautres dfauts en plus du dfaut
de capteur sur Sno2 illustr par la courbe rouge en pointills.

121

Rsidu Sno2
tat du capteur Sno2

5
4
3
2
1
0

100

200

300

400

500

600

Temps(jours)

Figure II.36 volution du rsidu Sno2


La Figure II.37 trace le rsidu de Sno2 par rapport la mesure Sno2 qui doit tre commande la
valeur 1 g. (N).m-3. Cependant, il est clair daprs cette figure quelle varie beaucoup cause des
bruits, perturbations et aussi des difficults de la rguler juste par le dbit Qa, sans oublier bien
sur les dfauts considrs.

Rsidu S

no2

Sno2 (g.m -3)

10
5
0
6

320

340

360

380

400

420

440

460

320

340

360

380
400
Temps(jours)

420

440

460

4
2
0

Figure II.37 La mesure de Sno2 et son rsidu


La Figure II.38 montre bien que malgr la variabilit de la variable TSSe la sortie. Le rsidu
arrive non seulement dtecter mais aussi isoler le dfaut sur le capteur TSS e puisqu'il arrive
rejeter les autres dfauts et cerne seulement le dfaut en question montr par la courbe rouge.

122

20
10

Rsidu TSS

TSSe (g.m -3)

30

0
5
4
3
2
1

100

200

300

400

500

600

100

200

300
Temps(jours)

400

500

600

Figure II.38 Mesure TSSe et son rsidu

II.6.2. Rglage des paramtres V et H en SVM


Les dcisions sur les diffrents dfauts
Parmi les dfauts tudis dans ce travail le dfaut dactionneur de type retard qui va influencer
ngativement sur les performances de rgulation en boucle ferme et provoque de srieux
problmes dans le comportement du systme, savoir la diminution de temps de rponse,
lapparition des oscillations, voire mme carrment linstabilit du systme.
Une grande valeur de V signifie moins de propagation ou plus de comportement non linaire du
noyau, donc elle permet de gouverner le degr de non linarit. Dans la conception des modles
de dcision SVM, V est choisi entre 2 et 17 par la mthode traditionnelle dessai-erreur. La
constante de rgulation C qui contrle le surapprentissage du modle est choisie entre 7 et 30. Un
seuil est fix pour diffrencier ltat normal de celui dfectueux. Sa valeur est choisie
minutieusement afin de dtecter le dfaut le plus rapidement possible tous en vitant au
maximum les fausses alarmes, en tenant compte que SVM classifie les donnes en deux
catgories ayant respectivement les labels +1 et -1. Le seuil est choisi dune valeur plus grande
que zro et plus prcisment des valeurs entre 0.7 et 1 ont t utiliss pour la prise de dcision.
Le noyau utilis dans cette tude est le noyau gaussien qui est le mieux appropri manipuler
avec les donnes relles incluant des bruits et des perturbations.

II.6.2.1. Dfaut actionneur Qa


Le vecteur de caractristiques utilis comme entre est le suivant:

123

rsidu Qa

x rsidu S no 2
Q (t )  Q (t  1)
a
a

Les paramtres dapprentissage utiliss pour construire ce modle de dcision sont :

C 30, V 15 la valeur du seuil est gale 0.7 pour ce dfaut


La Figure II.39 ci-dessous montre bien la capacit dcisionnelle du classifieur SVM, qui permet
de dtecter lapparition du dfaut Qa rapidement dans les deux zones dapprentissage et de test et
cela sans fausses alarmes.

Dcision sur le dfaut Qa


1
0.5
0
-0.5
-1
100

200

300

400

500

600

Temps(jours)

Figure II.39 Rsultat de dcision sur le dfaut Qa


Un zoom sur le rsultat de dcision du dfaut Qa (Figure II.40) dans la zone de test permet de
montrer la dtection de dfaut Qa de diffrents types : retard, fermeture complte, blocage.

124

Dcision sur le dfaut Qa


1
0.8
0.6
0.4
0.2
0
425

430

435

440

445

450

455

460

465

470

Temps(jours)

Figure II.40 Zoom sur le rsultat du dfaut Qa

II.6.2.2. Dfaut actionneur Kla5


Le vecteur de caractristiques utilis comme entre est donn par:

rsidu K la 5

x
rsidu So5

K (t )  K (t  1)
la 5
la 5

Les paramtres dapprentissage utiliss pour construire ce modle de dcision sont :

C 10, V

2 la valeur du seuil est gale 0.925 pour ce dfaut.

La Figure II.41 ci-dessous montre bien la capacit dcisionnelle du classifieur SVM, qui permet
de dtecter lapparition du dfaut Kla5 rapidement dans les deux zones dapprentissage et de test
et cela sans fausses alarmes.

125

Dcision sur le dfaut Kla5


1
0.5
0
-0.5
-1
100

200

300

400

500

600

Temps(jours)

Figure II.41 Rsultat de dcision sur le dfaut Kla5


Avec un zoom sur la zone de test on peut mieux apprcier le rsultat (Figure II.42)
Dcision sur le dfaut Kla5
1
0.8
0.6
0.4
470

475

480

485

490

495

500

505

510

515

Temps(jours)

Figure II.42 Zoom de dcision sur le dfaut Kla5

II.6.2.3. Dfaut Capteur Sno2


Le vecteur de caractristiques utilis dans ce cas est le suivant :

rsidu S no 2

rsidu S o 5

x
rsidu K la 5

rsidu Qa

S no 2 (t )  S no 2 (t  1)

Les paramtres dapprentissage utiliss pour construire ce modle de dcision sont :

C 10, V

2 , la valeur du seuil est gale 0.925 pour ce dfaut.


126

520

La Figure II.43 ci-dessous montre bien la capacit dcisionnelle du classifieur SVM, qui permet
de dtecter lapparition du dfaut Kla5 rapidement dans les deux zones dapprentissage et de test
et cela sans fausses alarmes.
Dcision sur le dfaut Sno2
1
0.5
0
-0.5
-1
100

200

300

400

500

600

Temps(jours)

Figure II.43 Rsultat de dcision sur le dfaut Sno2


Malgr la difficult sur ce dfaut due la trs grande variabilit de cette mesure et qui peut avoir
des valeurs de 0 g.m-3 mais qui correspond un fonctionnement normal, ce dfaut est bien
dtect. Un zoom va montrer plus de dtails (voir Figure II.44)
Dcision sur le dfaut Sno2
1.2
1
0.8
0.6
0.4
0.2

330

340

350

360

370

380

390

400

410

Temps(jours)

Figure II.44 Zoom sur la dcision du dfaut Sno2

II.6.2.4. Dfaut capteur TSSe

rsidu TSS e

Le vecteur de caractristiques utilis est donn comme suit : x

TSS e (t )  TSS e (t  1)

Les paramtres dapprentissage utiliss pour construire ce modle de dcision sont :

127

420

C 10, V

20 , la valeur du seuil est gale 0.925 pour ce dfaut. La Figure II.45 illustre le bon

rsultat obtenu pour le dfaut sur TSSe caractris par une rapidit de dtection et l'absence de
fausses alarmes.
Dcision sur le dfaut TSSe
8
6
4
2
0
100

200

300

400

500

600

Temps(jours)

Figure II.45 Rsultat de la dcision sur dfaut TSSe

II.6.2.5. Dfaut capteur So5


Le vecteur de caractristiques utilis comme entre est le suivant:

rsiduSo5

rsiduS no 2
x
rsidu K La 5

rsiduQ
a

Les paramtres dapprentissage utiliss pour construire ce modle de dcision sont :

C 7, V

2 , la valeur du seuil est gale 1 pour ce dfaut.

La Figure II.46 illustre que les dfauts sur le capteur So5 de type valeur fixe, drive ou complet
ont t bien dtects. Cependant, le dfaut de type offset ne lest pas puisque il est masqu par
laction du PID. On rappelle toujours la justesse de dcision sur le dfaut avec un pourcentage
nul de fausses alarmes.

128

Dcision sur le dfaut So5


1
0.5
0
-0.5
-1
100

200

300

400

500

600

Temps(jours)

Figure II.46 Rsultat de la dcision sur dfaut So5


Il est noter que malgr les fortes perturbations et bruits dans le procd de traitement des eaux,
cette stratgie propose dans ce travail a permis de surmonter ces difficults par la bonne
dtection et isolation du dfaut en question avec un grand avantage par rapport aux autres
mthodes statistiques telles que lACP qui est le pourcentage quasi nul des fausses alarmes

II.7. Conclusion
Le procd de traitement des eaux uses comme la plupart des procds rels est de nature
stochastique variable d en grande partie la variation de linfluent. C'est pour cela que les
approches statistiques deviennent de plus en plus populaires dans divers secteurs industriels.
La stratgie propose dans cette thse dlivre une mthodologie simple, utile et fructueuse pour
modliser les systmes rels. Il est dmontr la capacit de SVR raliser une modlisation
flexible qui capte la non-linarit et le maximum de variabilit des donnes et qui dcrit le
comportement dynamique du systme en prsence de lincertitude.
Les performances intressantes de prdiction de SVR ont t soulignes dans ce chapitre.
Je crois que la stratgie de diagnostic de dfaut propose dans ce chapitre qui utilise uniquement
la thorie des SVMs peut tre applique d'autres systmes complexes.

129

Je pense que SVM et SVR vont tre de plus en plus connus et utiliss et peuvent devenir ainsi un
outil important et indispensable dans lanalyse de donnes scientifiques dans les annes venir.
Cest pourquoi la comprhension de leur thorie est essentielle, un trs bon tutoriel a cherch
expliquer les SVMs et leurs paramtres avec un plan visuel illustr par des graphes (Brereton and
Lloyd, 2010).
Malgr les bons rsultats obtenus concernant la modlisation SVR, une amlioration peut tre
faite par la suite par l'incorporation des connaissances du procd WWTP dans le modle SVR.
Aussi, pour que ce dernier soit trs efficace dans les applications industrielles, je pense qu'il faut
tenir compte de changements dans le temps des proprits et caractristiques propres du procd
WWTP. L'ide dans le futur est d'ajouter un aspect dadaptation au SVR standard par l'utilisation
d'un terme correctif ou d'ajouter en parallle du modle SVR standard un algorithme SVR en
ligne qui va apprendre le comportement du procd au fur et mesure.

130

CHAPITRE III : Diagnostic de dfauts


dans les oliennes

131

132

III.1. Introduction
Lnergie est lobjet de beaucoup de dbats mondiaux aujourdhui. Lobjectif des pays est de
satisfaire la demande en nergie qui ne cesse daugmenter tout en respectant lenvironnement et
la scurit des gens. Diversifier les sources dnergie est essentiel cause du dbut dpuisement
des ressources dnergie naturelles comme le ptrole et le gaz, afin dviter la dpendance
nergtique pour les pays non producteurs des hydrocarbures, et aussi afin de prserver la nature.
Ainsi, lattention sest porte sur les nergies renouvelables.
Ces dernires annes, lnergie solaire et lnergie produite par les oliennes font partie de ces
nergies la mode. La matrise de ces nergies nouvelles demande des progrs non seulement
technologiques mais aussi scientifiques.
Lolienne est un systme d'nergie renouvelable qui permet dexploiter la ressource du vent et
de la transformer en nergie lectrique. L'nergie olienne est en pleine expansion aujourdhui.
Plusieurs installations de parcs oliens se trouvent en mer (offshore) (Figure III.1). Cette
tendance va se confirmer encore plus dans le futur pour viter de gner les citoyens au niveau du
paysage et du bruit, et aussi pour avoir un vent fort, frquent et assez rgulier.

Figure III.1 Eoliennes offshore


Ces implantations flottantes dans le large ncessitent une tude approfondie du vent, de
l'arodynamique, des courants marins, de l'hydrodynamique, de l'lasticit,

du contrle de

l'olienne, ainsi que la plate-forme afin de dterminer leur faisabilit technique et conomique.
Ceci exige aussi daugmenter la disponibilit et la fiabilit de lolienne, de rduire les arrts et
les visites de maintenance qui sont plus difficiles et plus coteuses par rapport aux installations
de lolienne sur la terre. Une faon de satisfaire ces exigences est de concevoir un systme de
133

surveillance et de diagnostic de dfauts assez performant. La surveillance et le diagnostic de


dfauts des oliennes permettent de prdire et dtecter rapidement toute occurrence dune
dfaillance avant quelle ne se propage et conduise larrt ou voire mme la destruction de
lappareil olien comme dans la Figure III.2.

Figure III.2 Destruction dune olienne par prise de feu


La taille des oliennes ne cesse daugmenter. Les plus grandes oliennes peuvent prsenter une
puissance de l'ordre 6 MW (par exemple celle dveloppe et ralise par Alstom) avec des pales
allant jusqu 73.5 mtres produisant un diamtre total de 150 mtres. Ces grandes structures
sont sujettes de fortes charges.
Lobjectif de la stratgie de Diagnostic de Dfaut est daider lobtention dun meilleur
fonctionnement de lolienne afin de maximiser la gnration de llectricit avec un cot
minimal tout en respectant les conditions de scurit. Toutefois, plusieurs difficults et dfis sont
rencontrs par le concepteur du systme FDI dont :
La structure complexe de lolienne.
La non-linarit, linstabilit et la complexit de larodynamique de lolienne.
Le cisaillement du vent cause des forces de frottement dues la rencontre du vent avec les
diffrents obstacles possibles.
Le vent, cette ressource abondante est ncessaire pour le fonctionnement de lolienne
puisque cest la force dentranement de cette machine. Cependant, sa nature alatoire et
turbulente nous amne le considrer aussi comme une perturbation.
Les fluctuations de la puissance de lolienne qui sont dues des processus stochastiques du
vent ainsi qu des phnomnes doscillations priodiques comme le cisaillement du vent et
la rorientation du vent en raison de la structure de la tour de lolienne tower shadow.
134

Inclure la modlisation de ces phnomnes dans le modle de lolienne permet daider le


concepteur de lolienne dans son travail (Das et al., 2011).
Les bruits de mesures et les perturbations.
La commutation de la commande.
Le travail prsent dans ce chapitre porte sur la surveillance et le diagnostic des dfauts de
capteurs, dactionneurs et du systme sur lolienne par lanalyse et lexploration des donnes.
L'approche gnrale propose base sur SVM permet de manipuler les non linarits du systme
olien et d'obtenir des rsultats trs satisfaisants.
Au dbut du chapitre, une revue bibliographique est prsente, puis une description du systme
olien et son modle mathmatique est donn. Ensuite la stratgie de diagnostic de dfaut base
sur SVM est explique. Par la suite, les rsultats de cette approche sont montrs ainsi quune
comparaison avec diffrentes mthodes de diagnostic. A la fin du chapitre, une combinaison
entre une approche base sur les donnes SVM et une autre base sur le modle observateur
de type Kalman est prsente.

III.1.1. Revue des mthodes de diagnostic sur les oliennes


Mme les oliennes de petite taille demandent un investissement considrable, afin de rendre le
rapport production dnergie-prix de lolienne intressant et dencourager la croissance de
lnergie produite par ces machines. La dtection des dfauts au tout dbut de leur apparition est
ncessaire et fondamentale pour lefficacit et la fiabilit de ces systmes en vitant la
dgradation des matriaux et d'autres effets secondaires. Ainsi, la conception automatise dun
systme FDI pour lolienne visant minimiser au maximum le besoin de dcision de
loprateur est ncessaire (Svrd and Nyberg, 2011). Dans ce sens (Echavarria et al., 2007)
propose une mthodologie base sur le concept de reconfiguration par lutilisation des
redondances fonctionnelles qui existent dans le systme et les informations sur le systme ainsi
que les interactions entre ses diffrentes composantes afin de garder lolienne en marche mme
si elle perd en capacit de production.
Diffrentes approches bases sur les modles sont utilises pour le FDI dans les oliennes. Un
observateur entre inconnue est utilis pour dtecter les dfauts de capteurs de vitesse angulaire
de rotor ( wr ) et de la gnratrice ( wg ) (Odgaard and Stoustrup, 2010) et un observateur linaire
Paramtre Variant sert estimer la sortie et adapter le seuil de dtection. La tche d'isolation
est effectue par le concept de sensibilit des rsidus de dfauts travers une matrice de
135

sensibilit de dfaut (Negre et al., 2011). Une autre approche linaire est celle qui utilise la
transformation de Coleman et lidentification de sous espaces pour obtenir un modle linaire
temps invariant (LTI) (Wei et al., 2009), permettant de construire un filtre de Kalman qui gnre
des rsidus avec comme but la dtection des dfauts. Cependant, ces mthodes linaires ont des
difficults cause de la non-linarit du comportement entre-sortie du systme olien.
Des approches bases sur les donnes ont aussi t appliques pour la surveillance et la dtection
de dfauts, comme par exemple lutilisation des rseaux de neurones qui imbrique une forme
non linaire (Brandao et al., 2010, Elhor et al., 1999). Lapproche rseau de neurones a t
galement utilise pour lestimation de la puissance gnre par lolienne (Li et al., 2001). Une
comparaison entre un rseau de neurones et un modle de rgression polynomiale a montr la
supriorit du rseau de neurones dans la dtection de dfauts dans une olienne (Schlechtingen
and Ferreira Santos, 2011).
Beaucoup de travaux s'intressent au diagnostic de dfauts sur une partie ou un composant
d'olienne:

Dtection de dfaut des capteurs dangle de calage : une mthode a t propos par (Simani
et al., 2011) utilisant un systme de modlisation s'appuyant sur les modles affins par
morceaux. Chacun d'eux est valable dans une rgion de fonctionnement, dont les paramtres
sont identifis travers les acquis d'entres-sorties des mesures touches par l'incertitude de
mesure. Par consquent, ces modles sont exploits pour gnrer des signaux rsiduels.

Dtection de dfaut du multiplicateur de vitesse : dans (Lu, 2012) des ondelettes extraient
des caractristiques lies au dfaut. Par la suite ces caractristiques avec les donnes de
diffrents capteurs sont fusionnes par une approche statistique de pondration base sur
lACP. Ces donnes fusionnes sont utilises comme entre pour un algorithme de dcision
sur les dfauts.

Dtection de dfaut du convertisseur : (Odgaard and Stoustrup, 2009) utilise un observateur


entre inconnue.

Dtection de dfaut du Frein mcanique (Entezami et al., 2012)


Fissure des dents dans un engrenage : (Barszcz and Randall, 2009) utilise le Kurtosis
Spectral, un outil statistique qui peut indiquer la prsence d'une srie de phnomnes
transitoires non gaussiens et leurs emplacements dans le domaine frquentiel.
Dtection de dfaut des Roulements dans une gnratrice induction double alimentation :
(Amirat et al., 2010a), (Amirat et al., 2010b) utilise la transformation de Hilbert comme une
mthode de dmodulation damplitude du courant.
136

Des revues qui dcrivent l'tat de l'art en terme de surveillance de l'tat de l'olienne ainsi que le
diagnostic de dfaut peuvent tre trouves dans (Hameed et al., 2009), (Amirat et al., 2009) et
(Lu et al., 2009). Ces travaux mettent aussi l'accent sur les outils d'analyse et prtraitement
tempsfrquence, tels que les ondelettes. La transforme d'ondelettes permet non seulement
dliminer le bruit, mais aussi de bien analyser les signaux non stationnaires comme celui de la
puissance. Elle a t utilise pour la surveillance dtat et le diagnostic de dfauts mcaniques et
lectriques (comme : le dsquilibre du rotor, un court-circuit dans le gnrateur, l'enroulement
de gnrateur) pouvant se produire sur une olienne gnrateur synchrone (Yang et al., 2008).
Aussi, cette transforme est utilise pour distinguer entre le situation normale et dfectueuse afin
de dtecter les dfauts de capteurs de position pitch , dactionneurs ainsi que des dfauts dans
le systme dentranement de lolienne (Dinesh Kumar et al., 2011).
Dans le printemps de l'anne 2010, une comptition internationale tait lance par la socite kkelectronic, MathWorks et l'universit d'Aalborg afin de trouver la meilleure approche de
dtection et isolation des dfauts dans une turbine olienne. Plusieurs solutions ont t
dveloppes pour relever le dfi pos couvrant diffrentes mthodes savoir :
Une approche base sur le rapport de vraisemblance gnralise the Generalized
Likelihood Ratio en anglais (GLR) (Kiasi et al., 2011)
Une solution base sur un compteur rversible Up-down counter (Ozdemir et al.,
2011)
Une solution base sur lestimation par observateur (Zhang et al., 2011)
Une solution base sur des modles affines (Simani et al., 2011) .
Une solution base sur les quations de parit qui gnre des rsidus primaires, suivie
dune deuxime gnration/filtrage ralise par une optimisation

(Pisu and Ayalew,

2011).
Une mthode base sur les donnes (Dong and Verhaegen, 2011)
Une solution base sur un observateur o un filtre de Kalman est utilis pour gnrer les
rsidus (Chen et al., 2011).
Notre stratgie (Laouti, et al., 2011a) a dmontr son efficacit et prcision et a t
classe en premire place (voir annexe III.1).
Pour plus de dtails concernant cette comptition merci de voir le lien suivant :
http://www.kk-electronic.com/Default.aspx?ID=9442&Action=1&NewsId=43&PID=34329

137

Trs peu d'tudes utilisent SVM dans les oliennes. Une tude pas trs pousse qui traite le
diagnostic de dfauts uniquement dans le systme de transmission de l'olienne par lutilisation
de SVM et la slection de caractristiques de vibration du signal de l'arbre principal est donne
par (An et al., 2011). Des modles de prdiction de dfauts ont t dvelopps par le choix de la
vitesse du vent ainsi que de la puissance de sortie comme entres de SVMs (Kusiak and Li,
2011). Mais, daprs les auteurs, la prdiction de ces modles est un peu basse pour tre
acceptable.

III.1.2. Revue sur la commande des oliennes


La commande des oliennes est indispensable non seulement pour satisfaire les performances
dsires en production dlectricit et maintenir un bon rgime de fonctionnement, mais aussi
pour diminuer les contraintes mcaniques et la charge quand le vent est fort.
L'objectif de commande est d'tendre la dure de vie d'une olienne et de rduire les cots de
production d'lectricit, ainsi que dassurer loptimisation et la rgulation de puissance des
oliennes (Boukhezzar, 2006). Plusieurs travaux utilisant diffrentes mthodes de commande ont
t appliqus la commande de lolienne :
Approche base sur la construction de contrleur Linaire Paramtre Variant (Sloth et al.,
2011, stergaard et al., 2009)
Une commande linaire quadratique gaussienne optimale avec une commande anticipative
feedforward utilisant des signaux destimation du vent permettant de rejeter les
perturbations et de rduire la charge sur les pales (Selvam et al., 2009).
Une commande mode glissant pour rguler la puissance de production dans une olienne
vitesse variable (Beltran et al., 2009).
Une commande anticipative utilisant une base orthogonale qui permet d'extraire les
tendances gnrales dans le signal de vent (Odgaard and Stoustrup, 2011).
Une commande adaptative et une commande floue (Musyafa et al., 2011).
Une commande prdictive non linaire (Henriksen et al., 2011).
Le systme de contrle cherche trouver le meilleur angle de calage des pales (optimisation)
l'aide de vrins hydrauliques autour d'un axe longitudinal pour profiter au maximum du vent
instantan et maximiser ainsi la production de puissance, tout en limitant la puissance pour des
vitesses de vent suprieures la vitesse nominale. La variation de l'angle de calage entrane une

138

diminution ou une augmentation de la portance de la pale, donc du couple moteur (Biegel et al.,
2011).
Un bon tutoriel sur les dynamiques et le contrle des oliennes qui dcrit l'volution rcente dans
les contrleurs avancs ainsi qu'un aperu de nombreux problmes ouverts dans les domaines de
la modlisation et du contrle des oliennes peut tre consult dans (Pao and Johnson, 2009).
Le systme de contrle doit avoir la capacit de travailler mme si l'olienne est expose des
dfauts. Une commande tolrante aux dfauts doit tre mise en uvre indpendamment de la
structure de la commande nominale (Esbensen and Sloth, 2009).
La dtection de dfauts est galement intressante pour la reconfiguration de commande pour
garantir une puissance optimale en cas de dfaut partiel. Pour plus dinformations sur les progrs
rcents dans le diagnostic de dfauts et la commande tolrante aux dfauts dans les oliennes, le
lecteur est conseill de voir (Pourmohammad and Fekih, 2011).

III.2. Description du systme olien


Afin de fournir quelques connaissances basiques sur lolienne et ces composants, la liste qui
suit montre les diffrentes composantes dune olienne (Figure III.3) :
Le rotor qui comprend gnralement 3 pales est fix la nacelle.
La Tour ou le mt permet de placer le rotor une hauteur suffisante pour permettre son
mouvement et quil soit entran par le vent.
La nacelle monte au-dessous de la Tour, peut tourner pour orienter la machine olienne
dans la bonne direction (perpendiculaire la direction du vent). Elle accueille
linstallation de gnration de lnergie lectrique, qui se compose de : multiplicateur de
vitesse, la gnratrice (permet de transformer lnergie mcanique en nergie lectrique),
armoire de commande,... etc.
Un anmomtre est plac au niveau de la nacelle pour mesurer la vitesse du vent qui a un impact
important sur les dynamiques de lolien. Il faut noter que cette mesure est trs bruite, une
estimation efficace de la valeur de vitesse du vent pouvant tre ralise par lutilisation de
langle du pitch et un observateur (stergaard et al., 2007).

139

Figure III.3 Coupe transversale dune nacelle dolienne


Il faut noter que la modlisation des oliennes tient compte de lendroit de son implantation, une
modlisation de lolienne place en terre ferme tant diffrente de celle place dans la mer
offshore (Jonkman, 2009, Matha, 2009). Dans ce travail, le modle de rfrence utilis est
suppos pour un olien en terre introduit par (Odgaard et al., 2009) incluant des dfauts de
capteurs, dactionneurs et du systme afin dvaluer les stratgies de diagnostic de dfauts. Ce
modle dcrit un type spcifique doliennes vitesse variable axe horizontal dune puissance
nominale de 4.8 Mw qui est une hlice perpendiculaire au vent, compose de trois pales et d'un
convertisseur complet.
La modlisation de lolienne reprsente principalement ses caractristiques arodynamiques,
mcaniques et lectrotechniques. Un schma-bloc (Figure III.4) est donn pour montrer la
structure du modle olien utilis dans ce chapitre.

Figure III.4 Une vue d'ensemble du modle de rfrence de lolienne


140

Ce modle contient un rotor avec les pales qui permettent de capter lnergie cintique du vent.
Un train d'entranement est utilis pour augmenter la vitesse de rotation du rotor au gnrateur.
Un convertisseur intgral coupl un gnrateur permet de convertir l'nergie mcanique en
nergie lectrique. Un contrleur cherche optimiser le fonctionnement de lolienne.

III.2.1. Modle des pales et pitch


Ce systme est une combinaison du modle arodynamique et du modle de calage des pales.
Modle arodynamique de lolienne (Johnson et al., 2006) : le couple arodynamique qui agit
sur les pales est donn comme suit

W r t

U .S .R 3Cq O t , E t .vw t 2
2

O Cq (O , E ) est le coefficient de couple arodynamique, E

(III.1)
est langle de calage des pales

pitch et R le rayon de pales, vw est la vitesse du vent, U est la densit de lair et O

wr .R
vw

correspond au rapport de vitesse la pointe (vitesse spcifique).


Modle du systme de calage des pales pitch : ce systme actionneur hydraulique peut tre
modlis par une fonction de transfert de 2me ordre avec des contraintes sur chaque pale :

E k , m ( s)
E kd ( s )

wn2
s 2  2.] .wn s  wn2

(III.2)

O E k ,m ( s) et E kd (s ) sont les positions mesures et dsires d'angle de calage des pales.


k=1, 2, 3, >wn ,] @

>11.11 rad / s, 0.6@ sont les paramtres nominaux du modle sachant que

wn

est la pulsation et ] est le coefficient d'amortissement. La baisse de pression est ralise par le
changement des paramtres du modle vers les valeurs wn 2 ,] 2 .

III.2.2. Modle convertisseur et gnratrice


Les dynamiques du convertisseur sont modlises par une fonction de transfert du 1me ordre:

W g , m s
W g , r s
O D gc

D gc
s  D gc

50 s 1 est le paramtre du modle. On peut lcrire sous cette forme

141

(III.3)

W g , m s
1
W g , r s W .s  1

(III.4)

O W g, m et W g ,r sont respectivement le couple rel et celui dsir, et la constante du temps est


W=0.02 s. Le couple rel tant non mesur, il est calcul partir de la vitesse du gnrateur
mesur wg , mi . La puissance produite par la gnratrice est :

Pg t K g wg t W g t

(III.5)

O K g est le rendement de la gnratrice.

III.2.3. Modle du systme dentranement


Le systme dentranement drive train est modlis par un modle 3 variables dtats en
tenant compte des inerties du gnrateur et du rotor. Les dynamiques de ce systme sont donnes
comme suit :

wr t

wg t
T t
'

wr t
W r t

A wg t  B
avec


W
t
g

T t
'

 Bdt  B
J
r

K B
dt dt
Ng Jg

Bdt
Ng Jr
 K dt Bdt
 Bg
2
Ng
Jg
1
Ng

Jr

K dt K dt
, B
Ng Jg

 K dt

1
J
r
0

1

J
g
0

(III.6)

O Jr, Jg sont respectivement le moment dinertie de larbre faible vitesse et grande vitesse.
Kdt est la rigidit de torsion du train dentranement, Bdt le coefficient de torsion amortie du
train dentranement, Bg le frottement visqueux de larbre grande vitesse, Ng le rapport de
transmission ou dengrenage, T ' t est langle de torsion du train dentranement, et Kdt le
rendement du train d'entranement.
Le dfaut systme de faible transmission est modlis par un autre paramtreKdt 2 .

Modle des capteurs


Les capteurs sont modliss par la valeur de la variable relle ajoute avec un bruit stochastique
ralis par le bloc de bruit alatoire bande limite dans Matlab. Les valeurs des paramtres du
modle de lolienne de rfrence sont donnes dans le Tableau III.1.

142

Tableau III.1 Paramtres du modle de rfrence de lolienne


Paramtres du modle pales et pitch

57.5 m 1.225 Kg/m3

wn

]2

wn 2

]3

wn3

0.6

11.11 rad/s

0.45

5.73 rad/s

0.9

3.42 rad/s

Paramtres du modle de transmission


Bdt
775.49

Br

N .m . s
rad

7.11

Bg

N .m . s
rad

45.6

N .m . s

Ng
95

Kdt
2.7 109

rad

N .m . s

dt

dt

0.97

0.92

Jg
390 Kg m2

Jr
55.106

Kg m2

rad

Paramtres du modle convertisseur et gnratrice

K gc

D gc
50 s

-1

0.98

III.2.4. Le systme de contrle


La vitesse du vent (prcisment sa moyenne) dtermine la zone de fonctionnement du contrleur
et par consquent de la machine olienne. La Figure III.5 illustre bien diffrentes zones. Lorsque
la vitesse est infrieure une certaine valeur vmin, l'olienne est l'arrt (zone1). Si vmin est
dpasse mais infrieure 12.5 m/s, le contrleur fonctionne dans la zone 2 qui correspond
l'optimisation de la puissance. La zone 3 correspond la saturation (valeur constante) dans la
production de puissance quand la vitesse du vent est entre 12.5m/s et vmax. Le dpassement de la
valeur vmax par la vitesse du vent peut avoir des consquences nfastes sur l'olienne. Cest pour
cette raison que dans cette zone 4 l'olienne est arrte.

Figure III.5 Puissance de lolienne en fonction de la vitesse du vent

143

Par la suite, la dtection de dfauts sera tudie l'aide de la simulation en boucle ferme dans la
zone 2 (optimisation de la puissance) et la zone 3 (production constante d'nergie) avec une
squence raliste de vent de 4400s montre dans la Figure III.6.

25

vw (m/s)

20
15
10
5
0

1000

2000 3000
Temps (s)

4000

Figure III.6 Squence vitesse du vent

III.2.5. Dfauts considrs dans ce modle olien


III.2.5.1. Dfauts capteurs
Le systme est quip de capteurs dupliqus permettant de mesurer les trois positions angulaires
de calage des pales

g , mi

k , mi

, k 1,2,3, i 1,2

et les vitesses de la gnratrice et du rotor

, wr , mi , i 1,2 . Cela donne un total de dix capteurs tous soumis deux types de dfauts:

valeur fixe et gain. Par consquent, vingt dfauts doivent tre dtects avec un temps de
dtection (TD) qui doit tre infrieur 10 fois le temps d'chantillonnage (Te=0,01 s).

III.2.5.2. Dfauts actionneurs


Les actionneurs sont les trois systmes hydrauliques pitch et le convertisseur. Ils permettent
respectivement le calage des pales et le rglage du couple gnrateur pour commander la vitesse
de rotation du gnrateur et le rotor. Ces actionneurs sont galement soumis un
dysfonctionnement. Le systme de convertisseur de couple peut avoir un dcalage qui doit tre
dtect rapidement (TD<5.Te). Les trois systmes de calage des pales peuvent avoir un
changement dans la dynamique qui peut tre d une chute de pression dans la pompe (5a) ou
haute teneur en air dans l'huile un rythme plus lent (5b) (voir le Tableau III.2). Dans ce cas, le
nombre total de dfauts dactionneurs est de sept.
144

III.2.5.3. Dfaut systme une panne de systme peut se produire dans la conduite d'un train
en raison du changement de frottement avec le temps. Le nombre total de dfauts devant tre
contrls est donc de 28.
Cependant, certains dfauts sont similaires. Par exemple, un dfaut sur le capteur de mesure de
position de la pale 1 blade 1 ( 'E1, mi ) est semblable ceux dans les capteurs de mesure des
positions des pales 2 et 3 . De cette manire, on peut voir que nous avons dix diffrents types de
dfauts prendre en considration distinctement qui sont classs dans le Tableau III.2. Le
processus a d'autres capteurs, mesurant par exemple la vitesse du vent, qui ne sont pas superviss
dans ce travail.
Tableau III.2 Dfauts considrs dans le modle olien de rfrence
N.

Dfaut

1a

Type

Exigences

Capteur

Symbole
'E k ,mi , k 1,2,3, i 1,2

Valeur fixe

TD<10.Te

1b

Capteur

'Ek , mi , k 1,2,3, i 1,2

Gain

TD<10.Te

2a

Capteur

'wr ,mi , i 1,2

Valeur fixe

TD<10.Te

2b

capteur

'wr ,mi , i 1,2

Gain

TD<10.Te

3a

Capteur

'wg ,mi , i 1,2

Valeur fixe

TD<10.Te

3b

Capteur

'wg ,mi , i 1,2

Gain

TD<10.Te

4a

Actionneur

'W g

Offset

TD<5.Te

5a

Actionneur

'Ek , k

1,2,3

Changement brusque de dynamique d TD<8.Te


une chute de pression dans la pompe

5b

Actionneur

'Ek , k

1,2,3

Changement lent de dynamique d la TD<100.Te


prsence de l'air dans lhuile

Systme

'wr , 'wg

Changement

de

dynamique

l'augmentation de vibration dans le


systme de transmission

Il est noter que l'exigence en termes de rapidit de temps de dtection du dfaut dpend de la
gravit de ce dernier. Et le nombre de fausses alarmes doit tre le plus faible possible.

145

III.3. Diagnostic de dfauts dans une olienne


Dans ce chapitre, une mthode de diagnostic de dfauts par SVM est propose. SVM
classification est utilis pour valuer les rsidus gnrs ainsi que d'autres caractristiques afin de
conclure sur l'tat de fonctionnement du systme. Il est essentiel de bien comprendre le systme
olien et comment il fonctionne avant denvisager de raliser un schma de diagnostic de dfaut
(Figure III.7). Lide derrire ce schma de diagnostic de dfaut ddi aux oliennes est de voir
le problme de diagnostic comme un problme de classification.

Figure III.7 Schma de diagnostic de dfaut pour les oliennes


La mthode SVM a t utilise pour le diagnostic de dfaut dans la majorit des cas par
l'utilisation directe des signaux d'entres/sorties (Ylamos et al., 2009, Ge et al., 2004) comme
montr dans la Figure III.8 ou par l'ajout d'une phase de prtraitement avant l'application des
SVMs : transforme dondelettes (Saravanan et al., 2008), transform de Walsh (Xiang et al.,
2008). Le deuxime choix apparat le plus appropri car le premier schma risque d'embrouiller
le travail de l'algorithme SVM qui va chercher la solution dans toutes les directions. Dans la
littrature, des chercheurs ont essay de combiner les SVMs avec d'autres techniques de
prtraitement telles que l'analyse en composantes principales (Widodo and Yang, 2008, Jemwa
and Aldrich, 2006). Bien que cette combinaison amliore un peu les rsultats des SVMs
appliqus sur les donnes brutes, des fausses alertes restent toujours prsentes. Cela peut se
comprendre car ACP cherche compresser les donnes brutes vers une dimension plus rduite
par la capture du maximum de variance des donnes brutes sans sintresser aux symptmes des
dfauts.

146

Figure III.8 Stratgie de diagnostic de dfaut classique avec SVM


Dans cette thse, je propose de voir le processus de dtection de dfauts dune faon plus
gnrale que celle de gnration de rsidu suivie par lvaluation de rsidu montre dans le
chapitre I. Il sagit de crer des caractristiques spcifiques chaque dfaut. Parmi ces
caractristiques se trouve le rsidu. On peut avoir des mesures pertinentes informatives de
dfaut, combinaison des mesures, mesures filtres, etc.., la Figure III.9 suivante illustre la vision
propose pour rsoudre le problme de diagnostic des diffrents systmes.

Figure III.9 Schma de diagnostic de dfauts propos


La construction des caractristiques dans ce travail appliqu au cas des oliennes est ralise
dune faon manuelle en se basant sur les connaissances du systme olien. Par la suite, SVM est
utilis comme une tape d'valuation des caractristiques d'un dfaut donn comme le montre la
Figure III.10.

Figure III.10 Stratgie propose de diagnostic de dfaut base sur SVM


147

La dtection de dfauts par SVM est dveloppe en deux parties. En premier lieu, un ensemble
de donnes avec et sans dfauts est utilis pour apprendre les modles de dtection de chaque
dfaut par l'utilisation d'une squence de vent donne comme entre. Les modles obtenus sont
valids sur un nouveau scnario de dfauts comme dans les autres applications tudies dans
cette thse.

III.3.1. Les vecteurs des caractristiques pour chaque dfaut


L'ide cl dans l'apprentissage d'un nouveau modle pour la dtection de dfaut par SVM est la
dfinition du vecteur x utiliser pour la classification. Ce vecteur doit inclure l'information la
plus pertinente du comportement du systme relative un dfaut donn.
Il peut contenir les sorties mesures, des mesures dcales, les entres, les consignes, une
combinaison de celles-ci ou la variation des sorties avec le temps. Afin de construire un vecteur
utile, il faut observer attentivement les rsultats des sorties du processus pour chaque anomalie
et proposer une combinaison qui assure un fort impact de dfaut considr dans le vecteur x.
Plusieurs vecteurs sont proposs pour diffrents types de dfauts. La redondance matrielle
(capteurs dupliqus) est utilise comme une caractristique dans la plupart de ces vecteurs. Le
noyau utilis pour l'apprentissage de tous les dfauts est le noyau gaussien qui est le plus adapt
aux donnes relles bruites et perturbes grce sa grande capacit d'apprentissage. La plupart
des donnes sont filtres par un filtre de premier ordre avec une constante de temps W afin de
rduire la sensibilit aux perturbations du procd ou aux bruits de mesures.

III.3.1.1. Diagnostic des dfauts de capteurs de pitch


Pour les 6 capteurs mesurant les positions pitch ( 'Ek ,mi , k 1,2,3, i 1,2 ), le paramtre V de la
fonction noyau gaussienne est rgul 10.
Type valeur fixe (1a) : pour ces dfauts, le vecteur suivant est utilis pour la dtection et
l'isolation:

Ek , m1 (t j )  Ek , m 2 (t j )

E k , m1 (t j )  E k , m1 (t j 1 )

E k , m 2 (t j )  E k , m 2 (t j 1 )

(III.7)

O t j et t j 1 sont les instants du temps j et j-1 respectivement et E est la valeur filtre de E


utilisant un filtre passe-bas avec une constante de temps W=0.06 s. Notez que les valeurs absolues
148

sont utilises dans x. Lorsque E k , m t j  E k , m t j 1


i

0, i 1,2 , ce terme est remplac par une

large valeur constante (5000) afin d'amliorer la distinction entre le dfaut de type valeur fixe et
le cas normal (sans dfaut).
Type gain (1b) : ce dfaut est dtect et isol en deux tapes. Tout d'abord, le dfaut est dtect
utilisant le vecteur suivant:
Ek , m1 (t j )  Ek , m 2 (t j )

Ek , m1 (t j )  Ek , m1 (t j 1 )

Ek , m 2 (t j )  Ek , m 2 (t j 1 )

(III.8)

Les deuxime et troisime lignes dans l'quation ci-dessus sont importantes afin d'exclure les
dfauts de type 1a. Par la suite, si le dfaut de type b est dtect, le vecteur suivant est utilis
pour l'isolation entre les capteurs 1 et 2:

Ek , r (t j )  Ek , m1 (t j )

Ek , r (t j )  Ek , m 2 (t j )

(III.9)

O Ek , r est la valeur dsire de l'angle pitch E k et E est la valeur filtre par un filtre passe-bas
de constante de temps W=0.08 s.

III.3.1.2. Diagnostic des dfauts capteurs des vitesses de gnratrice et du rotor


Pour des dfauts capteurs dans les vitesses de la gnratrice et du rotor (wg , mi , wr , mi , i 1,2) , la
variance gaussienne est rgle V

15 pour amliorer la croissance de la capacit de dtection.

Il est noter qu'une grande valeur de V peut conduire des fausses alarmes.
Types valeurs fixes 2a et 3a: pour la dtection des dfauts de type a, le vecteur suivant est utilis
pour la dtection et l'isolation:

w p , m1 (t j )  w p , m 2 (t j )

wp , m1 (t j )  wp , m1 (t j 1 ) , p
w (t )  w (t )
p , m 2 j 1
p,m2 j

g, r

(III.10)

w g est obtenu en utilisant un filtre avec W=0.02s et w r avec W=0.6s. Lorsque le terme

wp, mi (t j )  wp, mi (t j 1 ) 0, i 1,2 , il est remplac par une grande valeur constante dans le vecteur

de caractristique x afin d'amliorer la distinction entre le dfaut de valeur fixe et le cas normal
(sans dfaut) et faciliter la tche du classifieur SVM.
149

Types gains 2b et 3b: pour la dtection des dfauts de type gain b (sans les dfauts de type a), le
vecteur suivant est utilis en premire tape :

w p , m1 (t j )  w p , m 2 (t j )

w p , m1 (t j )  w p , m1 (t j 1 ) , p

p , m 2 (t j )  wp , m 2 (t j 1 )

g, r

(III.11)

Les mesures sont filtres par un filtre passe-bas avec une constante de temps gale W=0.6 s pour
l'estimation des dfauts w r et W=0.02s pour w g .
Dans une seconde tape, l'isolation entre les capteurs 1 et 2 dans le cas de dfaut de type b est
faite en utilisant le vecteur suivant:

Wg , m u w p , m1 (t j ) u c

Pgm
, p

Wg , m u w p , m 2 (t j ) u c

Pg , m

g , r avec c une constante c

c3 10 o p g

c4 1000 o p r

(III.12)

O, Pg , m est la mesure de la puissance gnre de la gnratrice. Les mesures sont filtres par un
passe bas avec une constante de temps gal W=0.6 s pour l'estimation des dfauts w r et W=0.06 s
pour w g .

III.3.1.3. Diagnostic des dfauts du convertisseur et du systme


Pour les dfauts (4a and 6), le vecteur suivant est utilis:

d
O wg

wg , m1 (t j )  wg , m 2 (t j )

W g , r (t j )  W g , m (t j )

O u wd (t )  ( w (t )  w (t )) / 2
g
j
g , m1 j
g ,m2 j

(III.13)

Pr
est la vitesse de la gnratrice dsire calcule partir du couple gnrateur dsir
W g ,r

W g , r obtenu par le contrleur avec Pr la puissance dsire. Le facteur O2 1010 u vw6 dans la 3me
composante de x est utilis pour tenir compte de la vitesse du vent et pour la normalisation
(avoir le mme ordre de grandeur). Notez galement que W g , r est filtr en utilisant un filtre du
premier ordre avec une constante de temps W= 0,02 s. L'objectif de ce filtre est de prendre en

150

compte la dynamique du systme de contrle (temps ncessaire pour W g, m pour atteindre W g , r ) et


non de rejeter le bruit de mesure ou les perturbations. Le paramtre V=10 pour dfaut de type 4a.

III.3.1.4. Dtection / isolation de dfaut actionneur sur le systme pitch


Pour la dtection de dfauts 5a et 5b, le vecteur suivant est utilis avec V=10:

wg , m1 (t j )  wg , m 2 (t j )

E k , m1 (t j )  E k , m 2 (t j )
E (t )  E (t )
k , m1 j 1

k , m1 j
E k , m 2 (t j )  E k , m 2 (t j 1 )

(III.14)

Une fois les vecteurs d'apprentissage dfinis pour chaque dfaut, les scnarios de dfauts sont
simuls et chaque chantillon est attribu z

r1 (avec ou sans faute) pour chaque type de

dfauts.

III.3.2. Rsultats de lapproche de diagnostic


Environ sept scnarios ont t envisags pour chaque dfaut avec des amplitudes de dfauts
diffrents. L'algorithme d'apprentissage SVM utilise les vecteurs de caractristiques ( x ) et les
valeurs z correspondantes pour identifier D i et les vecteurs de support ( xsup ) ncessaires pour la
prise de dcision. L'identification dpend du type du noyau et des paramtres de rglage: V et C.
Un bon rglage des paramtres dapprentissage de SVM vite le surapprentissage. Lapproche
essai-test a t adopte dans cette application. Elle consiste raliser plusieurs essais avec
diffrentes valeurs des paramtres C et V et de les tester sur un ensemble de test. Notez que le
mme modle ( xsup et D i ) est utilis pour tous les dfauts de type 1a, un autre modle pour
tous les dfauts de type 1b et ainsi de suite. Dix modles ont donc t dvelopps.
La solution de diagnostic de dfaut propose dans ce chapitre peut tre tlcharge partir du
lien suivant :

http://www.mathworks.com/matlabcentral/fileexchange/35130-award-winning-

fdi-solution-in-wind-turbines
Le scnario des dfauts considrs dans ce travail est le suivant :
Dfauts capteurs
Dfaut 1 (1a) : la mesure de capteur E1,m1 fix 4 entre les instants 100s et 200s
Dfaut 2 (1b) : la mesure E 2,m 2 multiplie par le facteur 1.8 entre les instants 2500s et 2600s
151

Dfaut 3 (1a) : la mesure E3, m1 fixe 12 entre les instants 900s et 1000s
Dfaut 4 (2a) : wr ,m1 fix 1.2 rad/s entre les instants 1200s et 1300s
Dfaut 5 (2b et 3b) : wr ,m2 multipli par le facteur 0.7 et wg ,m1 multipli par le facteur 1.7 entre
les instants 1700s et 1800s.
Les Figure III.11 et Figure III.12

30

montrent respectivement lvolution

vent

(lentre)

et

la

puissance

lectrique gnre (la sortie). Il


apparat clairement quil ya une forte

vw,m (m/s)

en fonction du temps de la vitesse du

20

10

liaison entre ces deux variables (la


valeur de lintercorrlation calcule

0.8643 dmontre bien cela). Ainsi, la

2000 3000 4000


Temps (s)
Figure III.11 Vitesse du vent mesure

puissance est maximum si la vitesse


du vent dpasse une certaine valeur.
Cependant la production de lnergie

x 10

1000

est aussi influence par la commande

assez clair dans lintervalle de temps


entre

2000

lintroduction

et

du

2200s

dfaut

sur

avec
le

pgm (w)

ainsi que par les dfauts. Cela est

systme dentrainement.

3
2
1
0

1000

2000 3000
Temps (s)

4000

Figure III.12 Puissance lectrique gnre


Dfauts actionneurs
Dfaut 6 (5a) : chute de pression hydraulique dans lactionneur de pitch 2, ce dfaut se
manifeste par un changement brutal de la dynamique de lactionneur pitch 2 avec

wn 2

5.73 et ] 2

0.45 entre 3200s et 3300s.

152

Dfaut 7 (5b) : augmentation de la teneur de l'air dans l'huile hydraulique dans lactionneur 3
entre 3400s-3500s. Ce dfaut est introduit par le changement des paramtres du modle avec les
valeurs wn3

3.42 et ] 2

0.9 .

Dfaut 8 (4a) : le dfaut dactionneur sur le convertisseur est not 'W g de type offset caus par un
dcalage dans les boucles internes de contrle. Ce dfaut est introduit entre 4200s et 4300s.
Dfaut sur le systme
Dfaut 9 (6) : Changement des dynamiques du systme dentranement entre 2000s et 2200s.
Les dfauts (1 et 3) de la position pitch de type valeur fixe peuvent tre dtects aprs seulement
2 priodes dchantillonnage satisfaisant ainsi le cahier de charge (voir annexe C). La Figure
III.13 montre les rsultats de dcision du dfaut de type (gain) ainsi que la mesure du capteur

E2, m2 qui sont assez satisfaisantes puisque ce dfaut est bien dtect et isol sans fausses alarmes
malgr la difficult lie ce type de dfauts qui peut tre confondu facilement avec une situation
normale cause de bruit, perturbations et les oscillations. Cependant, seuls les dfauts avec un
offset 'E t 2q peuvent tre dtects durant le temps requis ( 10.Te ) en fonction de la zone de
commande. Si le gain est appliqu plutt quun offset, les oscillations peuvent augmenter si
lordre de gain est lev mais la capacit de dtection reste la mme.
'

'

Figure III.13 Dtection et isolation du dfaut 2 de type gain (1b) sur le capteur de la
position pitch E2, m2
Le zoom ci-dessous sur la Figure III.13 permet de voir plus de dtails. Ainsi il est clair que le
dfaut qui correspond la multiplication de la mesure E 2,m 2 par le facteur 1.8 entre les instants
2500 s et 2600 s est dtect rapidement linstant 2500.03 s (juste aprs 3Te), et bien isol
153

puisque les autres signaux de dcisions sur les dfauts affichent une valeur nulle. Cependant,
cette dcision sur le dfaut 2 indique la fin de ce dernier linstant 2550.17 s alors que ce dfaut
se termine 2600 s, ce rsultat pouvant se comprendre puisque de 2550.17 s 2600 s comme
indique la Figure ci-dessous la mesure E 2,m 2 est proche de zro et donc ce dfaut de type gain va
seulement amplifier le bruit.

1
0.5
0

2350

2400

2450

2500

2550

2600

2650

30

2700

2750

2800

2750

2800

E2m2 ()

20
10
2350

2400

2450

2500

2550

2600

2650

2700

Temps(s)
La Figure III.14 indique l'apparition du dfaut 4 (2a) de type valeur fixe dans le capteur de la
vitesse de rotation du rotor entre 1200 s et 1300 s. On remarque que la dtection est ralise
instantanment linstant 1200.02s et prend rapidement la valeur zro aprs la disparition de ce
dfaut linstant 1300.01 s. Notez toujours que les signaux de dcision sur les autres dfauts
affichent une valeur nulle, ainsi, que la non-prsence des fausses alarmes dans le rsultat de
dtection, malgr les bruits et les perturbations.

'

'

Figure III.14 Dtection et isolation du dfaut 4 valeur fixe (type 2a) sur la vitesse du rotor
154

Le dfaut 5 (2b) de type gain de valeur 'wr , m 2

0.7 rad / s dans le capteur de vitesse du rotor a

pu tre dtect linstant 1700.37 s aprs 37 priodes dchantillonnage de son apparition


comme le montre la Figure III.15. La satisfaction des exigences demandes concernant ce type
de dfaut ( 10.Te ) ne peut se faire si la valeur de wr nest pas proche de zro et si le facteur de
multiplication du dfaut a une valeur consquente qui permet de le diffrencier du bruit et des
perturbations rapidement et sans fausse alarme. Notez que la dcision sur le dfaut 5 prend la
valeur zro (pas de dfaut) linstant 1800.5s aprs 50 Te de la disparition de ce dfaut.
'

'

Figure III.15 Dtection et isolation du dfaut 5 de type gain (2b) sur le capteur de la vitesse
rotationnelle du rotor wr ,m2

La Figure III.16 montre les rsultats de dtection et isolation de dfaut 5 (3b) du capteur vitesse
rotationnel de la gnratrice introduit entre les instants 1700s et 1800s. Dans le cas d'une erreur
de facteur de gain conduisant wg ! 50 rad / s , un changement important dans le rsidu se
produit rapidement menant une dtection facile de ce dfaut. Cependant, la mesure wg ,m1 est
influence aussi par des perturbations et dautres types de dfauts (comme le dfaut sur le
systme entre 2000 s et 2200 s). La tche disolation est donc plus complique. Malgr tout cela
le dfaut est bien isol et sans fausses alarmes. Le rsultat sur ce type de dfaut est assez bon d
la rapidit et la justesse de dcision qui commence 1700.03 s aprs juste 3 T e de lapparition
de ce dfaut et se termine 1800.06s (aprs 6 Te de la disparition du dfaut).

155

'

'

Figure III.16 Dtection et isolation du dfaut 5 de type gain (3b) sur le capteur de la vitesse
rotationnelle de la gnratrice wg ,m1
Le dfaut 8 (4a) sur lactionneur du convertisseur a pu tre dtect comme dsir en termes
damplitude de dfaut et de la rapidit comme montr dans la Figure III.17. On rappelle que x
utilise notamment la valeur de consigne du couple qui est compare celle mesure l'aide dun
retard de 2 priodes d'chantillonnage. On remarque que la dtection est ralise instantanment
aprs juste deux priode dchantillonnage linstant 4200.02s et prend rapidement la valeur
zro aprs la disparition ce dfaut linstant 4300.02s, avec un pourcentage nul de fausses
alarmes.
'

'

Figure III.17 Dtection et isolation du dfaut 8 de type offset (4a) sur le convertisseur
En ce qui concerne les actionneurs des systmes pitch, leurs dfauts ne pouvaient pas tre
dtects par le vecteur x propos. Ces types de dfauts seront traits par une approche hybride
combinant SVM avec un observateur de type Kalman (voir section III.5).
156

Dcision dfaut sur le systme d'entrainement


1
0.5
0
300

500

1000

1500

2000

2500

3000

3500

4000

200
100

Zgm1

500

1000

1500

2000

2500

3000

3500

4000

Temps(s)
Figure III.18 Dtection et isolation du dfaut 9 (6) sur le systme dentrainement
Finalement, la Figure III.18 montre la dtection de dfaut 9 sur le systme de transmission
(entrainement). Ce dfaut est modlis par le changement du paramtre Kdt

0.22 uKdt .

Cependant, cette erreur na pu tre dtecte quavec un niveau de dfaut beaucoup plus lev
dans ce paramtre Kdt

0.95 uKdt . Ce rsultat est un peu infrieur celui requis. Une

amlioration du modle SVM dcisionnel peut tre ralise avec une enqute plus approfondie
sur le vecteur des caractristiques, lintroduction de plus de donnes dans ltape dapprentissage
et l'adoption d'une mthode approprie de filtrage.
La plupart des exigences relatives la dtection des dfauts ont t ralises. Les diffrentes
types de dfauts ont t dtects et isols le plus rapidement possible et sans fausses alarmes.

III.4. Comparaison entre diffrentes mthodes de diagnostic


Il sagit de comparer diffrentes mthodes de diagnostic proposes dans le cadre de la
comptition internationale pose par kk-electronic.

Les mthodes considres pour cette

comparaison sont celles ayant obtenues les meilleurs rsultats :


L'approche propose par l'auteur de cette thse base sur SVM (Laouti, et al., 2011a)
MBSVM.
Une Mthode Base sur l'Estimation (Zhang et al., 2011) MBE
Solution base sur lestimation, un estimateur bas sur les modles et les paramtres associs
fournis dans (Odgaard and Stoustrup, 2010) est utilis pour la dtection de dfauts, ensuite un
banc destimateurs est utilis pour lisolation.
157

Une solution base sur un Compteur rversible (Ozdemir et al., 2011) MBC
Solution FDI base sur un compteur rversible (Up-down counter) qui permet de compter ou
dcompter selon le choix du sens de comptage. En effet, la gnration de rsidus est obtenue par
la redondance et les connaissances physiques, les quations de parit et diffrents filtres. Par la
suite, le compteur rversible utilise les rsidus et les dynamiques discrtes dans le temps pour la
dcision sur la dtection et lisolation de chaque dfaut. A linverse du seuil fixe qui trouve une
difficult pour rgler le compromis entre fausse alarmes et dtection manque, la solution
propose dans ce travail est base sur un seuil variable bas sur un compteur.
Mthode Base sur les Observateurs (Chen et al., 2011) MBO
Une approche base sur les observateurs est conue pour le diagnostic de dfauts dans lolienne.
Les rsidus sont gnrs par un filtre de Kalman et des observateurs dont les paramtres sont
choisis sur un compromis entre dtection rapide et fausses alarmes.
Le test de rapport de vraisemblance gnralise (Generalized Likelihood ratio test) et lindex de
variance cumulative sont utiliss pour valuer les rsidus gnrs. Lisolation est effectue par
l'aide de la redondance.
Mthode Automatique Gnrale de Dfauts (Svrd and Nyberg, 2011) MAGD
Cette approche se dcompose en 3 tapes :
1) Gnration de rsidus candidats
2) Slection des rsidus les plus adapts
3) Construction dun test de diagnostic sur les rsidus choisis avec la mthode de
divergence de Kullback-Leibler
Une comparaison entre les distributions de probabilits estimes de rsidus est utilise pour les
tests de diagnostic et l'valuation des donnes actuelles et sans faute.
Plusieurs scnarios ont t tests aussi par le changement du temps de loccurrence du dfaut.
Les tableaux suivants montrent les rsultats de comparaison :
Il apparat clair d'aprs le Tableau III.3 que la solution MBSVM est meilleure que les autres
solutions de dtection du dfaut 1 car elle permet de dtecter rapidement (2Te) sans fausses
alarmes ni dtections manques.
Tableau III.3 Rsultats de diagnostic du dfaut 1
Dfaut 1

Temps de Dtection

Fausses Alarmes

moyenne

minimum

Maximum

moyenne

minimum

Maximum

Moyenne

minimum

Maximum

MBSVM

0.02

0.02

0.02

MBE

0.02

0.01

0.02

3%

0%

20%

158

Dtection Manqus

MBC

0.03

0.02

0.03

MBO

10.32

10.23

10.33

0.89

MAGD

0.04

0.03

0.04

Le dfaut 2 (capteur de type gain) ne peut pas tre dtect si E r

0 sauf pour des grandes valeurs

de dfaut gain puisque E sera juste le bruit de mesure. E prend la valeur zro assez frquemment
puisquelle correspond la position optimale dans la zone 2 cest pour cette raison que la
dtection du dfaut est un peu lente. Ici aussi la mthode MBSVM surpasse les autres dans le
pourcentage nul des fausses alarmes, seule MBC ralise un rsultat quivalent sauf que niveau de
rapidit de dtection MBSVM est meilleur que MBC comme le montre le Tableau III.4.
Tableau III.4 Rsultats de diagnostic du dfaut 2
Dfaut 2

Temps de Dtection

Fausses Alarmes

Dtection Manqus

moyenne

minimum

Maximum

moyenne

minimum

Maximum

Moyenne

minimum

Maximum

MBSVM

47.24

3.23

95.09

56%

100%

MBE

44.65

0.63

95.82

22

16

28

56%

0%

100%

MBC

69.12

7.60

95.72

67%

100%

MBO

19.24

3.43

49.93

0.97

MAGD

13.70

0.38

25.32

3.08

18

Pour plus de dtails sur les rsultats de cette comptition voir (Odgaard and Stoustrup, 2012).
Il est noter que la solution propose par lauteur de cette thse a t classe comme la meilleure
stratgie pour le diagnostic de dfauts applique au modle de rfrence de lolienne malgr
quelle ne traite pas les dfauts 6 et 7 dactionneurs. Car cette stratgie se caractrise par une
rapidit de dtection, une justesse de dcision sur les dfauts et un pourcentage quasi nul de
fausses alarmes.

III.5. Combinaison entre lapproche base sur SVM et un


observateur
Comme on vient de le voir, la dtection des dfauts 6 et 7 na pas pu tre faite uniquement par
SVM. Dans ce qui suit, une amlioration de cette stratgie est faite par la combinaison entre la
mthode de diagnostic base sur les donnes SVM et une mthode base sur le modle
observateur de type Kalman . Ceci permis de dtecter et disoler les dfauts dactionneurs 6
et 7.
159

Les valeurs wn

11.11 rad / s et ]

0.6 correspondent aux paramtres dun comportement

normal. Les dfauts dactionneurs 6 et 7 sont introduits par le changement des valeurs nominales
des paramtres du modle dactionneur wn et ] :
Dfaut 6 : wn 2

5.73 rad / s et ] 2

0.45 ou Dfaut 7 : wn3 3.42 rad / s et ] 3

0.9

La Figure III.19 illustre le schma de combinaison entre SVM et un observateur de type Kalman.
Lide est de crer une sorte de communication entre eux. Le bloc SVM FDI envoie
lobservateur 2 un signal qui surveille la prsence du dfaut 6 appel F6, et lobservateur 3 un
signal qui surveille la prsence du dfaut 7 appel F7. Dans ce travail, le rle des lobservateurs 2
et 3 est destimer en ligne les paramtres du modle, wn 2e et ] 2e de lactionneur 2 pour
lobservateur 2 et wn3e et ] 3e de lactionneur 3 pour lobservateur 3. Il faut savoir que pour
chaque actionneur on peut construire un observateur ddi lui.
Le signal de dfaut F6 (comme F7) est un signal binaire qui prend la valeur zro quand il ny a
pas le dfaut 6 et la valeur 1 ds loccurrence de ce dfaut. F6 est filtr avec un filtre passe-bas de
constante de temps W 2

10 s . Afin de diminuer un peu leffet de commutations brusques dans le

fonctionnement de lobservateur 2, lestimation de wn 2e et ] 2e est mise en marche ds que le


signal F6 filtr dpasse le seuil 0.02.
De la mme faon que F6, F7 est filtr avec un passe-bas de constante de temps T3=3s et
lestimation de wn3e et ] 3e commence ds que le signal F6 filtr dpasse le seuil 0.01.
Les estims wn 2e , ] 2e , wn3e et ] 3e sont aussi filtrs avec une constante de temps de 1s pour rejeter
les bruits de mesures ainsi que les perturbations.

160

Figure III.19 Schma de combinaison SVM et observateur

III.5.1. Conception de lobservateur de type Kalman


y
u

Em
Er

1
s
2]

.s  1
2
wn wn
2

1
avec a
a.s  b.s  1

1
,b
wn2

2]
et wn z 0
wn

(III. 15)

Daprs la fonction de transfert du 2me ordre de lactionneur :

a.E  b.E  E
b

F a

G H

Er E F.E  G.E  H .Er


2] .wn ]
1
a

F
2 G

wn2 wn

(III. 16)

Avec la condition que G z 0 . La construction de lobservateur se fait par le choix des tats
suivants : x1

E , x2 E et les tats augments x3

Le systme dtat scrira alors :

161

F , x4

H et X

x1, x2 , x3 , x4 T


x
2

x1 x2
 F .x2  G.x1  H .u
x3 0
x4 0

E r et y

Avec u

(III. 17)

On obtient le systme dtat suivant

0
0

X

0  x2
0 0
0

u  x1
X  B.u
0

A. X  B.u

(III. 18)

Lobservateur est donn comme suit

A(u ) X  G(u )  S 1C T CX  y

(III. 19)

T .S  A (u ) S  SA(u )  C C
T

La valeur du paramtre de rglage T qui dtermine la vitesse de convergence de lobservateur est


rgle 3. La matrice symtrique dfinie positive S de taille 4u 4 est initialise la matrice
identit. Ltat initial de lobservateur est dfini comme suit :
X0

0,0,2.] .w , w 0,0,13.33,123. 43
n

2 T
n

Cet observateur permet destimer en ligne les paramtres ]

x3e
, wn
2 x3e

x4e , sachant quils

sont observables en prsence de dynamique.

III.5.2. Lapproche base SVM pour la dtection/isolation de dfaut


actionneur sur le systme pitch
Pour la dtection de dfauts 6 (5a) et 7(5b), le vecteur dapprentissage utilis est :

E k , m1 (t j )  E k , m 2 (t j )

w g , m1 (t j  250.Te )  w g , m2 (t j  250.Te )

Er (t j )  E k , m1 (t j )

E r (t j )  E k , m2 (t j )

162

(III.20)

O k=1, 2, 3 correspond au numro de lactionneur de pitch. Pour le dfaut 6 (5a) qui affecte
lactionneur 2, j=2 et pour le dfaut 7 (5b), j=3. Er est langle de pitch de rfrence filtr
avec la fonction de

2me

wn2
ordre du modle actionneur pitch 2
. Lobjectif de ce
s  2] .wn .s  wn2

filtre est de prendre en considration les dynamiques du systme hydraulique pitch (actionneur)
de telle sorte avoir le comportement normal (sans dfaut) E aprs une commande E r . Il faut
prciser que le rle de ce filtre nest pas de rejeter les bruits de mesures ou les perturbations.
Ce terme w g , m1 (t j )  w g , m2 (ti ) est filtr avec un filtre passe-bas de constante de temps gal 1.5 s
pour enlever le bruit, et aussi retard de 2.5s (soit 250 Te) pour des raisons de synchronisation
avec les autres signaux caractristiques des dfauts 6 et 7.
La Figure III.20 montre que cette approche hybride permis non seulement de dtecter la
prsence du dfaut 6 qui apparat entre 3200s et 3300s sur lactionneur pitch 2 mais aussi de bien
estimer le changement de la valeur du coefficient damortissement.
La difficult lie la dtection du dfaut dactionneur 6 est due au fait quil nest pas possible de
le dtecter si la consigne E r est gale 0. Dans ce cas, on oblige lactionneur ne pas ragir. Ce
dfaut est dtect entre 3200.02 s et 3300.03 s mais avec des intermittences. Lutilisation dun
filtre passe bas permet de diminuer ces effets sur lestimation du coefficient damortissement qui
prend une valeur aux alentours de 0.45 comme prvu.
La Figure III.20 illustre galement la bonne estimation par lapproche du changement de la
pulsation naturelle vers une valeur proche de 6 rad/s. Il faut noter aussi labsence de fausses
alarmes.

163

Figure III.20 Dtection et isolation du dfaut 6 (5a) sur lactionneur2 et estimation du


coefficient damortissement ] 2e et de la pulsation naturelle wn 2 avec lobservateur
Dfaut 7 sur lactionneur 3
La Figure III.21 montre quavant lapparition du dfaut 7 sur lactionneur 3 linstant 3400 s, la
valeur du coefficient damortissement est fixe la valeur nominale (0.6). Aprs la dtection du
dfaut par lapproche MBSVM, le coefficient damortissement prend une valeur proche de 0.9
qui indique bien un dfaut de type 5b. On rappelle que le dfaut 7 est introduit progressivement
dune faon linaire sur 30 s (de 3400s jusqu 3430s). Il reste actif pendant 40 s (de 3430s
jusqu 3470s), puis il va diminuer lentement nouveau sur 30 s (de 3470s jusqu 3500s).
La dtection de ce dfaut est ralise
linstant 3411.49s. Elle nest pas trs rapide puisque les
'
symptmes de ce dfaut 7 apparaissent lentement sur les mesures. La Figure III.21 illustre la
bonne estimation par lapproche du changement de la pulsation naturelle vers une valeur proche
de 3.42 rad/s.

164

Figure III.21 Dtection et isolation du dfaut 7 (5b) sur lactionneur 3 et estimation du


coefficient damortissement ] 3e et de la pulsation naturelle wn3 avec lobservateur
La combinaison entre lapproche base sur SVM et un filtre de type Kalman a permis non
seulement de spcifier linstant dapparition du dfaut et lactionneur dfectueux mais aussi de
prciser de quel type de dfaut il sagit, cela par lestimation en ligne des paramtres wn et ] .
Ainsi, dans ce travail, toutes les exigences relatives la dtection et isolation des dfauts dans le
benchmark utilis ont t respectes. Les diffrents types de dfauts ont t dtects et isols
rapidement et avec une grande prcision, sauf celui du systme comme montr par le Tableau III.
5.

165

Tableau III. 5 Rsultats de dtection des dfauts

Dfaut

Le niveau de dfaut
dtecter

Dtection et
Nombre de
isolation du dfaut
Te

Nombre
de Te
exig

1a)

Valeur fixe 'E k ,mi

Oui

1b)

Offset (ou gain) sur


'E k ,mi

1.1 u E , ('E | 1)

Oui si 'E t 0.5

10 si
'E 1.5

2a)

Valeur fixe 'wr , mi

Oui

2b)

Offset (ou gain) 'wr , mi

0.1 u wr

Oui si t 0.2 u wr

67

3a)

Valeur fixe 'wg , mi

Oui

3b)

Offset (ou gain) 'wg , mi

Oui si t 0.1 u wr

4a)

Offset sur 'W g

'W g t 100

Oui

<5

5a)

Brusque 'Ek

'wn t 0.5, '] t 0.25

Oui si E r z 0

<8

5b)

Lent 'Ek

'wn t 0.25, '] t 0.5

Oui si E r z 0

149

<100

6)

Systme dentrainement,
'wr , 'wg

2835

libre

0.1u wg , (| 10 rad .s 1 )

Oui
'Kdt t 50%

'Kdt t 5%

si

<10

III.6. Conclusion
La stratgie de diagnostic de dfaut propose dans ce chapitre fait appel plusieurs disciplines
allant du traitement de signal, physique, apprentissage automatique, lectricit jusqu'
lautomatique. Les Sparateurs Vaste Marge sont utiliss pour apprendre un modle de
dcision capable de dtecter et d'isoler des dfauts de type capteurs, actionneurs et systme dans
une olienne. Dfinir le vecteur caractristique ainsi que le rglage des paramtres du modle
sont primordiaux afin de dtecter et d'isoler ces dfauts. Un compromis ralis manuellement
entre la sensibilit de la dtection au bruit et au dfaut doit tre dtermin.
Lobservateur de type Kalman a permis de cerner le type dfaut sur lactionneur systme pitch
par une estimation assez prcise du changement de la valeur du coefficient damortissement ainsi
que la pulsation naturelle.
Lapproche propose base sur SVM permet davoir une capacit de gnralisation intressante
mme avec un nombre rduit dchantillons dapprentissage, et aussi de manipuler facilement la
non linarit du systme olienne.
La comparaison entre diffrentes mthodes de diagnostic de dfauts nest pas toujours facile
raliser dans la littrature puisque certaines donnes disponibles pour certains chercheurs ne le
166

sont pas pour les autres. Donc le fait davoir une comptition internationale o tout le monde est
confront au mme problme avec les mmes donnes et aux mmes exigences respecter, me
permet de dire dune faon objective que mon approche a montr son efficacit et sa supriorit
dans la rsolution du problme de diagnostic de dfauts dans les oliennes par rapport dautres
mthodes utilises dans cette comptition.

167

168

CHAPITRE IV :
parfaitement agit

Racteur

169

chimique

170

Dans ce chapitre, la stratgie de diagnostic de dfaut propose dans cette thse est applique un
racteur chimique parfaitement agit. Mme si le modle de ce procd contient moins de
variables que le procd de traitement des eaux uses ou le systme olien, il peut nanmoins
tre trs non linaire dans certains cas ce qui rend le problme de diagnostic plus difficile. Pour
cette raison, de nombreuses mthodes de diagnostic ont t proposes pour ce systme qui ne
pourront pas toutes tre rapportes ici. La revue bibliographique suivante se limitera donc aux
applications de SVMs aux racteurs chimiques.

IV.1. Revue bibliographique


La recherche de nouvelles mthodes pour le diagnostic de pannes dans les installations
chimiques industrielles est ncessaire afin d'assurer la scurit des oprations, la conformit
environnementale et afin d'viter la rduction de la qualit du produit et de la productivit des
procds.
Seuls quelques articles de revues concernent l'utilisation des SVMs pour la dtection de dfauts
dans les applications chimiques, et ce principalement travers des tudes de simulation. Le cas
d'tude le plus gnralement trait est celui du Tennessee Eastman benchmark (Monroy et al.,
2010, Hsu et al., 2010, Mahadevan and Shah, 2009, Ylamos et al., 2009, Zhang, 2009, Zhang,
2008, Mao et al., 2007, Ylamos et al., 2007, Kulkarni et al., 2005, Chiang et al., 2004). Ce
procd non linaire (Downs and Vogel, 1993) permet de simuler des conditions de
fonctionnement normales ainsi que 21 situations de dfauts, et est assez reprsentatif des
racteurs chimiques, faisant ainsi intervenir un racteur agit, un condensateur, un compresseur,
un sparateur et un dcapeur . Peu d'autres applications des SVMs aux procds chimiques ou
biochimiques peuvent tre trouves. On peut cependant citer le traitement de minraux (Jemwa
and Aldrich, 2006), la production de pnicilline (Li et al., 2006), le racteur eau bouillante dans
une centrale nuclaire (Rocco S. and Zio, 2007), la distillation de butadine (Bo et al., 2010), un
racteur chimique parfaitement agit (Saludes Rodil and Fuente, 2010) et la prdiction de la
vitesse critique d'un flux de suspension solide-liquide (Lahiri and Ghanta, 2008). Dans la plupart
des travaux mentionns, les SVMs ont montr une supriorit dans la prcision et un effort rduit
de calcul par rapport d'autres techniques, telles que les rseaux de neurones. Ceci est cohrent
avec la thorie de SVM base sur la recherche de sparateurs entre les classes par minimisation
de risque structurel tandis que les rseaux de neurones sont bass sur la minimisation du risque
empirique (Ravikumar et al., 2008, Ge et al., 2004).

171

Bien que les travaux utilisant les SVMs pour le diagnostic de dfauts dans les procds
chimiques soient encore limits, ils montrent que les SVMs reprsentent une alternative
intressante aux approches bases sur les modles qui sont largement tudies dans ce domaine.
Lors de lapplication des SVMs aux racteurs chimiques, certains chercheurs ont trouv
ncessaire dadapter la mthode doptimisation, le choix de noyaux, le rglage des paramtres, le
prtraitement des donnes ou la mthode de classification (mono- ou multi-classe). Tout dabord,
la mthode SVM traditionnelle est un classificateur binaire qui ne peut diffrencier que deux
classes. (Ylamos et al., 2009) a utilis les mthodes one versus all pour gnraliser son
application au cas multi-classe tout en assurant un effort rduit de calcul. Comme dcrit dans le
chapitre II, cette mthode ncessite k classificateurs pour k classes. De mme, (Chiang et al.,
2004) ont utilis la mthode one versus one qui exige k(k-1)/2 classificateurs qui est trs
lev, rduisant donc la vitesse dapprentissage et de test. Enfin, (Yuan and Chu, 2006) a utilis
la mthode one to others qui ncessite seulement (k-1) classificateurs. En contraste avec le
cas multi-classe, le cas mono-classe a t utilis (Mahadevan and Shah, 2009) pour la dtection
de dfauts dans l'industrie chimique. Un deuxime paramtre qui peut affecter le temps de calcul
est la stratgie d'optimisation sous contrainte quadratique ncessaire pour lapprentissage dun
grand nombre de donnes. Diffrentes techniques d'optimisation ont t utilises pour rsoudre le
critre d'optimisation des SVMs dans les procds chimiques. Parmi ces algorithmes se trouvent
les multiplicateurs de Lagrange, particle swarm optimisation (Tang et al., 2010, Wu, 2010,
Samanta and Nataraj, 2009), les algorithmes d'optimisation squentielle (Davy et al., 2006) et les
algorithmes gntiques (Zeng et al., 2006). Dans (Saravanan et al., 2010) , le critre de SVM a
t modifi pour optimiser le temps de calcul. Une variante nomme proximal SVM t
utilise pour dtecter les dfauts dans une bote vitesse. L'algorithme d'optimisation peut
galement tre utilis pour le rglage des paramtres. Parmi les techniques utilises pour le
rglage des paramtres de SVM pour le diagnostic des pannes dans les procds chimiques
apparaissent la validation croise, lvolution diffrentielle (Lahiri and Ghanta, 2008), The
artificial immune algorithm (Yuan and Chu, 2006) ou encore des algorithmes gntiques (Fei
and Zhang, 2009, Kulkarni et al., 2004) . En plus du rglage des paramtres, le choix du noyau
est galement dterminant dans SVM car il doit dcrire la relation entre les entres et les sorties
(linaire / non linaire). Enfin, la combinaison de SVM avec des outils bass sur les donnes
dans lobjectif de pr traitement des donnes sest avr utile afin de dcorrler les variables et
de les projeter dans un espace infrieur en dimensions avec une variance maximale. Les
principales mthodes statistiques qui ont t combines aux SVMs pour le prtraitement des

172

donnes sont ACP, ACP noyau, lanalyse en composantes indpendantes avec et sans noyau
(Hsu et al., 2010, Monroy et al., 2010, Widodo et al., 2009, Zhang, 2008).
Alors que l'attention des recherches a t axe principalement sur la dtection et l'isolement de
dfaut, moins d'effort de recherche a t consacr l'identification des dfauts l'aide des SVMs.
Cependant, l'identification des dfauts pourrait tre d'une grande utilit pour la reconfiguration
de la commande. En effet, les drives dans les capteurs peuvent tre corriges par le logiciel si le
niveau de la drive est connu. En outre, si un actionneur est partiellement dfectueux, il peut
encore tre utilis dans le systme de contrle si le niveau de la drive est valu. Cela
reprsente une des principales contributions de ce chapitre. Les diffrentes tapes de dtection,
isolement et didentification des dfauts sont ralises par SVM.
La deuxime contribution dans cette application consiste en la combinaison de la mthode SVM
avec un observateur grand gain pour la dtection et lisolation de dfaut dans une partie du
procd o la performance des SVMs a t limite. Il sagit des erreurs de capteurs dans le
milieu ractionnel qui est le plus influenc par la non-linarit du procd.
D cette non-linarit, afin de garantir des rsultats acceptables par SVM, lapprentissage doit
contenir un grand nombre de donnes dans des conditions varies. Dans labsence de ce grand
nombre de donnes, un modle de cette partie de systme peut aider au diagnostic de dfaut sil
est coupl aux SVMs. Lide propose est la suivante : Les SVMs sont utiliss en premier lieu
pour le diagnostic de tous les dfauts dans le racteur chimique. L o cette mthode montre des
faiblesses avec le jeu de donnes dapprentissage choisi par dfaut, un observateur est ajout afin
de rendre le diagnostic plus robuste.
Ce chapitre est organis comme suit : Tout dabord, le procd considr est prsent ainsi que
son modle. Dans un deuxime temps, lapplication des SVMs au diagnostic des diffrents
dfauts est considre. Ensuite, un observateur est dvelopp pour une partie du systme. La
mthodologie est value en premier par simulation puis exprimentalement sur un racteur de
polymrisation l'chelle du laboratoire. Ensuite, des donnes dun racteur de polymrisation
pilote de 250 L sont utilises pour valider les dfauts de capteurs dans le milieu ractionnel, ce
qui semblait tre la difficult principale. Le chapitre est termin par des conclusions partielles.

173

IV.2. Prsentation du systme


IV.2.1. Le procd
Deux racteurs chimiques parfaitement agits double enveloppe (Stirred Tank Reactor), ont t
utiliss : un racteur dun litre, l'chelle du laboratoire (Pignat ) et un racteur pilote de 250
litres (de la socit Arkema (Guinot et al., 2000)). Le systme de chauffe/refroidissement
(heating/cooling HC) utilis pour chauffer la double enveloppe est un bain d'huile thermostat
dans le racteur de laboratoire (Figure IV.1) et de la vapeur d'eau dans le racteur pilote.

Figure IV.1 Schma simplifi du racteur parfaitement agit du laboratoire (Tr1, Tr2, Tj1,
Tj2 et THC sont des sondes de temprature P1, P2, P3 et P4 sont des pompes)
Le racteur est quip de deux sondes de temprature dans le racteur (not Tr1 et Tr2), une
sonde de temprature dans le bain thermostat (THC), une sonde de mesure de la temprature
d'alimentation (Tfeed), une sonde de mesure de la temprature dentre de la double enveloppe
(Tjin) et une pour la sortie de la double enveloppe (Tjout). Le mlange d'alimentation est mis sur
174

une balance pour valuer la masse pompe et calculer le dbit d'alimentation prcisment (Ffeed).
La vitesse de rotation de lagitateur est mesure et utilise pour contrler le couple agitateur. Les
programmes de modle, de contrle et SVM sont dvelopps en utilisant Matlab/Simulink
combine des algorithmes de SVM de (Canu et al., 2005). Des rgulateurs PID locaux
permettent de contrler la temprature du bain thermostat (HC : heating/cooling), le dbit
d'alimentation et la rotation de lagitateur. La temprature du racteur est contrle en utilisant
une commande non linaire par linarisation entre/ sortie (Sheibat-Othman et al., 2011, SheibatOthman and Othman, 2006).
Les dfauts de capteurs considrs ici sont : TR1, TR2, Tjin, Tjout, THC, et le dfaut d'actionneur
consiste principalement en la capacit du bain thermostat chauffer ou refroidir (HC). Les
autres capteurs (balance, couple de lagitateur) ou actionneurs (couple de lagitateur, pompes
dintroduction dans le racteur et dans la double enveloppe) ne sont pas considrs.
Les mesures de procds utiliss dans la suite sont donc : y = [Tr1, Tr2, Tjin, Tjout, THC, Tfeed, Ffeed],
obtenues avec une frquence de 10 s.

IV.2.2. Le modle
Le modle considr pour la simulation se base sur le bilan de matire et de chaleur dun
racteur semi-continu parfaitement agit (valable pour les cas du racteur du laboratoire et du
racteur pilote) :

MCPTr Qr  UA T jout  Tr  F feed CPfeed T feed  Tr  Qlr


Qj

M C T out F C (T in  T out )  UA(T out  T )  Q


j Pj
j
j
j
r
lj
j Pj j

(IV.1)

O Tr, est la temprature moyenne dans le milieu ractionnel, U est le coefficient de transfert de
chaleur et A la surface de transfert de chaleur entre le racteur et la double enveloppe. M est la
masse totale du milieu ractionnel. CP, CPfeed et CPj sont les capacits thermiques du milieu
ractionnel, de l'alimentation et de lhuile caloporteuse. Qlr est la perte de chaleur du racteur
principalement par le condenseur et Qlj la perte de chaleur de la double enveloppe. Fj est le dbit
massique dans la double enveloppe. La chaleur produite par la raction est proportionnelle la
vitesse de raction (RP), o (-'H) est l'enthalpie de raction. Qr

 'H u R p

La polymrisation en mulsion de styrne est considre pour la validation exprimentale dans le


racteur de laboratoire, et un mlange de 3 monomres est considr dans le racteur pilote.
175

IV.3. Implmentation du diagnostic de dfauts


Ce chapitre prsente deux contributions originales :
-

La combinaison de la mthode SVM avec une mthode base sur le modle pour le
diagnostic de dfaut, sans avoir modliser tout le procd en dtail.

Lutilisation de SVM rgression (SVR) pour lidentification du niveau du dfaut.

IV.3.1 Implmentation des SVMs


La classification bi-classe de SVM est considre, afin de distinguer une situation normale dune
situation dfectueuse pour chacun des dfauts considrs.
J'ai essay dobtenir des mesures relles du procd dans des situations saines et dfectueuses
chaque fois que ctait possible. Dans le cas o les mesures ne sont pas utilises pour la
commande, un simple ajout du dfaut sur la mesure est ralis hors ligne dans le logiciel. Dans le
cas o la mesure est utilise pour la commande ou bien dans le cas de dfaut dactionneur, le
dfaut est introduit de manire logicielle mais en ligne afin de mesurer ses effets sur les autres
mesures.
La mthode SVM peut tre directement applique ces donnes y, ou ventuellement aprs
filtrage, normalisation, drivation ou en considrant un horizon de temps. Gnralement, il est
ncessaire de discerner les variables ou combinaisons de variables affectes par la faute afin
d'accrotre leur identifiabilit. Dans cette application, l'utilisation de la mthode Analyse en
composante principale (ACP) ou Partial least square PLS pour la rduction de la dimension
n'a pas t intressante : La pr-utilisation de lACP a dgrad les estimations et la PLS tait
presque quivalente aux SVMs, mais avec un temps de calcul plus important et des performances
moindres dans certains cas. Par consquent, le vecteur x est obtenu en slectionnant les lments
les plus reprsentatifs pour chaque faute en se basant sur un certain savoir-faire du racteur
donn dans le tableau IV.1 . Par exemple, le premier lment xi pour les fautes de Tr permet la
dtection de dfaut et les autres sont destins lisolation de dfaut. En ce qui concerne le
systme HC, on remarque quune faute loigne THC anormalement de Tjd. Cependant, on
remarque que les rsidus des capteurs Tjin, Tjout et THC sont corrls. Cette corrlation peut tre
dcouple par l'application d'une dcision logique, comme le suggre le tableau IV.2 pour isoler
le capteur dfectueux.

176

Tableau IV.1 Vecteurs dentrs SVM (xi), (i est linstant de temps)


Capteur/

Tjx
THC

actionneur

Tr1, Tr2

HC

(x=in, out)

Tr1 (i)  Tr 2 (i)


xi

Tjx (i)  THC (i)

Tjin (i)  Tjout (i)


in
j

T (i)  THC (i)

Tr1 (i)  Tj (i)


Tr 2 (i)  Tj (i)

Tjd (i)  THC (i)

Tr1 (i)  Tj (i  5)
Tr 2 (i)  Tj (i  5)

En utilisant des collections des donnes avec situations normales et dfectueuses pour chaque
type de dfaut, et en utilisant certaines valeurs initiales de C et V, nous pouvons identifier les
multiplicateurs de Lagranges Di, le biais b et les vecteurs de support xsup. Le rglage de C et V
sest fait par l'optimisation et validation croise. La comparaison du noyau gaussien et le noyau
polynmial de diffrents degrs a montr une meilleure gnralisation avec le noyau gaussien.
Pour le rglage des paramtres, (Cherkassky and Ma, 2004) ont propos une relation pour
calculer V partir des donnes dapprentissage comme suit: V=(0,2-0,5)uplage(x). Cette relation
donne des valeurs de V lgrement infrieures celles optimises dans ce travail soit
manuellement soit par validation croise.
La fonction de dcision peut alors tre value pour des nouvelles donnes x. Le seuil du rsidu
est fix 0,1 pour toutes les situations (en thorie, il peut tre = 0), ce qui signifie que la
situation est estime normale si la valeur rsiduelle est infrieure |+/- 0,1|. Les rsultats de
l'optimisation ont donn nsv = 30%, 6%, 42% et 57% de N pour THC, Tj, Tr et HC
respectivement, avec N = 810. Cette rduction systmatique de la taille des donnes rduit le
temps de calcul en ligne de manire importante (<5u10-3s pour tous les rsidus), ce qui
reprsente un avantage des SVMs par rapport aux autres mthodes statistiques. La valeur de Tj
(et Tr) est calcule par (Tjin+Tjout)/2 en l'absence de dfaut. En prsence de dfaut, Tj prend la
valeur de la sonde non dfectueuse.

177

Tableau IV.2 Correspondance entre rsidu de la temprature de la double enveloppe et du


bain thermost (R=rsidu)
R Tjin
Fault Tjin

R Tjout

Fault Tjout
Fault THC

R THC

u
u

IV.3.2 Implmentation de lobservateur de grand gain


La non-linarit principale dans ce systme est due la vitesse de la raction qui affecte
directement les capteurs Tr1 et Tr2. Pour cette raison, lapprentissage SVM doit contenir un
nombre important de donnes dans des situations varies afin de garantir des bons rsultats. Afin
d'amliorer le diagnostic de cette partie sans avoir enrichir les donnes dapprentissage de
manire importante, un observateur de Tr est utilis.
On note que les mesures Tr1 et Tr2 ne doivent pas tre utilises dans la conception d'observateur
puisqu'elles sont susceptibles de subir le dfaut que nous cherchons dtecter et isoler. Pour ce
faire, nous ne considrons que les mesures Tjin et Tjout et en estime Tr. Ensuite, nous considrons
le systme augment suivant o H1 reprsente un certain manque de connaissances de la
dynamique du bilan thermique de la double enveloppe (la dynamique de Tjout) et H2 reprsente la
dynamique de Tr suppose inconnue :

Tjout

Tr

UA out
T
1
M j C Pj j 
T
M j C Pj
0 r

F j C Pj (T jin  T jout )  UATjout  Qlj H 1




0
H 2

(IV.2)

y T jout
Nous pouvons voir que Tr est observable partir du systme (IV.2) car la forme du systme
respecte la forme de systme de (IV.1), si H1 est connu. Dans ce cas, l'observateur donn par le
systme peut tre utilis pour estimer Tr comme suit :

178

T out
j
T
r

UA out
T
1
M jC Pj j 
T
M jC Pj
0 r

FjC Pj (Tjin  T jout )  UAT jout  Q lj 2T out out

 M jC Pj T2 Tj  Tj

UA

(IV.3)

Cependant, le paramtre H1 n'est pas connu, par exemple en raison d'un manque de connaissance
de U, A, Qlj, Fj, Mj ou CPJ. L'objectif de ce travail est de proposer une mthodologie pour le
diagnostic qui peut tre applique rapidement sans tape de modlisation. Afin de rendre
l'observateur robuste ces incertitudes, le modle de base qui reprsente le bilan thermique de la
double enveloppe doit tre corrig en ligne bas sur les mesures de Tr1 et Tr2 dans des situations
normales, c'est dire quand il n'y a pas de dfaut (qui peut tre dtermin par SVM). La
correction du modle est effectue en introduisant un filtre du premier ordre sur Tr ( appliquer
en l'absence de dfaut) :

~
Tr

~
T T
TTr r1 r 2  Tr

(IV.4)

~
~
Tr est une valeur filtre de Tr et TTr est un paramtre de filtrage. Tr permet de calculer un
~
paramtre de correction du modle G Tr  Tr . Ensuite, l'estimation Tr est obtenue par

l'observateur (IV.3). Cette estime peut tre utilise pour isoler la sonde dfectueuse mme en
prsence d'erreurs de modlisation importantes en utilisant les rsidus suivants :

RTr 1

Tr1  Tr  G , RTr 2

Tr 2  Tr  G

On note que dans l'absence de faute l'quation (IV.5) se rduit RTri

(IV.5)

~
Tri  Tr , mais en

prsence de dfaut G est une constante. Le schma global de la dtection et isolation des dfauts
utilise dans ce chapitre est donne dans la Figure IV.2 .

179

Figure IV.2 Schma de diagnostic de dfauts par SVM en ligne

IV.3.3. Rsultats et discussion


L'objectif des scnarios considrs ici est de dmontrer la robustesse de la mthode SVM pour le
diagnostic dans la plupart des parties du procd et sa mise en uvre rapide. Puis nous montrons
la supriorit de la mthode couplant les SVMs une mthode base sur le modle dans une
partie qui subit une forte non-linarit du procd.

IV.3.3.1. Dfaut de capteur dans Tjin


La Figure IV.3 montre une validation exprimentale du modle obtenu dans le cas d'apparition
du dfaut dans les capteurs de Tj. Une drive croissante dans Tjin a commenc 55min. Elle a pu
tre dtect et isol 87 min lorsque le niveau de drive atteint 0,8C (seuil = 0,1). Notez que les
rsidus des autres actionneurs et capteurs ne sont pas affects par la faute. La sonde de Tj
estime normale est correcte tout le temps. Bas sur 4000 chantillons de validation, le
pourcentage de fausses alarmes a t estim trs faible pour Tjin, Tjout et de THC (0,6%) et tous
les dfauts avec 'T>2C ont pu tre dtects. En outre, les modles SVM obtenus (les fonctions
de dcision) taient valables pour une grande variabilit dans les conditions de fonctionnement
du procd.
180

Tempratures

74
73

drive dans Tj in

72

(C)

71

70
69
68

Tj in
Tj out
Tj correcte
Tr

67
66

65
0

30

60
90
Temps (min)

120

Rsidues

2
1.5
1
0.5
0
-0.5
-1
-1.5
-2
-2.5
-3

Dfaut de Tjin(C)
R HC (actionneur)
R Tj in
R Tj out
R THC
R Tr1
R Tr2

30

60
90
Temps (min)

120

Figure IV.3 Drive dans Tj,in 55min

IV.3.3.2 Dfaut dans THC


x

Rglage de la variance :

Lapprentissage des dfauts de THC est un bon exemple pour illustrer l'effet de rglage des
paramtres sur les hyperplans car xi est de dimension 2. La Figure IV.4 montre les hyperplans
sparatifs obtenus en utilisant diffrentes valeurs pour la variance de la fonction noyau V= 4, 20.
On peut observer quune grande valeur de V conduit a une sparation presque linaire. En outre,
la largeur de la marge augmente avec des valeurs leves de V, ce qui conduit un plus grand
nombre de vecteurs de support. En consquence, des valeurs leves de V sont connues pour
donner une gnralisation amliore, mais les trs hautes valeurs de V pourraient ne pas
correspondre aux donnes dapprentissage du tout. De lautre ct, des petites valeurs de V sont
connues pour s'adapter parfaitement aux donnes d'apprentissage mais peuvent ne pas tre en
mesure d'valuer des nouvelles donnes (surapprentissage, capacit rduite de la gnralisation).

181

Figure IV.4 Classification des dfauts de THC. Effet de V (variance du noyau gaussien) sur
les hyperplans optimaux (avec C=100)
Afin d'illustrer l'effet de V dans le cas de dtection de dfaut, les fonctions de dcision obtenues
avec diffrentes valeurs de V ont t values par simulation. La Figure IV.5 gauche montre
qu'une faute se produit en THC 66 min. Comme THC est utilis dans un rgulateur PID local du
systme de HC, un refroidissement rapide est effectu pour ramener THC vers Tjd afin de
maintenir Trd = 70C. En consquence, Tr s'carte de la consigne pendant environ 15 min. En
raison de la prsence dune intgrale dans le contrleur de Tr, Tjd change de manire ramener
Tr Trd mme en prsence de dfaut dans THC. Un rgulateur proportionnel seul ne serait pas en
mesure de compenser ce dfaut. Par consquent, le systme de contrle est robuste des dfauts
dans cette sonde, mais ncessite une dtection efficace dans la sonde de temprature de la
raction, qui sera examin dans la section suivante. On note que mme si le dfaut dans THC est
brutal, il n'est pas vident dtecter visuellement par l'oprateur car il apparat comme une
perturbation ponctuelle, ce qui justifie l'utilisation des SVMs.
La Figure IV.5 droite montre que le dfaut est instantanment dtect par les deux fonctions de
dcision (avec V = 4 et V = 20). L'amplitude du rsidu est plus leve avec V = 4. Le seuil peut
tre fix 0,1 (en thorie, il peut tre 0) ce qui signifie que la situation est estime normale si la
valeur du rsidu est infrieure |+/-0,1|). On remarque quune faible valeur de V conduit des
fausses alarmes. Les fausses alarmes ont eu lieu avec les deux fonctions au dbut de la raction
due la vitesse de raction leve dans cette priode. En guise de compromis, V a t fix 10.
En utilisant la relation propose par (Cherkassky and Ma, 2004), V=(0,2-0,5)uplage(x), et avec la
182

normalisation zscore x  moyenne(x) , la gamme de x est d'environ [8-10] en l'absence de dfaut,


cart type( x )

ce qui donne V|2-5. On rappelle que les valeurs de V optimises dans ce travail sont en gnral
lgrement suprieures celles proposes par (Cherkassky and Ma, 2004).

Tempratures (simulation)

74
73

Rsidus THC (simulation)

12
10

72
71

sigma=4
sigma=20
niveau du dfaut

(C)

70

69
68

4
THC
Tr
Tj

67
66

65
0

30

dbut de dfaut

60
90
120
Temps (min)

2
0

150

30

60
90
120
Temps (min)

150

Figure IV.5 Cas dtude par simulation (avec C=100) et diffrentes valeurs de V:
Occurrence de dfaut dans THC (objective de commande Trd=70C)
x

Rglage de C :

En ce qui concerne le paramtre C qui borne les multiplicateurs de Lagrange, il permet de crer
un compromis entre la pnalisation dune mauvaise classification et la minimisation de la
complexit de fonction. La Figure IV.6 montre que l'augmentation de la valeur de C permet de
rduire la largeur du tube (similaire la diminution de V), ce qui diminue le nombre de vecteurs
de support. Ceci est suppos jusqu' une certaine limite amliorer les rsultats des estimations.
Toutefois, cela pourrait rduire la capacit de gnralisation. On note aussi que le changement de
l'un des paramtres de rglage conduit xsup et D diffrents. Augmenter C pourrait conduire
une augmentation de la dimension de xsup ce qui augmente le temps de calcul en ligne et pourrait
rduire la capacit de gnralisation. Cette consquence n'est cependant pas systmatique.
De plus le vecteur xsup obtenu dpend de la marge et des points de donnes passant prs de la
fonction dans une configuration spcifique du problme d'optimisation. En guise de compromis,
dans cette application, C a t fix 100.

183

Hyperplans optimaux (C=10)


hyperplan optimal
hyperplan dfaut
hyperplan normal

Hyperplans sparatifs (C=1000)

Normaux
Dfectueux
Xsup

hyperplan optimal
hyperplan dfaut
hyperplan normal

X2

X2

Normaux
dfectueux
Xsup

-1

-1
-1

1
x1

-1

1
x1

Figure IV.6 Classification des defaults de THC. Effet de C (paramtre de rgularisation)


sur les hyperplans optimaux (avec V=10)

IV.3.3.3. Dfaut dactionneur dans HC


En ce qui concerne les dfauts d'actionneurs (systme HC), ils sont dus diffrentes raisons :
pompes, rsistance thermique ou systme de contrle, logiciel. Certains dfauts sont compenss
par le rgulateur PID local et ne donnent aucune incidence sur les mesures de processus. Seuls
les dfauts qui conduisent lloignement de THC de la consigne peuvent tre dtects et isols.
La Figure IV.7 montre une exprience relle o les paramtres du PID du systme HC ont t
changs environ 20 min. Cela a provoqu une lgre drive THC de Tjd. Lorsque l'impact de
dfaut conduit Tjd - THC = 2,4C, le rsidu de l'actionneur traverse 0,1 ( Tjd - THC = 1,8C, le
rsidu travers 0). Les rsidus des sondes THC, Tjin et Tjout sont rests gaux zro.

184

Tempratures

(C)

74
72

0.2

70

68

-0.2

66

-0.4
Tr

64

R HC (Actionneur)

R Tjin
R Tjout
R THC

-0.6

Tjd

62

Rsidus

0.4

-0.8

THC

-1

60
0

10 15 20
Temps (min)

25

30

10 15 20
Temps (min)

25

30

Figure IV.7 Dfaut dans le systme de chauffe/refroidissement (HC : un actionneur) en


changeant les paramtres du PID afin dcarter THC de Tjd (Tjd=70C)

IV.3.3.4. Dfaut de capteur dans Tr lchelle de laboratoire


Dans ce scnario, nous utilisons la fois la mthode SVM et lobservateur grand gain pour la
dtection et lisolation de dfaut en raison de la non-linarit leve et de la variabilit du
comportement lintrieur du racteur. Afin d'appliquer l'observateur, certains paramtres du
modle sont ncessaires (voir quation IV.1). Beaucoup d'entre eux sont connus dans le racteur
de laboratoire (ex. A, Mj, Cpj, Fj). Le principal paramtre inconnu lchelle du laboratoire est la
perte de chaleur de la double enveloppe l'environnement Qlj qui dpend de la diffrence entre
la temprature de la double enveloppe et la temprature ambiante, qui varie. Le coefficient de
transfert de chaleur la double enveloppe peut galement varier au cours de la raction d
l'encrassement de la paroi. Des approximations constantes de ces paramtres sont utilises dans
le modle (obtenues par calibration).
La Figure IV.8 montre une valuation exprimentale des deux mthodes dans le racteur du
laboratoire. Une drive a t introduite artificiellement aux mesures relles de Tr1 33 min. Le
dfaut est dtect par SVM 75 min, mais est identifi comme un dfaut Tr2. Le cas est dtect
et isol correctement par l'observateur 88 min (seuil = 1). La mthode SVM a pu dtecter et
correctement isoler le dfaut dans d'autres scnarios, mais la robustesse de l'observateur tait
toujours plus leve. On rappelle que la mthode SVM est utilise pour la dtection de dfaut et
que cette information est ncessaire pour la correction du modle dans lobservateur. D'aprs les
rsultats de cette section, on peut conclure que l'application d'une mthode statistique ncessite
l'utilisation de donnes exhaustives pour l'apprentissage en raison de la grande vitesse de
185

raction et de la variation de la dynamique du procd. L'utilisation d'un modle du procd


simplifi peut renforcer l'isolation de dfauts, qui est faite l'aide dun observateur. L'utilisation
des SVMs devrait toutefois rester le premier choix, car ils sont faciles mettre en uvre et
capables de dtecter la plupart des dfauts de capteurs et dactionneurs presque instantanment
avec peu de donnes d'apprentissage.
Tr

72

dfaut dans Tr1(C)


R Tr1 (observateur)
R Tr2 (observateur)
R Tr1 (SVM)
R Tr2 (SVM)

71

70

69
(C)

Rsidus de Tr

68

Tr1
Tr2
Tr saine (SVM)
Tr saine (observer)

67
66

-1

-2
-3

65
0

30

60

90

120

-4
0

30

Temps (min)

60
90
Temps (min)

120

Figure IV.8 Drive dans Tr1 33 min dans le racteur du laboratoire

IV.3.3.5. Dfaut de capteur dans Tr lchelle de pilote


Pour le racteur pilote de 250 L, les diffrences entre Tr1 et Tr2 sont leves (environ 4C ltat
stationnaire) en raison du volume plus grand du racteur. Ceci rend la dtection de dfaut plus
difficile qu lchelle du laboratoire. On note que l'une des sondes est place proximit de
l'agitateur et une autre au fond du racteur, plus proche de la paroi. Les deux sondes sont
ncessaires pour valuer l'homognit du racteur, ce qui donne des informations indirectes sur
la coagulation de latex sur l'agitateur ou sur la paroi du racteur. Afin d'appliquer l'observateur
dans ce systme, des paramtres approximatifs sont utiliss par simple extrapolation
approximative du racteur du laboratoire. Bien videmment, ces paramtres sont faux, mais
justement, la mthode doit y faire face. Pour les autres capteurs et actionneurs, seule la mthode
SVM doit tre utilise, ce qui vite la modlisation du procd en entier. Notez que la mthode
destimation est en partie base sur la classification SVM pour la correction du modle en
l'absence de faute.

186

Tempratures

100
95
90
85
80
75
70
65
60
55
50

Rsidus de Tr

20

R Tr1 (observateur)
R Tr2 (observateur)
R Tr1 (SVM)
R Tr2 (SVM)

15

(C)

10
5
Tr1
Tr2
Tj in
Tj out
0

50

100
150
Temps (min)

-5
200

50

100
150
Time (min)

200

Figure IV.9 Erreur de calibration de -5C est considre dans la sonde Tr2 dans le
racteur pilote de 250 L

La Figure IV.9 montre les rsultats obtenus par les deux mthodes dans le racteur pilote au
cours d'une raction typique de copolymrisation en semi-continu. Une erreur de calibration de 5C est considre dans Tr2. Une telle erreur ne peut pas tre dtecte par lanalyse visuelle des
courbes de temprature o une multitude de situations est possible. En effet, la dynamique de la
raction varie surtout pendant les premires minutes et la diffrence entre Tr1 et Tr2 n'est pas
constante dans toutes les expriences. Les oscillations dans ce scnario sont dues au systme de
contrle, non trait dans ce projet. L'observateur parvient dtecter et isoler lerreur statique
instantanment. Le seuil de dtection dans le racteur pilote est fix environ 4. Le rsidu de Tr1
obtenu par l'observateur est infrieur au seuil. La mthode SVM parvient dtecter le dfaut
rapidement, mais elle ne parvient pas lisoler tout le temps car les rsidus de Tr1 et Tr2 oscillent.
Une plus grande confiance peut donc tre attribue l'observateur. Notez que dans un tel
scnario, la correction du modle n'a pas lieu car une erreur est dtecte pendant toute
l'exprience. La correction du modle de correction n'a lieu que dans des situations normales, par
exemple dans les premires minutes du scnario prcdent (Figure IV.9).

187

Rsidu de Tr par l'observateur

20

Rsidus de Tr par SVM

15

rsidu Tr2
rsidu Tr1
dfaut de Tr1
dfaut de Tr2

8
3

(C)

(C)

10

0
rsidu Tr2
rsidu Tr1
dfaut de Tr1
dfaut de Tr2

-5
-10

-2
-7

-12

-15
0

20

40
60
Temps (min)

80

20

40
60
Temps (min)

80

Figure IV.10 Une valuation exprimentale de la mthode SVM et de lobservateur dans


un racteur pilote de 250 L
La Figure IV.10 montre les rsultats obtenus dans un second scnario par les deux mthodes
dans le racteur pilote. Un dfaut de niveau 10 est introduit dans ce cas dans Tr1 8 min (de
manire artificielle) et un dfaut de niveau -12C dans Tr2 64 min. La mthode base sur
lobservateur parvient dtecter et isoler les deux dfauts. La mthode SVM parvient dtecter
et d'isoler la deuxime panne dans Tr2. Mais elle a un retard dans la dtection du premier dfaut,
et provoque quelques fausses alarmes au cours des premires minutes de la raction si le seuil est
fix 0. On note que le premier dfaut a lieu pendant de fortes variations de la dynamique du
procd comme le montrent les variations dans les tempratures du racteur (Figure IV.11).
Tempratures

100

Tr1
Tr2
Tj in
Tj out

95

(C)

90

85
80

75
70
0

50
100
Temps (min)

150

Figure IV.11 Evolution des tempratures dans le racteur pilote sans dfaut

188

IV.4. Implmentation de SVR


Pendant la phase de chauffage du racteur, le modle de procd (q. IV.1) est rduit un
modle linaire (Qr = 0 et U est suppos constant sur la plage de temprature considre). Cette
phase peut tre utilise pour des finalits de calibration :
-

des sondes de tempratures, o des drives peuvent avoir lieu dans le temps.

du coefficient dchange thermique U, qui peut voluer au cours du temps d


lencrassement du racteur.

Des drives lgres dans les tempratures du racteur (Tr1 et Tr2) peuvent tre dtectes rien
qu'en examinant la diffrence entre les deux mesures. Cependant, isoler la sonde dfectueuse
reste difficile et ncessite lutilisation dune mthode de classification. Au lieu dappliquer
dabord une mthode de classification qui isole la sonde dfectueuse et densuite appliquer une
analyse des donnes afin didentifier le niveau du dfaut, nous proposons dutiliser la mthode
de rgression SVR directement. La dtection du niveau de la drive peut servir la correction de
la sonde avant la raction.
L'estimation du coefficient dchange de chaleur entre le racteur et la double enveloppe (U) est
essentielle pour le suivi contrle de la raction. On utilisera la mthode SVR et on comparera les
rsultats ceux obtenus avec un observateur grand gain. La mesure saine de Tr sera utilise en
cas de dfaut dans lune des sondes Tr1 ou Tr2.
Rgression SVM : identification (pendant la priode de
chauffe du racteur

d
r

+
-

Contrle
linaire

d
j

Tr  Tj

Tr (i)  Tr (i  1)

Tr1  Tr 2

Tr1  Tj
T  T
j
r2

Procd

Tr

Tr1
T
r2
Tjin
out
Tj
THC

Estimation
of U

Estimation
of 'Tr

Tr
'Tr

Figure IV.12 Schma de SVR pour lestimation de U et lidentification de niveaux de


dfauts pendant la priode la chauffe du racteur

189

IV.4.1. Identification d'une drive de temprature par rgression SVM


La rgression SVM (SVR) est utilise pour la dtection, l'isolation et l'identification du niveau de
dfaut dans les sondes de tempratures Tr1 et Tr2 dans le racteur. L'algorithme employ
(apprentissage et validation) peut tre rsum comme suit :
-

Recueillir des donnes relles (y) des diffrents capteurs au cours de deux priodes de
chauffe du racteur (30 min de chauffage de chaque priode d'chantillonnage avec Te=
10 s),

La premire exprience est utilise telle quelle et la seconde est artificiellement modifie
en ajoutant diverses 'Tr1 (de +/-1 +/-4C) diffrents moments au cours d'une phase de
chauffage. Les dfauts simultans dans Tr1 et Tr2 ne sont pas considrs. Cela a donn 50
points de donnes dans une situation dfectueuse pour Tr1 et 310 points de donnes
normales. Le modle de Tr1 sera utilis galement pour Tr2, donc il ny a pas
dapprentissage ncessaire pour Tr2. Les donnes nont pas t normes dans le cas de la
rgression des dfauts de Tr et de lestimation de U.

Le vecteur suivant est utilise comme entre pour le dveloppement du modle SVM car
le premier terme donne des informations sur le niveau de la drive (pour la dtection et
l'identification) et le second terme est utile pour l'isolement (la taille de x=360) :

xi
-

r1

(i)  Tr 2 (i) Tr1 (i)  T j (i) Tr 2 (i)  T j (i)

Le dveloppement du modle (ou de la fonction de dcision) pour l'identification du


niveau de dfaut est ensuite ralis en utilisant la mthode SVR. Cela se fait par
l'optimisation de l'quation (IV.6) qui donne les paramtres Di, b et les vecteurs de
support (xsup) pour un rglage donn de C, V, choix du noyau et les paramtres du noyau.
On note que dans le cas de la rgression, il faut galement rgler la largeur du tube H (par
rapport au cas de la classification).

Le modle obtenu est ensuite valu dans des situations nouvelles par simulation. Pour ce
faire, de nouveaux vecteurs x sont introduits dans le noyau slectionn, puis le rsidu
(donnant ici le niveau de dfaut) est calcul partir de Di, b et xsup en utilisant
l'quation(IV.6). En utilisant le noyau gaussien, la fonction de dcision pour des
nouvelles mesures x temps t est donne par :

190

f x

n sp

D
i 1


i

 x

sup i  x

2V 2

 D i e

b

(IV.6)

K ( xsup i , x )

Valider le modle SVM exprimentalement pour des nouvelles x en utilisant


lquation(IV.6).

Rglage de la variance du noyau gaussien:

La Figure IV.13 compare les rsultats de trois modles obtenus en utilisant diffrentes variances
de la fonction noyau V = 5, 20, 60, 200 (pour des donnes non normes). Un dfaut du niveau de
1,7 C est introduit 300 s. La dtection de dfauts est instantane. Comme dcrit prcdemment
dans le cas de la classification, on remarque que l'augmentation de V permet de mieux identifier
le niveau de dfaut jusqu' une certaine limite dans le cas de la rgression aussi. Le seuil de
rsidu didentification de 'Tr peut tre fix 0,5, ce qui signifie que la situation est estime
correcte si le niveau de dfaut (rsidu) est infrieur |+/-0,5C|. En appliquant la relation
propose par (Cherkassky and Ma, 2004) pour rgler V [V= (0,2-0,5) umarge(x)], on trouve dans
cet exemple V|12, qui est un peu faible (donnes non normes dans le cas de la rgression).

Figure IV.13 Validation exprimentale de lidentification dune drive dans la sonde de


temprature Tr1 avec diffrentes valeurs de V (H=0.01, C=100, objectif de commande
Tjd=70C)

191

Rglage de la largeur du tube :

Dans le cas de la rgression, un paramtre supplmentaire de rglage du modle SVR par rapport
la classification est ajout. Il sagit de la largeur du tube autour des donnes dapprentissage,
qui pourrait affecter les estimations. L'augmentation de H rduit le nombre de vecteurs de support
et donc la complexit du modle, ce qui peut entraner des estimations plus mauvaises.
La Figure IV.14 montre que la rduction de la valeur de H jusqu' une certaine limite permet
d'amliorer la qualit de l'estimation. Un dfaut du niveau de -3,5C est introduit dans Tr1 150s.
Sur la base des observations, H a t fix 0,01. En utilisant la relation empirique propose par
(Cherkassky and Ma, 2004) nous obtenons H = 0,0038, ce qui est appropri. Il est toutefois
important de noter que la qualit (variabilit, richesse) des donnes de formation est galement
importante et non seulement N. Par consquent, leur quation peut tre utilise pour trouver une
estimation initiale de H mais qui doit ensuite tre affine par l'utilisateur.

Figure IV.14 Identification de la drive dans la sonde Tr1 avec diffrentes valeurs de H
(V=60, C=100, objectif de commande Trd=60C)
x

Rglage de C :

Le rglage du paramtre C en rgression est similaire la classification. La Figure IV.15 montre


que l'augmentation de la valeur de C jusqu' une certaine limite permet d'amliorer les rsultats
des estimations. Dans cette application, C a t fix 100, en utilisant la relation propose par
(Cherkassky and Ma, 2004), comme z varie de +/-1 +/-4C et que la prcision de la sonde est
192

0,1C, C devrait tre lgrement suprieure 0,4. Comme on peut le voir sur la Figure IV.15,
cette valeur ne donne pas de prcision acceptable. Nous utilisons donc la valeur C=100.
Identification des dfauts de Tr1
0.5
0
-0.5 0
-1

(C)

-1.5
-2

200

400

600

800

1000

niveau du dfaut
C=20
C=100
C=300
C=500

-2.5
-3

-3.5
-4

Temps (s)

Figure IV.15 Identification de la drive du capteur Tr1 avec diffrentes valeurs de C


(HH=0.01, V=60)
Avec les paramtres calculs dans les derniers paragraphes, l'optimisation donne xsup de
dimension 114, tandis que x tait de taille 358, ce qui reprsente un bon compromis (rduction
de la taille initiale 32%). On note que le rglage de ces paramtres aurait pu se faire galement
par validation croise (comme dans les autres chapitres), ce qui exige cependant un temps de
calcul suprieur.

IV.4.2. Identification des U par rgression SVM


Lidentification de U est importante pour la supervision et la commande de procd, car il
intervient dans le bilan thermique du racteur. Lestimation de la valeur initiale de U peut tre
faite au cours de la phase de chauffe du racteur, o les paramtres du modle sont connus
(vitesse de raction nulle).
Lapprentissage de U est ralis entirement par simulation, car autrement, on aurait besoin de
racteurs avec diffrents matriaux. Diffrentes valeurs de U ont t considres et pour chacune
une simulation de chauffe de racteur est ralise sur 30 min (U=130-300 W/m/C). Puis,
comme pour lidentification dune drive 'Tr, les donnes collectes sont utilises pour
dvelopper un modle en utilisant la rgression SVM. En sinspirant de la structure du modle
du procd (eq. IV.1), le vecteur d'entre suivant est utilis pour la rgression pour
lidentification de U (taille de x=450):
193

xi

T (i)  T (i)
r

Tr (i)  Tr (i  1)

Bien videment, des mesures saines de Tr doivent tre utilises pour valuer U en cas de
dtection de drive dans Tr1 ou Tr2 pendant la phase de chauffe. En labsence de dfaut, Tr est
calcule comme la moyenne entre Tr1 et Tr2. Les paramtres valus comme optimaux sont:
H=1u10-2, C=7000 et V=30 (les paramtres calculs par (Cherkassky and Ma, 2004) sont H|0.34,
C|200 et V|17, en supposant X=1). On note que des valeurs les plus leves de z (ici U)
ncessitent une valeur plus leve que C (C = 100 pour l'identification de 'Tr). Avec ces
paramtres, le pourcentage des vecteurs de support est de 100%.
Afin de valider ce modle exprimentalement, il a t ncessaire de filtrer Tr avec un filtre
passe-bas (W = 5 s). Ceci est d au terme drivatif Tr(i)-Tr(i-1) dans x. Les rsultats
exprimentaux sont valids par comparaison deux autres mthodes d'identification : Tout
d'abord, un observateur non linaire est dvelopp et implment au cours de la phase de
chauffe ; Aussi, une identification de U est effectue par optimisation l'tat stationnaire avec
introduction dune rsistance thermique donnant diffrents niveaux de chaleur.
Lobservateur de U utilis est celui propos par (Hammouri et al., 2002). Il est bas sur le
modle suivant, qui utilise les mesures Tr et Tj :
Tr

U

0
0

 Tr A / MCP Tr
U
0

(IV.3)

En appliquant l'observateur non linaire grand gain propos par (Gauthier et al., 1992), nous
obtenons l'observateur suivant pour U :
T
r

A T j  Tr
2T

Tr
MCP  MC T 2 / A(T  T ) Tr  Tr
U
P
j
r
0

(IV.4)

La Figure IV.16 montre une simulation de la mthode SVM et de l'observation grand gain,
avec U = 150 et 200W/m/C. Lobservateur est initi 0 et converge avec le temps vers la
valeur nominale introduite dans la simulation. Mme avec un bon rglage, on sattend ce quil
converge un peu plus lentement que la mthode SVM. Le rglage du paramtre T a t choisi
comme compromis entre la vitesse de convergence et la sensibilit au bruit de mesure. Le
comportement des deux systmes est acceptable. Lorsque Tr se rapproche de Tj, l'observabilit
du systme est rduite, ce qui cause une divergence des deux mthodes.
194

Evolution des tempratures

70

250

60

200

50
40

Tr
Tj

30

Identification de U (simulation)

300

(W/m/C)

(C)

80

150
100

observateur
SVM
nominal

50

20

0
0

200

Figure IV.16

400
600
Temps (s)

800

200

400
600
Temps (s)

800

Estimation du coefficient dchange thermique U pendant la chauffe du

racteur (simulation avec diffrentes valeurs de U, paramtre de lobservateur T=0.04)


Les deux mthodes ont ensuite t appliques en ligne sur des donnes relles de chauffe du
racteur afin d'estimer U. Tr a t filtre avec un filtre passe-bas pour son utilisation dans la
mthode SVM. La Figure IV.17 montre que l'observateur estime U environ 207 W/m/C
Tr = 50C. La valeur value l'tat stationnaire par optimisation est gale 170 W/m/C. Les
estimations SVM se situent entre les deux valeurs (environ 190 W/m/C). La rponse de la
mthode SVM est plus rapide pour la convergence et la divergence.
Tempratures relles

Identification de U (relle)

300

70

250

60

200

50

Tr

40

Tj

(W/m/C)

(C)

80

30

150
100

observateur
SVM
Stationnaire

50

20

0
0

300

600
900
Temps (s)

1200

20

30

40
50
Tr (C)

60

70

Figure IV.17 Estimation exprimentale du coefficient dchange thermique U pendant la


chauffe du racteur

195

IV.5. Conclusions
Dans ce chapitre, la mthode SVM a t combine un observateur non linaire pour la
dtection de dfaut. L'efficacit de la stratgie propose a t dmontre par simulation et
exprimentalement dans deux racteurs de volumes diffrents. La mise en uvre de la mthode
SVM est rapide car elle ne ncessite pas de modlisation du procd. Avec un bon rglage des
paramtres et des donnes compltes, la mthode SVM peut assurer une bonne gnralisation.
En outre, le temps de calcul en ligne de SVM est rduit en raison de l'utilisation uniquement des
vecteurs de support dans la fonction de dcision. Il est dmontr que lorsque la dynamique du
procd est trs variable, l'utilisation d'un modle simplifi dans la partie fortement non linaire
peut tre utile pour amliorer l'isolation du dfaut. Dans ce cas, l'information obtenue par SVM
est utilise pour corriger le modle simplifi en l'absence de dfaut. De cette manire, une
mthode hybride FDI qui est robuste aux erreurs de modlisation et des variations de la
dynamique est propose. La mthode a pu tre applique un racteur pilote pour lequel les
paramtres du modle ne sont pas connus et o les dynamiques varient en raison de la nature
exothermique de la raction.

196

Conclusion gnrale
Le doute est le commencement de la sagesse Aristote
La Croissance des exigences en termes de productivit, qualit, conomie, scurit, maintenance
et respect de lenvironnement nous amnent rflchir amliorer davantage les outils de
surveillance et de diagnostic de dfauts.
Le choix port dans cette thse sur les mthodes dapprentissage automatique SVMs tait,
mon avis, assez ambitieux et pas facile malgr le caractre solide de leur base thorique. Ces
mthodes restent juste un outil quil faut bien comprendre, bien mettre dans le contexte de travail
et laccompagner par non seulement une bonne stratgie, mais aussi dautres outils ou mthodes
qui permettent de faciliter sa tche de diagnostic de dfauts.
La finalit de leur utilisation est dexploiter de la meilleure faon la quantit des donnes
disponibles avec les technologies modernes afin dextraire les informations utiles et le maximum
de connaissances.
Aprs les annes de recherche dans le sujet de diagnostic de dfauts, jai constat que cette tche
doit tre vue sous diffrents angles pour quelle soit ralise de la meilleure faon possible, car
les procds rels sont complexes et regroupent diffrentes disciplines tels que le traitement de
signal, automatique, statistique, mcanique, physique, chimie, biologie, probabilits, etc.
La ralisation dun bloc de diagnostic de dfauts prcis et efficace est fondamentale pour donner
une information prcise de ltat du procd loprateur et aussi pour toute reconfiguration de
commande dans le cadre dune commande tolrante aux dfauts, ainsi que pour toute procdure
dautomatisation dun systme.
Je crois que les recherches ralises dans cette thse apportent une contribution relative
lestimation et la modlisation, et aussi aux techniques de diagnostic de dfauts par une mthode
assez originale qui a montr de bons rsultats en termes de prcision, temps de dtection et
surtout le pourcentage presque nul des fausses alarmes.
La stratgie de dtection et de diagnostic de dfauts propose dans cette thse se base
globalement sur les Machines Vecteurs de Support (SVMs). Elle permet de manipuler
facilement le bruit, les perturbations et les valeurs aberrantes, et offre une grande capacit de
gnralisation sur de nouvelles situations non utilises dans lapprentissage.
197

J'ai pu dmontrer la puissance de prdiction de SVR dans ce travail. Ces bons rsultats obtenus
ne pouvaient pas tre atteints si on avait nglig la mise lchelle des donnes, lintroduction
des dcalages temporels ainsi que le choix des rgresseurs. Je peux conclure que la technique
propose dans cette thse utilisant SVR fournit une faon simple et efficace de modliser les
systmes rels tout en captant la non-linarit et la variabilit qui dcrivent le comportement
dynamique du systme.
La dcision par rapport au dfaut obtenue par lapproche base sur SVMs propose offre une
solution nette, rapide, prcise et sans fausses alarmes. Ce rsultat est confirm sur plusieurs
systmes non linaires complexes : olienne, procd de traitement des eaux uses et racteur
chimique parfaitement agit.
A lissue de ce travail, la combinaison entre Sparateurs vaste Marge (SVM) et un observateur
a permis la dtection et lisolation en dterminant le changement des paramtres estims en ligne
par lobservateur de type Kalman.
Lobjectif de cette thse tait de proposer une stratgie de diagnostic de dfauts assez gnrale et
efficace pouvant tre applique par la suite aux diffrents procds rels. Les rsultats obtenus
dans ce travail me permettent de confirmer que lobjectif a t atteint en grande partie.
Nanmoins, comme tout travail de recherche qui opte pour la perfection, la poursuite de ces
travaux apparat une ncessit afin damliorer encore lestimation, la surveillance et le rsultat
de diagnostic de ces systmes complexes.
Les travaux entrepris dans cette thse constituent les fondations de base pour plusieurs
recherches en perspective telles que :
- Lintgration la stratgie de diagnostic de dfauts, un modle appris en ligne et non pas hors
ligne comme propos dans la thse.
- Un des avantages du SVR est quil ne dpend pas des conditions initiales et quil apprend
rapidement. Cependant, il doit tre modifiable et adaptable, d'une manire efficace, pour faire
face aux changements dans les statistiques du procd. Par consquent, j'envisage dans le futur
damliorer lestimateur non-linaire SVR. Dans cette perspective, jestime que ceci peut tre
fait en rajoutant un aspect dadaptation par un terme correctif (comme celui de lobservateur). Ce
qui peut ouvrir un nouvel axe de recherche.
- J'envisage d'ajouter la stratgie de diagnostic de dfaut actuelle la variante SVM une classe au
dbut. Cela va permettre de dterminer si les nouvelles donnes acquises en ligne correspondent
198

a une situation compltement nouvelle et diffrente qui n'appartient pas au cas de dfauts connus
ni au cas de fonctionnement normal.
- La combinaison de SVMs avec la transforme dondelettes va galement permettre mon avis
damliorer les rsultats puisque londelette est un outil puissant de traitement de signal capable
de montrer les tendances et les discontinuits des mesures qui sont utilises dans un schma de
diagnostic de dfauts.
Par ailleurs, afin de rendre le processus dapprentissage un peu plus automatis, lutilisation des
algorithmes gntiques peut aider dans ce sens, et plus prcisment pour le choix des
caractristiques pertinentes descriptives de dfaut dans le cas de diagnostic ou celles descriptives
dune variable estimer (rgresseurs).
Une autre perspective de recherche consiste envisager de raliser par la suite une commande
tolrante aux dfauts pour les oliennes et le procd de traitement des eaux uses.

199

200

Notations
Notations relatives aux Machines Vecteurs Supports
Norme dun vecteur
.,.

Produit scalaire

f xi

Fonction de dcision

Remp > f @

Fonction risque empirique

R> f @

Fonction risque rel

D i , Pi

Multiplicateurs de Lagrange

]i

Variables de pnalit

Paramtre de rgularisation

Fonction non linaire de projection

Oi

Les valeurs propres

K x, xi

Fonction noyau

La largeur de distribution du noyau gaussien

P(x)

Probabilit de distribution de x

P ( x, y )

Probabilit de distribution conjointe de x, y

xi

Exemple dapprentissage

Le biais

Ensemble de donnes dapprentissage


201

Degr du noyau polynomial

dVC

Dimension de Vapnik et Chervonenkis

Hyperplan

Nombre de classes

Lagrangien

Nombre d'exemples dapprentissage

Sgn

Fonction signe

w, b

Paramtres de la fonction de dcision linaire f w ( x )

Xsup

Les vecteurs supports

Notations relatives au procd de traitement des eaux


NH3

Ammoniac

NH4

Ion ammonium

NO3

Nitrates

NO2

Nitrites

S O

La concentration de saturation pour loxygne

PA

Taux de croissance maximal de la biomasse autotrophe

fP

Fraction de biomasse recycle en produits particulaires

PH

Taux de croissance maximal de la biomasse htrotrophe

Kg

Facteur de correction pour la croissance anoxique des htrotrophes

Kh

Facteur de correction pour lhydrolyse sous condition anoxie

Q 0'

Vitesse maximale de dcantation

Q0

Vitesse maximale de dcantation (Vitesse de Vesilind)

rh

La dcantation freine

rP

La dcantation de particules isoles

202

f ns

Fraction non dcantable

J s, j

Flux de particules qui dcantent de la couche j vers la couche j+1

X min

Concentration en solides non dcantables

Q s, j

Vitesse de dcantation dans la couche j

Qij

Les coefficients stchiomtriques

bA

Taux de dcs autotrophe de la biomasse autotrophe

bH

Taux de dcs htrotrophe

DBO5 ou BOD5

Demande Biologique en Oxygne sur 5 jours (Biological Oxygen Demand )

DCO ou COD

La Demande Chimique en Oxygne (Chemical Oxygen Demand )

HO-

Ion hydroxyde

iXB

Fraction dazote dans la biomasse

iXP

Fraction dazote dans les produits de lyse

ka

Taux dammonification

kh

Taux dhydrolyse spcifique maximal

Kla5

Coefficient de transfert doxygne

KNH

Constante de demi-saturation de lazote ammoniacal pour la biomasse


autotrophe

KNO

Constante de demi-saturation du nitrate pour la biomasse htrotrophe

KO,A

Constante de demi-saturation de loxygne pour la biomasse autotrophe

KO,H

Constante de demi-saturation de loxygne pour la biomasse htrotrophe

KS

Constante de demi-saturation htrotrophe

KX

Constante de demi-saturation pour lhydrolyse du substrat lentement


biodgradable XS

MES ou TSS

Les Matires En Suspension (Total Suspended Solids)

NH3

Ammoniac

NH4OH

Ammoniaque

NTK ou TKN

Azote total (Total Kjeldahl Nitrogen)

Qintr ou Qa

Dbit de recyclage interne

rj

Vitesses des ractions

SALK

Alcanit

SI

Matire soluble inerte

SND

Azote organique soluble et biodgradable

SNH

Azote ammonium (NH4+) et ammoniac (NH3)


203

SNO

Azote sous forme de nitrite (NO2-) et de nitrate (NO3-)

SO

Oxygne dissous

SS

Substrat soluble facilement biodgradable

XB,A

Biomasse active autotrophe

XB,H

Biomasse active htrotrophe

XI

Matire organique particulaire inerte

XND

Azote organique particulaire et biodgradable

XP

Produits particulaires rsultant de dcomposition de la biomasse

XS

Substrat lentement biodgradable

YA

Rendement de croissance autotrophe

YH

Rendement de croissance htrotrophe

Notations relatives lolienne


E

Angle de calage des pales pitch

Er

Position du pitch de rfrence

Em

Position du pitch mesure

La densit de lair

Rapport de vitesse la pointe de lolienne

vw

Vitesse du vent qui agit sur l'olienne

Ww

Le couple du vent qui agit sur les pales

W w, m

Lestimation du couple du vent base sur la mesure de la vitesse du vent

Wr

Couple du rotor

Wg

Couple du gnrateur

Kg

Le rendement de la gnratrice

W g ,m

Couple de gnratrice mesure

204

W g, r

Couple de rfrence de la gnratrice

T'

Langle de torsion du systme dentranement drive train

Le coefficient d'amortissement dun systme de second ordre

Cq (O , E )

Le coefficient de couple arodynamique

wr

Vitesse rotationnelle du rotor

wr , m

Vitesse de la rotation mesure du rotor

wg

Vitesse rotationnelle de la gnratrice

wg , m

Vitesse de la rotation mesure de la gnratrice

Bdt

Coefficient de torsion amortie du train dentranement

Bg

Frottement visqueux de larbre grande vitesse

Jg

Le moment dinertie de larbre grande vitesse

Jr

Le moment dinertie de larbre faible vitesse

Kdt

La rigidit de torsion du train dentranement

Ng

Le rapport de transmission ou dengrenage

Pg

Puissance produite par la gnratrice

Pr

Puissance de rfrence de l'olienne

Rayon des pales de l'olienne

TD

Temps de dtection

Te

Temps d'chantillonnage

Vitesse angulaire

wn

La pulsation naturelle

205

Notations relatives au racteur chimique


(-'H)

L'enthalpie de raction

La surface de transfert de chaleur entre le racteur et la double enveloppe

Cp

Capacit thermique du milieu ractionnel

Cpfeed

Capacit thermique de l'alimentation

Cpj

Capacit thermique de lhuile caloporteur

Ffeed

Le dbit d'alimentation

Fj

Le dbit massique dans la double enveloppe

HC

Le systme de chauffe/refroidissement (Heating/Cooling )

La masse totale du milieu ractionnel

Qlj

La perte de chaleur de la double enveloppe

Qlr

La perte de chaleur du racteur principalement par le condenseur

Rp

Vitesse de raction

Tfeed

Sonde de mesure de la temprature d'alimentation

THC

Sonde de temprature dans le bain thermostat

Tjin

Sonde de mesure de la temprature dentre de la double enveloppe

Tjout

Sonde de mesure de la temprature de sortie de la double enveloppe

Tr

Temprature moyenne dans le milieu ractionnel

Tr1

Sonde 1 de temprature dans le racteur

Le coefficient de transfert de chaleur

206

Acronymes
ACP

Lanalyse en composantes principales Principal Component Analysis

CSTR

Racteurs chimiques parfaitement agits Continuous Stirred tank Reactor

dVC

dimension de Vapnik et Chervonenkis

FDI

Diagnostic de dfauts (Fault Detection and Isolation)

KKT

Karush Kuhn Tucker

LPV

Linaire Paramtre Variant

LQG

Linaire Quadratique Gaussiene

LTI

Linaire Temps Invariant

MRE

Minimisation du Risque Empirique

MRS

Minimisation du Risque Structurel

PLS

Moindres carrs partiels ou Projection aux Structures Latentes Partial Least Squares

RBF

Radial Basis Function (Fonction de base radiale)

SMO

Sequential Minimal Optimisation

SVM

Machines vecteurs de supports pour la classification

SVMs

Machines vecteurs de supports Support Vector Machines

SVR

Machines vecteurs de supports pour la rgression Support Vector Regression

SVs

Supports Vector (Vecteurs de Support)

VCP

Variance Cumulative en Pourcentage Cumulative Percent Variance

WWTP Procd de traitement des eaux uses Waste Water Treatment Process

207

208

Annexes

209

210

Annexe A
A.1 Mthode Monte Carlo
La mthode Monte Carlo (Kroese et al., 2011, Krauth, 2006) utilise un grand nombre de tirages
alatoires pour calculer une valeur numrique. Elle est aujourdhui rendue possible par le fait que
les ordinateurs modernes offrent un calcul rapide et prcis dun grand nombre de donnes avec
un faible cot. On note que les rsultats dpendent fortement du type de gnrateur des nombres
alatoires, qui ne doit pas tre biais. Cette mthode est utilise dans plusieurs domaines comme
la simulation des phnomnes physiques, lanalyse du risque en finances, lanalyse de la fiabilit
des composantes et la modlisation des molcules,etc.

Exemple Monte Carlo


A titre dexemple, afin dappliquer cette mthode pour dterminer la superficie dun lac en bleu
en connaissant la superficie du terrain (tout le rectangle), on procde de la faon suivante : on
demande un tireur de jeter N coups de canon de manire alatoire ; on compte ensuite le
nombre n de boules lintrieur du lac ; ensuite on ralise un rapport entre les valeurs :
superficie lac

N  n u superficie terrain
N

Le processus dapplication de Monte Carlo peut tre rsum par les points suivants :
1. Gnrer des nombres alatoires soit directement dans la loi de distribution ou partir
dune loi uniforme (permet dutiliser un gnrateur pseudo alatoire).
2. Appliquer le modle.
3. Calculer la moyenne empirique.
4. Ce processus (de 1 3) doit tre rpt o on applique une autre mthode, par exemple
Bootstraping pour calculer les intervalles de confiance.

211

Malgr que ces mthodes soient simples et faciles implmenter, elles prsentent des
inconvnients tels que la convergence lente et la ncessit dun grand nombre de rptitions. Il
est possible de rsoudre ce type de problme avec lutilisation des mthodes de rduction de
variance telles que la mthode des variables antithtiques, variable de contrle, quasi Monte
Carlo (squences Halton, Sabol). On peut citer aussi la rduction de la variance par
conditionnement, chantillonnage prfrentiel Importance sampling .
La mthode de Monte Carlo a dj t utilise dans le diagnostic de dfaut (Marseguerra and
Zio, 2009) . Dans cette thse, elle na pas t utilise pour le diagnostic de dfaut mais pour
valuer lefficacit du schma de diagnostic (valuer le taux de fausses alarmes, ou de non
dtection) ou la qualit dun modle de prdiction face des incertitudes. Ceci est fait en
ralisant un grand nombre de simulations avec des conditions alatoires (1000 fois par exemple)
en changeant par exemple le bruit et les perturbations dentre.

A.2 Lentropie de Shanon


Une variante de linformation mutuelle appele la variation de linformation peut tre utilise
comme une distance mtrique :

d X,Y H X,Y  I X,Y


H X  H Y  2 I X,Y H X/Y  H Y/X
O H est lentropie de Shanon dfinie comme la prdiction de la valeur de linformation
attendue. Soit x une variable alatoire, lentropie de X appele H(X) est donne comme suit :
H X

E I X

E  ln p x

H(X) permet de quantifier lincertitude (limprvisibilit) associe une variable alatoire X.


Linformation est grande quand elle est inattendue. Donc, lentropie indique la quantit de
linformation quil faut obtenir pour lever le doute sur un vnement probable comme un dfaut
par exemple :
N

H X  p xi log p xi
i 1

212

A.3 Lextraction des caractristiques dans le domaine frquentiel


Beaucoup dinformations peuvent tre obtenues par lanalyse des donnes dans le domaine
frquentiel qui fournit une ide sur les perturbations par exemple. La slection des
caractristiques peut se faire dans le domaine frquentiel avec la transforme S S-transform ,
qui est une technique rcente de traitement de signal produisant une reprsentation
temps/frquence. Elle a t utilise pour extraire les caractristiques partir des donnes de
perturbation de formes dondes data disturbance waveforms afin de dduire par SVR les
classes simples et multiples de perturbation de qualit de puissance dans un systme triphas de
puissance industrielle.
Analyse spectrale :

y f

m 1

y k e

 i 2 fk

k 0

La densit spectrale estime dun signal (periodogramme) :

R per

1
2
y f
m

Peut tre calcule par lautocorrlation :


R

abs fft(xcorr y t

Lapparition de haute frquence dont un signal normalement de basse frquence peut indiquer
que le signal est soumis une perturbation ou un dfaut sur une composante.

E f k

k l

R k
per

j k

213

A.4 Validation croise


Une faon simple et efficace pour dterminer les paramtres optimaux (garantissant une
corrlation maximale entre les variables et minimisent le critre EQM) est dutiliser la validation
croise. Cest une mthode destimation de la fiabilit et la prdiction dun modle avec
lutilisation dchantillonnage (Witten et al., 2011, Lendasse et al., 2003). Elle value le degr de
gnralisation du modle face des donnes indpendantes utilises pour la prdiction. Elle
permet dviter donc le problme de surapprentissage. Lutilisation de la validation croise
fournit un estimateur un peu biais du modle car lensemble dentranement est infrieur aux
cas observs.
La validation croise consiste rpter la division de lensemble de donnes principales en
deux : un ensemble de donnes dapprentissage et un de test ou de validation : lchantillon de
dimension n est divis en m parties gales disjointes. Le modle est construit avec les donnes
dapprentissage (en utilisant m-1 parties) et valid avec les donnes de test (la partie restante).
Cette opration est rpte m fois. Lerreur est estime par le calcul de lerreur quadratique
moyenne.
Les variantes les plus connues de la mthode de validation croise sont :
1. Validation croise k plis ou replis k-fold cross validation : lensemble de
donnes sera partitionn alatoirement en k sous-ensembles. Un seul sous-chantillon est
utilis pour la validation (test) alors que les k-1 sous-ensembles restants sont utiliss pour
lapprentissage. Ce processus est rpt k fois o chaque fois un seul sous-ensemble est
utilis pour la validation. Les k rsultats des k groupes peuvent tre moyenns ou
combins pour produire une seule estimation ou choisir le modle avec lerreur la moins
faible.
2. Validation croise avec un laiss en sortie leave-one-out cross validation : utilise
toutes les donnes sauf une. Lexemple non utilis dans lapprentissage sera utilis dans
le test. Cette procdure est rpte pour toutes les observations. Cette mthode est trs
exigeante en termes de temps de calcul.
3. Validation croise de Monte Carlo The Monte Carlo cross validation ou repeated
random sub-sampling validation : cette mthode divise lensemble des donnes de
faon alatoire en deux groupes : apprentissage et validation. Le modle est adapt aux
donnes dapprentissage et la prcision est value en utilisant les donnes de validation.
214

Les rsultats sont ensuite moyenns sur toutes les scissions. Lavantage de cette mthode
par rapport celle de k replis est que la proportion de la rpartition (scission ou division)
apprentissage/validation nest pas dpendante du nombre ditrations (plis). Son
inconvnient rside dans le fait que certaines observations peuvent ne jamais tre
slectionnes dans lensemble de validation.

A.5 La mthode de Bootstraping Bootstrap


Le mot Bootstrap provient de lexpression anglaise to pull one self up ones qui signifie
littralement se soulever en tirant sur les languettes de ses bottes .
Propose la fin des annes 70 par Bradley Efoon (Efron, 1988), Bootstrap est une mthode
destimation base sur le rchantillonnage qui consiste faire un tirage alatoire dun nombre
assez grand dchantillons avec remplacement partir de lchantillon initial. Lchantillon peut
jouer le rle dune population mre. On tire un nouvel chantillon, cest le rchantillonnage,
avec remise de manire conserver le mme nombre de donnes. Le Bootstrap ressemble la
validation croise dans sa mise en uvre mais diffre par la faon de dtermination des
ensembles dapprentissages.
Echantillonnage
chantillon

Population entire
(inconnue)

Rchantillonnage

chantillon de mme taille,


constitu avec remise

Le rchantillonnage dans le Bootstrap


Linfrence statistique est base sur les rsultats des chantillons ainsi obtenus. Le but de cette
technique est de fournir des indications sur une statistique autre que sa valeur (dispersion,
distribution, intervalle de confiance) afin de connatre la stabilit et la prcision des estimations
ralises (ou modle construit) sans recours des nouvelles observations (donnes). Cette
mthode permet entre autres destimer la confiance accorde un estimateur (modle, fonction

215

ou variable alatoire) par le calcul des intervalles de confiance. Bootstrap peut tre utilis aussi
comme une mesure gnrale derreur (biais dun estimateur, erreur de prdiction, tests).
Dans le cadre de lapprentissage automatique artificiel Machine Learning , cette technique
permet de rduire lcart entre le risque empirique et le risque rel fonctionnel et donc
damliorer la robustesse du nouveau modle prdictif (cela veut dire avoir des performances
dun niveau sensiblement constant face des donnes inconnues).

A.6 Autres variantes SVMs


x

Q - SVR Q Support Vector Classification

Cette variante utilise un autre paramtre Q >0,1@ pour remplacer le paramtre de rgularisation
C dans les SVMs classiques (Chen et al., 2005, Schlkopf et al., 2000). Ce paramtre est plus
facile interprter et rgler que C. Il permet de contrler le nombre maximal des points
Supports et les erreurs dapprentissage. Le problme primaire dans ce cas est formul comme
suit :

1
1 N
2


U
min
w

i , t 0

w,b,
2
N
i
1

sous les contraintes


z wT .(x) b t U  et t 0 pour i 1,....N
i
i
i

>

Le problme dual donc devient :

1 T

max 2 .G.

sous les contraintes

1
T z 0 ,1T t ,et 0 d d
pour i 1,....N
i N

La marge de Q-SVM est lie au paramtre C des C-SVM par : C

SVM une classe: one class SVM


216

Dans le cas mono classe, le problme pos change puisquil ny a pas dinformation de sortie zi
proprement dite car tous les xi appartiennent une mme classe (la classe normal +1).
D

^xi `,

i 1,...N

Il sagit dune extension de lalgorithme SVM classique binaire dans le cas des donnes non
tiquetes (Mahadevan and Shah, 2009, Schlkopf et al., 2001). Cet algorithme cherche
trouver une fonction qui prend la valeur +1 dans une petite rgion capturant la plupart des
donnes dapprentissage et -1 dans le cas contraire .c..d. pour les valeurs qui se trouvent
lextrieur du cluster de donnes dapprentissage. Lobjectif de cette variante est daccueillir la
plupart de donnes dapprentissage dans un modle en maximisant la sparation entre l'origine
considre comme la classe ngative et le groupe d'chantillons normaux dans l'espace des
caractristiques. Lutilit de cette technique est la dtection de nouveauts ou la dtection des
valeurs aberrantes.
Le problme primaire dans ce cas est donn comme suit :

1 N
w2 
i  b , t 0

min
w,b,
N i 1
2

sous les conctraint es


wT .(x) b  t 0 et t 0 pour i 1,....N
i

Le problme dual devient donc :

1 T

max 2 D .G.D

D N

sous les contraintes

1
1 T D 1, et 0 d D i d
, pour i 1,....N
QN

Dans le cas de dtection de dfaut, le cas mono-classe est motiv par le fait que les donnes dans
lindustrie ne sont pas riches en situations dfectueuses.

217

Q -SVR Q Support Vector Regression :

Dans ce cas, le paramtre Q >0,1@ remplace la zone dinsensibilit H de Q-SVR et contrle le


nombre des Vecteurs de supports (Chang and Lin, 2001,Schlkopf et al., 2000). Le problme
rsoudre est :

1 2
1

Minimiser
w  C QH 
N
2

(]
i 1


i

, ] i )

zi  w, I ( xi )  b d H  ] i

sujet w, I ( xi )  b  yi d H  ] i

] i , ] i t 0

La fonction de dcision est alors de la mme forme que le SVR classique :


Nsup

f ( x)

(D

 D i* ) K ( xi , x j )  b

i 1

(Chalimourda et al., 2004) traitent le problme du choix du paramtre

218

Q optimal.

Annexe B
Termes lis au traitement de leau
Leutrophisation dun cosystme aquatique se produit lorsque le milieu reoit trop de matires
nutritives assimilables par les algues (phosphore et azote). La multiplication de ces algues va
limiter considrablement la respiration de leau et les changes de ce dernier avec la lumire qui
dsquilibre totalement le milieu [2008_Belhani].
Matire organique (MO) : Dsigne la matire dorigine humaine, animale ou vgtale, capable
dtre dgrade et dcompose par laction dorganismes vivants. Elle constitue une faible
proportion dans l'univers. Il sagit par exemple des glucides, protides, lipides, en plus du carbone
qui est le composant principal. Ces molcules contiennent des atomes dhydrogne, doxygne et
dans une moindre mesure dazote, de phosphore, de soufre et de fer.
Pollution : Dsigne lintroduction, gnralement par suite de l'activit humaine, de substances
ou de chaleur contaminantes dans un milieu naturel provoquant son instabilit, dsordre et sa
dgradation. Elle a un impact ngatif sur la sant humaine ou sur la qualit des cosystmes.
Ammonification : C'est lactivit biologique qui permet la gnration d'ammonium (NH4+) ou
d'ammoniac (NNH3) partir soit de matires organiques en dcomposition ou par la rduction de
nitrate.
Arobie : Dsigne la capacit des micro-organismes vivre et se dvelopper dans un
environnement o loxygne libre est prsent et joue son rle.
Ammoniaque : Compos gazeux dazote et dhydrogne, trs soluble dans leau.
Anarobie : Qualifie les milieux dans lesquels loxygne libre est absent sous toutes ses formes,
et donc les nitrates nitrites sont absents aussi. Un dispositif anarobie n'a pas besoin d'air ou de
dioxygne pour fonctionner.
Anoxie : Qualifie les milieux dans lesquels loxygne nest pas prsent sous forme dissoute.
Biomasse : Masse totale de micro-organismes vivants, animaux et vgtaux prsente dans un
milieu considr pouvant devenir source d'nergie par combustion.
219

Biomasse autotrophe : Organisme qui utilise le dioxyde de carbone pour la synthse cellulaire.
Biomasse htrotrophe : Organisme qui utilise le carbone organique pour la synthse cellulaire.
Boues actives : Flocons bactriens produits au cours de lpuration biologique.
Lyse : Dsigne la dissolution ou la destruction de l'intgrit physique de la cellule.
Hydrolyse : Cest une opration chimique utilisant leau pour dcomposer de grosses molcules
en plus petites molcules.
La nitrification consiste en loxydation de lazote ammoniacal en nitrites (NO2-) puis en nitrates
(NO3-) par lintermdiaire de deux espces de bactries autotrophes. Ces bactries sont dites
autotrophes car elles utilisent du carbone minral pour constituer leurs cellules. Leur taux de
croissance est plus faible que celui des bactries dgradant la pollution carbone (bactries
htrotrophes).
Substrat : Les matires formant lalimentation requises au dveloppement des microorganismes.
Lalcalinit : Lalcalinit mesure la concentration quivalente de carbonate de calcium
(CaCO3), et elle exprime la capacit de leau rsister des variations du pH.
Liqueur mixte : Le mlange eaux uses-boues (flocs de micro-organismes).
Biodgradable : Se dit d'une substance capable dtre dcompose chimiquement par des microorganismes ou d'autres moyens biologiques en lments divers dpourvus d'effet dommageable
sur le milieu naturel.
Floculation : Dsigne le processus physico-chimique par lequel les particules fines et matires
en suspension ayant le problme de ne pas sdimenter dune manire naturelle, sont dues se
regrouper dans un floc par lajout dun floculant (chlorure ferrique et d'un polymre, etc.). Le
floc peut alors soit remonter la surface du liquide ou se dposer au fond.
Les matires en suspension (MES) (mg/L): cest la fraction non dissoute de la pollution qui
influe ngativement sur le milieu aquatique, les animaux et les plantes (Gad, 2008).
La demande biologique en oxygne (DBO) est un paramtre reprsentatif de la quantit
doxygne requise pour dcomposer la somme des matires organiques biodgradables.
Lazote peut se trouver sous forme minrale (ammoniacal, nitrate) ou organique.
220

Le phosphore se trouve gnralement sous forme de phosphate et il fait normalement partie de


l'environnement. On peut le trouver dans les roches lorsqu'il y'a une dcomposition des plantes
ou danimaux, mais aussi dans les engrais et les dtergents. Il est considr comme un lment
indispensable la vie des algues. Le phosphore est considr comme un des grands responsables
de l'eutrophisation des cours deau.
Demande chimique en oxygne (D.C.O.) : Quantit doxygne ncessaire une dgradation
purement chimique des composs organiques et minraux contenus dans une eau pollue sans
intervention de micro-organismes. Elle permet dexprimer la teneur de matires organiques
oxydables par voie chimique (Gad, 2008).

221

222

Annexe C
C.1 Le diplme de premire place dans la comptition sur la dtection des
dfauts pour les oliennes

C.2 Termes lis lolienne


olienne arognratrice wind turbines
Dispositif fonctionnant sous laction du vent permettant de convertir lnergie cintique du vent
en nergie lectrique.
Les pales de lolienne blades en anglais
Permettre de capter lnergie cintique du vent
Pitch est langle de calage des pales
Yaw l'angle qui fait rfrence l'orientation de la nacelle par rapport au vent.

223

La turbulence du vent
Les variations de la vitesse du vent ne sont pas incluses dans la vitesse moyenne du vent, et sont
causes par des facteurs multiples.
I

Vw
vw

u 100

O I lintensit de la turbulence, V w et vw sont respectivement lcart type et la moyenne de la


vitesse du vent.
La portance de la pale
Cest une force arodynamique perpendiculaire au plan de la pale due la diffrence de pression
entre la partie bombe et la partie plate de la pale quand lair scoule.
Remarque
Il est noter que la charge arodynamique a un impact important sur la robustesse du systme
FDI cause de ces caractristiques stochastiques. Il est conseill de dcoupler la charge du vent
de la dcision du systme de surveillance d'tat de l'olienne.

224

C.3 Implmentation de la solution de diagnostic de dfaut base sur SVM et


un observateur de type Kalman dans lolienne

225

226

Bibliographie
Abbasion, S., Rafsanjani, A., Farshidianfar, A., Irani, N., 2007. Rolling element bearings multifault classification based on the wavelet denoising and support vector machine.
Mechanical Systems and Signal Processing 21, 29332945.
Adachi, S., Ogawa, T., Konno, R., 2001. A System Identification Method for Linear Regression
Models Based on Support Vector Machine. Transactions of the Society of Instrument and
Control Engineers 37, 11891191.
Aggarwal, S., Aggarwal, N., 2011. Classification of Audio Data using Support Vector Machine.
International Journal of Computer Science and Technology 2, 398405.
Akaike, H., 1974. A new look at the statistical model identification. IEEE Transactions on
Automatic Control 19, 716723.
Alcorta Garca, E., Frank, P.M., 1997. Deterministic nonlinear observer-based approaches to
fault diagnosis: A survey. Control Engineering Practice 5, 663670.
Alex, J., Benedetti, L., Copp, J., Gernaey, K.V., Jeppsson, U., Nopens, I., Pons, M.N., Steyer,
J.P., Vanrolleghem, P., 2008. Benchmark Simulation Model no. 1 (BSM1).
Amirat, Y., Benbouzid, M.E.H., Al-Ahmar, E., Bensaker, B., Turri, S., 2009. A brief status on
condition monitoring and fault diagnosis in wind energy conversion systems. Renewable
and Sustainable Energy Reviews 13, 26292636.
Amirat, Y., Choqueuse, V., Benbouzid, M.E.., 2010. Failure Detection and Diagnosis in DFIGbased Wind Turbines using generator current amplitude demodulation. Presented at the
International Conference on Industrial Engineering and Manufacturing ICIEM10, Batna,
Algeria, pp. 444449.
An, X.L., Jiang, D.X., Li, S.H., Chen, J., 2011. Fault diagnosis of direct-drive wind turbine based
on support vector machine. Journal of Physics: Conference Series 305, 012030.
Ao, S.-I., Rieger, B.B., Amouzegar, M.A., 2010. Machine learning and systems engineering.
Springer, Dordrecht.
Arnanz, R., de Santiago, M.A.G., Reones, A., Rodrguez, J., Saludes, S., 2011. Monitoring and
Fault Diagnosis in Manufacturing Processes in the Automotive Industry, in: Chiaberge,
M. (Ed.), New Trends and Developments in Automotive Industry. InTech.

227

Artan, N., Orhon, D., Choi, E., 2004. Appropriate Design of Activated Sludge Systems for
Nitrogen Removal from High Strength Wastewaters. Journal of Environmental Science
and Health, Part A 39, 19131924.
Baccarini, L.M.R., Rocha e Silva, V.V., de Menezes, B.R., Caminhas, W.M., 2011. SVM
practical industrial application for mechanical faults diagnostic. Expert Systems with
Applications 38, 69806984.
Baggiani, F., Marsili-Libelli, S., 2009. Real-time fault detection and isolation in biological
wastewater treatment plants. Water Science & Technology 60, 2949-2961.
Barker, M., Rayens, W., 2003. Partial least squares for discrimination. Journal of Chemometrics
17, 166173.
Barszcz, T., Randall, R.B., 2009. Application of spectral kurtosis for detection of a tooth crack in
the planetary gear of a wind turbine. Mechanical Systems and Signal Processing 23,
13521365.
Basu, A., Walters, C., Shepherd, M., 2003. Support vector machines for text categorization.
Proceedings of the 36th Hawaii International Conference on System Sciences.
Baylar, A., Hanbay, D., Batan, M., 2009. Application of least square support vector machines in
the prediction of aeration performance of plunging overfall jets from weirs. Expert
Systems with Applications 36, 83688374.
Belia, E., Amerlinck, Y., Benedetti, L., Johnson, B., Sin, G., Vanrolleghem, P.A., Gernaey,
K.V., Gillot, S., Neumann, M.B., Rieger, L., Shaw, A., Villez, K., 2009. Wastewater
treatment modelling: dealing with uncertainties. Water Science & Technology 60, 19291941.
Beltran, B., Ahmed-Ali, T., Benbouzid, M., 2009. High-Order Sliding-Mode Control of
Variable-Speed Wind Turbines. IEEE Transactions on Industrial Electronics 56, 3314
3321.
Benhalla, A., Houssou, M., Charif, M., 2010. Linearization of the full activated sludge model No
1 for interaction analysis. Bioprocess Biosyst Eng 33, 759771.
Bermolen, P., Rossi, D., 2009. Support vector regression for link load prediction. Computer
Networks 53, 191201.
Biegel, B., Juelsgaard, M., Kraning, M., Boyd, S., Stoustrup, J., 2011. Wind Turbine Pitch
Optimization. Presented at the Proceedings 2011 IEEE Multi-conference on Systems and
Control, pp. 13271334.
Blanke, M., Kinnaert, M., Lunze, J., Staroswiecki, M., 2003. Diagnosis and Fault-Tolerant
Control, 1st ed. Springer.
228

Blanke, M., Kinnaert, M., Lunze, J., Staroswiecki, M., 2006. Diagnosis and Fault-Tolerant
Control, 2nd ed. Springer.
Bo, C., Qiao, X., Zhang, G., Bai, Y., Zhang, S., 2010. An integrated method of independent
component analysis and support vector machines for industry distillation process
monitoring. Journal of Process Control 20, 11331140.
Bornard, G., Couenne, N., Celle, F., 1989. Regularly persistent observers for bilinear systems,
in: Descusse, J., Fliess, M., Isidori, A., Leborgne, D. (Eds.), New Trends in Nonlinear
Control Theory, Lecture Notes in Control and Information Sciences. Springer Berlin /
Heidelberg, pp. 130140.
Bornard, G., Hammouri, H., 1991. A high gain observer for a class of uniformly observable
systems, in: Decision and Control, 1991., Proceedings of the 30th IEEE Conference On.
pp. 1494 1496 vol.2.
Boser, B., Guyon, I., Vapnik, V., 1992. A training algorithm for optimal margin classifiers, in:
Proceedings of the Fifth Annual Workshop on Computational Learning Theory. ACM,
Pittsburgh, Pennsylvania, United States, pp. 144152.
Boukhezzar, B., 2006. Sur les stratgies de commande pour loptimisation et la rgulation de
puissance des oliennes vitesse variable. Thse de Doctorat de lUniversit Paris-Sud.
Bozdogan, H., 2000. Akaikes information criterion and recent developments in information
complexity. J. Math. Psychol. 44, 6291.
Brandao, R.F.M., Carvalho, J.A.B., Barbosa, F.P.M., 2010. Neural networks for condition
monitoring of wind turbines, in: Modern Electric Power Systems (MEPS), Proceedings of
the International Symposium. pp. 1-4.
Brereton, R.G., Lloyd, G.R., 2010. Support Vector Machines for classification and regression.
Analyst 135, 230267.
Caccavale, F., Digiulio, P., Iamarino, M., Masi, S., Pierri, F., 2010. A neural network approach
for on-line fault detection of nitrogen sensors in alternated active sludge treatment plants.
Water Science & Technology 62, 2760- 2768.
Caccavale, F., Pierri, F., Iamarino, M., Tufano, V., 2011. Control and Monitoring of Chemical
Batch Reactors. Springer.
Camci, F., Chinnam, R.B., Ellis, R.D., 2008. Robust kernel distance multivariate control chart
using support vector principles. International Journal of Production Research 46, 5075
5095.
Canu, S., Grandvalet, Y., Guigue, V., Rakotomamonjy, A., 2005. SVM and Kernel Methods
Matlab toolbox, Perception Systmes et Information. INSA de Rouen, Rouen, France.
229

Chachuat, B., Roche, N., Latifi, M.A., 2003. Rduction du modle ASM 1 pour la commande
optimale des petites stations dpuration boues actives. Revue des sciences de leau
16, 526.
Chakraborty, U.K., 2008. Advances in differential evolution. Springer Verlag, Berlin.
Chang, C., Lin, C.-J., 2001. LIBSVM: a Library for Support Vector Machines.
Chang, C., Lin, C., 2011. LIBSVM: a library for support vector machines. Science 2, 139.
Chen, S., Wang, W., van Zuylen, H., 2009. Construct support vector machine ensemble to detect
traffic incident. Expert Systems with Applications 36, 1097610986.
Chen, W., Ding, S.X., Haghani, A., Naik, A., Khan, A.Q., Yin, S., 2011. Observer-Based FDI
Schemes for Wind Turbine Benchmark, in: IFAC. Presented at the Proceedings of the
18th IFAC World Congress, pp. 70737078.
Cheng, C.-S., Cheng, H.-P., 2008. Identifying the source of variance shifts in the multivariate
process using neural networks and support vector machines. Expert Systems with
Applications 35, 198206.
Cheng, C.-S., Chen, P.-W., Huang, K.-K., 2011. Estimating the shift size in the process mean
with support vector regression and neural networks. Expert Systems with Applications
38, 1062410630.
Cherkassky, V., Ma, Y., 2002. Selection of Meta-parameters for Support Vector Regression, in:
Proceedings of the International Conference on Artificial Neural Networks, ICANN 02.
Springer-Verlag, London, UK, UK, pp. 687693.
Cherkassky, V., Ma, Y., 2004. Practical selection of SVM parameters and noise estimation for
SVM regression. Neural Netw. 17, 113126.
Chetouani, Y., 2006. Fault Detection in a Chemical Reactor by Using the Standardized
Innovation. Process Safety and Environmental Protection 84, 2732.
Chiang, L.H., Russell, E.L., Braatz, R.D., 2000. Fault diagnosis in chemical processes using
Fisher discriminant analysis, discriminant partial least squares, and principal component
analysis. Chemometrics and Intelligent Laboratory Systems 50, 243252.
Chiang, L.H., Kotanchek, M.E., Kordon, A.K., 2004. Fault diagnosis based on Fisher
discriminant analysis and support vector machines. Computers & Chemical Engineering
28, 13891401.
Chitralekha, S.B., Shah, S.L., 2010. Application of support vector regression for developing soft
sensors for nonlinear processes. The Canadian Journal of Chemical Engineering 88, 696
709.

230

Choi, S.W., Lee, I.-B., 2004. Nonlinear dynamic process monitoring based on dynamic kernel
PCA. Chemical Engineering Science 59, 58975908.
Choi, Lee, I., 2005. Multiblock PLS-based localized process diagnosis. Journal of Process
Control 15, 295306.
Chong, H.G., Walley, W.J., 1996. Rule-based versus probabilistic approaches to the diagnosis of
faults in wastewater treatment processes. Artificial Intelligence in Engineering 10, 265
273.
Chow, E.Y., Willsky, A.S., Systems, M.I. of T.L. for I. and D., 1982. Analytic redundancy and
the design of robust failure detection systems. http://dspace.mit.edu/handle/1721.1/2828
Copp, J.B., 2002. The COST simulation benchmark: description and simulator manual. A
Product of COST Action 624 and COST Action 682, Directorate-General for Research.
Luxembourg: Office for Official Publications of the European Communities.
Corominas, L., Villez, K., Aguado, D., Rieger, L., Rosn, C., Vanrolleghem, P.A., 2011.
Performance evaluation of fault detection methods for wastewater treatment processes.
Biotechnology and Bioengineering 108, 333344.
Cortes, C., Vapnik, V., 1995. Support-vector networks. Machine Learning 20, 273297.
Crone, S.F., Kourentzes, N., 2010. Naive Support Vector Regression and Multilayer Perceptron
benchmarks for the 2010 neural network grand competition (NNGC) on time series
prediction. IEEE, pp. 18.
Das, S., Karnik, N., Santoso, S., 2011. Time-Domain Modeling of Tower Shadow and Wind
Shear in Wind Turbines. ISRN Renewable Energy 2011, 111.
David, R., Saucez, P., Vasel, J.-L., Vande Wouwer, A., 2009. Modeling and numerical
simulation of secondary settlers: A Method of Lines strategy. Water Research 43, 319
330.
David, R., Vande Wouwer, A., Vasel, J.-L., Queinnec, I., 2009. Robust control of the activated
sludge process. Biotechnology Progress 25, 701708.
Davy, M., Desobry, F., Gretton, A., Doncarli, C., 2006. An Online Support Vector Machine for
Abnormal Events Detection. Signal Processing 86, 2009 2025.
De Jong, S., 1993. SIMPLS: An alternative approach to partial least squares regression.
Chemometrics and Intelligent Laboratory Systems 18, 251263.
De Persis, C., Isidori, A., 2001. A geometric approach to nonlinear fault detection and isolation.
Automatic Control, IEEE Transactions on 46, 853 865.

231

Deswal, S., 2011. Modeling Oxygen-transfer by Multiple Plunging Jets using Support Vector
Machines and Gaussian Process Regression Techniques. International Journal of Civil
and Environmental Engineering 2833.
Detroja, K.P., Gudi, R.D., Patwardhan, S.C., 2007. Plant-wide detection and diagnosis using
correspondence analysis. Control Engineering Practice 15, 14681483.
Diehl, S., Jeppsson, U., 1998. A model of the settler coupled to the biological reactor. Water
Research 32, 331342.
Dinesh Kumar, J., Harikrishan, N., Karuppiah, S., Manoj, N., Satish, S., Vishal, L., Sunil Nag,
P.V., 2011. Wavelet based Fault Detection for Wind Turbine. Presented at the
International Symposium on Devices MEMS, Intelligent Systems & Communication
(ISDMISC) 2011, New York, Etats-Unis, pp. 710.
Ding, S.X., 2008. Model-based Fault Diagnosis Techniques: Design Schemes, Algorithms, and
Tools, 1st ed. Springer.
Dispan, J., 2003. Biodgradabilit de la matire organique dans le continuum aquatique rseau
dassainissement -station dpuration- milieu naturel rcepteur. Dveloppement dune
mthodologie pour le fractionnement de la matire organique en classes de
biodgradabilit. Thse de Doctorat de l'cole nationale des ponts et chausses.
Dolan, B., 2010. Wind Turbine Modelling, Control and Fault Detection.
Donders, S., 2002. Fault Detection and Identification for Wind Turbine Systems: a closed-loop
analysis. Masters Thesis, university of Twente.
Dong, J., Verhaegen, M., 2011. Data Driven Fault Detection and Isolation of a Wind Turbine
Benchmark. Presented at the Proceedings of the 18th IFAC World Congress, pp. 7086
7091.
Downs, J.J., Vogel, E.F., 1993. A plant-wide industrial process control problem. Computers &
Chemical Engineering 17, 245255.
Dumais, S., Platt, J., Heckerman, D., Sahami, M., 1998. Inductive learning algorithms and
representations for text categorization, in: Proceedings of the Seventh International
Conference on Information and Knowledge Management, CIKM 98. ACM, New York,
NY, USA, pp. 148155.
Dunia, R., Qin, S.J., Edgar, T.F., McAvoy, T.J., 1996. Identification of faulty sensors using
principal component analysis. AIChE Journal 42, 27972812.
Echavarria, E., Tomiyama, T., Bussel, G.J.W. van, 2007. Fault Diagnosis approach based on a
model-based reasoner and a functional designer for a wind turbine. An approach towards
self-maintenance. Journal of Physics: Conference Series 75, 012078.
232

Edwards, C., Spurgeon, S.K., Patton, R.J., 2000. Sliding mode observers for fault detection and
isolation. Automatica 36, 541553.
Efron, B., 1988. Jackknife: the Bootstrap and Other Resampling Plans. Soc. Ind. Appl. Math.,
Philadelphia.
Ekman, M., 2003. Urban Water Management - Modelling, Simulation and Control of the
Activated Sludge Process (dissertation). Uppsala University.
Ekman, M., Bjrlenius, B., Andersson, M., 2006. Control of the aeration volume in an activated
sludge process using supervisory control strategies. Water Research 40, 16681676.
Elhor, N., Bertrand, R., Postaire, J., Hamad, D., 1999. Neural networks for wind turbine
supervision. e & i Elektrotechnik und Informationstechnik 116, 366369.
Entezami, M., Hillmansen, S., Weston, P., Papaelias, M.P., 2012. Fault detection and diagnosis
within a wind turbine mechanical braking system using condition monitoring. Renewable
Energy 47, 175182.
Esbensen, T., Sloth, C., 2009. Fault Diagnosis and Fault-Tolerant Control of Wind Turbines.
Masters Thesis, Aalborg University.
Fang, F., Ni, B., Li, W., Sheng, G., Yu, H., 2011. A simulation-based integrated approach to
optimize the biological nutrient removal process in a full-scale wastewater treatment
plant. Chemical Engineering Journal 174, 635643.
Farza, M., Hammouri, H., Othman, S., Busawon, K., 1997. Nonlinear observers for parameter
estimation in bioprocesses. Chemical Engineering Science 52, 42514267.
Fei, S., Zhang, X., 2009. Fault diagnosis of power transformer based on support vector machine
with genetic algorithm. Expert Systems with Applications 36, 1135211357.
Ferrer, A., Aguado, D., VidalPuig, S., Prats, J.M., Zarzo, M., 2008. PLS: A versatile tool for
industrial process improvement and optimization. Applied Stochastic Models in Business
and Industry 24, 551567.
Flake, G.W., Lawrence, S., 2002. Efficient SVM Regression Training with SMO. Machine
Learning 46, 271290.
Fragkoulis, D., Roux, G., Dahhou, B., 2011. Detection, isolation and identification of multiple
actuator and sensor faults in nonlinear dynamic systems: Application to a waste water
treatment process. Applied Mathematical Modelling 35, 522543.
Frank, P.M., 1990. Fault diagnosis in dynamic systems using analytical and knowledge-based
redundancy: A survey and some new results. Automatica 26, 459474.

233

Frank, P.M., Kppen-Seliger, B., 1997. New developments using AI in fault diagnosis.
Engineering Applications of Artificial Intelligence 10, 314.
Frank, P.M., Garca, E.A., Kppen-Seliger, B., 2000. Modelling for fault detection and isolation
versus modelling for control. Math. Comput. Simul. 53, 259271.
Fuente, M.., Vega, P., Zarrop, M., Poch, M., 1996. Fault detection in a real wastewater plant
using parameter-estimation techniques. Control Engineering Practice 4, 10891098.
Ganyun, L.V., Haozhong, C., Haibao, Z., Lixin, D., 2005. Fault diagnosis of power transformer
based on multi-layer SVM classifier. Electric Power Systems Research 74, 17.
Gauthier, J.P., Hammouri, H., Othman, S., 1992. A simple observer for nonlinear systems
applications to bioreactors. Automatic Control, IEEE Transactions on 37, 875 880.
Ge, M., Du, R., Zhang, G., Xu, Y., 2004. Fault diagnosis using support vector machine with an
application in sheet metal stamping operations. Mechanical Systems and Signal
Processing 18, 143159.
Geladi, P., Kowalski, B.R., 1986. Partial least-squares regression: a tutorial. Analytica Chimica
Acta 185, 117.
Gernaey, K., Bogaert, H., Vanrolleghem, P., Van Vooren, L., Verstraete, W., 1998. Sensors for
Nitrogen

Removal

Monitoring

in

Wastewater

Treatment.

In:

Environmental

Biomonitoring: The Ecotoxicology Biotechnology Interface. Eds. Lynch J.M. and


Wiseman A., Cambridge University Press, UK. 180-207.
Gernaey, K.V., van Loosdrecht, M.C.., Henze, M., Lind, M., Jrgensen, S.B., 2004. Activated
sludge wastewater treatment plant modelling and simulation: state of the art.
Environmental Modelling & Software 19, 763783.
Gernaey, K.V., Rosen, C., Jeppsson, U., 2006. WWTP dynamic disturbance modelling--an
essential module for long-term benchmarking development. Water Sci. Technol. 53, 225
234.
Gertler, J., 1998. Fault detection and diagnosis in engineering systems. Marcel Dekker, New
York.
Gestel, T.V., Suykens, J.A.K., Baestaens, D., Lambrechts, A., Lanckriet, G., Vandaele, B.,
Moor, B.D., Vandewalle, J., 2001. Financial Time Series Prediction using Least Squares
Support Vector Machines within the Evidence Framework. IEEE Transactions on Neural
Networks 12, 809821.
Goethals, I., Pelckmans, K., Suykens, J.A.K., Moor, B.D., 2005. Subspace Identification of
Hammerstein Systems using Least Squares Support Vector Machines. IEEE Trans. on
Automatic Control 50, 15091519.
234

Gretton, A., Doucet, A., Herbrich, R., Rayner, P., Schoelkopf, B., 2001. Support Vector
Regression for Black-Box System Identification. In: Proceedings of the 11th IEEE
Workshop on Statistical Signal Processing, pp. 341 - 344.
Guermeur, Y., 2007. SVM Multiclasses, Thorie et Applications. Habilitation diriger des
recherches de lUniversit Nancy I.
Guinot, P., Sheibat-Othman, N., Fvotte, G., Mckenna, T., 2000. On-line monitoring of emulsion
copolymerisations using hardware sensors and calorimetry. Polymer Reaction
Engineering 8, 115134.
Gujer, W., Henze, M., Mino, T., Van Loosdrecht, M., 1999. Activated Sludge Model No. 3.
Water and Science Technology 39, 183193.
Gujer, W., 2010. Nitrification and me A subjective review. Water Research 44, 119.
Gunn, S., 1998. Support vector machines for classification and regression. Technical report,
University of Southampton.
Gunter, L., Zhu, J., 2007. Efficient Computation and Model Selection for the Support Vector
Regression. Neural Comput. 19, 16331655.
Gupta, S.M., 2007. Support Vector Machines based Modelling of Concrete Strength. Presented
at the Proceedings of world academy of science, engineering and technology, pp.305-311
Gustafsson, F., 2007. Statistical signal processing approaches to fault detection. Annual Reviews
in Control 31, 4154.
Haimi, H., Mulas, M., Sahlstedt, K., Vahala, R., 2009. Advanced operation and control methods
of municipal wastewater treatment processes in Finland. Helsinki University of
Technology, Water and Wastewater Engineering.
Hajiyev, C., 2012. TracyWidom distribution based fault detection approach: Application to
aircraft sensor/actuator fault detection. ISA Transactions 51, 189197.
Hameed, Z., Hong, Y.S., Cho, Y.M., Ahn, S.H., Song, C.K., 2009. Condition monitoring and
fault detection of wind turbines and related algorithms: A review. Renewable and
Sustainable Energy Reviews 13, 139.
Hammouri, H., de Leon Morales, J., 1990. Observer synthesis for state-affine systems, in:
Decision and Control, 1990., Proceedings of the 29th IEEE Conference On. pp. 784 785
vol.2.
Hammouri, H., Kinnaert, M., El Yaagoubi, E.H., 1999. Observer-based approach to fault
detection and isolation for nonlinear systems. IEEE Transactions on Automatic Control
44, 1879 1884.

235

Hammouri, H., Kabore, P., Othman, S., Biston, J., 2002. Failure diagnosis and nonlinear
observer. Application to a hydraulic process. Journal of the Franklin Institute 339, 455
478.
Han, H.-G., Qiao, J.-F., 2011. Adaptive dissolved oxygen control based on dynamic structure
neural network. Applied Soft Computing 11, 38123820.
Hauduc, H., 2010. Modles biocintiques de boues actives de type ASM: analyse thorique et
fonctionnelle, vers un jeu de paramtres par dfaut (Thse de doctorat). L'Universit
Laval, Qubec.
He, W., Wang, Z., Jiang, H., 2008. Model optimizing and feature selecting for support vector
regression in time series forecasting. Neurocomputing 72, 600611.
Henriksen, L.C., Poulsen, N.K., Hansen, M.H., 2011. Nonlinear Model Predictive Control of a
Simplified Wind Turbine. Presented at the the 18th IFAC World Congress, Milan, Italy,
pp. 551556.
Henze, M., Grady Jr, C.P.L., Gujer, W., Marais, G.V.R., Matsuo, T., 1987. A general model for
single-sludge wastewater treatment systems. Water Research 21, 505515.
Henze, M., Gujer, W.,Mino, T.,Matsuo,T.,Wentzel, M.C.,Marais, G.v.R, 1995. Activated Sludge
Model No. 2.IAWQ Scientific and Technical Reports, No.3, London.
Henze, M., Gujer, W., Mino, T., Van Loosdrecht M.C.M., 2000. Activated Sludge Models
Asm1, Asm2, Asm2d and Asm3. IWA Publishing, London.
Heymann, Y.T., 2010. A theory of the lifecycle of bacteria. Nature and Science, 121131.
Hsu, C.-C., Chen, M.-C., Chen, L.-S., 2010. Integrating independent component analysis and
support vector machine for multivariate process monitoring. Computers & Industrial
Engineering 59, 145156.
Huang, C., Davis, L.S., Townshend, J.R.G., 2002. An assessment of support vector machines for
land cover classification. International Journal of Remote Sensing 23, 725749.
Huang, Y., Reklaitis, G.V., Venkatasubramanian, V., 2003. A Heuristic Extended Kalman Filter
Based Estimator for Fault Identification in a Fluid Catalytic Cracking Unit. Industrial &
Engineering Chemistry Research 42, 33613371.
Hugo, G., Sbarbaro, D.G., 2011. Outliers Detection in Industrial Databases: An Example
Sulphur Recovery Process. IFAC World Congress 18, 16521657.
Humberstone, M.J., 2010. An Adaptive Nonparametric Modeling Technique for Expanded
Condition Monitoring of Processes (PhD diss). University of Tennessee - Knoxville.

236

Humberstone, M., Wood, B., Henkel, J., Hines, J., 2012. Differentiating between expanded and
fault conditions using principal component analysis. Journal of Intelligent Manufacturing
23, 179188.
Ingildsen, P., 2002. Realising full-scale control in wastewater treatment systems using in situ
nutrient sensors. Doctoral Dissertation in Industrial Automation, Lund University,
Sweden.
Isermann, R., Ball, P., 1997. Trends in the application of model-based fault detection and
diagnosis of technical processes. Control Engineering Practice 5, 709719.
Isermann, R., 2005. Model-based fault-detection and diagnosis status and applications. Annual
Reviews in Control 29, 7185.
Isermann, R., 2006. Fault-diagnosis systems: an introduction from fault detection to fault
tolerance. Springer.
Isermann, R., 2011. Fault-Diagnosis Applications Model-Based Condition Monitoring:
Actuators, Drives, Machinery, Plants, Sensors, and Fault-Tolerant Systems. Springer,
Berlin; Heidelberg; New York.
Ivanciuc, O., 2007. Applications of Support Vector Machines in Chemistry, in: Reviews in
Computational Chemistry. John Wiley & Sons, Inc., pp. 291400.
Jemwa, G.T., Aldrich, C., 2006. Kernel-based fault diagnosis on mineral processing plants.
Minerals Engineering 19, 11491162.
Jeppsson, U., 1996. Modelling aspects of wastewater treatment processes. Doctoral thesis, IEA,
Sweden.
Jeppsson, U., Alex, J., Pons, M.N., Spanjers, H., Vanrolleghem, P.A., 2002. Status and future
trends of ICA in wastewater treatment--a European perspective. Water Sci. Technol. 45,
485494.
Jeppsson, U., Pons, M.-N., Nopens, I., Alex, J., Copp, J.B., Gernaey, K.V., Rosen, C., Steyer, J.P., Vanrolleghem, P.A., 2007. Benchmark simulation model no 2: general protocol and
exploratory case studies. Water Science & Technology 56, 67-78.
Jianxu, L., 2011. Dynamic Optimization of Aeration Operations for a Benchmark Wastewater
Treatment Plant. Presented at the Proceedings of the 18th IFAC World Congress, 2011,
Milano, Italy, pp. 1418914194.
Joachims, T., 1999. Making large-scale support vector machine learning practical, in: Advances
in Kernel Methods: Support Vector Learning. MIT Press, pp. 169184.

237

Johnson, K.E., Pao, L.Y., Balas, M.J., Fingersh, L.J., 2006. Control of variable-speed wind
turbines: standard and adaptive techniques for maximizing energy capture. IEEE Control
Systems Magazine 26, 7081.
Jonasson, M., 2007. Energy Benchmark for Wastewater Treatment Processes - a Comparison
between Sweden and Austria, TEIE-5247, IEA.
Jonkman, J.M., 2009. Dynamics of offshore floating wind turbines-model development and
verification. Wind Energy 12, 459492.
Jun, B.H., 2011. Fault detection using dynamic time warping (DTW) algorithm and discriminant
analysis for swine wastewater treatment. Journal of Hazardous Materials 185, 262268.
Juricek, B.C., Seborg, D.E., Larimore, W.E., 2004. Fault Detection Using Canonical Variate
Analysis. Industrial & Engineering Chemistry Research 43, 458474.
Kabore, P., Othman, S., Mckenna, T.F., Hammouri, H., 2000. Observer-based fault diagnosis for
a class of non-linear systems Application to a free radical copolymerization reaction.
International Journal of Control 73, 787803.
Katipamula, S., Brambley, M.R., 2005. Review Article: Methods for Fault Detection,
Diagnostics, and Prognostics for Building SystemsA Review, Part I. HVAC&R
Research 11, 325.
Khushaba, R.N., Al-Ani, A., Al-Jumaily, A., 2011. Feature subset selection using differential
evolution and a statistical repair mechanism. Expert Systems with Applications 38,
1151511526.
Kiasi, F., Prakash, J., Shah, S.L., Lee, J.M., 2011. Fault Detection and Isolation of Benchmark
Wind Turbine Using the Likelihood Ratio Test. Presented at the Proceedings of the 18th
IFAC World Congress, 2011, Milano, Italy, pp. 70797085.
Kim, K., Lee, J.-M., Lee, I.-B., 2005. A novel multivariate regression approach based on kernel
partial least squares with orthogonal signal correction. Chemometrics and Intelligent
Laboratory Systems 79, 2230.
Kourti, T., 2005. Application of latent variable methods to process control and multivariate
statistical process control in industry. International Journal of Adaptive Control and
Signal Processing 19, 213246.
Kulkarni, A., Jayaraman, V.K., Kulkarni, B.D., 2004. Support vector classification with
parameter tuning assisted by agent-based technique. Computers & Chemical Engineering
28, 311318.

238

Kulkarni, A., Jayaraman, V.K., Kulkarni, B.D., 2005. Knowledge incorporated support vector
machines to detect faults in Tennessee Eastman Process. Computers & Chemical
Engineering 29, 21282133.
Kusiak, A., Li, W., 2011. The prediction and diagnosis of wind turbine faults. Renewable Energy
36, 1623.
Kwok, J.T., Tsang, I.W., 2003. Linear dependency between and the input noise in -support
vector regression. IEEE Transactions on Neural Networks 14, 544553.
Lahiri, S.K., Ghanta, K.C., 2008. The Support Vector Regression with the parameter tuning
assisted by a differential evolution technique: Study of the critical velocity of a slurry
flow in a pipeline. Chemical Industry and Chemical Engineering Quarterly 14, 191203.
Laouti, N., Sheibat-othman, N., Othman, S., 2011a. Support Vector Machines for Fault
Detection in Wind Turbines. Presented at the IFAC World Congress, Milano, Italy, pp.
70677072.
Laouti, N., Sheibat-Othman, N., Othman, S., 2011b. Fault diagnosis for wastewater treatment
plants using Support Vector Machines. Presented at the STIC & ENVIRONNEMENT,
France.
Lauer, F., Bloch, G., 2006. Mthodes SVM pour lidentification, in: Journes Identification Et
Modlisation Exprimentale, JIME2006, Poitiers, France, p. CDROM.
Lee, C., Choi, S.W., Lee, I.-B., 2004. Sensor fault identification based on time-lagged PCA in
dynamic processes. Chemometrics and Intelligent Laboratory Systems 70, 165178.
Lee, D.S., Vanrolleghem, P.A., Park, J.M., 2005. Parallel hybrid modeling methods for a fullscale cokes wastewater treatment plant. Journal of Biotechnology 115, 317328.
Lee, D.S., Lee, M.W., Woo, S.H., Kim, Y.-J., Park, J.M., 2006a. Nonlinear dynamic partial least
squares modeling of a full-scale biological wastewater treatment plant. Process
Biochemistry 41, 20502057.
Lee, H.W., Lee, M.W., Park, J.M., 2007. Robust Adaptive Partial Least Squares Modeling of a
Full-Scale Industrial Wastewater Treatment Process. Industrial & Engineering Chemistry
Research 46, 955964.
Lee, J., Qin, S.J., Lee, I., Lee, J., Qin, S.J., Lee, I., 2006. Fault detection and diagnosis based on
modified independent component analysis, Fault detection and diagnosis based on
modified independent component analysis. AIChE Journal 52, 35013514.
Lee, J.-M., Yoo, C., Lee, I.-B., 2004. Statistical process monitoring with independent component
analysis. Journal of Process Control 14, 467485.

239

Lee, M.W., Joung, J.Y., Lee, D.S., Park, J.M., Woo, S.H., 2005. Application of a MovingWindow-Adaptive Neural Network to the Modeling of a Full-Scale Anaerobic Filter
Process. Industrial & Engineering Chemistry Research 44, 39733982.
Lee, M.W., Hong, S.H., Choi, H., Kim, J.-H., Lee, D.S., Park, J.M., 2008. Real-time remote
monitoring of small-scaled biological wastewater treatment plants by a multivariate
statistical process control and neural network-based software sensors. Process
Biochemistry 43, 11071113.
Li, G., Qin, S.J., Zhou, D., 2010. Geometric properties of partial least squares for process
monitoring. Automatica 46, 204210.
Li, H., Liang, Y., Xu, Q., 2009. Support vector machines and its applications in chemistry.
Chemometrics and Intelligent Laboratory Systems 95, 188198.
Li, J., Cui, P., 2009. Improved kernel fisher discriminant analysis for fault diagnosis. Expert
Systems with Applications 36, 14231432.
Li, S., Wunsch, D.C., OHair, E.A., Giesselmann, M.G., 2001. Using neural networks to estimate
wind turbine power generation. Energy Conversion, IEEE Transactions on 16, 276 282.
Li, W., Shah, S.L., Xiao, D., 2008. Kalman filters in non-uniformly sampled multirate systems:
For FDI and beyond. Automatica 44, 199208.
Li, Y., Wang, Z., Yuan, J., 2006. On-line Fault Detection Using SVM-based Dynamic MPLS for
Batch Processes. Chinese Journal of Chemical Engineering 14, 754758.
Liang, J., Du, R., 2007. Model-based Fault Detection and Diagnosis of HVAC systems using
Support Vector Machine method. International Journal of Refrigeration 30, 11041114.
Liu, Y., Zheng, Y.F., 2005. One-against-all multi-class SVM classification using reliability
measures. Neural Networks, 2005. IJCNN '05. Proceedings. 2005 IEEE International
Joint Conference on, 2, pp. 849 854.
Lootsma, T.F., 1999. Observer-based Fault Detection and Isolation for Nonlinear Systems. IEEE
Transactions on Automatic Control 44, 18791884.
Lootsma, T.F., 2001. Observer-based fault detection and isolation for nonlinear systems: Ph.D.
thesis. Department of Control Engineering, Aalborg University, Aalborg.
Loureno, N.D., Menezes, J.C., Pinheiro, H.M., Diniz, D., 2008. Fuel park wastewater
monitoring with UV-VIS spectra and partial. Macedonian Journal of Chemistry and
Chemical Engineering 27, 1923.
Lu, B., Li, Y., Wu, X., Yang, Z., 2009. A review of recent advances in wind turbine condition
monitoring and fault diagnosis, in: IEEE Power Electronics and Machines in Wind

240

Applications, 2009. PEMWA 2009. Presented at the IEEE Power Electronics and
Machines in Wind Applications, 2009. PEMWA 2009, IEEE, pp. 17.
Lu, N., Wang, X., 2008. Fault Diagnosis Based on Signed Digraph Combined with Dynamic
Kernel PLS and SVR. Industrial & Engineering Chemistry Research 47, 94479456.
Lu, Y., 2012. Wind Turbine Gearbox Fault Detection Using Multiple Sensors With Features
Level Data Fusion. Transactions of the ASME - A - Engineering for Gas Turbines and
Power 134, 042501.
Ma, J., Theiler, J., Perkins, S., 2003. Accurate On-line Support Vector Regression. Neural
Computation 15, 26832703.
Maalouf, M., Khoury, N., Trafalis, T.B., 2008. Support vector regression to predict asphalt mix
performance. International Journal for Numerical and Analytical Methods in
Geomechanics 32, 19891996.
Mahadevan, S., Shah, S.L., 2009. Fault detection and diagnosis in process data using one-class
support vector machines. Journal of Process Control 19, 16271639.
Mao, Y., Xia, Z., Yin, Z., Sun, Y., Wan, Z., 2007. Fault Diagnosis Based on Fuzzy Support
Vector Machine with Parameter Tuning and Feature Selection. Chinese Journal of
Chemical Engineering 15, 233239.
Martnez-Ramn, M., Rojo-Alvarez, J.L., Camps-Valls, G., Muioz-Mar, J., Navia-Vzquez,
A., Soria-Olivas, E., Figueiras-Vidal, A.R., 2006. Support vector machines for nonlinear
kernel ARMA system identification. IEEE Trans Neural Netw 17, 16171622.
Matha, D., 2009. Model Development and Loads Analysis of an Offshore Wind Turbine on a
Tension Leg Platform, with a Comparison to Other Floating Turbine Concepts. National
Renewable Energy Laboratory, United States.
Mattera, D., Haykin, S., 1999. Advances in kernel methods, in: Schlkopf, B., Burges, C.J.C.,
Smola, A.J. (Eds.), MIT Press, Cambridge, MA, USA, pp. 211241.
Melssen, W., stn, B., Buydens, L., 2007. SOMPLS: A supervised self-organising map--partial
least squares algorithm for multivariate regression problems. Chemometrics and
Intelligent Laboratory Systems 86, 102120.
Mjalli, F.S., Al-Asheh, S., Alfadala, H.E., 2007a. Use of artificial neural network black-box
modeling for the prediction of wastewater treatment plants performance. Journal of
Environmental Management 83, 329338.
Mohamed, E.A., Rao, N.D., 1995. Artificial neural network based fault diagnostic system for
electric power distribution feeders. Electric Power Systems Research 35, 110.

241

Mohsen, A.K.A., El-Yazeed, M.F.A., 2004. Selection of Input Stimulus for Fault Diagnosis of
Analog Circuits Using ARMA Model. AEU - International Journal of Electronics and
Communications 58, 212217.
Monod, J., 1949. The Growth of Bacterial Cultures. Annual Review of Microbiology 3, 371
394.
Monroy, I., Benitez, R., Escudero, G., Graells, M., 2010. A semi-supervised approach to fault
diagnosis for chemical processes. Computers & Chemical Engineering 34, 631642.
Mujahed, A.-D., Westwick, D.T., 2011. Support Vector Machine Identification of Output Error
Hammerstein Models, in: Sergio, B. (Ed.), Presented at the the 18th IFAC World
Congress, Milano (Italy), pp. 1394813953.
Mukherjee, S., Vapnik, V., 1999. Multivariate Density Estimation: an SVM Approach.
Massachusetts Institute of Technology, Cambridge, MA, USA.
Mulas, M., 2006. Modelling and Control of Activated Sludge Processes. PhD dissertation,
University of Gagliari, Italy.
Musyafa, A., Negara, I.M.Y., Robandi, I., 2011. Design Optimal of Adaptive Control and Fuzzy
Logic Control on Torque-Shaft Small Scale Wind Turbine. Canadian Journal on
Electrical and Electronics Engineering 2, 202208.
Negre, P.L., Puig, V., Pineda, I., 2011. Fault Detection and Isolation of a Real Wind Turbine
Using LPV Observers. Presented at the the 18th IFAC World Congress, Milano, Italy, pp.
1237212379.
Nelson, M.I., Sidhu, H.S., 2009. Analysis of the activated sludge model (number 1). Applied
Mathematics Letters 22, 629635.
Nguyen, D.V., Rocke, D.M., 2002. Tumor Classification by Partial Least Squares Using
Microarray Gene Expression Data. Bioinformatics 18, 3950.
Niska, H., 2011. Predictive data-driven modeling approaches in environmental management
decision-making (Dissertation). University of Eastern Finland.
Nyberg, M., 1999. Model Based Fault Diagnosis: Methods, Theory, and Automotive Engine
Applications,PhDthesis. Linkping University, Sweden.
Odgaard, P., Stoustrup, J., 2009. Unknown Input Observer Based Scheme for Detecting Faults in
a Wind Turbine Converter, in: Proceedings of the 7th IFAC Symposium on Fault
Detection, Supervision and Safety of Technical Processes, pp. 161-166.
Odgaard, P., Stoustrup, J., Kinnaert, M., 2009. Fault Tolerant Control of Wind Turbines - a
Benchmark Model, in: Proceedings of Fault Detection, Supervision and Safety of
Technical Processes. Barcelona, pp. 155-160.
242

Odgaard, P.F., Stoustrup, J., 2010. Unknown input observer based detection of sensor faults in a
wind turbine. Presented at the 2010 IEEE International Conference on Control
Applications (CCA), IEEE, pp. 310315.
Odgaard, P.F., Stoustrup, J., 2011. Orthogonal Bases used for Feed Forward Control of Wind
Turbines. Presented at the In: Proceedings of the 18th IFAC World Congress, pp. 532537.
Odgaard, P.F., Stoustrup, J., 2012. Results of a wind turbine FDI competition. Presented at the
IFAC Workshop Series.
, G., Pappa, G.L., Mattoso, M., 2010.
Adaptive Normalization: A novel data normalization approach for non-stationary time
series, in: Neural Networks (IJCNN), The 2010 International Joint Conference On. pp. 1
8.
Olsson, G., 2007. Automation Development in Water and Wastewater Systems. Environ. Eng.
Res. 12, 197200.
stergaard, K.Z., Brath, P., Stoustrup, J., 2007. Estimation of effective wind speed. Journal of
Physics: Conference Series 75, 012082.
stergaard, K.Z., Stoustrup, J., Brath, P., 2009. Linear parameter varying control of wind
turbines covering both partial load and full load conditions. International Journal of
Robust and Nonlinear Control 19, 92116.
Ozdemir, A.A., Seiler, P., Balas, G.J., 2011. Wind Turbine Fault Detection Using Counter-Based
Residual Thresholding. Proceedings of the 18th IFAC World Congress, 2011 18, 8289
8294.
Pachet, F., Roy, P., 2009. Analytical Features: A Knowledge-Based Approach to Audio Feature
Generation. EURASIP Journal on Audio, Speech, and Music Processing 2009, 123.
Pao, L.Y., Johnson, K.E., 2009. A tutorial on the dynamics and control of wind turbines and
wind farms, in: American Control Conference, 2009. ACC 09. pp. 2076 2089.
Parrella, F., 2007. Online Support Vector Regression. PhD Thesis. University of Genoa, Italy.
Patton, R.J., 1997. Fault tolerant control systems : The 1997 situation, in: IFAC
SAFEPROCESS1997. Presented at the IFAC Symposium on Fault Detection
Supervision and Safety for Technical Processes, pp. 10331054.
Patton, R.J., Chen, J., 2000. On eigenstructure assignment for robust fault diagnosis.
International Journal of Robust and Nonlinear Control 10, 11931208.
Paviglianiti, G., Pierri, F., Caccavale, F., Mattei, M., 2010. Robust fault detection and isolation
for proprioceptive sensors of robot manipulators. Mechatronics 20, 162170.

243

Peng, H., Long, F., Ding, C., 2005. Feature selection based on mutual information: criteria of
max-dependency, max-relevance, and min-redundancy. IEEE Transactions on Pattern
Analysis and Machine Intelligence 27, 12261238.
Pierri, F., Paviglianiti, G., Caccavale, F., Mattei, M., 2008. Observer-based sensor fault detection
and isolation for chemical batch reactors. Engineering Applications of Artificial
Intelligence 21, 12041216.
Pisu, P., Ayalew, B., 2011. Robust Fault Diagnosis for a Horizontal Axis Wind Turbine.
Presented at the 18th IFAC World Congress, pp. 70557060.
Platt, J.C., 1999. Advances in kernel methods, in: Schlkopf, B., Burges, C.J.C., Smola, A.J.
(Eds.), MIT Press, Cambridge, MA, USA, pp. 185208.
Platt, J.C., Cristianini, N., Shawe-taylor, J., 2000. Large Margin DAGs for Multiclass
Classification, in: Advances in Neural Information Processing Systems. MIT Press, pp.
547553.
Pons, M.N., Belhani, M., Bourgois, J., Dupuit, E., 2008. Analyse du cycle de vie. Epuration des
eaux uses urbaines. Techniques de lingnieur. Environnement n 820, 22 pp.
Pourmohammad, S., Fekih, A., 2011. Fault-Tolerant Control of Wind Turbine Systems - A
Review, in: Green Technologies Conference (IEEE-Green), 2011 IEEE. pp. 1 6.
Pyhnen, S., Arkkio, A., Jover, P., Hytyniemi, H., 2005. Coupling pairwise support vector
machines for fault classification. Control Engineering Practice 13, 759769.
Prakash, J., Patwardhan, S.C., Narasimhan, S., 2002. A Supervisory Approach to Fault-Tolerant
Control of Linear Multivariable Systems. Industrial & Engineering Chemistry Research
41, 22702281.
Priyadarshin, D., Acharya, M., Prasad Mishra, A., 2011. Link Load Prediction using Support
Vector Regression and Optimization. International Journal of Computer Applications 24,
2225.
Pusha, S., Gudi, R., Noronha, S., 2009. Polar classification with correspondence analysis for
fault isolation. Journal of Process Control 19, 656663.
Queinnec, I., Gmez-Quintero, C.-S., 2009. Reduced modeling and state observation of an
activated sludge process. Biotechnology Progress 25, 654666.
Rduly, B., Gernaey, K.V., Capodaglio, A.G., Mikkelsen, P.S., Henze, M., 2007. Artificial
neural networks for rapid WWTP performance evaluation: Methodology and case study.
Environmental Modelling & Software 22, 12081216.

244

Ram Maurya, M., Rengaswamy, R., Venkatasubramanian, V., 2004. Application of signed
digraphs-based analysis for fault diagnosis of chemical process flowsheets. Engineering
Applications of Artificial Intelligence 17, 501518.
Ramaswami, M., Bhaskaran, R., 2009. A Study on Feature Selection Techniques in Educational
Data Mining. Journal of computing 1.
Ravikumar, B., Thukaram, D., Khincha, H.P., 2008. Application of support vector machines for
fault diagnosis in power transmission system. IET Generation, Transmission &
Distribution 2, 119-130.
Reiter, R., 1987. A theory of diagnosis from first principles. Artificial Intelligence 32, 5795.
Ren, N., Liang, J., Gu, B., Han, H., 2008. Fault diagnosis strategy for incompletely described
samples and its application to refrigeration system. Mechanical Systems and Signal
Processing 22, 436450.
Rieger, L., Takcs, I., Shaw, A., Winkler, S., Ohtsuki, T., Langergraber, G., Gillot, S., 2010.
Editorial: Status and future of wastewater treatment modelling. Water Science &
Technology 61, 821-823.
Rieger, L., Thomann, M., Gujer, W., Siegrist, H., 2005. Quantifying the uncertainty of on-line
sensors at WWTPs during field operation. Water Research 39, 51625174.
Rivas, A., Irizar, I., Ayesa, E., 2008. Model-based optimisation of Wastewater Treatment Plants
design. Environmental Modelling & Software 23, 435450.
Rocco S., C.M., Zio, E., 2007. A support vector machine integrated system for the classification
of operation anomalies in nuclear components and systems. Reliability Engineering &
System Safety 92, 593600.
Rosen, C., Jeppsson, U., Rieger, L., Vanrolleghem, P.A., 2008. Adding realism to simulated
sensors and actuators. Water Science & Technology 57, 337-344.
Rosen, C., Lennox, J.A., 2001. Multivariate and multiscale monitoring of wastewater treatment
operation. Water Research 35, 34023410.
Rosipal, R., Krmer, N., 2006. Overview and recent advances in partial least squares, in: In
Subspace, Latent Structure and Feature Selection Techniques, Lecture Notes in
Computer Science. Springer, pp. 3451.
Rosipal, R., Trejo, L.J., 2002. Kernel partial least squares regression in reproducing kernel
hilbert space. J. Mach. Learn. Res. 2, 97123.
Rosipal, R., Trejo, L.J., 2003. Kernel pls-svc for linear and nonlinear classification, in: In
Proceedings of the Twentieth International Conference on Machine Learning (ICML2003. pp. 640647.
245

Ruiz, D., Nougus, J., Caldern, Z., Espua, A., Puigjaner, L., 2000. Neural network based
framework for fault diagnosis in batch chemical plants. Computers & Chemical
Engineering 24, 777784.
Russell, E.L., Chiang, L.H., Braatz, R.D., 2000. Fault detection in industrial processes using
canonical variate analysis and dynamic principal component analysis. Chemometrics and
Intelligent Laboratory Systems 51, 8193.
Salahshoor, K., Kordestani, M., Khoshro, M.S., 2010. Fault detection and diagnosis of an
industrial steam turbine using fusion of SVM (support vector machine) and ANFIS
(adaptive neuro-fuzzy inference system) classifiers. Energy 35, 54725482.
Saludes Rodil, S., Arnanz Gmez, R., Bernrdez, J.M., Rodrguez, F., Miguel, L.J., Pern, J.R.,
2009. Laser welding defects detection in automotive industry based on radiation and
spectroscopical measurements. The International Journal of Advanced Manufacturing
Technology 49, 133145.
Saludes Rodil, S., Fuente, M.J., 2010. Fault tolerance in the framework of support vector
machines based model predictive control. Engineering Applications of Artificial
Intelligence 23, 11271139.
Samanta, B., 2004. Gear fault detection using artificial neural networks and support vector
machines with genetic algorithms. Mechanical Systems and Signal Processing 18, 625
644.
Samanta, B., Al-Balushi, K.R., Al-Araimi, S.A., 2003. Artificial neural networks and support
vector machines with genetic algorithm for bearing fault detection. Engineering
Applications of Artificial Intelligence 16, 657665.
Samanta, B., Nataraj, C., 2009. Use of particle swarm optimization for machinery fault detection.
Engineering Applications of Artificial Intelligence 22, 308316.
Samantaray, S.R., Dash, P.K., Panda, G., 2007. Distance relaying for transmission line using
support vector machine and radial basis function neural network. International Journal of
Electrical Power & Energy Systems 29, 551556.
Saravanan, N., Kumar Siddabattuni, V.N.S., Ramachandran, K.I., 2008. A comparative study on
classification of features by SVM and PSVM extracted using Morlet wavelet for fault
diagnosis of spur bevel gear box. Expert Systems with Applications 35, 13511366.
Saravanan, N., Ramachandran, K.I., 2009. A case study on classification of features by fast
single-shot multiclass PSVM using Morlet wavelet for fault diagnosis of spur bevel gear
box. Expert Systems with Applications 36, 1085410862.

246

Saravanan, N., Siddabattuni, V.N.S.K., Ramachandran, K.I., 2010. Fault diagnosis of spur bevel
gear box using artificial neural network (ANN), and proximal support vector machine
(PSVM). Applied Soft Computing 10, 344360.
Schittkowski, K., 2005. Optimal parameter selection in support vector machines. Journal of
Industrial and Management Optimization 1, 465476.
Schlechtingen, M., Ferreira Santos, I., 2011. Comparative analysis of neural network and
regression based condition monitoring approaches for wind turbine fault detection.
Mechanical Systems and Signal Processing 25, 18491875.
Schlkopf, B., Burges, C.J.C., Smola, A.J., 1999. Advances in kernel methods support vector
learning. MIT Press, Cambridge, Mass.
Schtze, M., Campisano, A., Colas, H., Schilling, W., Vanrolleghem, P.A., 2004. Real time
control of urban wastewater systems-where do we stand today? Journal of Hydrology
299, 335348.
Selvam, K., Kanev, S., van Wingerden, J.W., van Engelen, T., Verhaegen, M., 2009. Feedbackfeedforward individual pitch control for wind turbine load reduction. International
Journal of Robust and Nonlinear Control 19, 7291.
Shawe-Taylor, J., Cristianini, N., 2004. Kernel methods for pattern analysis. Cambridge
University Press, Cambridge, UK; New York.
Sheibat-Othman, N., Othman, S., 2006. Control of an Emulsion Polymerization Reactor.
Industrial & Engineering Chemistry Research 45, 206211.
Sheibat-Othman, N., Othman, S., Boyron, O., Alamir, M., 2011. Multivariable control of the
polymer molecular weight in emulsion polymerization processes. Journal of Process
Control 21, 861873.
Shevade, S.K., Keerthi, S.S., Bhattacharyya, C., Murthy, K.R.K., 2000. Improvements to the
SMO algorithm for SVM regression. IEEE Transactions on Neural Networks 11, 1188
1193.
Shinzawa, H., Ritthiruangdej, P., Ozaki, Y., 2011. Kernel Analysis of Partial Least Squares
(PLS) Regression Models. Applied Spectroscopy 65, 549556.
Shitong, W., Jiagang, Z., Chung, F.L., Qing, L., Dewen, H., 2004. Theoretically Optimal
Parameter Choices for Support Vector Regression Machines with Noisy Input. Soft
Computing 9, 732741.
Simani, S., Castaldi, P., Bonf, M., 2011. Hybrid Model-Based Fault Detection of Wind Turbine
Sensors. Proceedings of the 18th IFAC World Congress, 2011 18, 70617066.

247

Simani, S., Patton, R., Fantuzzi, C., 2003. Model-Based Fault Diagnosis in Dynamic Systems
Using Identification Techniques. Springer-Verlag New York, Inc., Secaucus, NJ, USA.
Singh, K.P., Basant, N., Malik, A., Sinha, S., Jain, G., 2009. Multi-way modeling of wastewater
data for performance evaluation of sewage treatment plantA case study. Chemometrics
and Intelligent Laboratory Systems 95, 1830.
Sloth, C., Esbensen, T., Stoustrup, J., 2011. Robust and fault-tolerant linear parameter-varying
control of wind turbines. Mechatronics 21, 645659.
Smola, A., Burges, C., Drucker, H., Golowich, S., Van Hemmen, L., Mller, K.-R., Schlkopf,
B., Vapnik, V., 1996. Regression Estimation with Support Vector Learning Machines.
Smola, A.J., Murata, N., Schlkopf, B., Mller, K.-R., 1998. Asymptotically Optimal Choice of
-Loss for Support Vector Machines, in: Proceedings of the 8th International Conference
on Artificial Neural Networks, perspectives in Neural Computing, Springer Verlag, pp.
105110.
Solomatine, D.P., Ostfeld, A., 2008. Data-driven modelling : some past experiences and new
approaches. Journal of hydroinformatics 10, 322.
Sotomayor, O.A.Z., Odloak, D., 2005. Observer-based fault diagnosis in chemical plants.
Chemical Engineering Journal 112, 93108.
Sprandio, M., Heran, M., Gillot, S., 2007. Modlisation dynamique des procds biologiques de
traitement des eaux. Techniques de lIngnieur.
Stefatos, G., Ben Hamza, A., 2010. Dynamic independent component analysis approach for fault
detection and diagnosis. Expert Systems with Applications 37, 86068617.
Sugumaran, V., Sabareesh, G.R., Ramachandran, K.I., 2008. Fault diagnostics of roller bearing
using kernel based neighborhood score multi-class support vector machine. Expert
Systems with Applications 34, 30903098.
Sun, X., Marquez, H.J., Chen, T., Riaz, M., 2005. An improved PCA method with application to
boiler leak detection. ISA Trans 44, 379397.
Sun, Y., Liu, L., Popp, M., Farmerie, W., 2006. Estimation Of Cross-Hybridization Signals
Using Support Vector Regression, in: Proceedings of the First International MultiSymposiums on Computer and Computational Sciences - Volume 1 (IMSCCS06) Volume 01, IMSCCS 06. IEEE Computer Society, Washington, DC, USA, pp. 1721.
Svard, C., Nyberg, M., 2010. Residual Generators for Fault Diagnosis Using Computation
Sequences With Mixed Causality Applied to Automotive Systems. IEEE Transactions on
Systems, Man, and Cybernetics - Part A: Systems and Humans 40, 13101328.

248

Svrd, C., Nyberg, M., 2011. Automated Design of an FDI-System for the Wind Turbine
Benchmark. Presented at the Proceedings of the 18th IFAC World Congress, 2011,
Milano, Italy, pp. 83078315.
Takcs, I., 2008. Experiments in activated sludge modelling. PhD Thesis, Ghent University,
Belgium, pp 267.
Takcs, I., Patry, G.G., Nolasco, D., 1991. A dynamic model of the clarification-thickening
process. Water Research 25, 12631271.
Tang, H.-S., Xue, S.-T., Chen, R., Sato, T., 2006. Online weighted LS-SVM for hysteretic
structural system identification. Engineering Structures 28, 17281735.
Tang, W.H., Wu, Q.H., 2011. Condition monitoring and assessment of power transformers using
computational intelligence. Springer, London; New York.
Tang, X., Zhuang, L., Cai, J., Li, C., 2010. Multi-fault classification based on support vector
machine trained by chaos particle swarm optimization. Knowledge-Based Systems 23,
486490.
Tenenhaus, A., Giron, A., Viennet, E., Bra, M., Saporta, G., Fertil, B., 2007. Kernel logistic
PLS: A tool for supervised nonlinear dimensionality reduction and binary classification.
Computational Statistics & Data Analysis 51, 40834100.
Tharrault, Y., 2008. Diagnostic de fonctionnement par analyse en composantes principales:
application une station de traitement des eaux uses. Thse de Doctorat de lInstitut
National Polytechnique de Lorraine. Universit de Nancy, France.
Theilliol, D., Ponsart, J.-C., Harmand, J., Join, C., Gras, P., 2003. On-line estimation of
unmeasured inputs for anaerobic wastewater treatment processes. Control Engineering
Practice 11, 10071019.
Tomita, R.K., Park, S.W., Sotomayor, O.A.Z., 2002. Analysis of activated sludge process using
multivariate statistical toolsa PCA approach. Chemical Engineering Journal 90, 283
290.
Ttterman, S., Toivonen, H.T., 2009. Support vector method for identification of Wiener models.
Journal of Process Control 19, 11741181.
Valle, S., Li, W., Qin, S.J., 1999. Selection of the Number of Principal Components: The
Variance of the Reconstruction Error Criterion with a Comparison to Other Methods
. Industrial & Engineering Chemistry Research 38, 43894401.
Vanrolleghem, P.A., Lee, D.S., 2003. On-line monitoring equipment for wastewater treatment
processes: state of the art. Water Sci. Technol. 47, 134.
Vapnik, V.N., 1998. Statistical Learning Theory. John Wiley & Sons Inc.
249

Vapnik, V., 1999a. The Nature of Statistical Learning Theory, 2nd ed. Springer.
Vapnik, V.N., 1999b. An overview of statistical learning theory. IEEE Transactions on Neural
Networks 10, 988999.
Vapnik, V.N., 2000. The nature of statistical learning theory. Springer.
Varol, Y., Oztop, H.F., Avci, E., 2008. Estimation of thermal and flow fields due to natural
convection using support vector machines (SVM) in a porous cavity with discrete heat
sources. International Communications in Heat and Mass Transfer 35, 928936.
Venkatasubramanian, V., 2003. A review of process fault detection and diagnosis Part III:
Process history based methods. Computers & Chemical Engineering 27, 327346.
Venkatasubramanian, V., Rengaswamy, R., Kavuri, S.N., 2003. A review of process fault
detection and diagnosis: Part II: Qualitative models and search strategies. Computers &
Chemical Engineering 27, 313326.
Venkatasubramanian, V., Rengaswamy, R., Yin, K., Kavuri, S.N., 2003. A review of process
fault detection and diagnosis - Part I: Quantitative model-based methods. Computers and
Chemical Engineering 27, 293311.
Verron, S., 2007. Diagnostic et surveillance des processus complexes par rseaux baysiens
Thse doctorat, universit d'Angers, France.
Verron, S., Tiplica, T., Kobi, A., 2007. Procedure based on mutual information and bayesian
networks for the fault diagnosis of industrial systems. IEEE, pp. 420425.
Verucchi, C.J., Acosta, G.G., Benger, F.A., 2008. A review on fault diagnosis of induction
machines. Latin American applied research 38, 113121.
Waewsak, C., Nopharatana, A., Chaiprasert, P., 2010. Neural-fuzzy control system application
for monitoring process response and control of anaerobic hybrid reactor in wastewater
treatment and biogas production. Journal of Environmental Sciences 22, 18831890.
Wang, D., Zhang, Y., Zhao, Y., 2007. Support Vector Machines for Photometric Redshift
Estimation from Broadband Photometry - researchr publication bibtex. Data Science
Journal 6, 474480.
Wang, J., Yu, T., Jin, C., 2006. On-line Estimation of Biomass in Fermentation Process Using
Support Vector Machine. Chinese Journal of Chemical Engineering 14, 383388.
Wang, L., Mu, Z., Guo, H., 2006. Application of support vector machine in the prediction of
mechanical property of steel materials. Journal of University of Science and Technology
Beijing, Mineral, Metallurgy, Material 13, 512515.

250

Wang, L., Shi, H., 2010. Multivariate statistical process monitoring using an improved
independent component analysis. Chemical Engineering Research and Design 88, 403
414.
Wang, X., Du, Z., Chen, J., Pan, F., 2009. Dynamic Modeling of Biotechnical Process Based on
Online Support Vector Machine. Journal of Computers 4, 251-258.
Wang, X., Li, A., Jiang, Z., Feng, H., 2006. Missing value estimation for DNA microarray gene
expression data by Support Vector Regression imputation and orthogonal coding scheme.
BMC Bioinformatics 7:32.
Wei, X., Verhaegen, M., van Engelen, T., 2009. Sensor fault detection and isolation for wind
turbines based on subspace identification and Kalman filter techniques. International
Journal of Adaptive Control and Signal Processing 687707.
Wei, X., 2010. Sensor fault detection and isolation for wind turbines based on subspace
identification and Kalman filter techniques. International Journal of Adaptive Control and
Signal Processing 24, 687707.
Widodo, A., Yang, B.-S., 2007. Support vector machine in machine condition monitoring and
fault diagnosis. Mechanical Systems and Signal Processing 21, 25602574.
Widodo, A., Yang, B., 2008. Wavelet support vector machine for induction machine fault
diagnosis based on transient current signal. Expert Systems with Applications 35, 307
316.
Widodo, A., Kim, E.Y., Son, J.-D., Yang, B.-S., Tan, A.C.C., Gu, D.-S., Choi, B.-K., Mathew,
J., 2009. Fault diagnosis of low speed bearing based on relevance vector machine and
support vector machine. Expert Systems with Applications 36, 72527261.
Wimberger, D., Verde, C., 2008. Fault diagnosticability for an aerobic batch wastewater
treatment process. Control Engineering Practice 16, 13441353.
Wise, B.M., Gallagher, N.B., 1996. The process chemometrics approach to process monitoring
and fault detection. Journal of Process Control 6, 329348.
Witten, I.H., Frank, E., Hall, M.A., 2011. Data Mining: Practical Machine Learning Tools and
Techniques, Third Edition, 3rd ed. Morgan Kaufmann.
Wold, H., 1966. Estimation of Principal Components and Related Models by Iterative Least
squares, in: Multivariate Analysis. Academic Press, pp. 391420.
Wu, Q., 2010. Fault diagnosis model based on Gaussian support vector classifier machine.
Expert Systems with Applications 37, 62516256.
Xiang, X., Zhou, J., An, X., Peng, B., Yang, J., 2008. Fault diagnosis based on Walsh transform
and support vector machine. Mechanical Systems and Signal Processing 22, 16851693.
251

Xue, C.X., Zhang, R.S., Liu, H.X., Liu, M.C., Hu, Z.D., Fan, B.T., 2004. Support Vector
Machines-Based Quantitative Structure-Property Relationship for the Prediction of Heat
Capacity. Journal of Chemical Information and Modeling 44, 12671274.
Yang, B.-S., Widodo, A., 2008. Support Vector Machine for Machine Fault Diagnosis and
Prognosis. Journal of System Design and Dynamics 2, 1223.
Yang, W., Tavner, P.J., Wilkinson, M., 2008. Condition monitoring and fault diagnosis of a wind
turbine with a synchronous generator using wavelet transforms. IET Conference
Publications 2008, 610.
Yang, Y., 2005. Support vector machines for environmental informatics: application to
biological nitrogen removal in wastewater treatment plants. Theses and dissertations.
Yang, Y.H., 2006. Support Vector Machines for Environmental Informatics: Application to
Modelling the Nitrogen Removal Processes in Wastewater Treatment Systems. Journal of
Environmental Informatics 7, 1423.
Ylamos, I., Escudero, G., Graells, M., Puigjaner, L., 2006. Fault diagnosis based on support
vector machines and systematic comparison to existing approaches, in: 16th European
Symposium on Computer Aided Process Engineering and 9th International Symposium
on Process Systems Engineering. Elsevier, pp. 12091214.
Ylamos, I., Graells, M., Puigjaner, L., Escudero, G., 2007. Simultaneous fault diagnosis in
chemical plants using a multilabel approach. AIChE Journal 53, 28712884.
Ylamos, I., Escudero, G., Graells, M., Puigjaner, L., 2009. Performance assessment of a novel
fault diagnosis system based on support vector machines. Computers & Chemical
Engineering 33, 244255.
Yin, S., Ding, S.X., Zhang, P., 2011. Study on Modifications of PLS Approach for Process
Monitoring. Presented at the the 18th IFAC World Congress, Milano (Italy), pp. 12389
12394.
Yoo, C.K., Choi, S.W., Lee, I.-B., 2002. Dynamic Monitoring Method for Multiscale Fault
Detection and Diagnosis in MSPC. Industrial & Engineering Chemistry Research 41,
43034317.
Yoo, C.K., Vanrolleghem, P.A., Lee, I.-B., 2006. Fault detection, monitoring and diagnosis of
sequencing batch reactor for integrated wastewater treatment management system.
Environ. Eng. Res. 11, 1-14.
Yoo, C.K., Villez, K., Lee, I.B., Hulle, S.V., Vanrolleghem, P.A., 2006. Sensor validation and
reconciliation for a partial nitrification process. Water Science & Technology 53, 513
521.
252

Yoo, C.K., Villez, K., Van Hulle, S.W.H., Vanrolleghem, P.A., 2008. Enhanced process
monitoring for wastewater treatment systems. Environmetrics 19, 602617.
Yu, J., 2012. A nonlinear kernel Gaussian mixture model based inferential monitoring approach
for fault detection and diagnosis of chemical processes. Chemical Engineering Science
68, 506519.
Yu, Z., Fu, X., Li, Y., 2005. Online Support Vector Regression for System Identification, in:
Wang, L., Chen, K., Ong, Y.S. (Eds.), Advances in Natural Computation. Springer Berlin
Heidelberg, Berlin, Heidelberg, pp. 627630.
Yuan, S.-F., Chu, F.-L., 2006. Support vector machines-based fault diagnosis for turbo-pump
rotor. Mechanical Systems and Signal Processing 20, 939952.
Yuan, S., Chu, F., 2007. Fault diagnosis based on support vector machines with parameter
optimisation by artificial immunisation algorithm. Mechanical Systems and Signal
Processing 21, 13181330.
Zeng, G.M., Li, X.D., Jiang, R., Li, J.B., Huang, G.H., 2006. Fault Diagnosis of WWTP Based
on Improved Support Vector Machine. Environmental Engineering Science 23, 1044
1054.
Zhang, J., Sato, T., Iai, S., 2007. Novel support vector regression for structural system
identification. Structural Control and Health Monitoring 14, 609626.
Zhang, X., Hoo, K.A., 2011. Effective fault detection and isolation using bond graph-based
domain decomposition. Computers & Chemical Engineering 35, 132148.
Zhang, X., Zhang, Q., Zhao, S., Ferrari, R., Polycarpou, M.M., Parisini, T., 2011. Fault
Detection and Isolation of the Wind Turbine Benchmark: An Estimation-Based
Approach. Presented at the the 18th IFAC World Congress, Milano, Italy, pp. 8295
8300.
Zhang, Y., 2008. Fault Detection and Diagnosis of Nonlinear Processes Using Improved Kernel
Independent Component Analysis (KICA) and Support Vector Machine (SVM).
Industrial & Engineering Chemistry Research 47, 69616971.
Zhang, Y., Jiang, J., 2008. Bibliographical review on reconfigurable fault-tolerant control
systems. Annual Reviews in Control 32, 229252.
Zhang, Y., 2009. Enhanced statistical analysis of nonlinear processes using KPCA, KICA and
SVM. Chemical Engineering Science 64, 801811.
Zhou, D., Li, G., Qin, S.J., 2010. Total projection to latent structures for process monitoring.
AIChE Journal 56, 168178.

253

Zumoffen, D., Basualdo, M., 2008. Improvements in Fault Tolerance Characteristics for Large
Chemical Plants: 1. Waste Water Treatment Plant with Decentralized Control. Industrial
& Engineering Chemistry Research 47, 54645481.

254

Titre

Diagnostic de dfauts par les Machines Vecteurs Supports :

application diffrents systmes mutivariables nonlinaires

Rsum Les systmes rels sont gnralement de nature non-linaire, et leurs modlisations et
surveillance restent une tche difficile accomplir. Nanmoins, avec les progrs technologiques
on dispose maintenant d'un atout de taille sur ces systmes qui est les donnes.
Ce travail prsente une technique de diagnostic de dfaut et de modlisation base en grande
partie sur la mthode d'apprentissage automatique Les Machines Vecteurs de Support,
SVM qui est base sur les donnes. La mthodologie propose est applique diffrentes
systmes multivariables et non linaires, savoir : un procd de traitement des eaux uses, un
systme olien et un racteur chimique parfaitement agit.
L'objectif de cette thse de doctorat est d'examiner la possibilit d'extraire le maximum
d'information partir de donnes afin de surveiller efficacement le comportement de systmes
rels et de dtecter rapidement tout dfaut qui peut compromettre leur bon fonctionnement. La
mme mthode est utilise pour la modlisation des diffrents systmes. Plusieurs dfis ont t
relevs tels que la complexit du comportement des systmes, le grand nombre de mesures
variant diffrentes chelles de temps, la prsence de bruit et les perturbations. Une mthode
gnrique de diagnostic de dfauts est propose par la gnration des caractristiques de chaque
dfaut suivie dune tape d'valuation de ces caractristiques avec une amlioration du transfert
de connaissances en modlisation.
Dans cette thse ont a dmontr l'utilit de l'outil Machines Vecteurs de Support, en
classification par la construction de modles de dcision SVM ddis l'valuation des
caractristiques de dfaut, et aussi en tant qu'estimateur non linaire/ou pour la modlisation par
l'utilisation des machines vecteurs de support ddis pour la rgression (SVR).
La combinaison de SVM et dune mthode base sur le modle "observateur" a t aussi tudie
et a t ncessaire dans certains cas pour garantir un bon diagnostic de dfauts.
Mots-cls : Diagnostic de dfauts, Machines Vecteurs de Supports, Apprentissage
automatique, Modlisation, identification paramtrique, Systmes multivariables non linaires,
Observateur d'tat, Procd de traitement des eaux uses, oliennes, Racteur chimique
parfaitement agit.

255

Title

Fault diagnosis using Support Vector Machines: application to

different multivariable nonlinear systems

Abstract Real systems are usually nonlinear and their modeling and monitoring remains a
difficult task. However, with advances in technology and the availability of big amounts of data,
we have a facility to operate these systems.
This work presents a methodology for fault diagnosis and modeling which is in large part based
on the method of Support Vector Machines (SVM) which data-based. The proposed
methodology is applied to various nonlinear multivariable systems including: wastewater
treatment processes, wind turbines and stirred tank reactors.
The objective of this PhD is to examine the possibility of extracting the maximum of information
from data to effectively monitor the behavior of real systems and rapidly detect any faults which
may impair their proper functioning. The same method is used for modeling the different
systems. Several challenges were identified and surmounted such as the complexity of the
system behavior, large amount of data varying at different time scales, the presence of noise and
disturbances. A generic method of fault diagnosis is proposed for the generation of the fault
characteristics followed by an evaluation of these characteristics as well as an improved transfer
of knowledge in modeling.
In this thesis the usefulness of the tool Support Vector Machines in Classification has been
demonstrated by the construction of decision models dedicated to evaluating the characteristics
of faults, and also its usefulness for modeling/ or as estimator for the nonlinear systems using
support vector machines dedicated for regression (SVR).
The combination of SVM and a method based on models observer was also considered and
was found to be interesting in some cases to ensure proper fault diagnosis.
Keywords: Fault diagnosis, Support Vector Machines, Machine learning, Modeling, System
identification, Multivariable nonlinear systems, Observers, Wastewater treatment process, Wind
Turbine, Stirred tank reactor.

256