Académique Documents
Professionnel Documents
Culture Documents
N dordre: 161-2012
Anne 2012
Par
M. Nassim LAOUTI
GIPSA-Lab, Grenoble
CRAN, Universit de Lorraine
Universit Libre de Bruxelles
LAGEP, Universit de Lyon
LAAS, Universit de Toulouse
LAGEP, Universit de Lyon
Rapporteur
Rapporteur
Examinateur
Co-encadrant
Prsident
Directeur de thse
Ddicaces
Je ddie cette thse mes trs chers parents qui je dois tout ce que je suis, et qui m'ont
donn un vritable modle de travail, et qui m'ont appris le respect de lautre, la gentillesse
et la persvrance. J'espre qu'ils trouveront dans ce travail toute ma reconnaissance et tout
mon amour.
A mes chers frres et surs et qui ont toujours t l pour moi: Leila, Mehdi, Sihem,
Mohamed, Hafid, Rayane Yasmine
Je ddie cette thse au directeur de lcole doctorale EEA de Lyon monsieur Grard Scorletti.
A tous mes amis : Kamel, Kamel, Reda, Bassem, Sidali, Belkacem, Amine, Aziz, Sofiane et
tous les autres qui mont encourag finir ce travail
Je ddie cette thse
Nassim
Remerciements
Je remercie Dieu de mavoir donn la volont et le courage qui mont permis de raliser ce
travail, veuille-t-il me guider dans le droit chemin.
Je remercie Madame Nida Othman et Monsieur Sami Othman, pour leurs gentillesses
ainsi que leurs encouragements rguliers face la difficult.
Je remercie aussi les membres du jury pour avoir accept de juger ce travail. Je suis trs
honor de prsenter mes travaux de thse devant un tel jury.
Figure I.3
....................................................................................................................................................... 13
Figure I.4
Figure I.5
Figure I.6
Figure I.7
Figure I.8
Figure I.9
Figure II.2
Figure II.3
Figure II.4
Figure II.5
Figure II.8
Analyse des relations entre variables avec linformation mutuelle ....................... 102
Figure II.10 Analyse des relations entre variables avec linformation mutuelle (pour COD e et
TSSe) ........................................................................................................................................... 102
Figure II.11 Evolution temporelle des variables dentre/sortie des matires en suspension ... 104
Figure II.12 Densit de probabilit Qin ..................................................................................... 105
Figure II.13 Concentration SNH,in et sa densit de probabilit .................................................. 106
Figure II.14 L'volution de la variable So5 par rapport Kla5 ................................................... 106
Figure II.15 Lvolution de la variable Sno2 par rapport Qa ................................................... 107
Figure II.16 Trac de Sno2 et son estime .................................................................................. 109
Figure II.17 Zoom sur le trac de Sno2 et son estim................................................................. 110
Figure II.18 Trac de TSSe et son estim .................................................................................. 110
Figure II.19 Zoom sur le trac de TSSe et son estim ............................................................... 111
Figure II.20 Trac de CODe et son estim ................................................................................ 111
Figure II.21 Trac de So5 et son estim ..................................................................................... 112
Figure II.22 Rsidu So5.............................................................................................................. 112
Figure II.23 Rsidu Sno2 ............................................................................................................ 113
Figure II.24 Rsidu filtre de Sno2 ............................................................................................. 113
Figure II.25 Densit de probabilit Sno2 .................................................................................... 114
Figure II.26 Autocorrlation du rsidu TSSe ............................................................................ 114
Figure II.27 Rsidu sur TSSe .................................................................................................... 115
Figure II.28 Densit de probabilit TSSe .................................................................................. 115
Figure II.29 Rsidu CODe ......................................................................................................... 115
Figure II.30 volution du rsidu Kla5 ........................................................................................ 119
Figure II.31 Zoom sur le rsidu Kla5 ......................................................................................... 119
Figure II.32 volution du rsidu Qa .......................................................................................... 120
Figure II.33 volution du rsidu So5 ......................................................................................... 120
Figure II.34 Trac de la mesure de loxygne dissous (So5) et son rsidu ................................ 121
Figure II.35 Zoom sur de la mesure de So5 et son rsidu .......................................................... 121
Figure II.36 volution du rsidu Sno2 ........................................................................................ 122
Figure II.37 La mesure de Sno2 et son rsidu............................................................................. 122
Figure II.38 Mesure TSSe et son rsidu .................................................................................... 123
Figure II.39 Rsultat de dcision sur le dfaut Qa .................................................................... 124
Figure II.40 Zoom sur le rsultat du dfaut Qa ......................................................................... 125
Figure II.41 Rsultat de dcision sur le dfaut Kla5 .................................................................. 126
Figure II.42 Zoom de dcision sur le dfaut Kla5 ...................................................................... 126
Figure II.43 Rsultat de dcision sur le dfaut Sno2 .................................................................. 127
Figure II.44 Zoom sur la dcision du dfaut Sno2...................................................................... 127
Eoliennes offshore.133
Figure III.2
Figure III.3
Figure III.4
Figure III.5
Figure III.6
Figure III.7
Figure III.8
Figure III.9
Figure III.10 Stratgie propose de diagnostic de dfaut base sur SVM ................................. 147
Figure III.11 Vitesse du vent mesure ...................................................................................... 152
Figure III.12 Puissance lectrique gnre ............................................................................... 152
Figure III.13 Dtection et isolation du dfaut 2 de type gain (1b) sur le capteur de la position
pitch E2, m2 ................................................................................................................................... 153
Figure III.14 Dtection et isolation du dfaut 4 valeur fixe (type 2a) sur la vitesse du rotor ... 154
Figure III.15 Dtection et isolation du dfaut 5 de type gain (2b) sur le capteur de la vitesse
rotationnelle du rotor wr ,m2 ......................................................................................................... 155
Figure III.16 Dtection et isolation du dfaut 5 de type gain (3b) sur le capteur de la vitesse
rotationnelle de la gnratrice wg ,m1 ........................................................................................... 156
Figure III.17 Dtection et isolation du dfaut 8 de type offset (4a) sur le convertisseur .......... 156
Figure III.18 Dtection et isolation du dfaut 9 (6) sur le systme dentrainement ................. 157
Figure III.19 Schma de combinaison SVM et observateur ..................................................... 161
Figure III.20 Dtection et isolation du dfaut 6 (5a) sur lactionneur2 et estimation du coefficient
damortissement ] 2e et de la pulsation naturelle wn 2 avec lobservateur .................................... 164
Figure III.21 Dtection et isolation du dfaut 7 (5b) sur lactionneur 3 et estimation du
coefficient damortissement ] 3e et de la pulsation naturelle wn3 avec lobservateur .................. 164
Figure IV.1 Schma simplifi du racteur parfaitement agit du laboratoire (Tr1, Tr2, Tj1, Tj2
et THC sont des sondes de temprature P1, P2, P3 et P4 sont des pompes)...174
Figure IV.2
Figure IV.3
Figure IV.4 Classification des dfauts de THC. Effet de V (variance du noyau gaussien) sur les
hyperplans optimaux (avec C=100) ............................................................................................ 182
Figure IV.5 Cas dtude par simulation (avec C=100) et diffrentes valeurs de V: Occurrence de
dfaut dans THC (objective de commande Trd=70C) ................................................................. 183
Figure IV.6 Classification des defaults de THC. Effet de C (paramtre de rgularisation) sur les
hyperplans optimaux (avec V=10) .............................................................................................. 184
Figure IV.7 Dfaut dans le systme de chauffe/refroidissement (HC : un actionneur) en
changeant les paramtres du PID afin dcarter THC de Tjd (Tjd=70C) ..................................... 185
Figure IV.8 Drive dans Tr1 33 min dans le racteur du laboratoire ...................................... 186
Figure IV.9 Erreur de calibration de -5C est considre dans la sonde Tr2 dans le racteur pilote
de 250 L ...................................................................................................................................... 187
Figure IV.10 Une valuation exprimentale de la mthode SVM et de lobservateur dans un
racteur pilote de 250 L .............................................................................................................. 188
Figure IV.11 Evolution des tempratures dans le racteur pilote sans dfaut .......................... 188
Figure IV.12 Schma de SVR pour lestimation de U et lidentification de niveaux de dfauts
pendant la priode la chauffe du racteur ................................................................................... 189
Figure IV.13 Validation exprimentale de lidentification dune drive dans la sonde de
temprature Tr1 avec diffrentes valeurs de V (H=0.01, C=100, objectif de commande Tjd=70C)
..................................................................................................................................................... 191
Figure IV.14 Identification de la drive dans la sonde Tr1 avec diffrentes valeurs de H (V=60,
C=100, objectif de commande Trd=60C) ................................................................................... 192
Figure IV.15 Identification de la drive du capteur Tr1 avec diffrentes valeurs de C (H=0.01,
V=60) ........................................................................................................................................... 193
Figure IV.16 Estimation du coefficient dchange thermique U pendant la chauffe du racteur
(simulation avec diffrentes valeurs de U, paramtre de lobservateur T=0.04) ........................ 195
Figure IV.17 Estimation exprimentale du coefficient dchange thermique U pendant la chauffe
du racteur ................................................................................................................................... 195
Tableau II.2
Tableau II.5
Tableau II.6
Tableau II.7
Tableau IV.1 Vecteurs dentrs SVM (xi), (i est linstant de temps) ........................................ 177
Tableau IV.2 Correspondance entre rsidu de la temprature de la double enveloppe et du bain
thermost (R=rsidu)................................................................................................................... 178
Introduction gnrale
Tout ce que je sais, :c'est que je ne sais rien Socrate
La socit actuelle est trs oriente vers la technologie et dpend ainsi de la disponibilit, la
scurit et la fiabilit de technologies de plus en plus complexes. Cependant, la matrise parfaite
de ces systmes reste un sujet important et ouvert. Afin de satisfaire le bon fonctionnement, le
diagnostic de dfaut Fault detection and isolation FDI apparat ainsi comme une ncessit
qui consiste identifier les causes du dfaut partir des symptmes ou signaux perus afin
d'viter toute propagation de ce dfaut. Ce dernier peut occasionner notamment :
1. Un arrt de fonctionnement du systme,
2. Des dgts matriels,
3. La pollution de lenvironnement,
4. Des dangers pour l'utilisateur.
Le diagnostic de dfauts est, en fait, lensemble des actions mises en uvre pour dtecter,
localiser et identifier tout dysfonctionnement sur un systme. Ceci peut se faire partir des
informations pouvant tre rcupres du systme, telles que les mesures fournies par les
capteurs, les sorties calcules par les contrleurs, et les connaissances sur la structure ou le
modle du systme. Parmi les intrts du diagnostic de dfauts figure l'optimisation des
oprations de maintenance, la minimisation de larrt du service, lassurance dune bonne qualit
du produit, ainsi que la reconfiguration de la commande.
La conception d'un systme de diagnostic performant n'est, cependant, pas une tche facile
raliser, puisque la majorit des systmes rels sont de nature non-linaire faisant intervenir un
grand nombre de variables et travaillant dans un environnement entach de bruit, et affect par
diffrents types de perturbations. Depuis des annes, un grand nombre de chercheurs se sont
intresss la rsolution du problme de diagnostic des dfauts. On trouve ainsi plusieurs tudes
dans la littrature qui proposent diffrentes techniques de diagnostic de dfauts. Dune faon
gnrale, on peut dcomposer les mthodes de diagnostic en deux grandes familles : des
mthodes bases sur le modle, et des mthodes bases sur les donnes rcupres partir du
systme. Cependant, la complexit des systmes industriels rend difficile, voire impossible,
lobtention dun modle fondamental exact et prcis reprsentant le systme dans toutes les
conditions de fonctionnement afin de lutiliser pour raliser un diagnostic de dfaut par modle.
Dun autre ct, la technologie moderne nous offre un grand bnfice puisquelle fournit un
grand nombre dinformations (donnes) mais dont lanalyse nest pas vidente, ce qui explique
1
le recours des mthodes de diagnostic de dfauts bases sur les donnes. En plus la nature des
signatures(ou symptmes) de dfauts qui sont des grandeurs alatoires rend la dtection dune
diffrence ventuelle entre la signature nominale et celle mesure ne peut pas se faire facilement
avec les mthodes dterministes.
Pour ces raisons, lintrt des industriels pour les mthodes de diagnostic de dfauts diriges par
des donnes notamment celle de lintelligence artificielle (rseaux de neurones, systmes
experts,..) prend de plus en plus dampleur. Lintelligence artificielle a pour but dlaborer des
systmes ayant des capacits intellectuelles comparables lhomme capable de prendre des
dcisions dune manire automatique dans lenvironnement peru. Dans ce vaste domaine, on
trouve un axe de recherche assez important qui est lapprentissage automatique Machine
Learning (Ao et al., 2010) qui permet de bien comprendre un phnomne ou un systme
illustr par un nombre limit dexemples de donnes afin de construire des modles pouvant tre
appliqus des nouvelles observations (exemples). Dans cette thse, la mthode dintelligence
artificielle stochastique Machines Vecteurs Supports (ou Sparateur Vaste Marge, Support
Vector Machines, SVM) est utilise pour la conception des mthodes de diagnostic avances.
La mthode SVM est issue de la thorie de lapprentissage statistique (Vapnik, 1998) introduite
par Vapnik dans les annes 90 (Boser et al., 1992). Elle a t conue au dpart pour trouver un
discriminateur optimal entre deux classes de donnes, et a t ensuite tendue pour le cas de la
rgression. La capacit de gnralisation, et l'aspect stochastique ont favoris l'utilisation de cette
mthode d'apprentissage statistique pour le diagnostic de dfauts. Dans ce cas, le diagnostic de
dfaut est assimil un problme de classification (en deux classes : normale et anormale). Dans
cette mthode, le choix et lextraction des caractristiques reprsentatives de chaque dfaut
reprsentent l'tape la plus importante afin dtre sensible aux symptmes du dfaut et dobtenir
ainsi un systme de diagnostic ractif et prcis.
Ce travail contribue dvelopper une nouvelle approche originale de diagnostic de dfauts assez
performante en termes de prcision, temps de dtection et permettant un pourcentage quasi nul
des fausses alarmes. La mthode SVM est utilise en premier choix pour la dtection et
lisolation de dfaut. Dans certains cas, la modlisation par SVM pour la rgression SVR est
ralise en parallle afin dajouter des estimations au vecteur de mesure. Dans dautres cas, une
combinaison avec des mthodes bases sur le modle (principalement lobservateur grand
gain) a t ncessaire afin de garantir une bonne isolation de dfaut. Cette stratgie est applique
aux systmes rels lchelle de laboratoire/pilote dans le cas dun racteur chimique, et en
simulation dans le cas de procd de traitement des eaux uses et du systme olien.
2
Dans ce chapitre, nous prsentons dune manire simplifie les concepts basiques de diagnostic
de dfauts, et les fondements thoriques des mthodes utilises dans cette thse telles que les
Machines Vecteurs Supports SVM, Observateurs, Analyse en Composantes Principales, etc.
I.1. Gnralits
La recherche constante dune meilleure comptitivit pousse les entreprises produire des
machines ayant une grande fiabilit et disponibilit. Cependant, un systme quelle que soit sa
modernit et sa robustesse, est affect par des dysfonctionnements qui peuvent compromettre son
bon fonctionnement. Il apparat donc ncessaire didentifier rapidement les changements
inattendus (dfauts).
Dans cette premire partie, nous allons d'abord prsenter les principes de diagnostic de dfauts et
quelques dfinitions de la terminologie dans ce domaine.
Nous pouvons souligner que le terme diagnostic a une origine mdicale, qui signifie trouver
les causes de la maladie (dfaut) partir des symptmes perus (les signes observables).
Figure I.1 Architecture du fonctionnement dun systme avec une commande tolrante aux
dfauts
Le bloc de reconfiguration permet de garder le systme dans ltat dsir par le rglage des
paramtres du contrleur ou par une adaptation dune nouvelle loi de commande (Blanke et al.,
2006, Blanke et al., 2003, Prakash et al., 2002). On note quil existe plusieurs mthodes de
reconfiguration, toutefois elles ne seront pas discutes dans ce mmoire. Le but de la
reconfiguration est de continuer faire fonctionner le systme tout en maintenant les
performances/conditions de scurit requises malgr la prsence de dysfonctionnement dans
l'attente d'une opration de maintenance (Patton, 1997).
Afin de raliser le diagnostic des dfauts, une premire approche consiste dupliquer les
composants d'instruments de mesure pour augmenter la fiabilit. Cela nous permet de choisir la
mesure saine partir des mesures disponibles. Cette approche sappelle la redondance
9
matrielle. Elle est utilise dans le diagnostic, surtout dans le domaine aronautique, mais elle
entrane une augmentation des cots et une rduction de lautonomie du systme. La deuxime
approche, qui est la redondance analytique, est trs intressante la fois sur le plan financier et
technique puisquelle se base uniquement sur lexploitation de relations existantes entre les
diffrentes variables mesures ou estimes. Aprs la collection des donnes, on essaie dextraire
les informations utiles partir de ces donnes, en dautres termes, de convertir ces donnes
brutes en quelque chose de significatif pour des objectifs bien prcis. Le processus de dtection
de dfauts proprement dit est donc compos essentiellement de deux phases (Chow et al., 1982) :
gnration de rsidus suivie par lanalyse de rsidus, comme le montre la Figure I.2
10
Lorsquun systme ou procd fonctionne en boucle ouverte et quun dfaut apparat, ce dernier
va influencer la sortie Y par un cart (offset) 'Y. Par contre, dans le cas de procd fonctionnant
en boucle ferme, la sortie risque de ne montrer quune faible dviation qui disparat
rapidement, surtout si un contrleur de type intgral est utilis pour asservir cette sortie
(contrleur PI). En revanche, la variable dentre manipule U va montrer un offset permanent
'U. Il est souligner que la sortie est galement affecte par des bruits, perturbations et des
variations dans U. Cela rend la tche de diagnostic trs difficile.
On note galement que les dfauts peuvent apparatre de diffrentes faons, dune manire
brusque (cest le cas dune coupure de phase dans un moteur lectrique), dune faon progressive
(on parle dune drive lente, cest le cas dencrassement) ou dune faon intermittente qui
apparat selon les conditions de fonctionnement (temprature, pression, concentration).
Procds chimiques : (Caccavale et al., 2011, Verron, 2007, Pierri et al., 2008a,
Chetouani, 2006, Ram Maurya et al., 2004)
Industrie automobile : (Arnanz et al., 2011,Saludes Rodil et al., 2009, Svard and
Nyberg, 2010)
On peut trouver aussi une revue dtaille sur le diagnostic de dfauts appliqu sur les
systmes de chauffage, ventilation, et climatisation : (Katipamula and Brambley,
2005).
12
1. Schmas
bass
sur
le
modle
(Venkatasubramanian
V.
et
al.,
Figure I.3 Schma de classification des mthodes de diagnostic de dfauts bases sur le
modle
13
Partant de l'ide qu'un dfaut se reflte dans les paramtres physiques du systme, des mthodes
d'estimation paramtriques sont utilises pour estimer la valeur actuelle de ces paramtres. Le
rsidu est ainsi calcul partir de l'cart entre la valeur des paramtres estims et celle de
rfrences obtenue dans le cas sans dfaut (Simani et al., 2003, Gertler, 1998, Fuente et al.,
1996).
x
Cette technique se base sur la rcriture des quations d'tat et de mesure de telle sorte que seules
les variables connues (entres et sorties) sont autorises apparatre. Ces variables connues sont
ensuite utilises afin de construire un rsidu indicateur de dfaut.
Soit le modle G M
A z
dcrivant le systme G p
B z
Az
. Ainsi le rsidu peut tre dfini
B z
comme suit :
Az
r z
B
z
A z
u z
B z
(I.1)
Plusieurs travaux ont utilis cette mthode pour le diagnostic de dfauts (Gustafsson, 2007,
Gertler, 1998) ou ont combin cette mthode avec la mthode destimation de paramtre
(Isermann, 2005).
x
La construction des observateurs dtat reprsente une des techniques les plus employes dans
lapproche base sur le modle (Ding, 2008, Pierri et al., 2008b, Li et al., 2008, Isermann, 2006,
Simani et al., 2003, Venkatasubramanian V. et al., 2003a, Lootsma, 2001, Lootsma, 1999). La
redondance analytique est obtenue grce aux tats estims partir dun modle adquat et dun
ensemble de mesures appropries. En comparant les variables estimes et mesures, un ensemble
de signaux (rsidus) sensibles aux dfauts est gnr. Ces rsidus sont ensuite analyss pour
dtecter et/ou isoler le dfaut.
Diffrents types dobservateurs ont t proposs dans la littrature pour les systmes linaires et
non linaires. Parmi les techniques les plus utilises, on peut citer les observateurs entre
inconnue (Sotomayor and Odloak, 2005); les observateurs bass sur le placement de structure
propre The eigen structure assignment approach (Patton and Chen, 2000), les observateurs
14
mode glissant (Edwards et al., 2000) , le filtre de Kalman tendu qui a t initialement appliqu
pour la dtection et lisolation des dfauts des systmes non linaires par (Huang et al., 2003).
Le problme fondamental de dtection et disolation des dfauts de systmes non linaires a t
introduit initialement par Frank (Frank, 1990). Depuis lors, plusieurs techniques ont t utilises
pour les systmes non linaires. Une revue sur les principales approches bases sur les
observateurs pour les systmes non linaires a t donne par (Alcorta Garca and Frank, 1997) .
Les auteurs dans (Hammouri et al., 2002), (De Persis and Isidori, 2001), (Kabore et al., 2000) et
(Hammouri et al., 1999) ont propos une solution pour la dtection et lisolation des dfauts des
systmes non linaires en combinant une approche gomtrique de dcouplage avec les
techniques des observateurs non linaires, notamment le grand gain.
Tout l'art de ces approches rside dans le choix du terme correctif et plus particulirement la
synthse de gain qui a pour objectif non seulement de s'assurer de la convergence de l'estimation
vers la sortie relle du procd mais aussi le dcouplage par rapport aux autres dfauts.
Dans cette thse on sintresse deux types dobservateurs ; un observateur grand gain et un
autre de type Kalman cause de leur convergence exponentielle. Lobservateur grand gain
sera appliqu dans lestimation dtat d'un racteur chimique alors que lobservateur de type
Kalman trouvera son application dans le systme olien. Un bref rappel de ces types
dobservateurs est donn ci-dessous.
y (t ) x1 (t ) Cx
O x
>x , , x @
15
(I.2)
I k , 0,, 0 .
Un observateur grand gain peut tre construit pour le systme prcdent en se basant sur les
hypothses suivantes:
H1) \ est globalement Lipschitz par rapport x.
H2) Les matrices Ai (u(t ), s(t )) et leurs drives sont inversibles et bornes
H3) Les matrices Ai (u(t ), s(t )) sont diffrentiables par rapport au temps et leurs drives sont
bornes.
Dans ce cas, lobservateur grand gain du systme (I.2) est donn par:
x
(I.3)
O K est une matrice de taille nu k tel que A KC est une matrice Hurwitz,
0 Aq 1(u (t ), s (t ))
0
0
0
0 A1(u (t ), s (t ))
0
A2 (u (t ), s (t ))
0
A(u (t ), s (t ))
0
0
\1(u , s, x1)
, '
\ (u , t )
T
\ q 1(u , s, x1, , xq 1)
\ q (u , s, x )
Ik
0
/ (t )
0
A1 (u (t ), s (t ))
T 0
2
0 T
0
0
0
q
0 T
(I.4)
A1 (u (t ), s (t )) u u Aq1 (u (t ), s (t ))
(I.5)
0 Ik 0 0
0 0 Ik 0
A
0 0 0 I
k
0 0 0 0
16
(I.6)
(I.7)
Thorme: (bas sur les rsultats donns dans Farza et al., 1997, Gauthier et al., 1992)
Supposons que le systme (I.2) satisfait les hypothses H1), H2) and H3), alors:
x A(u ) x M (u )
y Cx
(I.8)
Au ( s ) .Iu ( s, t0 )
(I.9)
t0 t1
*
u
(t , t0 )C *CIu (t , t0 )dt
(I.10)
t0
O C* reprsente la transpose de C.
Dfinition :
Lentre uRm est dite rgulirement persistante pour le systme (I.8) si t1 > 0, D1 > 0, D2
> 0 and t0 t 0 tels que ttt0 :
Omin G u, t0 , t0 t1 t D1
Omax G u, t0 , t0 t1 d D 2
17
(I.11)
O O min et O max reprsentent la plus petite et la plus grande valeur propre respectivement.
Thorme: (Bornard and Hammouri, 1991)
Si u est rgulirement persistante, alors pour tout T > 0, le systme suivant :
x
A(u ) x G (u ) R 1C T Cx y
T .R AT (u ) R R. A(u ) C T C
(I.12)
18
La mthode la plus simple de supervision dans le cas dabsence de modle est mono variable et
se base sur la vrification de limites (seuils) de la valeur de certaines variables mesurables telles
que : la pression, la temprature, la force, la vitesse et la position. Si cette valeur dpasse la zone
de tolrance ( Ymin Y Ymax et
dY
dYmin
Y max ), une alarme se dclenche. Loprateur doit
dt
dt
ensuite cerner le dfaut (le localiser) afin de prendre les mesures ncessaires pour le retour
ltat normal.
Certes, cette mthode est simple et facile mettre en uvre, mais elle a des limites. En effet, si
une variable mesure dpasse la zone de tolrance, le procd est probablement dj dans un tat
critique. En plus, malgr que ces mthodes fonctionnent quand le procd est ltat dquilibre,
la situation devient plus complique si la variable contrle change de dynamique avec les points
de fonctionnement. Aussi, un dfaut important dans un procd complexe peut dclencher
plusieurs alarmes en mme temps. Cela rend la tche de loprateur qui supervise le procd
difficile pour identifier le dfaut en question afin de ragir immdiatement par les actions
requises.
Mthodes statistiques
Les mthodes statistiques font partie des mthodes bases sur les donnes. En tudiant les
caractristiques dun ensemble dobjets ou dobservations, elles donnent un moyen essentiel
pour la connaissance. A partir de ces donnes, elles fournissent un outil graphique facilement
19
20
Variabilit
Composantes
Principales
Explique %
1
2 3 4 5
6 7 8
9 10 11 12 13
x11 x1m
x n1 x nm
L'ACP cherche laxe (utilis dans la projection des chantillons) qui va maximiser la capture de
variabilit ou variance (information) des nuages de points. Ceci est fait en utilisant une matrice
de transformation P mun , qui projette les donnes dans un espace de dimension rduit :
X
TPT et E
(I.13)
X X
Pi est nomm le vecteur poids loading , qui contient linformation qui concerne la relation
entre les variables. X est la nouvelle matrice de donnes qui estime X . E est la matrice des
rsidus et reprsente la source de bruit. Les lments de T sont appels scores, et ils contiennent
la relation entre les chantillons. Les scores reprsentent les valeurs des variables originales
mesures et transformes dans lespace de dimension rduit. Lespace des donnes dorigine
peut tre calcul comme :
X
TPT E X
t p
i
T
i
(I.14)
E
i 1
O ti est le vecteur score. Ceci donne la mthode ACP la possibilit denlever le bruit et de
laisser seulement linformation pertinente. La matrice de variance-covariance R est obtenue par
la dcomposition en valeurs singulires :
R U/1/ 2U T
>
XTX
1
X T X ET E
n 1 n 1
21
(I.15)
O / est la matrice diagonale contenant les valeurs propres dans un ordre dcroissant de la
matrice de corrlation R. Les colonnes de la matrice U sont les vecteurs propres de R. La matrice
P est gnre par le choix des vecteurs propres de U.
Le choix du nombre a (a<m) des variables latentes (composantes principales, vecteurs colonnes
de P) est important puisquil permet de construire la matrice P, et par la suite X qui reprsente
la source de variabilit dans le procd. Il dtermine donc la qualit du modle ACP afin de
garder la plupart de linformation dorigine (Valle et al., 1999). Ces variables doivent respecter
trois proprits : elles sont non corrles, elles ont des variances squentiellement maximales et
lerreur dapproximation quadratique entre les vecteurs dorigines et les premires CP est
minimale.
Une des mthodes qui permet de dterminer le nombre de composantes a, est la Variance
Cumulative en Pourcentage Cumulative Percent Variance : Dans cette mthode, le choix se
fait de telle sorte que les premires a composantes doivent avoir une VCP suprieure 90% :
a
VCP (a)
i 1
trace R
u 100
(I.16)
22
T 2 (k ) t (k )/a1t T (k )
x(k ) P/1PT xT (k ) d G T2
(I.17)
a (n 2 1)
FD a, n a
n( n a )
2
a , n ,D
SPE (k )
x (k ) x (k )
n
e(k )e(k )T
X I Pa PaT X T d G T2
(I.18)
d G T2
(I.19)
j 1
x (k ) t (k ) p
n
ET E
T 2
j
j 1
La limite suprieure, ou les seuils de confiance de Q statistique, peuvent tre calculs par sa
distribution approximative comme suit :
1
QD
h .c . 2T1 T 2 h0 h0 1 h0
T1 0 D
T1
T12
Ti
i
j
, h0 1
j a 1
(I.20)
2T1T3
3T 22
O cD est l'cart type normal correspondant la partie suprieure (1-D) centile, Oj est la valeur
propre associe au jme vecteur poids. Q statistique reprsente lerreur de prdiction quadratique
dcrivant le bruit dans les donnes et la variation lextrieur du modle. Q est utilis pour
surveiller et suivre de prs la corrlation entre les variables du procd. Une augmentation de sa
valeur signifie un changement dans les corrlations qui gouvernent les variables ce qui
23
indiquerait un dfaut. Cependant, la distance SPE est sensible aux incertitudes de modlisation
provoquant de nombreuses fausses alarmes si les systmes sont non-linaires.
Des travaux ont t faits utilisant lACP avec les cartes de contrle Q et T2 statistiques afin de
diffrencier entre loccurrence dun dfaut et une condition de fonctionnement normale largie
(Humberstone et al., 2012, Humberstone, 2010). Nanmoins, ces cartes de contrle prsentent
certaines restrictions puisqu'elles font des suppositions sur la distribution des donnes. (Camci et
al., 2008) proposent une carte de contrle base sur la distance noyau utilisant les principes de
SVM et dmontre quil est sensible tous les types de donnes en hors contrle quels que soient
leurs distributions et permet aussi de bnficier et dapprendre de ces donnes.
plus soigne des donnes amliorant ainsi la qualit des modles dajustement. Cette mthode
permet de manipuler plus facilement le bruit et les donnes redondantes et corrles et de raliser
une marginalisation des valeurs anormales pour amliorer la robustesse du systme. Elle
reprsente aussi une faon trs propre dinverser des matrices, la diffrence de lanalyse en
composantes principales qui cherche trouver les composantes principales qui expliquent le
maximum de variance dun seul bloc X ou Y sans tenir compte des autres blocs. Enfin, elle a
lavantage de pouvoir prdire soit plusieurs variables rponse la fois (PLS2) soit juste une seule
variable rponse (PLS1). En gnral, plus les variables rponses sont corrles meilleure sera la
performance de PLS2 par rapport PLS1 en termes dinterprtation et de prcision de prdiction.
Les algorithmes PLS sont numriquement stables, leur simplicit dimplmentation et de calcul
leur donne un aspect fort. Une des difficults de rglage du PLS est le choix du nombre de
valeurs latentes qui permet une bonne gnralisation. Cela peut se faire avec une validation
croise.
La PLS est un outil trs polyvalent qui peut raliser plusieurs tches : la rgression (Melssen et
al., 2007, Kim et al., 2005), la rduction de dimension (Tenenhaus et al., 2007), la classification
(Barker and Rayens, 2003, Nguyen and Rocke, 2002), la supervision et le contrle des procds
(Kourti, 2005), la surveillance des procds (Zhou et al., 2010), et la modlisation (Shinzawa et
al., 2011). Elle a aussi t utilise avec succs dans la surveillance et la dtection des dfauts
pour les donnes chimiques (Wise and Gallagher, 1996). La PLS est mieux adapte au
diagnostic de dfauts que l'ACP sur le plan thorique et pratique (Chiang et al., 2000) car lACP
sintresse seulement la capture du maximum de variance sans tenir compte de la relation qui
existe entre les donnes et les dfauts. La performance et lefficacit de la mthode PLS a t
montre dans plusieurs travaux et articles (Ferrer et al., 2008,Yin et al., 2011), et elle a t
combine aussi avec dautres mthodes telles que les SVMs (Rosipal and Trejo, 2003, Lu and
Wang, 2008).
Diffrentes mthodes ont t proposes pour tendre la mthode PLS au cas non linaire. En
utilisant la force des mthodes noyau, la PLS peut tre tendue dune manire simple et efficace
au cas des systmes non linaires. Il y a aussi plusieurs variantes de PLS qui diffrent selon la
faon avec laquelle elles extraient les vecteurs latents. Un des algorithmes les plus lgants qui
reprsentent la faon standard du PLS est le PLS itratif non linaire (Geladi and Kowalski,
1986) qui est le plus appropri pour la supervision des procds par rapport la mthode
SIMPLS (Li et al., 2010). Lalgorithme SIMPLS a cependant lavantage de calculer les facteurs
PLS directement comme une combinaison linaire des variables dorigine en maximisant un
25
critre de covariance et donc vite de calculer des matrices dgonfles comme cest le cas dans
lalgorithme NIPALS (de Jong, 1993).
Fondement thorique de la mthode PLS
Soit un ensemble de donnes compos des deux matrices X des mesures (entres) et Y des
rponses (sorties). La PLS dtermine la relation entre ces deux blocs, en essayant de garder le
maximum de covariance entre eux, par les quations suivantes :
X TPT E
T
Y UQ F
(I.21)
X est la matrice prdicateurs de donnes de taille num o chaque ligne reprsente une
observation ou les mesures un chantillon donn, et chaque colonne reprsente les mesures
dune variable. T est la matrice de scores de X, P la matrice de chargement de X, Y la matrice de
rponse de taille numy , U la matrice des scores de Y, Q la matrice de chargement de Y, E et F
sont les matrices rsiduelles.
La modlisation de X et Y de cette faon suppose que les deux sont observs avec une erreur
(rsidu). Le chargement se fait travers les vecteurs latents T qui peuvent tre choisis de
diffrentes faons, condition quils soient orthogonaux (dcorrls) couvrant lespace des
colonnes de X. Des conditions additionnelles sont requises afin de spcifier T pour que les
vecteurs de T soient orthogonaux, telle la cration dune combinaison linaire des colonnes de X
et Y en multipliant ces dernires par les poids w et c respectivement de telle sorte que leur
covariance soit maximale (Geladi and Kowalski, 1986, Rosipal and Krmer, 2006) :
Xw, u Yc, wT w 1, t T t 1
(I.22)
w (uT u)1 X T u
et
(t T t )1Y T t
(I.23)
Avant de commencer le processus itratif, le vecteur u est initialis dune faon alatoire par le
choix dune colonne de Y (celle avec la plus grande variance).
26
X Tu
, w o 1, t
uT u
Y Tt
, c o 1, u Yc
tT t
Xw, c
(I.24)
On rpte ces tapes jusqu' la convergence. La PLS est une mthode itrative, qui dtermine
chaque itration les vecteurs poids w, c ou les vecteurs scores t, u et les chargements p sont
calculs, ainsi X et Y seront ajusts par ces rsultats :
X t. pT
Y u.qT
X t tT X
Y t tTY
(I.25)
p (tT t )1 X T t
(I.26)
q (uT u)1Y T u
et
Aprs chaque itration les vecteurs w, t, p et q sont enregistrs dans les matrices W, T, P, et Q
respectivement. On peut voir w comme le vecteur propre droite de la matrice S
X T Y , et le
problme devient :
X T YY T Xw Ow
t Xw
(I.27)
Dans PLS rgression le but est de prdire Y en utilisant X et leur structure commune :
Y
(I.28)
XE H
Daprs (Rosipal and Krmer, 2006), la structure commune est donne par la relation suivante :
E W ( PTW )1CT
(I.29)
X TU (T T XX TU )1T TY
(I.30)
ce qui donne :
PLS noyau : (KPLS) est une extension non linaire du PLS linaire. Lutilisation de fonction
noyau (Kernel) permet de transformer (mapper) les donnes complexes non linaires de lentre
dans un espace de caractristiques de plus grande dimension dans lequel la modlisation linaire
peut se faire facilement (Rosipal and Trejo, 2002). Cette notion de noyau va tre dtaille par la
suite dans la thorie des SVMs. La fonction noyau est donne comme suit :
K x xi , x j
\ xi ,\ x j
(I.31)
Avant de commencer le processus itratif, le vecteur u est initialis dune faon alatoire :
1) t \\ T u
Kx u
2) t o 1
3) c Y T t
4) u Yc
5) u o 1
27
(I.32)
XX T YY T t
Ot
(I.33)
u YY T t
Considrons K y
Ot
(I.34)
Ky t
Pour centrer les donnes transformes dans lespace des caractristiques, cela revient :
1
1
K x m ( I n 1n1Tn ) K x ( I n 1n1Tn )
n
n
1
1
K y m ( I n 1n1Tn ) K y ( I n 1n1Tn )
n
n
(I.35)
O I n est la matrice identit de taille n, et 1n est le vecteur unit de taille n. Aprs le calcul des
nouveaux scores t et u, on soustrait des matrices K x et K y leurs approxims calculs partir de t
et u :
K x m ( I n tt T ) K x ( I n tt T )
Y
Y tt T Y
(I.36)
Et donc on obtient :
E \ TU (T T K xU ) 1T T Y
Y \E
K xU (T T K xU ) 1T T Y
TT T Y
(I.37)
I.2.3. Etapes de mise en uvre des mthodes bases sur les donnes
Malgr le fait quon sintresse principalement lutilisation des mthodes bases sur les
donnes pour le diagnostic de dfaut, il est important de noter que ces mthodes peuvent
galement tre utilises pour la modlisation, donc avec un objectif diffrent
x
Dans lobjectif de diagnostic, les mthodes statistiques permettent de relier les entres et
sorties du systme au type de situation (dfectueuse ou normale pour diffrents dfauts).
Dans lobjectif de modlisation (rgression), on cherche par ces mthodes trouver une
relation empirique entre les entres et les sorties.
Lapplication des mthodes bases sur les donnes pour le diagnostic de dfaut est ralise en
plusieurs tapes : lacquisition et prtraitement des donnes, lextraction des caractristiques
28
pour le diagnostic (relation mesures-type de dfaut), des donnes dans les situations
normale et dfectueuse sont ncessaires.
Supposons X une matrice de donnes (contenant les entres U et les sorties mesures Y) de taille
n u m constitue de n rcurrences de mesures (observations, ou encore chantillons) et m
>U ,Y @
x11 x1m
xn1 xnm
>X ,, X
1
, , X m
Les donnes acquises sont gnralement spares en deux groupes : donnes dapprentissage et
donnes de test. Les donnes dapprentissage sont utilises pour le dveloppement du modle
(slection des caractristiques et dveloppement du modle). Les donnes de test sont utilises
pour la validation (valuation ou jugement) du modle et des caractristiques choisies.
29
La normalisation est trs utile lorsque le systme a plusieurs variables dont les amplitudes et
variances varient dans des plages diffrentes. Elle consiste mettre lchelle la matrice de
donnes X en rendant les variables de la nouvelle matrice XN comparables (la mme plage de
variation). Parmi les mthodes de normalisation de donnes, on peut citer :
1. La mthode min/max : met les valeurs de chaque colonne de X selon le maximum et le
minimum de cette colonne, de telle sorte avoir les valeurs de la matrice normalis XN
dans lintervalle [bas-haut] :
XN
haut bas u
X minimum ( X )
bas
maximum ( X ) minimum ( X )
X moyenne ( X )
cart type ( X )
Dans le monde rel, les donnes ne sont pas toujours propres et compltes. Souvent elles sont
censures et corrompues. Plusieurs techniques existent pour traiter les donnes manquantes, mais
la mthode la plus simple et la plus utilise consiste dterminer la ligne de la matrice o des
donnes sont corrompues puis la supprimer. Malgr sa simplicit, cette mthode rduit la taille
de la matrice de donnes. Cela conduit une perte de puissance (informations) du rsultat. En
plus, il y a des cas o la ligne corrompue contient des donnes importantes quon ne peut pas
supprimer, ou des cas o la matrice de donnes a beaucoup de valeurs manquantes et donc la
suppression de toutes ces lignes mne une matrice avec peu de donnes. Dans ce cas, on a
recours la mthode de substitution qui remplace les donnes manquantes par une
30
approximation raisonnable en supposant que ces donnes sont faciles modliser. Parmi les
mthodes de substitution se trouve linterpolation ou la substitution par rgression, avec une
moyenne ou avec la mdiane. La prcision de cette mthode dpend de la prcision du modle de
donnes.
x
Valeurs aberrantes
Les bases de donnes peuvent galement contenir des donnes errones ou fausses. La
manipulation et la dtection des valeurs aberrantes est ncessaire toute modlisation car leur
prsence dtriore llaboration dun bon modle. Parmi les techniques de dtection des valeurs
aberrantes dans les bases de donnes on cite la distance de Mahalanobis et lanalyse de rsidu de
la rgression PLS avec les rseaux de neurones (Hugo and Sbarbaro, 2011).
se fait par une des deux faons suivantes : La slection des caractristiques ou la
transformation des caractristiques.
1. La slection des caractristiques :
La slection de caractristiques joue un rle important dans la classification. Elle permet de
simplifier le modle en rduisant le cot de calcul et en facilitant son implmentation. On
sintresse seulement aux mesures qui sont pertinentes en cartant les caractristiques
insignifiantes de lensemble de donnes. Cela rend le modle plus lisible et comprhensible et
plus robuste au bruit et aux incertitudes, ce qui amliorera les performances (prcision, erreur
quadratique, etc.) de classification/rgression des diffrents modles. La slection de
caractristiques permet de contourner la maldiction de la dimensionnalit et dviter le surapprentissage.
Les algorithmes de slection choisissent un sous-ensemble de caractristiques (appels
prdictifs) partir des caractristiques originales afin de construire un modle optimisant les
erreurs prdictives. Ces algorithmes se dcomposent en deux catgories :
x
Mthodes de filtre : Elles reposent sur les caractristiques gnrales des donnes afin
dvaluer et de slectionner les sous-ensembles de caractristiques sans impliquer
lalgorithme dapprentissage.
Dans (Mahadevan and Shah, 2009) une mthode de slection de caractristiques appele
limination rcursive de caractristiques par SVM a t utilise pour la slection des
caractristiques pour la discrimination dans le cas de la classification et dans (He et al., 2008)
elle a t utilise pour la prdiction dans le cas de rgression.
La slection et l'extraction des caractristiques peuvent tre ralises aussi par un algorithme
gntique (AG). Cest une approche doptimisation stochastique utilisant la thorie de Darwin
de la slection naturelle et les travaux de Mendel dans la gntique pour simuler lvolution
biologique (Chakraborty, 2008). Elle cherche trouver une solution optimale sans le besoin
davoir des connaissances thoriques sur le problme rsoudre. Contrairement aux modles
gradients qui peuvent se coincer sur un optimum local, lalgorithme gntique tente via plusieurs
points de recherche de trouver dautres parties de lespace de recherche et de surpasser
32
loptimum local pour atteindre un optimum global. LAG cherche maximiser une fonction
Fitness J T qui mesure laptitude dun individu T survivre, saccoupler et produire une
descendance (progniture) dans une population dindividus pour un environnement donn.
Lefficacit de lapplication de lalgorithme gntique dpend essentiellement de la faon de
codage du problme et le choix de la fonction objective (fitness). Plusieurs travaux ont utiliss
des algorithmes gntiques pour loptimisation et la slection des caractristiques en gnral
(Khushaba et al., 2011) ou les caractristiques dans lapprentissage des SVR (He et al., 2008).
La slection des caractristiques peut se faire aussi dans le domaine frquentiel (voir annexe A.3)
On note quon peut utiliser les poids wi dans les SVM comme des poids de caractristiques pour
obtenir leur classement respectif. Quelques indices peuvent aider la slection de caractristiques
dans les problmes de classification en maximisant la dpendance entre deux quantits ou
variables tous en minimisant la redondance :
A. Lintercorrlation pour lestimation du temps de retard :
Une valeur dinter-corrlation proche de zro indique une absence de relation linaire entre ces
deux variables, alors quune valeur proche de 1 signifie une forte relation entre les deux
variables.
(t)
(I.38)
u(t D) (t)
R vu E^vt ut ` E^> ut D w t @ut `
E^ ut Dut w t ut ` R uu D R wu
(I.39)
Par la supposition que le bruit et lentre sont non corrls, c..d. Rwu W 0 , on obtient
R vu D R uu D
Donc il y aura un seul pic dans Rvu qui correspond W
(I.40)
D.
B. Information mutuelle :
Linformation mutuelle rentre dans le cadre de la thorie dinformation et la thorie des
probabilits. Dans cette thorie, on calcule I X , Y , une quantit qui mesure la dpendance au
sens probabilistique (linformation apporte par une ralisation de X sur Y) de deux variables
33
alatoires X et Y. Cette mesure permet de rduire au maximum linformation incertaine qui relie
X et Y.
p x,y
px p y
(I.41)
I X,Y H X H X H X,Y
H X H X/Y H Y H Y/X
(I.42)
O H(X) et H(Y) sont des entropies, H(X,Y) lentropie conjointe, et H(X/Y) et H(Y/X) sont les
entropies conditionnelles (voir lannexe A.2).
Linformation mutuelle peut tre applique plusieurs domaines, comme par exemple le
diagnostic de dfaut dans un procd Tennessee Eastman (Verron et al., 2007). Nanmoins,
l'application principale reste la slection de caractristiques dans les problmes de classification
(Peng et al., 2005), o le but est de maximiser la dpendance entre deux quantits ou variables.
Dans cette thse, linformation mutuelle et lintercorrlation sont proposs dans le chapitre II
pour aider dans le choix des variables caractristiques dans un problme de rgression.
2. La transformation des caractristiques, fonctionnalits, attributs ou prdicteurs
La famille des transformations des caractristiques concerne la cration de nouvelles variables
prdictives partir des variables initiales, ce qui rduit la dimension de lespace dentre par
transformation. Ces mthodes comprennent la technique danalyse en composantes principales
(ACP), Partial least square (PLS), analyse factorielle, etc.
Aprs plusieurs essais de ces mthodes de transformation et slection de caractristiques pour le
problme de diagnostic de dfauts sur trois procds diffrents (olien, procd de traitement des
eaux, racteur chimique CSTR), jai constat que parfois ce nest pas suffisant dutiliser
seulement les caractristiques dorigine (ou leurs transforms) car elles peuvent tre non
informatives, redondantes et ayant des interactions entre elles. La solution est de crer de
nouvelles caractristiques qui dcrivent au mieux un dfaut donn.
34
I.2.3.4. Modlisation
Les mthodes bases sur les donnes sont utilises dans cette thse pour deux finalits :
1. Le diagnostic de dfaut, o on attend de ces mthodes de relier les entres + sorties
X=[U,Y] au type de situation (Z) (dfectueuse ou normale pour diffrents dfauts). Un
modle comportemental (ou empirique) est attendu, contrairement aux mthodes bases
sur les modles qui utilisent le modle fondamental du systme.
2. La modlisation, o on attend de ces mthodes de trouver une relation empirique entre
les entres + sorties X=[U,Y] et quelques tats du systme (mesurs ou non mesurs). L
encore, un modle comportemental (empirique) est obtenu. Cette modlisation donne une
estime qui servira enrichir les donnes dans lobjectif de diagnostic de dfauts.
Ce paragraphe discute la modlisation entres-sorties du systme par des modles empiriques
data driven modeling (Solomatine and Ostfeld, 2008, Niska, 2011).
De manire gnrale, les modles (fondamentaux ou empiriques) amliorent la comprhension
intrinsque du systme et son comportement. Ils peuvent tre utiliss pour lanalyse de la
scurit, la conception, la simulation et le contrle du systme, ainsi que pour lapprentissage des
oprateurs et le diagnostic de dfauts. Un modle doit tre prcis, simple et gnral, et il est
35
prfrable quil soit facile construire, comprendre et tester. On note que tous les modles
(mme fondamentaux) sont faux puisquils donnent juste une image de la ralit (systme).
Le choix de la structure du modle dpend des connaissances a priori du systme. Sans
connaissance a priori, le modle de type bote noire (black box model) est choisi. Il a une
structure flexible et une bonne puissance dapproximation. Avec des connaissances sur la
physique dcrivant la dynamique du systme, on choisit la structure bote grise (grey box model)
qui incorpore les connaissances a priori avec une structure dquations diffrentielles en plus de
certains paramtres ou constantes inconnues. La structure du modle dpend galement du type
de la relation entre entres et sorties, linaire ou non linaire. On peut galement choisir
dintroduire linfluence des perturbations sur les entres/sorties. En effet, la connaissance de la
nature des perturbations est trs utile pour prdire les sorties futures du systme par la
comprhension des corrlations qui existent entre ces perturbations.
La technique la plus courante dans lajustement et la modlisation est probablement la
rgression. Elle cherche trouver une fonction f qui explique la relation entre deux variables y
et x de telle sorte avoir :
f x ,
x p
(I.43)
O p est le nombre des variables explicatives et H est le bruit. Minimiser lerreur au sens des
moindres carrs veut dire minimiser lerreur entre la donne relle y et son estime y :
rsidu
y y
(I.44)
La rgression requiert des hypothses que lutilisateur doit spcifier pour construire le modle
dcrit par la relation entre les entres et les sorties. Le choix du modle est bas sur les
connaissances sur les dynamiques du procd. Cela est raisonnable lorsque ces hypothses sont
bases sur les lois physiques ou des dtails connus dans le domaine concern.
La rgression linaire consiste trouver la droite qui passe au mieux (au sens des moindres
carrs) travers le nuage de points reprsentant les donnes. Par lutilisation des fonctions
noyaux (Kernel), la rgression peut apprhender une fonction non linaire. Les mthodes de
rgression conventionnelles, comme la rgression linaire multiple, souffrent de plusieurs
dfauts, comme lincapacit de dterminer un modle si le nombre dobservations est infrieur
aux variables explicatives, lincapacit de prendre en compte les donnes manquantes et
lincapacit de manipuler les variables colinaires. Ces problmes peuvent tre rgls par des
mthodes telles que lorthogonalisation des prdicateurs (Rgression sur les composantes
36
principales), les mthodes de rgularisation (Ridge regression), la rgression PLS (partial least
square) ou la rgression par machines vecteurs supports.
MSE
1
N
z z
i
(I.45)
i 1
MAE
1
N
(I.46)
zi
i 1
NMSE
1 1
V2 N
zi zi
i 1
(I.47)
1 N
zi zi 2
N i1
RMSE
(I.48)
zi zi
i 1
NRMSE
(I.49)
2
i
i 1
6. La somme relative des erreurs quadratiques (RSSE) Relative Sum of Squared Error :
2
zi
i 1
RSSE
(I.50)
zi2
i 1
7. Le coefficient de dtermination R2 :
zi zi
N
1
i
N
zi z
(I.51)
8. Le critre dAkaike (AIC) : (Akaike, 1974), (Bozdogan, 2000) Le degr optimal est dfini
comme le degr qui minimise AIC :
AIC 2 u k 2 log L(T)
(I.52)
O k est le nombre de paramtres libres dans le modle, L(T) est la fonction de maximum de
vraisemblance
9. Rapport ou ratio des vecteurs supports (SV) dans les SVM : Le rapport entre le nombre
des points supports divis par le nombre total des donnes dapprentissage. Une valeur
importante de ce ratio indique que le problme est difficile rsoudre :
Ratio SV
NSV
N
(I.53)
10. Compromis biais-variance : Un biais dsigne un cart systmatique entre une grandeur (P)
et son estimation (prdiction) ( P ) :
Biais E[P ] P
(I.54)
Les performances dun modle sont mesures par la valeur de lerreur quadratique moyenne :
38
(I.55)
L'incertitude peut tre dfinie comme la racine carre de la somme des carrs du biais et la
variance (V) :
2 biais 2
(I.56)
Pour avoir une erreur minimale et donc un bon modle, il faut diminuer le biais. Cela peut
conduire laugmentation du nombre de paramtres (ou degr) du modle, ce qui entrane
laugmentation de la variance, puisque le modle va suivre trop de dtails des chantillons
(observations). Une grande variance augmente lerreur quadratique. Il est ncessaire donc de
faire un compromis biais-variance de telle sorte augmenter la prcision du modle sans trop
augmenter son degr de faon minimiser le biais et la variance en mme temps.
efficace et sophistiqu des algorithmes dapprentissage automatique introduit par Vapnik dans le
dbut des annes 1990 (Boser et al., 1992), conu pour trouver un sparateur optimal (reprsent
par les paramtres dune fonction de dcision) qui maximise la marge entre les frontires de
chaque classe, par lutilisation dun ensemble limit dentranement. Lalgorithme a t construit
au dbut pour rsoudre les problmes de discrimination (classification) et de reconnaissance de
formes. Il a t ensuite tendu pour le cas de rgression.
Dans cette thse, le terme SVMs est utilis pour dcrire la fois la classification et la rgression
en utilisant les mthodes vecteurs de support. Le terme SVM sera utilis pour dcrire la
classification par les machines vecteurs de Supports tandis que le terme SVR sera utilis pour
dcrire les mthodes de rgression vecteurs de supports.
^x i , z i `,
i 1,...N
Le but de lapprentissage est de trouver une fonction f qui estime au mieux les sorties zi partir
dun nombre limit dentres xi. Les approches traditionnelles cherchent minimiser la mesure
de cots sur les N donnes dapprentissage, en dautres termes minimiser les erreurs sorties zi et
leurs estimes zi
1 N
zi zi
N i1
1 N
Lzi , f ( xi )
N i1
(I.57)
Le risque rel (ou fonctionnel) R qui reprsente lesprance des cots sur des nouvelles
observations (tous les observations possibles) est donn comme suit :
R> f @
z z Px, z dxdz
(I.58)
x,z
Vapnik a cherch trouver une relation qui lie le risque empirique mesur (Remp) et le risque rel
R, et a dmontr que :
R> f @ d Remp > f @ M dVC
40
(I.59)
^x z
i
1`,
^x z
i 1....N , xi p , zi ^ 1, 1`
1`
Chaque exemple dentre xi (nomm aussi chantillon, observation, forme ou encore motif) est
caractris par un ensemble de p variables descriptives. Ainsi, le vecteur x est donn comme
suit : xi
x ,x
i1
i2
,...,xip
La sortie zi dfinit la classe (ou ltiquette, la cible ou encore la marque) du vecteur xi.
41
Lobjectif des SVMs est de trouver un hyperplan optimal f (x) permettant de sparer les donnes
dapprentissage de sorte que tous les points dune mme classe soient du mme ct de
lhyperplan. Donc, cet hyperplan dun point de vue gomtrique divise lespace en deux comme
illustr dans la Figure I.6. Deux cas se prsentent : cas des donnes linairement sparables, et
cas des donnes non linairement sparables, que nous dtaillons dans la section suivante.
w, xi
b
w, xi
b
1
Classe +1
w
w, xi
b
1
w
Hyperplan
canonique
Vecteurs de support
2
w
Hyperplan
sparateur
Hyperplan
canonique
Classe -1
f x
w,x b
(I.60)
w et b sont les paramtres de lhyperplan sparateur, o w est le vecteur poids qui dfinit la
direction perpendiculaire lhyperplan sparateur et b est le terme de biais (un scalaire). Ces
paramtres sont calculs partir des donnes formant lensemble D.
42
Cet hyperplan sparateur permet de mettre les points dune mme classe dans un mme ct :
zi w, xi b t 1
pour i 1, 2,..., N. w p et b
(I.61)
Vapnik a montr quil existe une capacit optimale du classifieur qui est obtenue lorsque la
distance entre lhyperplan et les points les plus proches de chaque classe sera maximise. Cette
distance dfinie comme
1
est appele Marge. L'hyperplan optimal spare donc bien les deux
w
1
2
min 2 w
O f ( xi )
(I.62)
L( w, b,D )
N
1 2
w D i > w, x i b z i 1@
2
i 1
(I.63)
wL
ww
wL
wb
0 o w
zi
(I.64)
i 1
0 o
z
i
i 1
43
(I.65)
1 N N
z
z
x
,x
i
min
i j i j i j
2
i
j
i
1
1
1
(I.66)
Cette formulation du problme peut recevoir une solution efficace qui laisse peu de paramtres
libres choisir. La fonction de dcision est alors :
f(x) sgn
w,x
b
(I.67)
avec w
z ixi
i 1
La classe dun nouveau point x est ensuite donne par le signe de f(x). La fonction de dcision
est donc influence uniquement par un petit sous ensemble de D correspondant aux points
(exemples) ayant i non nuls. Ces points sont appels les vecteurs de support ou Support
Vectors (SVs) . La solution f(x) dans ce cas peut se traduire comme une combinaison linaire
des motifs supports.
Note : Les Supports Vectors (SVs) sont les points qui se trouvent exactement une distance
gale la marge dont les i sont non nuls.
Il sagit l dune proprit trs intressante des SVMs : seuls les SVs sont ncessaires pour
dcrire la dcision. Le nombre des SVs pour le modle optimal est gnralement petit devant le
nombre des donnes dapprentissage N. Les poids w dfinissant la fonction de dcision
discriminante sont calculs partir de tous les vecteurs de support.
La rsolution Lagrangienne qui permet de trouver les diffrents paramtres, est ralise de
manire satisfaire les conditions de Karush-Kuhn-Tucker (KKT) qui dcrivent quau point de
la solution, le produit entre les variables duales et les contraintes est nul.
Conditions de KKT : jouent un rle essentiel dans la thorie et la pratique d'optimisation sous
contraintes. Si on considre le problme (I.63), et en posant :
Ri
z i w.x i b - 1
0 o Ri t0
44
2. 0 D i C o R i
3. D i
C o Ri d 0
Les conditions de KKT sont violes dans les deux cas suivants :
1. D i C et R i 0
2. D i 0 et R i 0
O C est un paramtre de rglage.
Classe +1
w
1
w
Exemples mal
classs
Vecteurs de support
Classe -1
45
La distance entre les vecteurs bien classs et lhyperplan doit tre maximale.
La distance entre les vecteurs mal classs et lhyperplan doit tre minimale.
Classe +1
1
w
Vecteurs de support
Classe -1
z i w, x i b t 1 i pour i
1, 2,..., N
(I.68)
1
2
min
w
C
i , C t 0
i 1
(I. 69)
46
Lw,b,,b,
N
N
1 2
w C i - i zi w,xi
2
i 1
i 1
b i 1 ) i i
(I.70)
i 1
wL
ww
wL
wb
wL
w i
0 o w
z x
i
(I.71)
i 1
0 o
z
i
(I.72)
i 1
0 o i C - i i
(I.73)
N
1 N N
i - i j zi z j xi ,x j
max
2i1 j1
i 1
sous les contraintes
0 d i d C i 1,...,N
N
et i z i
0
i 1
(I.74)
La seule diffrence avec le cas linairement sparable est lintroduction dune borne suprieure
pour les paramtres duaux Di ( Di C ). Ces multiplicateurs de Lagrange reprsentent une sorte
de forces virtuelles dcoulant des contraintes poses sur le problme rsoudre.
2. Fonctions noyaux
Dans le cas de donnes non linairement sparables, plus la dimension de lespace de description
est grande, plus la probabilit de pouvoir trouver un hyperplan sparateur entre les exemples et
les contre-exemples est leve. En transformant lespace dentre en un espace de redescription
(appel aussi espace de caractristique) dune plus grande dimension, ventuellement infinie, il
devient possible dutiliser la mthode des SVMs (Figure I.10).
47
x2
g3
)
g2
x1
g1
x 1,....x P T
o x
1 x ,....n x
(I.75)
O <,> dnote le produit scalaire dans le nouvel espace. Le problme doptimisation se transcrit
dans ce cas par :
N
1 N N
i - i j z i z j x i ,x j
max
2i1 j1
i 1
sous les contraintes
0 d i d C
N
et i z i
0 avec i 1,.......N
i 1
(I.76)
f(x)
z x ,x
i
(I.77)
i 1
(sans parler du cas de la dimension infinie). Ceci est dautant plus difficile si on utilise des
transformations non linaires des descripteurs dentre. On peut dans certains cas sarranger pour
court-circuiter le passage par les calculs dans lespace de redescription. Il existe des fonctions
bilinaires symtriques positives K(xi , x j ) , appeles fonctions noyaux (Kernel functions),
faciles calculer et dont on peut montrer quelles correspondent un produit scalaire
xi , x j dans un espace de grande dimension :
48
K x i , xj
x i , x j
(I.78)
La Figure I.11 ci-dessous, illustre le calcul dune surface de dcision par la mthode noyau
dans le cas des donnes non linairement sparables.
Vecteurs
Supports
Sparateur
Figure I.11 Vecteurs support et surface de dcision calcule par la mthode noyau
On peut utiliser nimporte qu'elle fonction noyau K ( xi , x j ) valide satisfaisant la condition de
Mercer sans avoir besoin de connatre des informations sur la transformation non linaire quil y
a derrire. La condition de Mercer nous indique si une fonction est un noyau mais ne fournit
aucune information sur la fonction ) (et donc sur lespace des caractristiques) induite par ce
noyau.
Condition de Mercer : Sachant que la matrice contenant les similarits entre tous les exemples
de lentranement est appele la matrice de Gram (G), la condition ou le thorme de Mercer
snonce comme suit :
La fonction K ( xi , x j ) : X u X o est un noyau si est seulement si matrice de Gram
G
Kx
, x j , avec i, j
49
T 1 T
D I - D .G.D
max
N
D
2
Avec D T
>D1,...,D N @ ,
zT
(I.79)
zi z j K xi , x j
est la matrice dinfluence par paires du terme gnral. Cette matrice est carre symtrique dfinie
positive de taille N u N . Pour dcider quelle classe appartient une donne x, il suffit de prendre
le signe de la fonction de dcision donn par (I.77) :
f x sgn ziD i K x i , x b
i1
(I.80)
Si le signe de f(x) est positif alors la donne x appartient la classe +1, sinon elle appartient la
classe 1. Cette fonction est une somme pondre de fonction noyaux. Elle dpend juste des
Nsup, car Di=0 ailleurs. Donc, on peut remplacer N par Nsup :
Nsup
f x sgn ziD i K x i , x b
i1
(I.81)
La valeur du biais b peut tre calcule par lutilisation de deux supports opposs x A et xB tels
que f x A 1 et f x B 1 :
1 N
b zi i >K xA,xi K xB ,xi @
2i1
3. Exemples de noyaux
1. Noyau linaire
K xi , x j
xi , x j
avec )xi xi
50
(I.82)
2. Noyau polynomial
K xi , x j
xi , x j
O d est le degr du polynme. Ce noyau ralise implicitement un produit scalaire dans lespace
des descripteurs correspondant tous les produits d dimensions.
3. Noyau gaussien (ou noyau RBF)
Cette fonction noyau est typique et trs largement utilise puisqu'elle permet avec un rglage
appropri de reprsenter nimporte quelle fonction. Le noyau gaussien reprsente une mesure de
similarit entre les chantillons ( xi , x j ) et scrit sous la forme suivante
K xi , x j
x x
i
j
exp
2
2V
K xi , x j tanh xi .x j 1
Dautres variantes de SVM existent. On cite par exemple SVM une classe, Q SVM (voir
lannexe A.6 pour plus de dtails)
^x1, z1 , x 2 , z2 ,........,x N , z N `,
xi p , zi z
^1,..., k`
Dans ce cas, il ne sagit plus de trouver une seule sparatrice entre deux classes mais il faudra
classer les exemples en plusieurs classes, ce qui revient construire k hyperplans linaires
dquations donnes comme suit :
51
wkT x bk
(I.83)
0 avec k z
Gnraliser les SVMs dans le cas multi classes revient rsoudre le problme de programmation
quadratique suivant :
N
1
2
min
w
ik
i 1
wk ,bk , 2 kz
(I.84)
1,..., N et k z
f x argmax f K x o f k x wkT bk k z
kz
(I.85)
k z
(I.86)
Plusieurs mthodes ont t proposes pour rsoudre ce problme, les plus utilises sont les
suivantes :
1. Un Contre tous (OAA pour One Against All)
Pour chaque classe, on dtermine un hyperplan sparant celle-ci de toutes les autres, en
considrant cette dernire comme la classe +1 et les autres classes comme tant la classe 1, ce
qui rsulte en k SVMs binaires (pour un problme k classes) (Liu and Zheng, 2005) .
2. Un contre un (OAO pour One Against One)
Dans ce cas, on construit un SVM pour chaque paire de classes. Ainsi, on sera amen calculer
k k 1
SVMs binaires. Cette approche est associe en gnral une opration de vote
2
k k 1
sous-classifieurs SVMs.
2
contient un classifieur SVM destin distinguer entre deux classes seulement parmi les autres. A
chaque niveau, on limine une classe jusqu ce quune seule classe reste.
La mthode Chunking.
La mthode de dcomposition.
De la mme manire que la rsolution lagrangienne, toutes ces mthodes doivent vrifier les
conditions de KKT. La mthode SMO est considre comme une des plus efficaces mthodes
dcrites ci-dessus, elle est la base de plusieurs algorithmes tels que la librairie LIBSVM (Chang
and Lin, 2001) qui va tre utilise dans cette thse pour la construction des modles de prdiction
par SVR dans le chapitre II.
x
En 1999, John Platt (Platt, 1999) proposa un nouvel algorithme pour lentranement des SVMs
quil appela algorithme dOptimisation Squentielle Minimale (SMO). Cet algorithme
53
dcompose le problme de (I.62) mais choisit de rsoudre le plus petit sous-problme possible
chaque tape doptimisation de la fonction objectif. Cela est ralisable en choisissant
doptimiser, non pas un ensemble de multiplicateurs de Lagrange la fois, mais deux seulement.
De ce fait, lalgorithme SMO ne ncessite aucun stockage supplmentaire de matrice. Du ct
des performances en temps de rponse, lalgorithme SMO est plus efficace. En effet, il ncessite
plus ditrations pour converger, mais chaque itration effectue moins doprations.
Lalgorithme SMO est bas sur trois lments :
1. Une mthode analytique pour rsoudre les deux multiplicateurs de Lagrange.
2. Deux heuristiques pour choisir quels sont les multiplicateurs optimiser.
3. Une mthode pour le calcul du paramtre b utilis dans la fonction de dcision.
Pas de problme avec une grande dimension des donnes. Faire face des situations
complexes lorsque le nombre de variables est plus grand que celui dobservations.
Capacit dobtenir un rsultat prcis mme dans le cas de taille rduite de lensemble
dapprentissage.
Elimination des donnes non significatives par la concentration de linformation utile sur
les vecteurs supports.
Grce ces avantages, les SVMs ont montr leur efficacit dans plusieurs domaines et
applications, surtout dans les problmes de grande taille grce leur solide fondement thorique
qui cherche minimiser la borne suprieure de lerreur de gnralisation permettant de rcuprer
54
juste linformation utile partir des donnes dapprentissage. Parmi ces applications, on peut
citer :
x Reconnaissance de chiffres manuscrits (Vapnik, 1998, Cortes and Vapnik, 1995, Boser et
al., 1992)
x Reconnaissance et classification d'image
x Catgorisation du texte (Dumais et al., 1998, Basu et al., 2003)
x Classification de la couverture des terres (Huang et al., 2002)
x Classification des donnes audio (Aggarwal and Aggarwal, 2011)
x Applications en chimie (Li et al., 2009, Ivanciuc, 2007),
x Estimation de densit (Mukherjee and Vapnik, 1999)
x Prdiction: sries temporelles financires (Gestel et al., 2001), capacit thermique (Xue et
al., 2004)
x Surveillance des variations des procds (Cheng and Cheng, 2008, Camci et al., 2008)
x Classification des dfauts : ex. analyse du transformateur de gaz dissous (Tang and Wu,
2011), o lalgorithme gntique extrait les caractristiques des dfauts et la mthode
Bootstrap aide amliorer le prtraitement par lgalisation des nombres d'chantillons
pour diffrents types de dfauts. Ensuite, un classifieur comme le SVM est utilis pour le
diagnostic de dfauts.
(Widodo and Yang, 2007) prsente une revue de la littrature utilisant les SVM dans la
surveillance et le diagnostic des machines roulements, moteur induction, HVAC, machine,
boite vitesse, pompe, vanne, compresseurs. Dans la littrature, plusieurs travaux se sont
intresss lutilisation de SVM pour rsoudre le problme de diagnostic de dfauts :
x
Procd de traitement des eaux uses (Laouti et al., 2011b, Zeng et al., 2006)
Procd Tennessee Eastman (Monroy et al., 2010, Zhang, 2009, Ylamos et al., 2007)
55
Il existe plusieurs programmes et progiciels qui implmentent les SVMs avec plusieurs langages
de programmation comprenant des routines doptimisation numriques trs efficaces. Parmi ces
logiciels on trouve :
x
SVMlight : limplmentation des SVMs la plus connue ralise par Thorsten Joachims
(Joachims, 1999) (http://svmlight.joachims.org/).
La boite outils SV : crite compltement dans Matlab par Stphane Canu et al.
(2005), elle est une implmentation facile manipuler pour les gens familiariss avec
Matlab. [http://asi.insa-rouen.fr/enseignants/~arakotom/toolbox/index.html].
LIBSVM : reprsente une bibliothque complte des SVMs prsente par Chang et Lin
(Chang and Lin, 2011 (Chang and Lin, 2001) crite dans le langage C/C++ et Java
utilisant la mme mthode de dcomposition du problme quadratique que celle de
lalgorithme SMO. Ce package effectue la fois les tches de classification et de
rgression, et propose plusieurs interfaces pour les autres langages tel que : Phyton,
Matlab. Cette bibliothque peut tre tlcharge sur :
http://www.csie.ntu.edu.tw/~cjlin/libsvm/
56
systmes. Linformation de la modlisation sera utilise dans cette thse afin denrichir les
donnes dans lobjectif de dtection de dfauts.
I.3.3.1. Thorie
Soit lensemble D2 de N paires donnes, ayant un vecteur de donnes xi comme entre et
ltiquette zi de ce vecteur comme sortie, qui peut maintenant prendre nimporte quelle valeur
relle.
D2
Comme prcdemment, habituellement dans une rgression le but est trouver une fonction
pouvant mettre en relation les entres xi et les sorties zi :
f ( xi )
zi
Choisir un modle qui reprsente au mieux ces donnes, par exemple une droite:
f ( xi ) a.xi b
-
i 1
Avec une fonction de cot de type quadratique (moyenne des erreurs quadratique MSE), on
obtient la solution de maximum de vraisemblance quand le bruit est gaussien ou normalement
distribu. Mais, la prsence dune valeur aberrante risque de biaiser le modle obtenu reprsent
par la fonction f. Lide qui permet de gnraliser lutilisation des SVMs de la classification a la
rgression est ladoption dune nouvelle fonction de perte (cot) perte de Vapnik qui inclut la
notion de distance. Cette fonction de perte ignore les erreurs qui se trouvent une certaine
distance de la vraie valeur. Ce type de fonction est considr comme une fonction de perte insensible. Elle a lavantage de diminuer ainsi le surapprentissage.
57
Perte
H
i
H
[i H
z f (x)
f ( x) z H
f ( x) z H
f ( x) z 0
[ j
x
f ( x)
w, x b qui rapproche
toutes les paires ( xi , zi ) avec une prcision de (voir Figure I.12), ou en dautres termes une
fonction qui estime les cibles bruits zi avec au maximum un cart . Une faon pour assurer la
platitude de la fonction f (x) est de minimiser w .
Afin dautoriser certaines erreurs (plus grande de ), des variables dcart ( ] , ] ) peuvent tre
introduites pour adoucir la marge avec le paramtre de rgulation C qui fait le compromis entre
les erreurs et le terme de rgularisation
Minimiser
1 2
w .
2
l
1 2
w C (] i , ] i )
2
i 1
zi w,I ( xi ) b d H ] i
sujet w,I ( xi ) b zi d H ] i
] i , ] i t 0
(I.87)
58
si ] d H
] H
(I.88)
sinon
N
N
1 2
w C ] i ] i
- Pi] i Pi
] i
2
i 1
i 1
D i H ] i zi w, xi b
i 1
N
D i H ] i zi w, xi b
(I.89)
i 1
Comme pour le cas de classification, le problme peut se rsoudre par lutilisation du dual
lagrangien qui conduit :
Nsup
f ( x)
(D
D i* ) K ( xi , x) b
(I.90)
i 1
N sup
Avec, w
D i* I ( xi )
(I.91)
i 1
O D i ,D i* sont les multiplicateurs de Lagrange. Seules les valeurs non nulles des multiplicateurs
de Lagrange sont utiles pour la dtermination de la courbe de rgression. Les points de donnes
associs ces coefficients (qui se trouvent sur ou l'extrieur du tube rH) sont appels les
vecteurs de support.
Le fait dajouter des variables dcart et de manipuler le paramtre de rgularisation C donne aux
SVR un aspect flexible et rigoureux la fois. Pour voir linfluence des diffrents paramtres
dune manire visuelle, voir le tutorial sur les SVM et SVR donn dans (Brereton and Lloyd,
2010).
La mthode classique de moindres carrs bien quelle soit considre comme le meilleur
algorithme destimation polynomiale, reste inferieure en termes de performances (R2, erreur
quadratique) par rapport lapproche SVR, Ceci a t dmontr dans (Wang et al., 2007), ou
dans (Maalouf et al., 2008) pour la prdiction du module dlasticit des matriaux de chausse
dans le domaine de gnie civil.
La comparaison de SVR avec dautres mthodes en termes de prcision et robustesse a balanc
en faveur du SVR dans la quasi- totalit des cas :
59
Prdiction de charge de liaison d'un rseau (Priyadarshin et al., 2011, Bermolen and Rossi,
2009).
Modlisation de type bote noire du comportement dun bras de robot hydraulique (Gretton et
al., 2001).
Estimation des champs thermiques et d'coulement dus la convection naturelle (Varol et al.,
2008)
Prdiction des proprits mcaniques des matriaux en acier (Wang, Mu et al., 2006).
60
Capteur logiciel dindices de fusion melt indices pour deux applications : processus de
neutralisation de pH en simulation et un procd dextrusion de polymre chelle de
laboratoire (Chitralekha and Shah, 2010).
Identification des dfauts (Cheng et al., 2011) et a montr sa supriorit par rapport aux
rseaux de neurones et la mthode de carte de contrle des sommes cumules CUSUM
(Cumulative Sum Control chart)
Parmi les algorithmes dentranement les plus populaires et efficaces des SVR, on trouve
lalgorithme classique SMO. Nanmoins, ce dernier prsente une source dinefficacit due au
fonctionnement avec une valeur de seuil unique en plus de sa vitesse de convergence lente.
Ainsi, plusieurs travaux proposent une amlioration de lalgorithme SMO (Shevade et al., 2000),
(Flake and Lawrence, 2002).
(Wang et al., 2009) ont propos un algorithme SVR en ligne crit sur Matlab pour modliser la
fonctionnalit dynamique du processus de fermentation. Cet algorithme prsente un inconvnient
puisquil est inadapt aux grandes dimensions. (Ma et al., 2003) ont dvelopp et implment un
algorithme SVR en ligne capable dtre appliqu pour la prdiction de sries temporelles et la
validation croise sans le besoin de refaire lapprentissage quand un nouvel chantillon est ajout
ou supprim. Un autre algorithme SVR en ligne a t dvelopp pour prdire les tensions
ncessaires appliquer pour compenser la charge de gravit du bras d'un robot (Parrella, 2007).
Dans lidentification des systmes non linaires, le systme peut tre reprsent comme une srie
de blocs lis entre eux. On cite par exemple :
x
Le modle Hammerstein : qui est compos dun bloc non linaire statique suivi dun
bloc ou lment linaire dynamique comme le montre la Figure I.13. Lobtention du
modle Hammerstein peut se faire par lalgorithme didentification sous-espace N4SID
qui utilise SVR moindres carrs LS-SVR (Goethals et al., 2005), et dans (Mujahed and
Westwick, 2011) un modle SVR pour capter la non linarit.
Entre : u(t)
NL
w(t)
Le modle de type Wiener : constitu dun lment dynamique linaire suivi dun
61
lment non-linaire statique comme le montre la Figure I.14. Dans (Ttterman and
Toivonen, 2009), le composant linaire du modle Wiener est reprsent par un filtre
tendu basis filter expansion et le bloc non linaire est dtermin par un modle SVR
noyau.
Entre : u(t)
v(t)
NL
Sortie : y(t)
Modle ARMA : est un outil pour comprendre et prdire les valeurs futures dune srie
temporelle. Il est compos de deux parties : une part autorgressive (AR) et une part
moyenne-mobile (MA). Le modle est gnralement not ARMA(p,q), o p est l'ordre de
la partie AR et q l'ordre de la partie MA (Zhang et al., 2007, Mohsen and El-Yazeed,
2004).
- Lastuce noyau dans SVR : transforme les donnes dentres non linairement sparables
en un espace o elles pourraient tre sparables : espace de Hilbert noyau reproduisant
(EHNR), ce qui permet au SVR de capter les non linarit du systme dans un modle de
type ARMA par exemple (Martnez-Ramn et al., 2006) .
- Modle ARX : Autorgressif avec entres exognes. Une mthode de rseaux de neurones
ARX adaptatives utilisant une fentre mobile qui a t propose pour prdire des
variables. Il a montr une capacit pour capter les changements dynamiques lents du
procd de filtration anarobie pleine chelle de traitement des eaux uses (Lee et al.,
2005). (Adachi et al., 2001) ont propos un modle de rgression linaire de type ARX
et FIR qui a montr sa robustesse contre les valeurs aberrantes.
62
1
1
N jusqu' N .
32
2
valeurs. Une solution pratique sur le choix de ces paramtres consiste en une recherche de grille
avec des squences en croissance exponentielle.
Jusqu aujourdhui, ny a pas une mthode dfinitive qui permet de calculer les paramtres
optimaux de SVMs. Nanmoins, plusieurs travaux ont t effectus dans ce sens afin de proposer
des valeurs pratiques (Schittkowski, 2005, Shitong et al., 2004, Cherkassky and Ma, 2002,
Schlkopf et al., 1999, Smola et al., 1998)
(Mjalli et al., 2007) et (Gunter and Zhu, 2007) ont propos un algorithme qui calcul le chemin de
la solution complte de la rgression par SVR. Une estimation non biaise pour le degr de
63
O z est la moyenne des rponses de lensemble dapprentissage. X z est lcart type des
rponses de lensemble dapprentissage. Cette prescription permet aussi de manipuler les valeurs
aberrantes.
Paramtre V (variance de la distribution gaussienne) :
Cest lunique paramtre du noyau gaussien. Le paramtre V permet de rgler la largeur de la
gaussienne, et donc va contrler la capacit de gnralisation des SVMs. (Cherkassky and Ma,
2004) ont propos cette relation pour calculer V :
V 2 1.5
1
N
z z
i 1
64
65
WX
ln N
, avec la
N
66
67
68
Dans ce chapitre, la stratgie de diagnostic de dfaut propose dans cette thse est applique au
procd de traitement des eaux uses (station dpuration) Waste Water Treatment Process
WWTP . Dans la premire section, nous prsentons le procd et son modle. La deuxime
section prsente une revue bibliographique des mthodes bases sur les donnes qui ont t
utilises pour la modlisation et la dtection de dfaut dans le procd WWTP. Dans la troisime
section, nous considrons lapplication de la mthode SVR pour la modlisation de certaines
variables du procd (oxygne dissous So5, azote oxyd Sno2, Matires En Suspension la sortie
MES (TSSe en anglais) . ) et ensuite la mthode SVM pour le diagnostic de dfauts de
capteurs (So5, Sno2,..) et aussi dactionneurs (dbit de recyclage interne Qintr , coefficient de
transfert doxygne Kla5).
Le traitement des eaux uses se fait dans les stations dpuration. Ces stations font intervenir
un ensemble dinstallations et dquipements qui permettent denlever la pollution et de rendre
leau conforme selon les normes environnementales avant son rejet dans le milieu naturel, sa
rutilisation pour lirrigation ou son recyclage. Ce sont des systmes complexes, non linaires,
soumis des perturbations/incertitudes importantes dans les dbits influents (ou affluents) et
dans la composition des eaux (la charge polluante) (Belia et al., 2009). En plus de la difficult
lie la composition de lentrant, ces ractions ont lieu dans des conditions considres non
optimales (produits toxiques, faible temprature, oxygne insuffisant, cart de pH, faible
concentration en biomasse ...) et il y a une ncessit de fonctionner dune manire continue.
70
Aprs un sjour suffisant dans le racteur biologique, leau traiter est ensuite envoye vers un
clarificateur ou un dcanteur qui va permettre de sparer la biomasse (solide) de leau pure
(liquide) par leffet de gravitation. Une dcantabilit convenable des boues signifie une eau de
bonne qualit assez claire avec une faible turbidit. Leau pure se trouve en haut du dcanteur
et se dverse lextrieur par effet de dbordement, tandis que la biomasse (boue) se trouve en
bas du clarificateur. Une partie de biomasse est enleve et jete comme dchets et la partie qui
reste va tre recycle afin de maintenir une concentration assez leve de boue dans le bassin
daration qui permet une intensification des processus biologique. Il faut noter que le stockage
et le transport des boues produites comme des dchets constituent une charge importante dans les
stations dpuration.
II.1.2. La modlisation
La modlisation des procds de traitement des eaux est devenue une tape importante utilise
en ingnierie (Jeppsson, 1996 , Gernaey et al., 2004, Rieger et al., 2010). La connaissance des
cintiques biologiques mises en jeu sont essentielles pour assurer une bonne gestion des
installations, la supervision et la commande (Sprandio et al., 2007). Par exemple, ceci permet la
prdiction de la quantit ncessaire doxygne et la production de la biomasse qui sont des
informations importantes pour la gestion du procd. La modlisation a permis de raliser des
simulations ralistes du procd de traitement boues actives qui ont t appliques pour :
- L'optimisation du traitement (Rivas et al., 2008) et de la consommation dnergie
(Jonasson, 2007)
- La conception douvrage dassainissement (Artan et al., 2004)
- Le dveloppement et le test de nouvelles commandes (David, Vande Wouwer, et al., 2009),
(Mulas, 2006)
- Le test des schmas de surveillance et de diagnostic de dfauts (Caccavale et al., 2010)
Parmi ces modles, on peut citer le modle ASM1 (Activated Sludge Modelno1) qui dcrit les
processus importants qui se produisent dans les procds de traitement des eaux uses boues
actives (Henze et al., 1987). Il a t ralis par le groupe de travail sur la modlisation
mathmatique pour la conception et le fonctionnement du procd des boues actives appel en
anglais Task Group on Mathematical Modelling for Design and Operation of the Activated
Sludge Process dans le cadre de lassociation IWA en 1986. Ce Modle est considr comme
la base de plusieurs modles de rfrence et il est encore largement utilis dans les logiciels de
71
simulation dynamique. Par la suite, diffrents modles ont t dvelopps ASM2, ASM2d,
ASM3 (Henze et al., 2000).
Par rapport ASM1(Nelson and Sidhu, 2009) qui a pour objectif dliminer lazote et le carbone,
les modles ASM2 et ASM2d dcrivent en plus les processus lis l'limination biologique du
phosphore (Henze et al., 1995). Le modle ASM3 est une version amliore de ASM1, il a t
labor par lintroduction de nouveaux processus comme lincorporation des processus de
stockage de la matire organique, et des simplifications comme le changement du processus de
mort et rgnration
tentatives pour construire un guide pour la modlisation boues actives ont t faites comme
par exemple celle du groupe de travail "Good Modeling Practice" (GMP-TG) de l'International
Water Association (IWA) (https://iwa-gmp-tg.cemagref.fr/).
Le dveloppement des modles reprsentant les procds de traitement des eaux uses reste une
tche assez dlicate car ils intgrent un grand nombre de paramtres et variables. La
dtermination de la valeur de ces paramtres pose un problme en raison de leur dpendance aux
conditions de fonctionnement (temprature, climat), (Hauduc, 2010). La manipulation de ces
modles, pour lautomatisation du procd est galement difficile, comme ASM1 par exemple,
puisquils sont complexes et de nature non linaire. La linarisation de ces modles est souvent
ralise afin dobtenir des modles linaires temps variant plus facilement commandable et
interprtable (Benhalla et al., 2010). Lutilisation du modle rduit (plus simple mais assez
reprsentatif du systme, (Costa et al., 2008, Queinnec and Gmez-Quintero, 2009) est
galement courante dans le traitement des eaux uses boues actives, pour des fins de
commande (Chachuat et al., 2003, Ekman, 2003), ou de construction de capteur logiciel (Mulas,
2006), et destimation de variables dtats non mesures (Queinnec and Gmez-Quintero, 2009),
(Theilliol et al., 2003). La rduction du modle peut se faire par la suppression des dynamiques
lentes, comme les concentrations des composantes azotes (Chachuat et al., 2003).
D aux incertitudes et perturbations lies ces systmes, les modles mcanistiques ont
cependant des difficults reprsenter le comportement du systme. Pour ces raisons,
lutilisation des mthodes de modlisation diriges par des donnes comme les rseaux de
neurones (Jeppsson et al. 2002, Lee, Joung, et al., 2005, Mjalli et al., 2007, Rduly et al., 2007),
les moindres carrs partiels PLS (Lee et al., 2007), ou la combinaison des deux (Lee, Lee, et al.,
2006a) devient intressante pour lautomatisation du systme.
Le modle utilis dans ce travail est le modle de simulation BSM1 (Copp, 2002), appel en
anglais the Benchmark Simulation Model No 1 . Il a t dvelopp au sein du groupe de
72
travail COST action 682 et 624 et le groupe de travail sur l'analyse comparative des stratgies
de contrle des installations de traitement des eaux uses de lassociation internationale de leau
(IWA), appel en anglais Task Group on Benchmarking of Control Stratgies for Wastewater
Treatment Plants . Ce modle dcrit le fonctionnement du systme et particulirement le
racteur biologique et le clarificateur intgrant le contrle et les critres dvaluation de
performances de ces systmes. Pour plus de dtails voir les liens suivants:
http://www.benchmarkwwtp.org/
http://www.primodal.com/iwa_taskgroup_bsm.htm
Une extension du modle BSM1 pour une implmentation complte des systmes de
management deaux uses est ralise par Jeppsson dans (Jeppsson et al., 2007).
Ces diffrents modles sont programms dans plusieurs logiciels commerciaux utiles pour la
modlisation, lanalyse, laide la conception des procds ou les tests des stratgies de contrle,
on cite par exemple :
BIOWIN: http://www.envirosim.com/products/bw32/bw32intro.php
GPS-X:
http://www.hydromantis.com/GPS-X.html
SIMBA:
http://www.ifak-system.com/services/dynamic-simulation.html
Dans cette thse, nous avons programm le modle BSM1 dans Matlab afin dy incorporer le
bloc FDI, sans lutilisation des logiciels commerciaux.
V1 V2 1000 m3 .
73
Une section arobie : constitue de trois cuves ares dun volume gal
V3
V4
V5
Qf
74
Dans le modle BSM1, la dsignation X signifie particulaire et S soluble, lindice i signifie inerte
et lindice s (exemple XS) caractrise la biodgrabilit (Dispan, 2003) (Tableau II.1).
Tableau II.1 Les concentrations intervenant dans le modle BSM1
Particulaire
Dfinition
Alcalinit
Matire soluble inerte
Oxygne dissous
Azote sous forme de nitrites (NO2-) et de nitrates (NO3-)
Azote ammonium (NH4+) et ammoniac (NH3)
Azote organique soluble et biodgradable
Substrat soluble facilement biodgradable
Biomasse active htrotrophe
Biomasse active autotrophe
Matire organique particulaire inerte
Azote organique particulaire et biodgradable
Produits particulaires rsultant de dcomposition de la biomasse
Substrat lentement biodgradable
Notation
SALK
SI
SO
SNO
SNH
SND
SS
XB,H
XB,A
XI
XND
XP
XS
Substrat particulaire.
75
S S
SO
K O,H SO K S S S
X B,H
(II.2)
K O ,H S S
S NO
K g X B,H
H
(II.3)
K NO S NO K O ,H SO K S S S
Les bactries htrotrophes sont en grande partie responsables de la dcomposition des matires
2
organiques telles que la matire carbone en arobie ou en anoxie. En anoxie elles utilisent les
nitrates ( NO3 ) ou nitrites ( NO 2 ) comme source doxygne. Les processus anoxies sont inhibs
par loxygne.
3. Croissance arobie des autotrophes
Les bactries autotrophes sont capables de se multiplier en utilisant la matire minrale
(oxygne, hydrogne, carbone, azote et sels minraux divers) dans un milieu ar (arobie) afin
de produire un composant organique complexe qui reprsente leur nutriment.
3
SO
S NH
K O,A SO K NH S NH
X B,A
(II.4)
Les quations des processus de croissance de (II.2) (II.4) sont reprsentes par un modle
classique de Monod coupl des fonctions de commutation de type Michaelis-Menten. Ces
fonctions vont permettre plus au moins dactiver ou dsactiver la croissance (ajout des conditions
de limitation) suivant les conditions environnementales concernant la prsence de certains
lments ncessaires la croissance.
76
(II.5)
bH X B,H
5 bA X B,A
6. Ammonification de l'azote organique soluble
6
(II.7)
ka S ND X B,H
KO,H
X S /X B,H
S NO
SO
h
kh
(II.8)
K S K S K X /X X B,H
KO,H SO
O,H
O
NO
NO
S
B,H
X
dhydrolyse.
8. Hydrolyse de lazote organique absorb
KO,H
X S /X B,H
SO
S NO
X ND
h
kh
X B,H
KO,H SO K NO S NO K X X S /X B,H X S
KO,H SO
(II.9)
X ND
7
XS
Les paramtres du modle BSM1 dpendent de la temprature. Par exemple le taux de croissance
8
des bactries (PA, PH) et leurs taux de mortalit (bA, bH) varient suivant la temprature. Les
valeurs donnes dans le Tableau II.2 correspondent une temprature aux alentours de 15C.
Paramtres Stchiomtrique
Description
Symbole
Valeur
YA
0.24
YH
0.67
fP
0.08
iXB
0.08
gN
g DCO
iXP
0.06
gN
g DCO
77
Unit
g DCO x B,A
gN
g DCO x B,H
gN
Paramtres cintiques
PH
j-1
KS
10
g DCO. m-3
KO,H
0.2
g O2 .m-3
KNO
0.5
g NO3-N .m-3
bH
0.3
j-1
Kg
0.8
Kh
0.8
kh
KX
0.1
PA
0.5
j-1
KNH
g (NH4-N) .m-3
bA
0.05
j-1
KO,A
0.4
g (O2) .m-3
ka
0.05
m3 (g (DCO) j)-1
g DCO x
g DCO x B,H . j-1
g DCO x s
g DCO x B,H
Le traitement des diffrents types de pollution (organique, azote) se fait par des mthodes
distinctes, dcrites dans les sections suivantes. On note que lorsque les matires organiques
(Figure II.2) sont abondantes, cela va causer le dpassement de la capacit dautopuration
naturelle du milieu rcepteur. En effet, la dgradation de ces substances (oxydation par des
microorganismes) provoque une consommation excessive doxygne au dtriment des
organismes aquatiques qui vont tre asphyxis.
La reproduction des microorganismes intervient en conditions favorables en favorisant le
mtabolisme des bactries. Lorsque leur croissance est importante et que les bactries se mettent
se diviser, un floculant est ajout leur permettant de s'accumuler en flocs dcantables
produisant des boues. Cette floculation va permettre dliminer les composantes carbones
(graisses, sucres, protines, etc.) et les lments polluants qui se trouvent dans leau reue.
78
Matire organique
Composs particulaires
Organique(MVS)
DCO biomasse
Rsidus de
dcomposition
XP
Biomasse
autotrophe XBA
Composs solubles
Minrale(MM)
Oxygne dissous
Facilement
biodgradable SS
DCO particulaire
Particulaire
inerte XI
DCO soluble
Soluble
inerte SI
Lentement
biodgradable
XS
Biomasse
htrotrophe XBH
Azote organique
soluble SND
Azote organique
particulaire XND
1
NH 4 O2 o NO2 H 2O 2 H
2
1
NO2 O2 o NO3
2
79
2 NO3 2H o N 2 H 2O 2.5O2
daluminium par exemple) qui permet la prcipitation des molcules de phosphates qui se
mettent en liaison, ensuite une coagulation se cre et enfin des flocs se forment. Ces
derniers peuvent tre enlevs par sdimentation. Ce type de traitement a plusieurs
inconvnients, par exemple la salinisation de leau, laugmentation de la quantit de
boues, sans oublier le prix des prcipitants qui augmente.
x Traitement biologique : ce type de traitement ncessite la prsence dune zone anarobie
appele digestion anarobie afin de librer les phosphates, ensuite les phosphates sont
absorbs dans des conditions anoxiques ou arobies. Comme l'absorption est plus grande
que la libration, elle conduit une absorption nette de phosphore.
II.1.3.5. Hydrolyse
Dans certains cas, quand le substrat (par exemple XS) nest pas assimilable par les
microorganismes, une opration dhydrolyse seffectue laide des exoenzymes afin de le rendre
plus facilement assimilable par les microorganismes et donc dgradable.
HYDROLYSE
LYSE
X S
o S S CROISSANCE
o X BH
o X P
HYDROLYSE
AMONIFICAT ION
NITRIFICAT ION
Dnitrific ation
X ND
o S ND
o S NH
o NO3
o N 2
80
Pour S s ( j 2) : r2 1 U1 1 U 2 U 7
YH
YH
Pour X I ( j 3) : r3 0
Pour X S ( j 4) : r4 1 f p U 4 1 f p U 5 U 7
Pour X B ,H ( j 5) : r5 U1 U 2 U 4
Pour X B , A ( j 6) : r6 U 3 U 5
Pour X ( j 7) : r
f p U 4 f p U5
7
P
Pour SO ( j 8) : r8 1 YH U1 4.57 YA U 3
YH
YA
Pour S NO ( j 9) : r9 1 YH U 2 1 U 3
2.86 YH
YA
1
Pour S ( j 10) : r
i XB U1 i XB U 2 i XB U 3 U 6
10
NH
YA
i
1 YH
i
i
1
1
Pour S ALK ( j 13) : r13 XB U1
U 3 U 6
XB U 2 XB
14
14
14 7YA
14.2.86YH 14
Avec r j
ij
(II.10)
Qij sont les coefficients stchiomtriques, impliquant chaque variable dans chaque raction.
Leurs valeurs sont ngatives pour les composs consomms et positives pour ceux produits.
Les quations de ractions prcdentes montrent que ce modle fait intervenir des relations de
liaison entre les diffrentes composantes qui crent ainsi une sorte de comptition entre ces
81
composantes. Certaines vont se dvelopper plus aisment au dtriment dautres qui deviennent
une minorit ou vont disparatre. Tout ceci donne un modle complexe et non linaire.
>S , S
I
, X I , X S , X B ,H , X B , A , X P , SO , S NO , S NH , S ND , X ND , S ALK @
Les quations dynamiques de ces concentrations font intervenir les vitesses des ractions
dtailles plus haut. Pour le premier compartiment k=1 (ou 1er unit) :
dC1
dt
1
Qin Cin Qr Cr QaCa r1V1 Q1C1
V1
avec
Q1
Qin Qr Qa
(II.11)
avec
Qk
Qk 1
(II.12)
Pour k=2 5 :
dCk
dt
1
Qk 1Ck 1 rkVk Qk Ck
Vk
Et :
Qf
Q5 Qa
Qe Qw Qr
Ca
C5 , C f
C5 , Cw
Qe Qu
Cr
(II.13)
Il faut noter que lquation diffrentielle de loxygne dissous reprsente un cas spcial dans le
sens o cest la seule variable dtat dont la dynamique dpend dun terme de transfert qui
caractrise le couple racteur/systme daration. Son expression est donne comme suit :
dS O ,k
dt
Avec SO
1
Qk 1S O ,k 1 rkVk Qk SO ,k K L a k Vk S O
S O ,k S O ,k
Vk
(II.14)
Symbole
Valeur
250
Unit
m.j-1
Q0
474
m.j-1
rh
rP
f ns
0.000576
m3/g de TSS
0.00286
m3/g de TSS
0.00228
Q
(Vitesse
de
'
0
J s, j
m3.j-1
X min
g.m-3
Q s, j
m.j-1
Js
v s X X
(II.15)
O X est la concentration totale des boues. Suivant (Takcs et al., 1991) la vitesse du
clarificateur peut scrire sous la forme suivante :
>
rp X X min
`@
avec X min
f ns X f
(II.16)
est tabli afin de dduire la concentration des matires en suspension. Pour la couche du fond
(m=1) :
(II.17)
(II.18)
Qf X f
dX m
dt
83
(II.19)
dX m
dt
(II.20)
2008).
(II.22)
DBO5 (kg.j-1) : Demande Biologique en Oxygne sur 5 jours (Biological Oxygen Demand
after five days (BOD5) en anglais)
Elle reprsente la quantit d'oxygne ncessaire pour oxyder les matires organiques
(biodgradables) par voie biologique (par des bactries). Cette quantit indique la teneur en
matires organiques biodgradables de la charge polluante carbone des eaux uses. DBO5
doit tre infrieure 10 g.m-3 doxygne dissous au bout de 5 jours.
DBO5
0.25 u X S SS (1 f p )( X B, A X B,H )
84
(II.23)
MES (kg.j-1) : Les Matires En Suspension (Total Suspended Solids (TSS) en anglais)
Il sagit de lensemble des particules solides fines non dissoutes visibles l'il nu qui se
trouvent en suspension dans leau. Ces matires augmentent la turbidit, empchent la
bonne pntration de la lumire et affectent ngativement le milieu aquatique, les animaux
et les plantes. MES doivent tre infrieurs 30 g.m-3 pour satisfaire les normes de rejet.
MES 0.75 u X P X I X S X B, A X B,H
(II.24)
NTK (kg.j-1) : Azote total (ammoniacal et organique) (Total Kjeldahl Nitrogen (TKN) en
anglais)
Pour lazote, 5 formes peuvent tre trouves dans le procd de traitement deau use :
L'azote organique (constitue les cellules vivantes vgtales ou animales principalement
composes dure et dacides amins), l'azote ammoniacal ( N H 4 ), les nitrites ( NO 2 ), les
nitrates ( NO3 ) et lazote gazeux (N2). NTK correspond la somme de lazote sous forme
ammoniacale et organique. Elle doit tre infrieure 18 g.m-3.
NTK
S NH S ND X ND i XB u X B , A X B ,H i XP u X P X I
NTotal
S NO NTK
(II.25)
Dans cette thse, ces variables sont notes COD, BOD5 , TSS et TKN par la suite.
Les informations concernant le procd sont transmises par les capteurs, qui sont comme les
yeux et les oreilles chez l'homme. Ces donnes transmises sont ncessaires pour raliser un bon
contrle en ligne du procd de traitement des eaux (Schtze et al., 2004).
La commande des procds WWTP consiste commander laration (Ekman et al., 2006),
pompage de boues et les aliments chimiques par les manipulations dactionneurs (vanne, pompe,
etc..) et le contrle par le dbit de purge permet de rgler le temps de sjour des boues dans le
procd.
Parmi les stratgies de contrle, on cite le correcteur PID qui est la faon la plus simple et en
mme temps efficace pour rguler des systmes sans avoir connatre des informations autres
que la mesure de la variable contrler sur ces derniers. Cependant, cette commande prsente
des inconvnients tels que la limite rejeter des perturbations et rencontre des problmes face
des procds de grande constante de temps. Autre stratgie, la commande anticipatrice
86
(feedforward control) qui permet d'entreprendre une action corrective avant mme que les
perturbations n'affectent les sorties du systme. Cette commande est utile pour les procds lents
comme c'est le cas dans le procd WWTP. Une commande adaptative base sur architecture en
rseau de neurones est applique la rgulation de l'oxygne dissous dans un procd WWTP
(Han and Qiao, 2011), une approche combinant un rseau neuronal avec une commande floue
(Waewsak et al., 2010). Un bon rapport qui discute les mthodes de contrle des procds
WWTP municipales peut tre revu dans (Haimi et al., 2009)
Le maintien des objectifs de contrle quand le procd de traitement des eaux est affect par
un dfaut est fondamental. Cette tche se ralise par une commande tolrante aux dfauts
(Blanke et al., 2006) qui consiste soit accommoder le dfaut si ce dernier n'est pas trs
dangereux par l'adaptation des paramtres de contrleur aux proprits dynamique du procd
dfectueux, ou carrment par la reconfiguration de la loi de commande ainsi que la structure du
contrleur. Une stratgie de commande tolrante au dfaut a t propose par (Zumoffen and
Basualdo, 2008a). Celle-ci est base sur une commande prdictive en ligne et est applique un
procd WWTP.
87
mthodes bases sur les modles (ex. l'estimation de paramtres (Fuente et al., 1996), les
observateurs adaptatifs (Fragkoulis et al., 2011)).
Parmi les outils bass sur les donnes qui ont t utiliss dans le traitement des eaux uses, nous
pouvons citer les rseaux de neurones (Lee et al., 2008), (Caccavale et al., 2010)) le rseau
Baysien ((Chong and Walley, 1996), les modles Bonds graphs (Zhang and Hoo, 2011) et les
mthodes statistiques (ex. ACP (PCA en anglais), PLS et SVM).
La construction de modles de prdiction de certaines variables du procd WWTP comme les
concentrations de leffluent (CODeff, BODeff, TSS,TKN ,) est intressant pour surveiller le
comportement du procd WWTP. Cette estimation peut se faire par lutilisation soit dun
Rseau de Neurones Artificiel (ANN en anglais) ((Rduly et al., 2007), (Mjalli et al., 2007)) ou
par lapplication de mthodes de rgression telles que lAnalyse Factorielle Parallle et la
Projection en Structures Latentes non linaire (Singh et al., 2009). Dans cette thse on sintresse
aussi la construction de modle de prdiction par SVR.
Analyse canonique (AC) canonical variate analysis (CVA) en anglais (Juricek et al.,
2004), (Russell et al., 2000).
Ces approches multivariables ont t appliques sur diffrentes systmes, mais leur principe
se ressemble puisqu'il se base sur:
1. Construire un modle sans dfaut dans les conditions normales de fonctionnement
2. Choix dune mtrique et dun seuil
3. Projeter une donne de test sur ce modle, le calcul de la distance mtrique et
convenablement la classer comme une donne normale ou dfectueuse
4. Dans le cas d'un dfaut, l'identification des variables qui sont associes au dfaut en
utilisant des mesures de contribution
Dautres varits ont aussi t utilises pour ce systme telles que lICA multidimensionnelle
"multi-way en anglais" (Yoo, Vanrolleghem, et al., 2006), une mthode combinant la
dformation temporelle dynamique "Dynamic Time Warping (DTW) en anglais" avec l'analyse
discriminante (Jun, 2011).
Une volution intressante des mthodes statistiques concerne lutilisation de noyaux non
linaires. En effet, les mthodes classiques statistiques multivariables comme lACP et lACI
peuvent rencontrer des difficults lors de la manipulation des donnes relles dynamiques
cause des changements saisonniers comme dans le cas WWTP et des non linarits. Des tudes
comparatives ont montr que lutilisation dun modle non linaire avec un noyau gaussien rend
de meilleurs rsultats par rapport lACI dans le diagnostic de dfaut d'un procd WWTP (Yu,
2012). Dautres limitations de la mthode ACP sont lies au fait quelle ne permet pas d'analyser
des procds qui admettent des variations sur plusieurs chelles de temps. Dans ce cas,
lutilisation de l'approche ACP multi-chelles, qui utilise la transforme dondelettes (par
89
exemple) peut tre utile pour la surveillance du procd de traitement des eaux (Rosen and
Lennox, 2001). La transforme dondelettes est souvent utilise comme tape de prtraitement
des signaux afin de dterminer les caractristiques et les singularits de transitions (Zhang and
Hoo, 2011), (Saravanan et al., 2008), (Abbasion et al., 2007), (Ruiz et al., 2000). Cette mthode
permet de dcomposer le signal en plusieurs chelles de temps, ce qui aide analyser le signal
localement et ainsi faire face aux perturbations. Ceci est ralis en multipliant le signal original
par les ondelettes de diffrentes tailles et diffrents intervalles de temps, une autre difficult
surgie lors de lutilisation de lACP est lie au non stationnarit du procd. Cette difficult peut
tre surmonte en utilisant l'ACP adaptative qui met jour les proprits statistiques (variance,
moyenne, covariance..) du modle ACP initial. Cette approche est applique la surveillance du
procd WWTP dans (Rosen and Lennox, 2001). On note que la transforme de Fourier est
incapable de traiter de faon globale les signaux non-stationnaires et perd aussi le comportement
temporel du signal. Enfin, la mthode ACI est utilise pour la transformation d'espace dans
lobjectif de projeter les donnes dans un espace de caractristique de faible dimension construit
par des variables latentes qui sont la fois non gaussiennes et aussi indpendantes
statistiquement entre elles (Zhang, 2008).
90
peuvent tre faites par PLS multi-blocs qui a t utilise pour lestimation du COD en utilisant
les cartes de contrle Q et T2 pour dtecter les dfauts (Choi and Lee, 2005).
II.3.3. SVM
Les approches de base de SVM sont la classification (SVM) et la rgression (SVR). Lapproche
SVR est applique pour la modlisation (prdiction, estimation ou identification) alors que
lapproche SVM est applique pour le diagnostic de dfauts. On cite par exemple lutilisation de
SVR pour la prdiction du coefficient global de transfert doxygne (Deswal, 2011) et
lestimation en ligne de la concentration de la biomasse dans un procd de fermentation
(Wang,Yu et al., 2006). Un modle SVR a galement t dvelopp pour estimer la qualit de
leau travers la prdiction des concentrations COD, NH4+ , TN et TP de leffluent (Fang et al.,
2011).
Une variante de SVM appele SVM moindres carrs (Least square SVM en anglais, aussi
LSSVR) a t utilise afin de prdire le taux dentranement dair dans les bassins (Baylar et al.,
2009). Cette approche diffre un peu dans la formulation de lapproche SVM classique dans les
considrations faites sur les contraintes choisies (Des contraintes de type galit sont choisies
pour rsoudre des quations linaires au lieu des contraintes dingalit qui gnrent un
problme de programmation quadratique). Cette mme approche LSSVM a t applique avec
succs dans un procd de traitement des eaux uses pour lestimation de la concentration du
nitrite-nitrate dans leffluent (SNO) (Yang, 2006, Yang, 2005). Dans ces travaux, des
connaissances sur le procd et plus particulirement sur le processus dlimination de lazote
ont t utilises pour choisir les variables dentre pour entraner lalgorithme LSSVR afin
destimer la concentration SNO de leffluent. Les variables choisies ont t COD, TSS, TKN, TN
de linfluent, Kla5 et Sno2.
La premire approche propose par lauteur de cette thse applique au procd de traitement
des eaux est base uniquement sur SVM classification (Laouti et al., 2011b). Cependant, cette
tude ntait pas trs pousse puisqu'elle demande un effort assez consquent pour le rglage des
paramtres dapprentissage C et V sans garantir lannulation des fausses alarmes, en plus elle t
appliqu sur une variante simpliste du modle ASM1. Afin damliorer ce rsultat une deuxime
approche originale est propose qui va tre dtaille par la suite de ce chapitre.
91
Figure II.4 Stratgie SVR suivi par SVM pour le diagnostic de dfauts
93
Lide dans cette stratgie est donc de crer des caractristiques, observations spcifiques ou
signaux symptmes du dfaut, et ne pas se contenter des entres/sorties disponibles. Une de ces
caractristiques les plus importantes est le rsidu qui est la diffrence entre un signal mesur et
celui estim. Par la suite, les caractristiques sont utilises comme entres de SVM classification
afin de construire une fonction de dcision claire et prcise permettant de spcifier ou de prdire
la nature de la nouvelle observation. Le fait dutiliser la mme thorie pour la modlisation et le
diagnostic est un des points forts de notre stratgie. Le dveloppement dun estimateur pour
prdire les valeurs de diffrentes variables de sortie Y par SVR est simple et rapide en termes de
temps de calcul en ligne puisque il utilise un nombre rduit de donnes qui sont les supports.
Malgr les avantages du SVR, et sa robustesse face aux variations des paramtres et la proprit
de flexibilit, lutilisation des SVR dans la communaut des automaticiens reste en grande partie
peu explore, c'est pour cela, cette thse apportera mon avis un plus la communaut des
automaticiens.
CT
>S , S
I
94
6. Inhibition : ce dfaut est plus violent que le premier, produit par les dchets hospitaliers
ou mtallurgiques. Il va non seulement rduire la croissance des organismes
htrotrophies ( P h max ), mais aussi acclrer la mort de ces organismes (bh ) . Inhibition de
la nitrification et toxicit sont causes par les mmes composs (l'inhibition produit des
effets des concentrations faibles tandis que la toxicit se produit des concentrations
plus leves).
7. Gonflement ou prise de masse des boues (bulking en anglais) : ce phnomne est d
la croissance de microorganismes filamenteux dans les boues actives, ce qui provoque
l'impossibilit de dcantation dans le dcanteur. Il concide avec les priodes d't : haute
temprature et faible dbit 266 j et 567 j. Cet vnement est reprsent dans le modle
par les paramtres de dcantation de la fonction double-exponentielle et plus prcisment
la vitesse de sdimentation de 250 200 m.d-1.
Les dfauts procd (choc de toxicit, inhibition, gonflement de la masse des boues) ne sont pas
considrs dans ce travail, nanmoins il est envisag de les traits dans un futur proche.
Dautres capteurs savoir TSSe et CODe sont dune importance capitale puisqu'ils permettent de
caractriser les performances de traitement de leau de ce systme.
En fonction de cette analyse, les dfauts considrs ( superviser) dans cette thse sont les
dfauts de capteurs de mesures de :
1. TSSe : les matires en suspensions de l'effluent en sortie
2. Sno2 : la concentration de l'azote sous forme de nitrites-nitrates dans le 2me compartiment.
3. So5 : la concentration doxygne dissous dans le 2me compartiment
On considrera des dfauts de type : offset, drive, dfaut fixe (blocage de mesure) et arrt
complet pour ces diffrents capteurs.
Ainsi que des dfauts dactionneurs
4. Qa ou Qintr : dbit de recyclage interne
5. Kla5 : le coefficient du transfert doxygne Kla5 dans le 5me compartiment
Avec les types de dfauts suivants : offset, retard, blocage de lactionneur et arrt ou
fermeture complte.
Les variables modliser :
96
En fonction de ces dfauts, nous avons choisi destimer (modliser) les variables suivantes qui
sont susceptibles dapporter plus dinformation concernant certains dfauts :
Sno2, Sno5, CODeff et TSSe.
(ce qui revient choisir lentre de manire rendre le systme observable). En effet,
l'observabilit des systmes non linaires dpend gnralement de l'entre du systme. Lentre
doit permettre davoir un bon suivi de trajectoire et en mme temps dtre continuellement
excitante (ou excitation persistante) pour obtenir une bonne identification qui permet dextraire
les dynamiques du systme.
Les entres dans ce systme sont la concentration doxygne dissous dans le 5me compartiment
et la concentration de nitrites/nitrates dans le 2me compartiment. Ces concentrations sont
considres comme entre puisquelles sont les variables rguls. La Figure II.5 montre la
concentration de nitrites/nitrates dans la 2me cuve (Sno2) pour les priodes dapprentissage et de
test (et la Figure II.6 montre celle de So5).
Apprentissage
Test
1.5
1
0.5
0
100
200
300
400
500
600
Temps(jours)
Consigne So5(g.m3)
3.5
Test
Apprentissage
3
2.5
2
1.5
1
100
200
300
400
500
Temps(jours)
Figure II.6 Concentration doxygne dissous dans la 5me cuve utilise pour
lapprentissage et le test du modle SVR
98
600
Ces mmes donnes sont galement utilises pour limplmentation de SVM pour le diagnostic
de dfauts, la diffrence que des situations dfectueuses sont galement considres en plus des
situations saines. Chaque dfaut (de capteur, dactionneur ou de procd) a lieu sur un intervalle
de temps bien distinct des intervalles des autres dfauts.
x 10
8
6
4
2
TS
Su
C
O
Du
Sn
he
Ss
5
TS
S4
TS
S5
So
5
Kl
a5
a
Q
in
SN
H
in
C
O
Di
n
TK
N
in
TS
S2
C
O
D2
BO
D
2
Sn
o2
Figure II.7 Bote moustache des variables du procd WWTP non normes
Les donnes ont aussi parfois besoin de filtrage afin de diminuer limpact du bruit et de pouvoir
dcrypter les tendances. Le lissage peut tre fait par exemple en utilisant une moyenne mobile
afin dliminer les pics au courts du temps. La suppression des valeurs aberrantes peut tre faite
par la suppression des mesures qui sont en dehors de r 3V par exemple et reconstituer ou
99
supprimer les valeurs manquantes. SVR peut tre utilise pour estimer les valeurs manquantes
comme cest le cas pour les donnes dexpression gniques (Wang et al., 2006). Dans ce travail,
un filtre passe bas est utilis pour diminuer le bruit.
1
0.8
0.6
0.4
0.2
TS
Su
C
O
Du
Sn
he
Ss
5
TS
S4
TS
S5
So
5
Kl
a5
a
Q
in
SN
H
in
C
O
Di
n
TK
N
in
TS
S2
C
O
D2
BO
D
2
Sn
o2
Figure II.8 Bote moustache des variables du procd WWTP normalises avec la
mthode min/max
Qin
Kla5
TKNin
TNin
BODin
CODin
SNH,in
TSSin
0.5
0.47
0.44
0.44
0.41
0.4
0.39
0.36
96
96
96
Pour la variable Sno2 elle est affecte le plus par : TSS1, COD1, BOD1, TN1, TSS2, COD2,
BOD2, TSS3, COD3, BOD3. Et les corrlations maximales avec TSSe, Sno2 et Sno5 sont donnes
pour un retard de :
2 chantillons entre TSSe et Qin. 16 chantillons entre Sno2 et Kla5. 22 chantillons entre Sno2 et
SNH,in. 12 chantillons entre So5 et Kla5. 20 chantillons entre So5 et SNH,in
On remarque que lanalyse de linter-corrlation na pas permis de trouver une dpendance
linaire entre Sno2 et Qa, alors que daprs la connaissance du procd on sait quil existe une
relation entre ces deux variables puisque Qa est la variable manipule permettant la rgulation de
Sno2, Ceci est d au fait que ltude de la corrlation et de linter-corrlation informe uniquement
sur les relations de dpendance linaire entre les variables. Cependant, le procd de traitement
des eaux uses est un systme complexe et fortement non linaire. Afin de raliser une
101
1.6
0.8
1.4
0.6
1.2
0.4
0.8
0.6
0.2
0.4
0.2
0
So5
Qa_app
Qa
Qin
Kla5
Kla5_app
CODu
TSSu
TSSu
Sno5
Snoe
COD2
COD3
COD4
COD5
Figure II.9 Analyse des relations entre variables avec linformation mutuelle
(pour Sno2 et Sno5)
0
TSSe
Qin
Qa_app
Qa
CODu
TSSu
TKN
BODu
COD2
COD3
TSS2
COD1
TSS3
TSS1
Sno5
Figure II.10 Analyse des relations entre variables avec linformation mutuelle (pour CODe
et TSSe)
102
103
400
30
350
25
TSS e (g.m-3)
TSS in (g.m-3)
300
250
200
150
100
20
15
10
50
0
100
x 10
200
300
400
Temps (jours)
500
600
200
300
400
Temps (jours)
500
600
500
600
10000
9000
8000
TSS u (g.m-3)
Qin (m3.j-1)
100
3
2
7000
6000
5000
4000
100
200
300
400
Temps (jours)
500
3000
600
100
200
300
400
Temps (jours)
x 10
Qin (m3.j-1)
5
4
3
2
1
0
105
110
115
120
125
130
Temps(jours)
104
135
140
145
150
-5
x 10
Qin
Ajustement
Densit
4
3
2
1
0
3
Qin (m3.j-1)
6
4
x 10
SNH,in (g.m3)
50
40
30
20
10
0
100
200
300
Temps(jours)
105
400
500
600
0.05
SNHin
Ajustement
Densit
0.04
0.03
0.02
0.01
0
10
20
30
40
50
60
SNHin (g.m3)
So5(g.m3)
2
1.9
1.8
1.7
105
110
115
120
125
130
135
140
145
150
135
140
145
150
Temps(jours)
250
Kla5 (j-1)
200
150
100
50
0
105
110
115
120
125
130
Temps(jours)
106
Linterprtation des figures ci-dessus nest pas facile, d la variabilit du procd et la grande
priode dvaluation. Un zoom (Figure II.14) montre bien que la variable KLa5 permet de bien
rguler loxygne dissous So5 la valeur 2 g.m-3 (sa valeur varie entre 1.78 et 2.1).
Un zoom sur le graphe de Sno2 permet de mieux voir les dynamiques sur cette variable (Figure
II.15), et la difficult lie la rgulation de cette variable puisque le but est de stabiliser la valeur
de la concentration Sno2 1 g.m-3.
2
Sno2 (g.m3)
1.5
1
0.5
0
105
110
115
120
125
130
135
140
145
150
135
140
145
150
Temps(jours)
4
10
x 10
Qa(m3.j-1)
8
6
4
2
0
105
110
115
120
125
130
Temps(jours)
caractristiques grce sa capacit de mise en relation entre deux quantits (entre/sortie). Jai
choisi la matrice de donnes comme entre et un dfaut donn comme sortie. PLS classique
linaire na pas permis de modliser cette relation non linaire entre le dfaut et les donnes du
procd. Par la suite, PLS noyau a t utilise et a permis de capter la relation non linaire.
Cependant, les rsultats obtenus taient loin dtre satisfaisants, dus au nombre lev de fausses
alarmes et dtection manques.
Des tudes de Monte Carlo peuvent-tre envisages dans un futur proche afin de mieux
caractriser les incertitudes avec des gnrations alatoires de diffrentes variables dentre
comme SNH,in, Qin utilisant leurs distributions respectives, changement des valeurs nominales des
paramtres du modle ainsi que des changements sur le bruit.
Les vecteurs d'entres des diffrents modles SVR sont donns comme suit:
Le vecteur dentre pour modliser Sno2 par SVR
Lincorporation de dcalages temporels des variables dentres et sorties a permis damliorer la
qualit du modle de prdiction.
Em1
TSS
in
in
Aprs une multitude d'essais, le tableau II.5 suivant donne les valeurs des diffrents indices de
performances concernant les meilleurs modles de prdiction construit par SVR. Ces
performances dmontrent bien lefficacit de la mthode de modlisation propose. Deux
modles sont construits pour estimer Sno2. Le 2me modle est plus performant que le premier car
son coefficient de dtermination R2 qui dtermine la qualit de lajustement du modle est plus
lev (R2 doit tre le plus proche de 1), ses erreurs (MSE, MAE, NMSE, RMSE, NRMSE,
RSSE) sont plus petites que celles du premier modle Sno2.
108
Modle1
Sno2
0.9044
Modle2
Sno2
0.9270
Modle2
TSSeff
0.9982
Modle1
So5
0.8492
Modle3
So5
0.8626
Modle
CODeff
0.8450
MSE
AIC
MAE
NMSE
RMSE
NRMSE
RSSE
RatioSV
0.0206
-105
0.1039
0.0956
0.1434
0.1474
0.0217
0.0378
0.0157
-1.1 105
0.0885
0.0730
0.1253
0.1288
0.0166
0.0587
0.0171
-1.1 105
0.0942
0.0018
0.1306
0.0357
0.0013
0.0413
0.0176
-105
0.0437
0.1508
0.1326
0.0939
0.0088
0.0329
0.0160
-1.1 105
0.0413
0.1374
0.1266
0.0897
0.0080
0.0613
2.8139
1.85 105
1.1628
0.1550
1.6775
0.2456
0.0603
0.0650
relle
estime
Sno2 (g.m3)
2
1
0
-1
100
200
300
Temps(jours)
400
500
600
109
2.5
relle
estime
Sno2 (g.m3)
2
1.5
1
0.5
0
302
304
306
308
310
312
Temps(jours)
314
316
318
320
TSSe(g.m3)
25
20
15
10
5
100
200
300
Temps(jours)
400
500
600
110
TSSe(g.m3)
25
relle
estime
20
15
10
5
305
310
315
320
325
330
Temps(jours)
335
340
345
350
60
CODe(g.m3)
55
50
45
40
35
30
305
310
315
320
325
330
Temps(jours)
335
340
345
350
La Figure II.20 montre bien l'adquation entre CODe et son estime sur une priode de test allant
de 300 jusqu'a 350 jours.
111
relle
estime
So5(g.m-3)
2.5
2
1.5
1
0.5
100
200
300
Temps(jours)
400
500
600
0.5
100
200
300
400
500
600
Temps(jours)
100
200
300
Temps(jours)
400
500
600
100
200
300
Temps(jours)
400
500
600
113
5
residu
Ajustement
Densit
4
3
2
1
0
-1
-0.5
0.5
rsidu Sno2
1.5
Coefficient de corrlation
1.2
1
0.8
0.6
0.4
0.2
0
-0.2
-6
-4
-2
0
2
dcalage temporel
6
4
x 10
114
0.8
Rsidu TSSe filtre
0.6
0.4
0.2
0
100
200
300
Temps(jours)
400
500
600
Densit
3
2
1
0
-1
-0.5
0.5
1.5
rsidu TSSe
100
200
300
Temps(jours)
400
500
600
La Figure II.29 montre une valeur infrieure 8. Cependant, malgr quelle reste une valeur
convenable par rapport l'ordre de grandeur de CODe (50 g.m-3), une amlioration peut tre
envisage dans un futur proche.
Malgr la difficult rencontre avec ce type de procd, et par rapport d'autres approches qui
dpendent des conditions initiales, les rsultats obtenus sont assez satisfaisants du point vue
prcision mais aussi de simplicit de la mise en forme de ce type d'approche de modlisation.
Description du
Type
dfaut
Capteur TSSe
Offset
2
3
4
5
Capteur TSSe
Capteur TSSe
Capteur TSSe
Capteur Sno2
Drive
Fixe
complet
Offset
6
7
8
9
Capteur Sno2
Capteur Sno2
Capteur Sno2
Capteur So5
Drive
Fixe
complet
Offset
10
11
12
13
Capteur So5
Capteur So5
Capteur So5
Capteur Qa
Drive
Fixe
complet
Offset
14
15
16
Actionneur Qa
Actionneur Qa
Actionneur Qa
17
Actionneur Kla5
Retard
Blocage
Fermeture
complte
Offset
18
Actionneur Kla5
Retard
Numro
du
dfaut
Valeur du dfaut
apprentissage
[62:63]
[63.5:64.5]
[65:66.5]
[72:80]
[68.5 :70]
[67:68]
[82:83]
[83.5:84.5]
[85:86.5]
[92:100]
[88.5 :90]
[87:88]
[102:103]
[103.5:104.5]
[105:106.5]
[112:120]
[108.5 :110]
[107:108]
[122:123]
[123.5:124.5]
[125:126.5]
[132:140]
[128.5 :130]
[127:128]
Test
[260:262]
[265:267]
[285.5:287]
[270:280]
[310:315]
[300:305]
[320:322]
[325:327]
[345.5:347]
[330:340]
[370:375]
[360:365]
[370:372]
[375:377]
[375.5:377]
[380:400]
[410:415]
[400:405]
[420:422]
[425:427]
[445:447]
[430:440]
[460:465]
[450:455]
apprentissage
-2 g.m-3
2 g.m-3
5 g.m-3
0.2 j-1
-0.5 g.m-3
0.5 g.m-3
1 g.m-3
0.2 g.m-3j-1
-0.5 g.m-3
0.5 g.m-3
1 g.m-3
0.2 g.m-3j-1
-800 m3.j-1
800 m3.j-1
1600 m3j-1
0.2 j
-
test
2 g.m-3
5 g.m-3
10 g.m-3
0.2 j-1
0.5 g.m-3
1 g.m-3
2 g.m-3
0.2 g.m-3j-1
-1 g.m-3
1 g.m-3
2 g.m-3
0.2 g.m-3j-1
1000 m3j-1
-1000 m3j-1
2000 m3j-1
0.2 j
-
[142:143]
[143.5:144.5]
[145:146.5]
[152:160]
[470:472]
[475:477]
[495:497]
[480:490]
-5 j-1
5 j-1
10 j-1
5 j-1
15 j-1
-10 j-1
116
19
20
Actionneur Kla5
Actionneur Kla5
Blocage
Fermeture
complte
[148.5 :150]
[147:148]
[510:515]
[500:505]
Les valeurs de dfauts montrs dans le Tableau II.6 correspondent un seul scnario, sachant
que d'autres scnarios ont t tests par le changement des valeurs de dfauts.
Dans les procds rels, il ya plusieurs retards normaux dus au transport longue distance ou
associ au retard des mesures. Dans ce travail, en plus des autres dfauts supposs sur les
actionneurs Kla5 et Qa, j'ai considr que c'est intressant d'ajouter le dfaut retard supplmentaire
qui se produit souvent en pratique et qui peut provoquer un changement du comportement du
systme command en boucle ferme dgradant ainsi les performances de rgulation et peut
mme causer une instabilit.
Les variables manipules Kla5 et Qa pour la rgulation du procd WWTP sont contraints par des
valeurs limites: Kla5=[0-240 j-1] et Qa=[0-92230 m3j-1]
Le problme dvaluation de performances des mthodes de diagnostic de dfaut dans les
procds WWTP a t trait dans (Corominas et al., 2011), o un indice a t propos pour
examiner, dterminer les limites et comparer entre des mthodes de diagnostic dans le modle de
rfrence dun procd de traitement des eaux uss BSM1. Dautres indices de comparaison de
performance ont t proposs dans (Ylamos et al., 2006).
Les critres de dtection du dfaut considrs dans ce travail sont :
Temps de dtection du dfaut (TD), fausses alertes(FA)
Tableau II.7 Rsultats de dtection de dfauts
Dfaut
Type
Capteur TSSe
Offset
Capteur TSSe
Capteur TSSe
Capteur TSSe
Drive
Fixe
Complet
Capteur Sno2
Offset
Capteur Sno2
Capteur Sno2
Drive
Fixe
Valeur
2 g.m-3
5 g.m-3
10 g.m-3
0.2 g.m-3.j-1
0.5 g.m-3
1 g.m-3
2 g.m-3
0.2 g.m-3.j-1
117
Temps
d'occurrence
260
265
285.5
270
310
300
320
325
345.5
330
370
j
j
j
j
j
j
j
j
j
j
j
TD ( j )
260.1
265.04
285.021
275.5
310.333
300.021
345.8
334.6
-
FA
0
0
0
0
0
0
0
Capteur Sno2
Complet
Capteur So5
Offset
Capteur So5
Capteur So5
Capteur So5
Drive
Fixe
Complet
Actionneur Qa
Offset
Actionneur Qa
Actionneur Qa
Actionneur Qa
Retard
Blocage
Fermeture complte
Actionneur Kla5
Offset
Actionneur Kla5
Actionneur Kla5
Actionneur Kla5
Retard
Blocage
Fermeture complte
-1 g.m-3
1 g.m-3
2 g.m-3
0.2 g.m-3.j-1
1000 m3j-1
-1000 m3j-1
2000 m3j-1
0.2 j
5 j-1
15 j-1
-10 j-1
0.2 j
-
360
370
375
375.5
380
410
400
420
425
445
430
460
450
470
475
495
480
510
500
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
j
361.1
385.2
410.6
400.4
430.137
460.19
450.073
470.8
475.187
495.2
480.1
510.2
500.1
0
0
0
0
0
0
0
0
0
0
0
0
0
Il est difficile de dtecter des dfauts offset sur Sno2 et aussi sur So5 puisque ces concentrations
sont rgules par un PID qui va masquer l'effet de ce dfaut.
Les types de dfauts considrs ou suspects dans ce travail sont montrs dans le Tableau II.7
ci-dessus.
III.6.1. Rsultats de diagnostic par la stratgie propose base sur les SVMs
Afin dvaluer la capacit de lapproche propose, plusieurs dfauts sont introduits diffrents
moments sur une large priode de temps (609 jours).
Le rsidu reste parmi les caractristiques principales utilises comme entre par la dcision
SVM, elle est la plus importante mon avis. La Figure II.30 trace le rsidu filtr de Kla5 en bleu
qui est sensible seulement ltat de dfaut sur lactionneur Kla5 prsent par une valeur non
nulle dans la courbe rouge en pointills.
118
400
Rsidu Kla5 filtre
tat de l'actionneur Kla5
300
200
100
0
100
200
300
400
500
600
Temps(jours)
Rsidu Kla5
tat de Kla5
80
60
40
20
470
480
490
500
510
520
530
Temps(jours)
119
10
x 10
Rsidu Qa
tat de l"actionneur Qa
8
6
4
2
0
100
200
300
400
500
600
Temps(jours)
3
2
1
0
100
200
300
400
500
600
Temps(jours)
120
6
4
2
Rsidu S o5
0
3
100
200
300
400
500
600
100
200
300
Temps(jours)
400
500
600
2
1
0
6
4
2
Rsidu S o5
0
3
380
400
420
380
400
420
440
460
480
500
520
440
460
Temps(jours)
480
500
520
2
1
0
121
Rsidu Sno2
tat du capteur Sno2
5
4
3
2
1
0
100
200
300
400
500
600
Temps(jours)
Rsidu S
no2
10
5
0
6
320
340
360
380
400
420
440
460
320
340
360
380
400
Temps(jours)
420
440
460
4
2
0
122
20
10
Rsidu TSS
30
0
5
4
3
2
1
100
200
300
400
500
600
100
200
300
Temps(jours)
400
500
600
123
rsidu Qa
x rsidu S no 2
Q (t ) Q (t 1)
a
a
200
300
400
500
600
Temps(jours)
124
430
435
440
445
450
455
460
465
470
Temps(jours)
rsidu K la 5
x
rsidu So5
K (t ) K (t 1)
la 5
la 5
C 10, V
La Figure II.41 ci-dessous montre bien la capacit dcisionnelle du classifieur SVM, qui permet
de dtecter lapparition du dfaut Kla5 rapidement dans les deux zones dapprentissage et de test
et cela sans fausses alarmes.
125
200
300
400
500
600
Temps(jours)
475
480
485
490
495
500
505
510
515
Temps(jours)
rsidu S no 2
rsidu S o 5
x
rsidu K la 5
rsidu Qa
S no 2 (t ) S no 2 (t 1)
C 10, V
520
La Figure II.43 ci-dessous montre bien la capacit dcisionnelle du classifieur SVM, qui permet
de dtecter lapparition du dfaut Kla5 rapidement dans les deux zones dapprentissage et de test
et cela sans fausses alarmes.
Dcision sur le dfaut Sno2
1
0.5
0
-0.5
-1
100
200
300
400
500
600
Temps(jours)
330
340
350
360
370
380
390
400
410
Temps(jours)
rsidu TSS e
TSS e (t ) TSS e (t 1)
127
420
C 10, V
20 , la valeur du seuil est gale 0.925 pour ce dfaut. La Figure II.45 illustre le bon
rsultat obtenu pour le dfaut sur TSSe caractris par une rapidit de dtection et l'absence de
fausses alarmes.
Dcision sur le dfaut TSSe
8
6
4
2
0
100
200
300
400
500
600
Temps(jours)
rsiduSo5
rsiduS no 2
x
rsidu K La 5
rsiduQ
a
C 7, V
La Figure II.46 illustre que les dfauts sur le capteur So5 de type valeur fixe, drive ou complet
ont t bien dtects. Cependant, le dfaut de type offset ne lest pas puisque il est masqu par
laction du PID. On rappelle toujours la justesse de dcision sur le dfaut avec un pourcentage
nul de fausses alarmes.
128
200
300
400
500
600
Temps(jours)
II.7. Conclusion
Le procd de traitement des eaux uses comme la plupart des procds rels est de nature
stochastique variable d en grande partie la variation de linfluent. C'est pour cela que les
approches statistiques deviennent de plus en plus populaires dans divers secteurs industriels.
La stratgie propose dans cette thse dlivre une mthodologie simple, utile et fructueuse pour
modliser les systmes rels. Il est dmontr la capacit de SVR raliser une modlisation
flexible qui capte la non-linarit et le maximum de variabilit des donnes et qui dcrit le
comportement dynamique du systme en prsence de lincertitude.
Les performances intressantes de prdiction de SVR ont t soulignes dans ce chapitre.
Je crois que la stratgie de diagnostic de dfaut propose dans ce chapitre qui utilise uniquement
la thorie des SVMs peut tre applique d'autres systmes complexes.
129
Je pense que SVM et SVR vont tre de plus en plus connus et utiliss et peuvent devenir ainsi un
outil important et indispensable dans lanalyse de donnes scientifiques dans les annes venir.
Cest pourquoi la comprhension de leur thorie est essentielle, un trs bon tutoriel a cherch
expliquer les SVMs et leurs paramtres avec un plan visuel illustr par des graphes (Brereton and
Lloyd, 2010).
Malgr les bons rsultats obtenus concernant la modlisation SVR, une amlioration peut tre
faite par la suite par l'incorporation des connaissances du procd WWTP dans le modle SVR.
Aussi, pour que ce dernier soit trs efficace dans les applications industrielles, je pense qu'il faut
tenir compte de changements dans le temps des proprits et caractristiques propres du procd
WWTP. L'ide dans le futur est d'ajouter un aspect dadaptation au SVR standard par l'utilisation
d'un terme correctif ou d'ajouter en parallle du modle SVR standard un algorithme SVR en
ligne qui va apprendre le comportement du procd au fur et mesure.
130
131
132
III.1. Introduction
Lnergie est lobjet de beaucoup de dbats mondiaux aujourdhui. Lobjectif des pays est de
satisfaire la demande en nergie qui ne cesse daugmenter tout en respectant lenvironnement et
la scurit des gens. Diversifier les sources dnergie est essentiel cause du dbut dpuisement
des ressources dnergie naturelles comme le ptrole et le gaz, afin dviter la dpendance
nergtique pour les pays non producteurs des hydrocarbures, et aussi afin de prserver la nature.
Ainsi, lattention sest porte sur les nergies renouvelables.
Ces dernires annes, lnergie solaire et lnergie produite par les oliennes font partie de ces
nergies la mode. La matrise de ces nergies nouvelles demande des progrs non seulement
technologiques mais aussi scientifiques.
Lolienne est un systme d'nergie renouvelable qui permet dexploiter la ressource du vent et
de la transformer en nergie lectrique. L'nergie olienne est en pleine expansion aujourdhui.
Plusieurs installations de parcs oliens se trouvent en mer (offshore) (Figure III.1). Cette
tendance va se confirmer encore plus dans le futur pour viter de gner les citoyens au niveau du
paysage et du bruit, et aussi pour avoir un vent fort, frquent et assez rgulier.
du contrle de
l'olienne, ainsi que la plate-forme afin de dterminer leur faisabilit technique et conomique.
Ceci exige aussi daugmenter la disponibilit et la fiabilit de lolienne, de rduire les arrts et
les visites de maintenance qui sont plus difficiles et plus coteuses par rapport aux installations
de lolienne sur la terre. Une faon de satisfaire ces exigences est de concevoir un systme de
133
sensibilit de dfaut (Negre et al., 2011). Une autre approche linaire est celle qui utilise la
transformation de Coleman et lidentification de sous espaces pour obtenir un modle linaire
temps invariant (LTI) (Wei et al., 2009), permettant de construire un filtre de Kalman qui gnre
des rsidus avec comme but la dtection des dfauts. Cependant, ces mthodes linaires ont des
difficults cause de la non-linarit du comportement entre-sortie du systme olien.
Des approches bases sur les donnes ont aussi t appliques pour la surveillance et la dtection
de dfauts, comme par exemple lutilisation des rseaux de neurones qui imbrique une forme
non linaire (Brandao et al., 2010, Elhor et al., 1999). Lapproche rseau de neurones a t
galement utilise pour lestimation de la puissance gnre par lolienne (Li et al., 2001). Une
comparaison entre un rseau de neurones et un modle de rgression polynomiale a montr la
supriorit du rseau de neurones dans la dtection de dfauts dans une olienne (Schlechtingen
and Ferreira Santos, 2011).
Beaucoup de travaux s'intressent au diagnostic de dfauts sur une partie ou un composant
d'olienne:
Dtection de dfaut des capteurs dangle de calage : une mthode a t propos par (Simani
et al., 2011) utilisant un systme de modlisation s'appuyant sur les modles affins par
morceaux. Chacun d'eux est valable dans une rgion de fonctionnement, dont les paramtres
sont identifis travers les acquis d'entres-sorties des mesures touches par l'incertitude de
mesure. Par consquent, ces modles sont exploits pour gnrer des signaux rsiduels.
Dtection de dfaut du multiplicateur de vitesse : dans (Lu, 2012) des ondelettes extraient
des caractristiques lies au dfaut. Par la suite ces caractristiques avec les donnes de
diffrents capteurs sont fusionnes par une approche statistique de pondration base sur
lACP. Ces donnes fusionnes sont utilises comme entre pour un algorithme de dcision
sur les dfauts.
Des revues qui dcrivent l'tat de l'art en terme de surveillance de l'tat de l'olienne ainsi que le
diagnostic de dfaut peuvent tre trouves dans (Hameed et al., 2009), (Amirat et al., 2009) et
(Lu et al., 2009). Ces travaux mettent aussi l'accent sur les outils d'analyse et prtraitement
tempsfrquence, tels que les ondelettes. La transforme d'ondelettes permet non seulement
dliminer le bruit, mais aussi de bien analyser les signaux non stationnaires comme celui de la
puissance. Elle a t utilise pour la surveillance dtat et le diagnostic de dfauts mcaniques et
lectriques (comme : le dsquilibre du rotor, un court-circuit dans le gnrateur, l'enroulement
de gnrateur) pouvant se produire sur une olienne gnrateur synchrone (Yang et al., 2008).
Aussi, cette transforme est utilise pour distinguer entre le situation normale et dfectueuse afin
de dtecter les dfauts de capteurs de position pitch , dactionneurs ainsi que des dfauts dans
le systme dentranement de lolienne (Dinesh Kumar et al., 2011).
Dans le printemps de l'anne 2010, une comptition internationale tait lance par la socite kkelectronic, MathWorks et l'universit d'Aalborg afin de trouver la meilleure approche de
dtection et isolation des dfauts dans une turbine olienne. Plusieurs solutions ont t
dveloppes pour relever le dfi pos couvrant diffrentes mthodes savoir :
Une approche base sur le rapport de vraisemblance gnralise the Generalized
Likelihood Ratio en anglais (GLR) (Kiasi et al., 2011)
Une solution base sur un compteur rversible Up-down counter (Ozdemir et al.,
2011)
Une solution base sur lestimation par observateur (Zhang et al., 2011)
Une solution base sur des modles affines (Simani et al., 2011) .
Une solution base sur les quations de parit qui gnre des rsidus primaires, suivie
dune deuxime gnration/filtrage ralise par une optimisation
2011).
Une mthode base sur les donnes (Dong and Verhaegen, 2011)
Une solution base sur un observateur o un filtre de Kalman est utilis pour gnrer les
rsidus (Chen et al., 2011).
Notre stratgie (Laouti, et al., 2011a) a dmontr son efficacit et prcision et a t
classe en premire place (voir annexe III.1).
Pour plus de dtails concernant cette comptition merci de voir le lien suivant :
http://www.kk-electronic.com/Default.aspx?ID=9442&Action=1&NewsId=43&PID=34329
137
Trs peu d'tudes utilisent SVM dans les oliennes. Une tude pas trs pousse qui traite le
diagnostic de dfauts uniquement dans le systme de transmission de l'olienne par lutilisation
de SVM et la slection de caractristiques de vibration du signal de l'arbre principal est donne
par (An et al., 2011). Des modles de prdiction de dfauts ont t dvelopps par le choix de la
vitesse du vent ainsi que de la puissance de sortie comme entres de SVMs (Kusiak and Li,
2011). Mais, daprs les auteurs, la prdiction de ces modles est un peu basse pour tre
acceptable.
138
diminution ou une augmentation de la portance de la pale, donc du couple moteur (Biegel et al.,
2011).
Un bon tutoriel sur les dynamiques et le contrle des oliennes qui dcrit l'volution rcente dans
les contrleurs avancs ainsi qu'un aperu de nombreux problmes ouverts dans les domaines de
la modlisation et du contrle des oliennes peut tre consult dans (Pao and Johnson, 2009).
Le systme de contrle doit avoir la capacit de travailler mme si l'olienne est expose des
dfauts. Une commande tolrante aux dfauts doit tre mise en uvre indpendamment de la
structure de la commande nominale (Esbensen and Sloth, 2009).
La dtection de dfauts est galement intressante pour la reconfiguration de commande pour
garantir une puissance optimale en cas de dfaut partiel. Pour plus dinformations sur les progrs
rcents dans le diagnostic de dfauts et la commande tolrante aux dfauts dans les oliennes, le
lecteur est conseill de voir (Pourmohammad and Fekih, 2011).
139
Ce modle contient un rotor avec les pales qui permettent de capter lnergie cintique du vent.
Un train d'entranement est utilis pour augmenter la vitesse de rotation du rotor au gnrateur.
Un convertisseur intgral coupl un gnrateur permet de convertir l'nergie mcanique en
nergie lectrique. Un contrleur cherche optimiser le fonctionnement de lolienne.
W r t
U .S .R 3Cq O t , E t .vw t 2
2
(III.1)
est langle de calage des pales
wr .R
vw
E k , m ( s)
E kd ( s )
wn2
s 2 2.] .wn s wn2
(III.2)
>11.11 rad / s, 0.6@ sont les paramtres nominaux du modle sachant que
wn
est la pulsation et ] est le coefficient d'amortissement. La baisse de pression est ralise par le
changement des paramtres du modle vers les valeurs wn 2 ,] 2 .
W g , m s
W g , r s
O D gc
D gc
s D gc
141
(III.3)
W g , m s
1
W g , r s W .s 1
(III.4)
Pg t K g wg t W g t
(III.5)
wr t
wg t
T t
'
wr t
W r t
A wg t B
avec
W
t
g
T t
'
Bdt B
J
r
K B
dt dt
Ng Jg
Bdt
Ng Jr
K dt Bdt
Bg
2
Ng
Jg
1
Ng
Jr
K dt K dt
, B
Ng Jg
K dt
1
J
r
0
1
J
g
0
(III.6)
O Jr, Jg sont respectivement le moment dinertie de larbre faible vitesse et grande vitesse.
Kdt est la rigidit de torsion du train dentranement, Bdt le coefficient de torsion amortie du
train dentranement, Bg le frottement visqueux de larbre grande vitesse, Ng le rapport de
transmission ou dengrenage, T ' t est langle de torsion du train dentranement, et Kdt le
rendement du train d'entranement.
Le dfaut systme de faible transmission est modlis par un autre paramtreKdt 2 .
142
wn
]2
wn 2
]3
wn3
0.6
11.11 rad/s
0.45
5.73 rad/s
0.9
3.42 rad/s
Br
N .m . s
rad
7.11
Bg
N .m . s
rad
45.6
N .m . s
Ng
95
Kdt
2.7 109
rad
N .m . s
dt
dt
0.97
0.92
Jg
390 Kg m2
Jr
55.106
Kg m2
rad
K gc
D gc
50 s
-1
0.98
143
Par la suite, la dtection de dfauts sera tudie l'aide de la simulation en boucle ferme dans la
zone 2 (optimisation de la puissance) et la zone 3 (production constante d'nergie) avec une
squence raliste de vent de 4400s montre dans la Figure III.6.
25
vw (m/s)
20
15
10
5
0
1000
2000 3000
Temps (s)
4000
g , mi
k , mi
, k 1,2,3, i 1,2
, wr , mi , i 1,2 . Cela donne un total de dix capteurs tous soumis deux types de dfauts:
valeur fixe et gain. Par consquent, vingt dfauts doivent tre dtects avec un temps de
dtection (TD) qui doit tre infrieur 10 fois le temps d'chantillonnage (Te=0,01 s).
III.2.5.3. Dfaut systme une panne de systme peut se produire dans la conduite d'un train
en raison du changement de frottement avec le temps. Le nombre total de dfauts devant tre
contrls est donc de 28.
Cependant, certains dfauts sont similaires. Par exemple, un dfaut sur le capteur de mesure de
position de la pale 1 blade 1 ( 'E1, mi ) est semblable ceux dans les capteurs de mesure des
positions des pales 2 et 3 . De cette manire, on peut voir que nous avons dix diffrents types de
dfauts prendre en considration distinctement qui sont classs dans le Tableau III.2. Le
processus a d'autres capteurs, mesurant par exemple la vitesse du vent, qui ne sont pas superviss
dans ce travail.
Tableau III.2 Dfauts considrs dans le modle olien de rfrence
N.
Dfaut
1a
Type
Exigences
Capteur
Symbole
'E k ,mi , k 1,2,3, i 1,2
Valeur fixe
TD<10.Te
1b
Capteur
Gain
TD<10.Te
2a
Capteur
Valeur fixe
TD<10.Te
2b
capteur
Gain
TD<10.Te
3a
Capteur
Valeur fixe
TD<10.Te
3b
Capteur
Gain
TD<10.Te
4a
Actionneur
'W g
Offset
TD<5.Te
5a
Actionneur
'Ek , k
1,2,3
5b
Actionneur
'Ek , k
1,2,3
Systme
'wr , 'wg
Changement
de
dynamique
Il est noter que l'exigence en termes de rapidit de temps de dtection du dfaut dpend de la
gravit de ce dernier. Et le nombre de fausses alarmes doit tre le plus faible possible.
145
146
La dtection de dfauts par SVM est dveloppe en deux parties. En premier lieu, un ensemble
de donnes avec et sans dfauts est utilis pour apprendre les modles de dtection de chaque
dfaut par l'utilisation d'une squence de vent donne comme entre. Les modles obtenus sont
valids sur un nouveau scnario de dfauts comme dans les autres applications tudies dans
cette thse.
Ek , m1 (t j ) Ek , m 2 (t j )
E k , m1 (t j ) E k , m1 (t j 1 )
E k , m 2 (t j ) E k , m 2 (t j 1 )
(III.7)
large valeur constante (5000) afin d'amliorer la distinction entre le dfaut de type valeur fixe et
le cas normal (sans dfaut).
Type gain (1b) : ce dfaut est dtect et isol en deux tapes. Tout d'abord, le dfaut est dtect
utilisant le vecteur suivant:
Ek , m1 (t j ) Ek , m 2 (t j )
Ek , m1 (t j ) Ek , m1 (t j 1 )
Ek , m 2 (t j ) Ek , m 2 (t j 1 )
(III.8)
Les deuxime et troisime lignes dans l'quation ci-dessus sont importantes afin d'exclure les
dfauts de type 1a. Par la suite, si le dfaut de type b est dtect, le vecteur suivant est utilis
pour l'isolation entre les capteurs 1 et 2:
Ek , r (t j ) Ek , m1 (t j )
Ek , r (t j ) Ek , m 2 (t j )
(III.9)
O Ek , r est la valeur dsire de l'angle pitch E k et E est la valeur filtre par un filtre passe-bas
de constante de temps W=0.08 s.
Il est noter qu'une grande valeur de V peut conduire des fausses alarmes.
Types valeurs fixes 2a et 3a: pour la dtection des dfauts de type a, le vecteur suivant est utilis
pour la dtection et l'isolation:
w p , m1 (t j ) w p , m 2 (t j )
wp , m1 (t j ) wp , m1 (t j 1 ) , p
w (t ) w (t )
p , m 2 j 1
p,m2 j
g, r
(III.10)
w g est obtenu en utilisant un filtre avec W=0.02s et w r avec W=0.6s. Lorsque le terme
wp, mi (t j ) wp, mi (t j 1 ) 0, i 1,2 , il est remplac par une grande valeur constante dans le vecteur
de caractristique x afin d'amliorer la distinction entre le dfaut de valeur fixe et le cas normal
(sans dfaut) et faciliter la tche du classifieur SVM.
149
Types gains 2b et 3b: pour la dtection des dfauts de type gain b (sans les dfauts de type a), le
vecteur suivant est utilis en premire tape :
w p , m1 (t j ) w p , m 2 (t j )
w p , m1 (t j ) w p , m1 (t j 1 ) , p
p , m 2 (t j ) wp , m 2 (t j 1 )
g, r
(III.11)
Les mesures sont filtres par un filtre passe-bas avec une constante de temps gale W=0.6 s pour
l'estimation des dfauts w r et W=0.02s pour w g .
Dans une seconde tape, l'isolation entre les capteurs 1 et 2 dans le cas de dfaut de type b est
faite en utilisant le vecteur suivant:
Wg , m u w p , m1 (t j ) u c
Pgm
, p
Wg , m u w p , m 2 (t j ) u c
Pg , m
c3 10 o p g
c4 1000 o p r
(III.12)
O, Pg , m est la mesure de la puissance gnre de la gnratrice. Les mesures sont filtres par un
passe bas avec une constante de temps gal W=0.6 s pour l'estimation des dfauts w r et W=0.06 s
pour w g .
d
O wg
wg , m1 (t j ) wg , m 2 (t j )
W g , r (t j ) W g , m (t j )
O u wd (t ) ( w (t ) w (t )) / 2
g
j
g , m1 j
g ,m2 j
(III.13)
Pr
est la vitesse de la gnratrice dsire calcule partir du couple gnrateur dsir
W g ,r
W g , r obtenu par le contrleur avec Pr la puissance dsire. Le facteur O2 1010 u vw6 dans la 3me
composante de x est utilis pour tenir compte de la vitesse du vent et pour la normalisation
(avoir le mme ordre de grandeur). Notez galement que W g , r est filtr en utilisant un filtre du
premier ordre avec une constante de temps W= 0,02 s. L'objectif de ce filtre est de prendre en
150
wg , m1 (t j ) wg , m 2 (t j )
E k , m1 (t j ) E k , m 2 (t j )
E (t ) E (t )
k , m1 j 1
k , m1 j
E k , m 2 (t j ) E k , m 2 (t j 1 )
(III.14)
Une fois les vecteurs d'apprentissage dfinis pour chaque dfaut, les scnarios de dfauts sont
simuls et chaque chantillon est attribu z
dfauts.
http://www.mathworks.com/matlabcentral/fileexchange/35130-award-winning-
fdi-solution-in-wind-turbines
Le scnario des dfauts considrs dans ce travail est le suivant :
Dfauts capteurs
Dfaut 1 (1a) : la mesure de capteur E1,m1 fix 4 entre les instants 100s et 200s
Dfaut 2 (1b) : la mesure E 2,m 2 multiplie par le facteur 1.8 entre les instants 2500s et 2600s
151
Dfaut 3 (1a) : la mesure E3, m1 fixe 12 entre les instants 900s et 1000s
Dfaut 4 (2a) : wr ,m1 fix 1.2 rad/s entre les instants 1200s et 1300s
Dfaut 5 (2b et 3b) : wr ,m2 multipli par le facteur 0.7 et wg ,m1 multipli par le facteur 1.7 entre
les instants 1700s et 1800s.
Les Figure III.11 et Figure III.12
30
vent
(lentre)
et
la
puissance
vw,m (m/s)
20
10
x 10
1000
2000
lintroduction
et
du
2200s
dfaut
sur
avec
le
pgm (w)
systme dentrainement.
3
2
1
0
1000
2000 3000
Temps (s)
4000
wn 2
5.73 et ] 2
152
Dfaut 7 (5b) : augmentation de la teneur de l'air dans l'huile hydraulique dans lactionneur 3
entre 3400s-3500s. Ce dfaut est introduit par le changement des paramtres du modle avec les
valeurs wn3
3.42 et ] 2
0.9 .
Dfaut 8 (4a) : le dfaut dactionneur sur le convertisseur est not 'W g de type offset caus par un
dcalage dans les boucles internes de contrle. Ce dfaut est introduit entre 4200s et 4300s.
Dfaut sur le systme
Dfaut 9 (6) : Changement des dynamiques du systme dentranement entre 2000s et 2200s.
Les dfauts (1 et 3) de la position pitch de type valeur fixe peuvent tre dtects aprs seulement
2 priodes dchantillonnage satisfaisant ainsi le cahier de charge (voir annexe C). La Figure
III.13 montre les rsultats de dcision du dfaut de type (gain) ainsi que la mesure du capteur
E2, m2 qui sont assez satisfaisantes puisque ce dfaut est bien dtect et isol sans fausses alarmes
malgr la difficult lie ce type de dfauts qui peut tre confondu facilement avec une situation
normale cause de bruit, perturbations et les oscillations. Cependant, seuls les dfauts avec un
offset 'E t 2q peuvent tre dtects durant le temps requis ( 10.Te ) en fonction de la zone de
commande. Si le gain est appliqu plutt quun offset, les oscillations peuvent augmenter si
lordre de gain est lev mais la capacit de dtection reste la mme.
'
'
Figure III.13 Dtection et isolation du dfaut 2 de type gain (1b) sur le capteur de la
position pitch E2, m2
Le zoom ci-dessous sur la Figure III.13 permet de voir plus de dtails. Ainsi il est clair que le
dfaut qui correspond la multiplication de la mesure E 2,m 2 par le facteur 1.8 entre les instants
2500 s et 2600 s est dtect rapidement linstant 2500.03 s (juste aprs 3Te), et bien isol
153
puisque les autres signaux de dcisions sur les dfauts affichent une valeur nulle. Cependant,
cette dcision sur le dfaut 2 indique la fin de ce dernier linstant 2550.17 s alors que ce dfaut
se termine 2600 s, ce rsultat pouvant se comprendre puisque de 2550.17 s 2600 s comme
indique la Figure ci-dessous la mesure E 2,m 2 est proche de zro et donc ce dfaut de type gain va
seulement amplifier le bruit.
1
0.5
0
2350
2400
2450
2500
2550
2600
2650
30
2700
2750
2800
2750
2800
E2m2 ()
20
10
2350
2400
2450
2500
2550
2600
2650
2700
Temps(s)
La Figure III.14 indique l'apparition du dfaut 4 (2a) de type valeur fixe dans le capteur de la
vitesse de rotation du rotor entre 1200 s et 1300 s. On remarque que la dtection est ralise
instantanment linstant 1200.02s et prend rapidement la valeur zro aprs la disparition de ce
dfaut linstant 1300.01 s. Notez toujours que les signaux de dcision sur les autres dfauts
affichent une valeur nulle, ainsi, que la non-prsence des fausses alarmes dans le rsultat de
dtection, malgr les bruits et les perturbations.
'
'
Figure III.14 Dtection et isolation du dfaut 4 valeur fixe (type 2a) sur la vitesse du rotor
154
'
Figure III.15 Dtection et isolation du dfaut 5 de type gain (2b) sur le capteur de la vitesse
rotationnelle du rotor wr ,m2
La Figure III.16 montre les rsultats de dtection et isolation de dfaut 5 (3b) du capteur vitesse
rotationnel de la gnratrice introduit entre les instants 1700s et 1800s. Dans le cas d'une erreur
de facteur de gain conduisant wg ! 50 rad / s , un changement important dans le rsidu se
produit rapidement menant une dtection facile de ce dfaut. Cependant, la mesure wg ,m1 est
influence aussi par des perturbations et dautres types de dfauts (comme le dfaut sur le
systme entre 2000 s et 2200 s). La tche disolation est donc plus complique. Malgr tout cela
le dfaut est bien isol et sans fausses alarmes. Le rsultat sur ce type de dfaut est assez bon d
la rapidit et la justesse de dcision qui commence 1700.03 s aprs juste 3 T e de lapparition
de ce dfaut et se termine 1800.06s (aprs 6 Te de la disparition du dfaut).
155
'
'
Figure III.16 Dtection et isolation du dfaut 5 de type gain (3b) sur le capteur de la vitesse
rotationnelle de la gnratrice wg ,m1
Le dfaut 8 (4a) sur lactionneur du convertisseur a pu tre dtect comme dsir en termes
damplitude de dfaut et de la rapidit comme montr dans la Figure III.17. On rappelle que x
utilise notamment la valeur de consigne du couple qui est compare celle mesure l'aide dun
retard de 2 priodes d'chantillonnage. On remarque que la dtection est ralise instantanment
aprs juste deux priode dchantillonnage linstant 4200.02s et prend rapidement la valeur
zro aprs la disparition ce dfaut linstant 4300.02s, avec un pourcentage nul de fausses
alarmes.
'
'
Figure III.17 Dtection et isolation du dfaut 8 de type offset (4a) sur le convertisseur
En ce qui concerne les actionneurs des systmes pitch, leurs dfauts ne pouvaient pas tre
dtects par le vecteur x propos. Ces types de dfauts seront traits par une approche hybride
combinant SVM avec un observateur de type Kalman (voir section III.5).
156
500
1000
1500
2000
2500
3000
3500
4000
200
100
Zgm1
500
1000
1500
2000
2500
3000
3500
4000
Temps(s)
Figure III.18 Dtection et isolation du dfaut 9 (6) sur le systme dentrainement
Finalement, la Figure III.18 montre la dtection de dfaut 9 sur le systme de transmission
(entrainement). Ce dfaut est modlis par le changement du paramtre Kdt
0.22 uKdt .
Cependant, cette erreur na pu tre dtecte quavec un niveau de dfaut beaucoup plus lev
dans ce paramtre Kdt
amlioration du modle SVM dcisionnel peut tre ralise avec une enqute plus approfondie
sur le vecteur des caractristiques, lintroduction de plus de donnes dans ltape dapprentissage
et l'adoption d'une mthode approprie de filtrage.
La plupart des exigences relatives la dtection des dfauts ont t ralises. Les diffrentes
types de dfauts ont t dtects et isols le plus rapidement possible et sans fausses alarmes.
Une solution base sur un Compteur rversible (Ozdemir et al., 2011) MBC
Solution FDI base sur un compteur rversible (Up-down counter) qui permet de compter ou
dcompter selon le choix du sens de comptage. En effet, la gnration de rsidus est obtenue par
la redondance et les connaissances physiques, les quations de parit et diffrents filtres. Par la
suite, le compteur rversible utilise les rsidus et les dynamiques discrtes dans le temps pour la
dcision sur la dtection et lisolation de chaque dfaut. A linverse du seuil fixe qui trouve une
difficult pour rgler le compromis entre fausse alarmes et dtection manque, la solution
propose dans ce travail est base sur un seuil variable bas sur un compteur.
Mthode Base sur les Observateurs (Chen et al., 2011) MBO
Une approche base sur les observateurs est conue pour le diagnostic de dfauts dans lolienne.
Les rsidus sont gnrs par un filtre de Kalman et des observateurs dont les paramtres sont
choisis sur un compromis entre dtection rapide et fausses alarmes.
Le test de rapport de vraisemblance gnralise (Generalized Likelihood ratio test) et lindex de
variance cumulative sont utiliss pour valuer les rsidus gnrs. Lisolation est effectue par
l'aide de la redondance.
Mthode Automatique Gnrale de Dfauts (Svrd and Nyberg, 2011) MAGD
Cette approche se dcompose en 3 tapes :
1) Gnration de rsidus candidats
2) Slection des rsidus les plus adapts
3) Construction dun test de diagnostic sur les rsidus choisis avec la mthode de
divergence de Kullback-Leibler
Une comparaison entre les distributions de probabilits estimes de rsidus est utilise pour les
tests de diagnostic et l'valuation des donnes actuelles et sans faute.
Plusieurs scnarios ont t tests aussi par le changement du temps de loccurrence du dfaut.
Les tableaux suivants montrent les rsultats de comparaison :
Il apparat clair d'aprs le Tableau III.3 que la solution MBSVM est meilleure que les autres
solutions de dtection du dfaut 1 car elle permet de dtecter rapidement (2Te) sans fausses
alarmes ni dtections manques.
Tableau III.3 Rsultats de diagnostic du dfaut 1
Dfaut 1
Temps de Dtection
Fausses Alarmes
moyenne
minimum
Maximum
moyenne
minimum
Maximum
Moyenne
minimum
Maximum
MBSVM
0.02
0.02
0.02
MBE
0.02
0.01
0.02
3%
0%
20%
158
Dtection Manqus
MBC
0.03
0.02
0.03
MBO
10.32
10.23
10.33
0.89
MAGD
0.04
0.03
0.04
de dfaut gain puisque E sera juste le bruit de mesure. E prend la valeur zro assez frquemment
puisquelle correspond la position optimale dans la zone 2 cest pour cette raison que la
dtection du dfaut est un peu lente. Ici aussi la mthode MBSVM surpasse les autres dans le
pourcentage nul des fausses alarmes, seule MBC ralise un rsultat quivalent sauf que niveau de
rapidit de dtection MBSVM est meilleur que MBC comme le montre le Tableau III.4.
Tableau III.4 Rsultats de diagnostic du dfaut 2
Dfaut 2
Temps de Dtection
Fausses Alarmes
Dtection Manqus
moyenne
minimum
Maximum
moyenne
minimum
Maximum
Moyenne
minimum
Maximum
MBSVM
47.24
3.23
95.09
56%
100%
MBE
44.65
0.63
95.82
22
16
28
56%
0%
100%
MBC
69.12
7.60
95.72
67%
100%
MBO
19.24
3.43
49.93
0.97
MAGD
13.70
0.38
25.32
3.08
18
Pour plus de dtails sur les rsultats de cette comptition voir (Odgaard and Stoustrup, 2012).
Il est noter que la solution propose par lauteur de cette thse a t classe comme la meilleure
stratgie pour le diagnostic de dfauts applique au modle de rfrence de lolienne malgr
quelle ne traite pas les dfauts 6 et 7 dactionneurs. Car cette stratgie se caractrise par une
rapidit de dtection, une justesse de dcision sur les dfauts et un pourcentage quasi nul de
fausses alarmes.
Les valeurs wn
11.11 rad / s et ]
normal. Les dfauts dactionneurs 6 et 7 sont introduits par le changement des valeurs nominales
des paramtres du modle dactionneur wn et ] :
Dfaut 6 : wn 2
5.73 rad / s et ] 2
0.9
La Figure III.19 illustre le schma de combinaison entre SVM et un observateur de type Kalman.
Lide est de crer une sorte de communication entre eux. Le bloc SVM FDI envoie
lobservateur 2 un signal qui surveille la prsence du dfaut 6 appel F6, et lobservateur 3 un
signal qui surveille la prsence du dfaut 7 appel F7. Dans ce travail, le rle des lobservateurs 2
et 3 est destimer en ligne les paramtres du modle, wn 2e et ] 2e de lactionneur 2 pour
lobservateur 2 et wn3e et ] 3e de lactionneur 3 pour lobservateur 3. Il faut savoir que pour
chaque actionneur on peut construire un observateur ddi lui.
Le signal de dfaut F6 (comme F7) est un signal binaire qui prend la valeur zro quand il ny a
pas le dfaut 6 et la valeur 1 ds loccurrence de ce dfaut. F6 est filtr avec un filtre passe-bas de
constante de temps W 2
160
Em
Er
1
s
2]
.s 1
2
wn wn
2
1
avec a
a.s b.s 1
1
,b
wn2
2]
et wn z 0
wn
(III. 15)
a.E b.E E
b
F a
G H
F
2 G
wn2 wn
(III. 16)
Avec la condition que G z 0 . La construction de lobservateur se fait par le choix des tats
suivants : x1
161
F , x4
H et X
x1, x2 , x3 , x4 T
x
2
x1 x2
F .x2 G.x1 H .u
x3 0
x4 0
E r et y
Avec u
(III. 17)
0
0
X
0 x2
0 0
0
u x1
X B.u
0
A. X B.u
(III. 18)
(III. 19)
T .S A (u ) S SA(u ) C C
T
0,0,2.] .w , w 0,0,13.33,123. 43
n
2 T
n
x3e
, wn
2 x3e
E k , m1 (t j ) E k , m 2 (t j )
w g , m1 (t j 250.Te ) w g , m2 (t j 250.Te )
Er (t j ) E k , m1 (t j )
E r (t j ) E k , m2 (t j )
162
(III.20)
O k=1, 2, 3 correspond au numro de lactionneur de pitch. Pour le dfaut 6 (5a) qui affecte
lactionneur 2, j=2 et pour le dfaut 7 (5b), j=3. Er est langle de pitch de rfrence filtr
avec la fonction de
2me
wn2
ordre du modle actionneur pitch 2
. Lobjectif de ce
s 2] .wn .s wn2
filtre est de prendre en considration les dynamiques du systme hydraulique pitch (actionneur)
de telle sorte avoir le comportement normal (sans dfaut) E aprs une commande E r . Il faut
prciser que le rle de ce filtre nest pas de rejeter les bruits de mesures ou les perturbations.
Ce terme w g , m1 (t j ) w g , m2 (ti ) est filtr avec un filtre passe-bas de constante de temps gal 1.5 s
pour enlever le bruit, et aussi retard de 2.5s (soit 250 Te) pour des raisons de synchronisation
avec les autres signaux caractristiques des dfauts 6 et 7.
La Figure III.20 montre que cette approche hybride permis non seulement de dtecter la
prsence du dfaut 6 qui apparat entre 3200s et 3300s sur lactionneur pitch 2 mais aussi de bien
estimer le changement de la valeur du coefficient damortissement.
La difficult lie la dtection du dfaut dactionneur 6 est due au fait quil nest pas possible de
le dtecter si la consigne E r est gale 0. Dans ce cas, on oblige lactionneur ne pas ragir. Ce
dfaut est dtect entre 3200.02 s et 3300.03 s mais avec des intermittences. Lutilisation dun
filtre passe bas permet de diminuer ces effets sur lestimation du coefficient damortissement qui
prend une valeur aux alentours de 0.45 comme prvu.
La Figure III.20 illustre galement la bonne estimation par lapproche du changement de la
pulsation naturelle vers une valeur proche de 6 rad/s. Il faut noter aussi labsence de fausses
alarmes.
163
164
165
Dfaut
Le niveau de dfaut
dtecter
Dtection et
Nombre de
isolation du dfaut
Te
Nombre
de Te
exig
1a)
Oui
1b)
1.1 u E , ('E | 1)
10 si
'E 1.5
2a)
Oui
2b)
0.1 u wr
Oui si t 0.2 u wr
67
3a)
Oui
3b)
Oui si t 0.1 u wr
4a)
'W g t 100
Oui
<5
5a)
Brusque 'Ek
Oui si E r z 0
<8
5b)
Lent 'Ek
Oui si E r z 0
149
<100
6)
Systme dentrainement,
'wr , 'wg
2835
libre
0.1u wg , (| 10 rad .s 1 )
Oui
'Kdt t 50%
'Kdt t 5%
si
<10
III.6. Conclusion
La stratgie de diagnostic de dfaut propose dans ce chapitre fait appel plusieurs disciplines
allant du traitement de signal, physique, apprentissage automatique, lectricit jusqu'
lautomatique. Les Sparateurs Vaste Marge sont utiliss pour apprendre un modle de
dcision capable de dtecter et d'isoler des dfauts de type capteurs, actionneurs et systme dans
une olienne. Dfinir le vecteur caractristique ainsi que le rglage des paramtres du modle
sont primordiaux afin de dtecter et d'isoler ces dfauts. Un compromis ralis manuellement
entre la sensibilit de la dtection au bruit et au dfaut doit tre dtermin.
Lobservateur de type Kalman a permis de cerner le type dfaut sur lactionneur systme pitch
par une estimation assez prcise du changement de la valeur du coefficient damortissement ainsi
que la pulsation naturelle.
Lapproche propose base sur SVM permet davoir une capacit de gnralisation intressante
mme avec un nombre rduit dchantillons dapprentissage, et aussi de manipuler facilement la
non linarit du systme olienne.
La comparaison entre diffrentes mthodes de diagnostic de dfauts nest pas toujours facile
raliser dans la littrature puisque certaines donnes disponibles pour certains chercheurs ne le
166
sont pas pour les autres. Donc le fait davoir une comptition internationale o tout le monde est
confront au mme problme avec les mmes donnes et aux mmes exigences respecter, me
permet de dire dune faon objective que mon approche a montr son efficacit et sa supriorit
dans la rsolution du problme de diagnostic de dfauts dans les oliennes par rapport dautres
mthodes utilises dans cette comptition.
167
168
CHAPITRE IV :
parfaitement agit
Racteur
169
chimique
170
Dans ce chapitre, la stratgie de diagnostic de dfaut propose dans cette thse est applique un
racteur chimique parfaitement agit. Mme si le modle de ce procd contient moins de
variables que le procd de traitement des eaux uses ou le systme olien, il peut nanmoins
tre trs non linaire dans certains cas ce qui rend le problme de diagnostic plus difficile. Pour
cette raison, de nombreuses mthodes de diagnostic ont t proposes pour ce systme qui ne
pourront pas toutes tre rapportes ici. La revue bibliographique suivante se limitera donc aux
applications de SVMs aux racteurs chimiques.
171
Bien que les travaux utilisant les SVMs pour le diagnostic de dfauts dans les procds
chimiques soient encore limits, ils montrent que les SVMs reprsentent une alternative
intressante aux approches bases sur les modles qui sont largement tudies dans ce domaine.
Lors de lapplication des SVMs aux racteurs chimiques, certains chercheurs ont trouv
ncessaire dadapter la mthode doptimisation, le choix de noyaux, le rglage des paramtres, le
prtraitement des donnes ou la mthode de classification (mono- ou multi-classe). Tout dabord,
la mthode SVM traditionnelle est un classificateur binaire qui ne peut diffrencier que deux
classes. (Ylamos et al., 2009) a utilis les mthodes one versus all pour gnraliser son
application au cas multi-classe tout en assurant un effort rduit de calcul. Comme dcrit dans le
chapitre II, cette mthode ncessite k classificateurs pour k classes. De mme, (Chiang et al.,
2004) ont utilis la mthode one versus one qui exige k(k-1)/2 classificateurs qui est trs
lev, rduisant donc la vitesse dapprentissage et de test. Enfin, (Yuan and Chu, 2006) a utilis
la mthode one to others qui ncessite seulement (k-1) classificateurs. En contraste avec le
cas multi-classe, le cas mono-classe a t utilis (Mahadevan and Shah, 2009) pour la dtection
de dfauts dans l'industrie chimique. Un deuxime paramtre qui peut affecter le temps de calcul
est la stratgie d'optimisation sous contrainte quadratique ncessaire pour lapprentissage dun
grand nombre de donnes. Diffrentes techniques d'optimisation ont t utilises pour rsoudre le
critre d'optimisation des SVMs dans les procds chimiques. Parmi ces algorithmes se trouvent
les multiplicateurs de Lagrange, particle swarm optimisation (Tang et al., 2010, Wu, 2010,
Samanta and Nataraj, 2009), les algorithmes d'optimisation squentielle (Davy et al., 2006) et les
algorithmes gntiques (Zeng et al., 2006). Dans (Saravanan et al., 2010) , le critre de SVM a
t modifi pour optimiser le temps de calcul. Une variante nomme proximal SVM t
utilise pour dtecter les dfauts dans une bote vitesse. L'algorithme d'optimisation peut
galement tre utilis pour le rglage des paramtres. Parmi les techniques utilises pour le
rglage des paramtres de SVM pour le diagnostic des pannes dans les procds chimiques
apparaissent la validation croise, lvolution diffrentielle (Lahiri and Ghanta, 2008), The
artificial immune algorithm (Yuan and Chu, 2006) ou encore des algorithmes gntiques (Fei
and Zhang, 2009, Kulkarni et al., 2004) . En plus du rglage des paramtres, le choix du noyau
est galement dterminant dans SVM car il doit dcrire la relation entre les entres et les sorties
(linaire / non linaire). Enfin, la combinaison de SVM avec des outils bass sur les donnes
dans lobjectif de pr traitement des donnes sest avr utile afin de dcorrler les variables et
de les projeter dans un espace infrieur en dimensions avec une variance maximale. Les
principales mthodes statistiques qui ont t combines aux SVMs pour le prtraitement des
172
donnes sont ACP, ACP noyau, lanalyse en composantes indpendantes avec et sans noyau
(Hsu et al., 2010, Monroy et al., 2010, Widodo et al., 2009, Zhang, 2008).
Alors que l'attention des recherches a t axe principalement sur la dtection et l'isolement de
dfaut, moins d'effort de recherche a t consacr l'identification des dfauts l'aide des SVMs.
Cependant, l'identification des dfauts pourrait tre d'une grande utilit pour la reconfiguration
de la commande. En effet, les drives dans les capteurs peuvent tre corriges par le logiciel si le
niveau de la drive est connu. En outre, si un actionneur est partiellement dfectueux, il peut
encore tre utilis dans le systme de contrle si le niveau de la drive est valu. Cela
reprsente une des principales contributions de ce chapitre. Les diffrentes tapes de dtection,
isolement et didentification des dfauts sont ralises par SVM.
La deuxime contribution dans cette application consiste en la combinaison de la mthode SVM
avec un observateur grand gain pour la dtection et lisolation de dfaut dans une partie du
procd o la performance des SVMs a t limite. Il sagit des erreurs de capteurs dans le
milieu ractionnel qui est le plus influenc par la non-linarit du procd.
D cette non-linarit, afin de garantir des rsultats acceptables par SVM, lapprentissage doit
contenir un grand nombre de donnes dans des conditions varies. Dans labsence de ce grand
nombre de donnes, un modle de cette partie de systme peut aider au diagnostic de dfaut sil
est coupl aux SVMs. Lide propose est la suivante : Les SVMs sont utiliss en premier lieu
pour le diagnostic de tous les dfauts dans le racteur chimique. L o cette mthode montre des
faiblesses avec le jeu de donnes dapprentissage choisi par dfaut, un observateur est ajout afin
de rendre le diagnostic plus robuste.
Ce chapitre est organis comme suit : Tout dabord, le procd considr est prsent ainsi que
son modle. Dans un deuxime temps, lapplication des SVMs au diagnostic des diffrents
dfauts est considre. Ensuite, un observateur est dvelopp pour une partie du systme. La
mthodologie est value en premier par simulation puis exprimentalement sur un racteur de
polymrisation l'chelle du laboratoire. Ensuite, des donnes dun racteur de polymrisation
pilote de 250 L sont utilises pour valider les dfauts de capteurs dans le milieu ractionnel, ce
qui semblait tre la difficult principale. Le chapitre est termin par des conclusions partielles.
173
Figure IV.1 Schma simplifi du racteur parfaitement agit du laboratoire (Tr1, Tr2, Tj1,
Tj2 et THC sont des sondes de temprature P1, P2, P3 et P4 sont des pompes)
Le racteur est quip de deux sondes de temprature dans le racteur (not Tr1 et Tr2), une
sonde de temprature dans le bain thermostat (THC), une sonde de mesure de la temprature
d'alimentation (Tfeed), une sonde de mesure de la temprature dentre de la double enveloppe
(Tjin) et une pour la sortie de la double enveloppe (Tjout). Le mlange d'alimentation est mis sur
174
une balance pour valuer la masse pompe et calculer le dbit d'alimentation prcisment (Ffeed).
La vitesse de rotation de lagitateur est mesure et utilise pour contrler le couple agitateur. Les
programmes de modle, de contrle et SVM sont dvelopps en utilisant Matlab/Simulink
combine des algorithmes de SVM de (Canu et al., 2005). Des rgulateurs PID locaux
permettent de contrler la temprature du bain thermostat (HC : heating/cooling), le dbit
d'alimentation et la rotation de lagitateur. La temprature du racteur est contrle en utilisant
une commande non linaire par linarisation entre/ sortie (Sheibat-Othman et al., 2011, SheibatOthman and Othman, 2006).
Les dfauts de capteurs considrs ici sont : TR1, TR2, Tjin, Tjout, THC, et le dfaut d'actionneur
consiste principalement en la capacit du bain thermostat chauffer ou refroidir (HC). Les
autres capteurs (balance, couple de lagitateur) ou actionneurs (couple de lagitateur, pompes
dintroduction dans le racteur et dans la double enveloppe) ne sont pas considrs.
Les mesures de procds utiliss dans la suite sont donc : y = [Tr1, Tr2, Tjin, Tjout, THC, Tfeed, Ffeed],
obtenues avec une frquence de 10 s.
IV.2.2. Le modle
Le modle considr pour la simulation se base sur le bilan de matire et de chaleur dun
racteur semi-continu parfaitement agit (valable pour les cas du racteur du laboratoire et du
racteur pilote) :
Qj
(IV.1)
O Tr, est la temprature moyenne dans le milieu ractionnel, U est le coefficient de transfert de
chaleur et A la surface de transfert de chaleur entre le racteur et la double enveloppe. M est la
masse totale du milieu ractionnel. CP, CPfeed et CPj sont les capacits thermiques du milieu
ractionnel, de l'alimentation et de lhuile caloporteuse. Qlr est la perte de chaleur du racteur
principalement par le condenseur et Qlj la perte de chaleur de la double enveloppe. Fj est le dbit
massique dans la double enveloppe. La chaleur produite par la raction est proportionnelle la
vitesse de raction (RP), o (-'H) est l'enthalpie de raction. Qr
'H u R p
La combinaison de la mthode SVM avec une mthode base sur le modle pour le
diagnostic de dfaut, sans avoir modliser tout le procd en dtail.
176
Tjx
THC
actionneur
Tr1, Tr2
HC
(x=in, out)
Tr1 (i) Tj (i 5)
Tr 2 (i) Tj (i 5)
En utilisant des collections des donnes avec situations normales et dfectueuses pour chaque
type de dfaut, et en utilisant certaines valeurs initiales de C et V, nous pouvons identifier les
multiplicateurs de Lagranges Di, le biais b et les vecteurs de support xsup. Le rglage de C et V
sest fait par l'optimisation et validation croise. La comparaison du noyau gaussien et le noyau
polynmial de diffrents degrs a montr une meilleure gnralisation avec le noyau gaussien.
Pour le rglage des paramtres, (Cherkassky and Ma, 2004) ont propos une relation pour
calculer V partir des donnes dapprentissage comme suit: V=(0,2-0,5)uplage(x). Cette relation
donne des valeurs de V lgrement infrieures celles optimises dans ce travail soit
manuellement soit par validation croise.
La fonction de dcision peut alors tre value pour des nouvelles donnes x. Le seuil du rsidu
est fix 0,1 pour toutes les situations (en thorie, il peut tre = 0), ce qui signifie que la
situation est estime normale si la valeur rsiduelle est infrieure |+/- 0,1|. Les rsultats de
l'optimisation ont donn nsv = 30%, 6%, 42% et 57% de N pour THC, Tj, Tr et HC
respectivement, avec N = 810. Cette rduction systmatique de la taille des donnes rduit le
temps de calcul en ligne de manire importante (<5u10-3s pour tous les rsidus), ce qui
reprsente un avantage des SVMs par rapport aux autres mthodes statistiques. La valeur de Tj
(et Tr) est calcule par (Tjin+Tjout)/2 en l'absence de dfaut. En prsence de dfaut, Tj prend la
valeur de la sonde non dfectueuse.
177
R Tjout
Fault Tjout
Fault THC
R THC
u
u
Tjout
Tr
UA out
T
1
M j C Pj j
T
M j C Pj
0 r
0
H 2
(IV.2)
y T jout
Nous pouvons voir que Tr est observable partir du systme (IV.2) car la forme du systme
respecte la forme de systme de (IV.1), si H1 est connu. Dans ce cas, l'observateur donn par le
systme peut tre utilis pour estimer Tr comme suit :
178
T out
j
T
r
UA out
T
1
M jC Pj j
T
M jC Pj
0 r
M jC Pj T2 Tj Tj
UA
(IV.3)
Cependant, le paramtre H1 n'est pas connu, par exemple en raison d'un manque de connaissance
de U, A, Qlj, Fj, Mj ou CPJ. L'objectif de ce travail est de proposer une mthodologie pour le
diagnostic qui peut tre applique rapidement sans tape de modlisation. Afin de rendre
l'observateur robuste ces incertitudes, le modle de base qui reprsente le bilan thermique de la
double enveloppe doit tre corrig en ligne bas sur les mesures de Tr1 et Tr2 dans des situations
normales, c'est dire quand il n'y a pas de dfaut (qui peut tre dtermin par SVM). La
correction du modle est effectue en introduisant un filtre du premier ordre sur Tr ( appliquer
en l'absence de dfaut) :
~
Tr
~
T T
TTr r1 r 2 Tr
(IV.4)
~
~
Tr est une valeur filtre de Tr et TTr est un paramtre de filtrage. Tr permet de calculer un
~
paramtre de correction du modle G Tr Tr . Ensuite, l'estimation Tr est obtenue par
l'observateur (IV.3). Cette estime peut tre utilise pour isoler la sonde dfectueuse mme en
prsence d'erreurs de modlisation importantes en utilisant les rsidus suivants :
RTr 1
Tr1 Tr G , RTr 2
Tr 2 Tr G
(IV.5)
~
Tri Tr , mais en
prsence de dfaut G est une constante. Le schma global de la dtection et isolation des dfauts
utilise dans ce chapitre est donne dans la Figure IV.2 .
179
Tempratures
74
73
drive dans Tj in
72
(C)
71
70
69
68
Tj in
Tj out
Tj correcte
Tr
67
66
65
0
30
60
90
Temps (min)
120
Rsidues
2
1.5
1
0.5
0
-0.5
-1
-1.5
-2
-2.5
-3
Dfaut de Tjin(C)
R HC (actionneur)
R Tj in
R Tj out
R THC
R Tr1
R Tr2
30
60
90
Temps (min)
120
Rglage de la variance :
Lapprentissage des dfauts de THC est un bon exemple pour illustrer l'effet de rglage des
paramtres sur les hyperplans car xi est de dimension 2. La Figure IV.4 montre les hyperplans
sparatifs obtenus en utilisant diffrentes valeurs pour la variance de la fonction noyau V= 4, 20.
On peut observer quune grande valeur de V conduit a une sparation presque linaire. En outre,
la largeur de la marge augmente avec des valeurs leves de V, ce qui conduit un plus grand
nombre de vecteurs de support. En consquence, des valeurs leves de V sont connues pour
donner une gnralisation amliore, mais les trs hautes valeurs de V pourraient ne pas
correspondre aux donnes dapprentissage du tout. De lautre ct, des petites valeurs de V sont
connues pour s'adapter parfaitement aux donnes d'apprentissage mais peuvent ne pas tre en
mesure d'valuer des nouvelles donnes (surapprentissage, capacit rduite de la gnralisation).
181
Figure IV.4 Classification des dfauts de THC. Effet de V (variance du noyau gaussien) sur
les hyperplans optimaux (avec C=100)
Afin d'illustrer l'effet de V dans le cas de dtection de dfaut, les fonctions de dcision obtenues
avec diffrentes valeurs de V ont t values par simulation. La Figure IV.5 gauche montre
qu'une faute se produit en THC 66 min. Comme THC est utilis dans un rgulateur PID local du
systme de HC, un refroidissement rapide est effectu pour ramener THC vers Tjd afin de
maintenir Trd = 70C. En consquence, Tr s'carte de la consigne pendant environ 15 min. En
raison de la prsence dune intgrale dans le contrleur de Tr, Tjd change de manire ramener
Tr Trd mme en prsence de dfaut dans THC. Un rgulateur proportionnel seul ne serait pas en
mesure de compenser ce dfaut. Par consquent, le systme de contrle est robuste des dfauts
dans cette sonde, mais ncessite une dtection efficace dans la sonde de temprature de la
raction, qui sera examin dans la section suivante. On note que mme si le dfaut dans THC est
brutal, il n'est pas vident dtecter visuellement par l'oprateur car il apparat comme une
perturbation ponctuelle, ce qui justifie l'utilisation des SVMs.
La Figure IV.5 droite montre que le dfaut est instantanment dtect par les deux fonctions de
dcision (avec V = 4 et V = 20). L'amplitude du rsidu est plus leve avec V = 4. Le seuil peut
tre fix 0,1 (en thorie, il peut tre 0) ce qui signifie que la situation est estime normale si la
valeur du rsidu est infrieure |+/-0,1|). On remarque quune faible valeur de V conduit des
fausses alarmes. Les fausses alarmes ont eu lieu avec les deux fonctions au dbut de la raction
due la vitesse de raction leve dans cette priode. En guise de compromis, V a t fix 10.
En utilisant la relation propose par (Cherkassky and Ma, 2004), V=(0,2-0,5)uplage(x), et avec la
182
ce qui donne V|2-5. On rappelle que les valeurs de V optimises dans ce travail sont en gnral
lgrement suprieures celles proposes par (Cherkassky and Ma, 2004).
Tempratures (simulation)
74
73
12
10
72
71
sigma=4
sigma=20
niveau du dfaut
(C)
70
69
68
4
THC
Tr
Tj
67
66
65
0
30
dbut de dfaut
60
90
120
Temps (min)
2
0
150
30
60
90
120
Temps (min)
150
Figure IV.5 Cas dtude par simulation (avec C=100) et diffrentes valeurs de V:
Occurrence de dfaut dans THC (objective de commande Trd=70C)
x
Rglage de C :
En ce qui concerne le paramtre C qui borne les multiplicateurs de Lagrange, il permet de crer
un compromis entre la pnalisation dune mauvaise classification et la minimisation de la
complexit de fonction. La Figure IV.6 montre que l'augmentation de la valeur de C permet de
rduire la largeur du tube (similaire la diminution de V), ce qui diminue le nombre de vecteurs
de support. Ceci est suppos jusqu' une certaine limite amliorer les rsultats des estimations.
Toutefois, cela pourrait rduire la capacit de gnralisation. On note aussi que le changement de
l'un des paramtres de rglage conduit xsup et D diffrents. Augmenter C pourrait conduire
une augmentation de la dimension de xsup ce qui augmente le temps de calcul en ligne et pourrait
rduire la capacit de gnralisation. Cette consquence n'est cependant pas systmatique.
De plus le vecteur xsup obtenu dpend de la marge et des points de donnes passant prs de la
fonction dans une configuration spcifique du problme d'optimisation. En guise de compromis,
dans cette application, C a t fix 100.
183
Normaux
Dfectueux
Xsup
hyperplan optimal
hyperplan dfaut
hyperplan normal
X2
X2
Normaux
dfectueux
Xsup
-1
-1
-1
1
x1
-1
1
x1
184
Tempratures
(C)
74
72
0.2
70
68
-0.2
66
-0.4
Tr
64
R HC (Actionneur)
R Tjin
R Tjout
R THC
-0.6
Tjd
62
Rsidus
0.4
-0.8
THC
-1
60
0
10 15 20
Temps (min)
25
30
10 15 20
Temps (min)
25
30
72
71
70
69
(C)
Rsidus de Tr
68
Tr1
Tr2
Tr saine (SVM)
Tr saine (observer)
67
66
-1
-2
-3
65
0
30
60
90
120
-4
0
30
Temps (min)
60
90
Temps (min)
120
186
Tempratures
100
95
90
85
80
75
70
65
60
55
50
Rsidus de Tr
20
R Tr1 (observateur)
R Tr2 (observateur)
R Tr1 (SVM)
R Tr2 (SVM)
15
(C)
10
5
Tr1
Tr2
Tj in
Tj out
0
50
100
150
Temps (min)
-5
200
50
100
150
Time (min)
200
Figure IV.9 Erreur de calibration de -5C est considre dans la sonde Tr2 dans le
racteur pilote de 250 L
La Figure IV.9 montre les rsultats obtenus par les deux mthodes dans le racteur pilote au
cours d'une raction typique de copolymrisation en semi-continu. Une erreur de calibration de 5C est considre dans Tr2. Une telle erreur ne peut pas tre dtecte par lanalyse visuelle des
courbes de temprature o une multitude de situations est possible. En effet, la dynamique de la
raction varie surtout pendant les premires minutes et la diffrence entre Tr1 et Tr2 n'est pas
constante dans toutes les expriences. Les oscillations dans ce scnario sont dues au systme de
contrle, non trait dans ce projet. L'observateur parvient dtecter et isoler lerreur statique
instantanment. Le seuil de dtection dans le racteur pilote est fix environ 4. Le rsidu de Tr1
obtenu par l'observateur est infrieur au seuil. La mthode SVM parvient dtecter le dfaut
rapidement, mais elle ne parvient pas lisoler tout le temps car les rsidus de Tr1 et Tr2 oscillent.
Une plus grande confiance peut donc tre attribue l'observateur. Notez que dans un tel
scnario, la correction du modle n'a pas lieu car une erreur est dtecte pendant toute
l'exprience. La correction du modle de correction n'a lieu que dans des situations normales, par
exemple dans les premires minutes du scnario prcdent (Figure IV.9).
187
20
15
rsidu Tr2
rsidu Tr1
dfaut de Tr1
dfaut de Tr2
8
3
(C)
(C)
10
0
rsidu Tr2
rsidu Tr1
dfaut de Tr1
dfaut de Tr2
-5
-10
-2
-7
-12
-15
0
20
40
60
Temps (min)
80
20
40
60
Temps (min)
80
100
Tr1
Tr2
Tj in
Tj out
95
(C)
90
85
80
75
70
0
50
100
Temps (min)
150
Figure IV.11 Evolution des tempratures dans le racteur pilote sans dfaut
188
des sondes de tempratures, o des drives peuvent avoir lieu dans le temps.
Des drives lgres dans les tempratures du racteur (Tr1 et Tr2) peuvent tre dtectes rien
qu'en examinant la diffrence entre les deux mesures. Cependant, isoler la sonde dfectueuse
reste difficile et ncessite lutilisation dune mthode de classification. Au lieu dappliquer
dabord une mthode de classification qui isole la sonde dfectueuse et densuite appliquer une
analyse des donnes afin didentifier le niveau du dfaut, nous proposons dutiliser la mthode
de rgression SVR directement. La dtection du niveau de la drive peut servir la correction de
la sonde avant la raction.
L'estimation du coefficient dchange de chaleur entre le racteur et la double enveloppe (U) est
essentielle pour le suivi contrle de la raction. On utilisera la mthode SVR et on comparera les
rsultats ceux obtenus avec un observateur grand gain. La mesure saine de Tr sera utilise en
cas de dfaut dans lune des sondes Tr1 ou Tr2.
Rgression SVM : identification (pendant la priode de
chauffe du racteur
d
r
+
-
Contrle
linaire
d
j
Tr Tj
Tr (i) Tr (i 1)
Tr1 Tr 2
Tr1 Tj
T T
j
r2
Procd
Tr
Tr1
T
r2
Tjin
out
Tj
THC
Estimation
of U
Estimation
of 'Tr
Tr
'Tr
189
Recueillir des donnes relles (y) des diffrents capteurs au cours de deux priodes de
chauffe du racteur (30 min de chauffage de chaque priode d'chantillonnage avec Te=
10 s),
La premire exprience est utilise telle quelle et la seconde est artificiellement modifie
en ajoutant diverses 'Tr1 (de +/-1 +/-4C) diffrents moments au cours d'une phase de
chauffage. Les dfauts simultans dans Tr1 et Tr2 ne sont pas considrs. Cela a donn 50
points de donnes dans une situation dfectueuse pour Tr1 et 310 points de donnes
normales. Le modle de Tr1 sera utilis galement pour Tr2, donc il ny a pas
dapprentissage ncessaire pour Tr2. Les donnes nont pas t normes dans le cas de la
rgression des dfauts de Tr et de lestimation de U.
Le vecteur suivant est utilise comme entre pour le dveloppement du modle SVM car
le premier terme donne des informations sur le niveau de la drive (pour la dtection et
l'identification) et le second terme est utile pour l'isolement (la taille de x=360) :
xi
-
r1
Le modle obtenu est ensuite valu dans des situations nouvelles par simulation. Pour ce
faire, de nouveaux vecteurs x sont introduits dans le noyau slectionn, puis le rsidu
(donnant ici le niveau de dfaut) est calcul partir de Di, b et xsup en utilisant
l'quation(IV.6). En utilisant le noyau gaussien, la fonction de dcision pour des
nouvelles mesures x temps t est donne par :
190
f x
n sp
D
i 1
i
x
sup i x
2V 2
D i e
b
(IV.6)
K ( xsup i , x )
La Figure IV.13 compare les rsultats de trois modles obtenus en utilisant diffrentes variances
de la fonction noyau V = 5, 20, 60, 200 (pour des donnes non normes). Un dfaut du niveau de
1,7 C est introduit 300 s. La dtection de dfauts est instantane. Comme dcrit prcdemment
dans le cas de la classification, on remarque que l'augmentation de V permet de mieux identifier
le niveau de dfaut jusqu' une certaine limite dans le cas de la rgression aussi. Le seuil de
rsidu didentification de 'Tr peut tre fix 0,5, ce qui signifie que la situation est estime
correcte si le niveau de dfaut (rsidu) est infrieur |+/-0,5C|. En appliquant la relation
propose par (Cherkassky and Ma, 2004) pour rgler V [V= (0,2-0,5) umarge(x)], on trouve dans
cet exemple V|12, qui est un peu faible (donnes non normes dans le cas de la rgression).
191
Dans le cas de la rgression, un paramtre supplmentaire de rglage du modle SVR par rapport
la classification est ajout. Il sagit de la largeur du tube autour des donnes dapprentissage,
qui pourrait affecter les estimations. L'augmentation de H rduit le nombre de vecteurs de support
et donc la complexit du modle, ce qui peut entraner des estimations plus mauvaises.
La Figure IV.14 montre que la rduction de la valeur de H jusqu' une certaine limite permet
d'amliorer la qualit de l'estimation. Un dfaut du niveau de -3,5C est introduit dans Tr1 150s.
Sur la base des observations, H a t fix 0,01. En utilisant la relation empirique propose par
(Cherkassky and Ma, 2004) nous obtenons H = 0,0038, ce qui est appropri. Il est toutefois
important de noter que la qualit (variabilit, richesse) des donnes de formation est galement
importante et non seulement N. Par consquent, leur quation peut tre utilise pour trouver une
estimation initiale de H mais qui doit ensuite tre affine par l'utilisateur.
Figure IV.14 Identification de la drive dans la sonde Tr1 avec diffrentes valeurs de H
(V=60, C=100, objectif de commande Trd=60C)
x
Rglage de C :
0,1C, C devrait tre lgrement suprieure 0,4. Comme on peut le voir sur la Figure IV.15,
cette valeur ne donne pas de prcision acceptable. Nous utilisons donc la valeur C=100.
Identification des dfauts de Tr1
0.5
0
-0.5 0
-1
(C)
-1.5
-2
200
400
600
800
1000
niveau du dfaut
C=20
C=100
C=300
C=500
-2.5
-3
-3.5
-4
Temps (s)
xi
T (i) T (i)
r
Tr (i) Tr (i 1)
Bien videment, des mesures saines de Tr doivent tre utilises pour valuer U en cas de
dtection de drive dans Tr1 ou Tr2 pendant la phase de chauffe. En labsence de dfaut, Tr est
calcule comme la moyenne entre Tr1 et Tr2. Les paramtres valus comme optimaux sont:
H=1u10-2, C=7000 et V=30 (les paramtres calculs par (Cherkassky and Ma, 2004) sont H|0.34,
C|200 et V|17, en supposant X=1). On note que des valeurs les plus leves de z (ici U)
ncessitent une valeur plus leve que C (C = 100 pour l'identification de 'Tr). Avec ces
paramtres, le pourcentage des vecteurs de support est de 100%.
Afin de valider ce modle exprimentalement, il a t ncessaire de filtrer Tr avec un filtre
passe-bas (W = 5 s). Ceci est d au terme drivatif Tr(i)-Tr(i-1) dans x. Les rsultats
exprimentaux sont valids par comparaison deux autres mthodes d'identification : Tout
d'abord, un observateur non linaire est dvelopp et implment au cours de la phase de
chauffe ; Aussi, une identification de U est effectue par optimisation l'tat stationnaire avec
introduction dune rsistance thermique donnant diffrents niveaux de chaleur.
Lobservateur de U utilis est celui propos par (Hammouri et al., 2002). Il est bas sur le
modle suivant, qui utilise les mesures Tr et Tj :
Tr
U
0
0
Tr A / MCP Tr
U
0
(IV.3)
En appliquant l'observateur non linaire grand gain propos par (Gauthier et al., 1992), nous
obtenons l'observateur suivant pour U :
T
r
AT j Tr
2T
Tr
MCP MC T 2 / A(T T ) Tr Tr
U
P
j
r
0
(IV.4)
La Figure IV.16 montre une simulation de la mthode SVM et de l'observation grand gain,
avec U = 150 et 200W/m/C. Lobservateur est initi 0 et converge avec le temps vers la
valeur nominale introduite dans la simulation. Mme avec un bon rglage, on sattend ce quil
converge un peu plus lentement que la mthode SVM. Le rglage du paramtre T a t choisi
comme compromis entre la vitesse de convergence et la sensibilit au bruit de mesure. Le
comportement des deux systmes est acceptable. Lorsque Tr se rapproche de Tj, l'observabilit
du systme est rduite, ce qui cause une divergence des deux mthodes.
194
70
250
60
200
50
40
Tr
Tj
30
Identification de U (simulation)
300
(W/m/C)
(C)
80
150
100
observateur
SVM
nominal
50
20
0
0
200
Figure IV.16
400
600
Temps (s)
800
200
400
600
Temps (s)
800
Identification de U (relle)
300
70
250
60
200
50
Tr
40
Tj
(W/m/C)
(C)
80
30
150
100
observateur
SVM
Stationnaire
50
20
0
0
300
600
900
Temps (s)
1200
20
30
40
50
Tr (C)
60
70
195
IV.5. Conclusions
Dans ce chapitre, la mthode SVM a t combine un observateur non linaire pour la
dtection de dfaut. L'efficacit de la stratgie propose a t dmontre par simulation et
exprimentalement dans deux racteurs de volumes diffrents. La mise en uvre de la mthode
SVM est rapide car elle ne ncessite pas de modlisation du procd. Avec un bon rglage des
paramtres et des donnes compltes, la mthode SVM peut assurer une bonne gnralisation.
En outre, le temps de calcul en ligne de SVM est rduit en raison de l'utilisation uniquement des
vecteurs de support dans la fonction de dcision. Il est dmontr que lorsque la dynamique du
procd est trs variable, l'utilisation d'un modle simplifi dans la partie fortement non linaire
peut tre utile pour amliorer l'isolation du dfaut. Dans ce cas, l'information obtenue par SVM
est utilise pour corriger le modle simplifi en l'absence de dfaut. De cette manire, une
mthode hybride FDI qui est robuste aux erreurs de modlisation et des variations de la
dynamique est propose. La mthode a pu tre applique un racteur pilote pour lequel les
paramtres du modle ne sont pas connus et o les dynamiques varient en raison de la nature
exothermique de la raction.
196
Conclusion gnrale
Le doute est le commencement de la sagesse Aristote
La Croissance des exigences en termes de productivit, qualit, conomie, scurit, maintenance
et respect de lenvironnement nous amnent rflchir amliorer davantage les outils de
surveillance et de diagnostic de dfauts.
Le choix port dans cette thse sur les mthodes dapprentissage automatique SVMs tait,
mon avis, assez ambitieux et pas facile malgr le caractre solide de leur base thorique. Ces
mthodes restent juste un outil quil faut bien comprendre, bien mettre dans le contexte de travail
et laccompagner par non seulement une bonne stratgie, mais aussi dautres outils ou mthodes
qui permettent de faciliter sa tche de diagnostic de dfauts.
La finalit de leur utilisation est dexploiter de la meilleure faon la quantit des donnes
disponibles avec les technologies modernes afin dextraire les informations utiles et le maximum
de connaissances.
Aprs les annes de recherche dans le sujet de diagnostic de dfauts, jai constat que cette tche
doit tre vue sous diffrents angles pour quelle soit ralise de la meilleure faon possible, car
les procds rels sont complexes et regroupent diffrentes disciplines tels que le traitement de
signal, automatique, statistique, mcanique, physique, chimie, biologie, probabilits, etc.
La ralisation dun bloc de diagnostic de dfauts prcis et efficace est fondamentale pour donner
une information prcise de ltat du procd loprateur et aussi pour toute reconfiguration de
commande dans le cadre dune commande tolrante aux dfauts, ainsi que pour toute procdure
dautomatisation dun systme.
Je crois que les recherches ralises dans cette thse apportent une contribution relative
lestimation et la modlisation, et aussi aux techniques de diagnostic de dfauts par une mthode
assez originale qui a montr de bons rsultats en termes de prcision, temps de dtection et
surtout le pourcentage presque nul des fausses alarmes.
La stratgie de dtection et de diagnostic de dfauts propose dans cette thse se base
globalement sur les Machines Vecteurs de Support (SVMs). Elle permet de manipuler
facilement le bruit, les perturbations et les valeurs aberrantes, et offre une grande capacit de
gnralisation sur de nouvelles situations non utilises dans lapprentissage.
197
J'ai pu dmontrer la puissance de prdiction de SVR dans ce travail. Ces bons rsultats obtenus
ne pouvaient pas tre atteints si on avait nglig la mise lchelle des donnes, lintroduction
des dcalages temporels ainsi que le choix des rgresseurs. Je peux conclure que la technique
propose dans cette thse utilisant SVR fournit une faon simple et efficace de modliser les
systmes rels tout en captant la non-linarit et la variabilit qui dcrivent le comportement
dynamique du systme.
La dcision par rapport au dfaut obtenue par lapproche base sur SVMs propose offre une
solution nette, rapide, prcise et sans fausses alarmes. Ce rsultat est confirm sur plusieurs
systmes non linaires complexes : olienne, procd de traitement des eaux uses et racteur
chimique parfaitement agit.
A lissue de ce travail, la combinaison entre Sparateurs vaste Marge (SVM) et un observateur
a permis la dtection et lisolation en dterminant le changement des paramtres estims en ligne
par lobservateur de type Kalman.
Lobjectif de cette thse tait de proposer une stratgie de diagnostic de dfauts assez gnrale et
efficace pouvant tre applique par la suite aux diffrents procds rels. Les rsultats obtenus
dans ce travail me permettent de confirmer que lobjectif a t atteint en grande partie.
Nanmoins, comme tout travail de recherche qui opte pour la perfection, la poursuite de ces
travaux apparat une ncessit afin damliorer encore lestimation, la surveillance et le rsultat
de diagnostic de ces systmes complexes.
Les travaux entrepris dans cette thse constituent les fondations de base pour plusieurs
recherches en perspective telles que :
- Lintgration la stratgie de diagnostic de dfauts, un modle appris en ligne et non pas hors
ligne comme propos dans la thse.
- Un des avantages du SVR est quil ne dpend pas des conditions initiales et quil apprend
rapidement. Cependant, il doit tre modifiable et adaptable, d'une manire efficace, pour faire
face aux changements dans les statistiques du procd. Par consquent, j'envisage dans le futur
damliorer lestimateur non-linaire SVR. Dans cette perspective, jestime que ceci peut tre
fait en rajoutant un aspect dadaptation par un terme correctif (comme celui de lobservateur). Ce
qui peut ouvrir un nouvel axe de recherche.
- J'envisage d'ajouter la stratgie de diagnostic de dfaut actuelle la variante SVM une classe au
dbut. Cela va permettre de dterminer si les nouvelles donnes acquises en ligne correspondent
198
a une situation compltement nouvelle et diffrente qui n'appartient pas au cas de dfauts connus
ni au cas de fonctionnement normal.
- La combinaison de SVMs avec la transforme dondelettes va galement permettre mon avis
damliorer les rsultats puisque londelette est un outil puissant de traitement de signal capable
de montrer les tendances et les discontinuits des mesures qui sont utilises dans un schma de
diagnostic de dfauts.
Par ailleurs, afin de rendre le processus dapprentissage un peu plus automatis, lutilisation des
algorithmes gntiques peut aider dans ce sens, et plus prcisment pour le choix des
caractristiques pertinentes descriptives de dfaut dans le cas de diagnostic ou celles descriptives
dune variable estimer (rgresseurs).
Une autre perspective de recherche consiste envisager de raliser par la suite une commande
tolrante aux dfauts pour les oliennes et le procd de traitement des eaux uses.
199
200
Notations
Notations relatives aux Machines Vecteurs Supports
Norme dun vecteur
.,.
Produit scalaire
f xi
Fonction de dcision
Remp > f @
R> f @
D i , Pi
Multiplicateurs de Lagrange
]i
Variables de pnalit
Paramtre de rgularisation
Oi
K x, xi
Fonction noyau
P(x)
Probabilit de distribution de x
P ( x, y )
xi
Exemple dapprentissage
Le biais
dVC
Hyperplan
Nombre de classes
Lagrangien
Sgn
Fonction signe
w, b
Xsup
Ammoniac
NH4
Ion ammonium
NO3
Nitrates
NO2
Nitrites
S O
PA
fP
PH
Kg
Kh
Q 0'
Q0
rh
La dcantation freine
rP
202
f ns
J s, j
X min
Q s, j
Qij
bA
bH
DBO5 ou BOD5
DCO ou COD
HO-
Ion hydroxyde
iXB
iXP
ka
Taux dammonification
kh
Kla5
KNH
KNO
KO,A
KO,H
KS
KX
MES ou TSS
NH3
Ammoniac
NH4OH
Ammoniaque
NTK ou TKN
Qintr ou Qa
rj
SALK
Alcanit
SI
SND
SNH
SNO
SO
Oxygne dissous
SS
XB,A
XB,H
XI
XND
XP
XS
YA
YH
Er
Em
La densit de lair
vw
Ww
W w, m
Wr
Couple du rotor
Wg
Couple du gnrateur
Kg
Le rendement de la gnratrice
W g ,m
204
W g, r
T'
Cq (O , E )
wr
wr , m
wg
wg , m
Bdt
Bg
Jg
Jr
Kdt
Ng
Pg
Pr
TD
Temps de dtection
Te
Temps d'chantillonnage
Vitesse angulaire
wn
La pulsation naturelle
205
L'enthalpie de raction
Cp
Cpfeed
Cpj
Ffeed
Le dbit d'alimentation
Fj
HC
Qlj
Qlr
Rp
Vitesse de raction
Tfeed
THC
Tjin
Tjout
Tr
Tr1
206
Acronymes
ACP
CSTR
dVC
FDI
KKT
LPV
LQG
LTI
MRE
MRS
PLS
Moindres carrs partiels ou Projection aux Structures Latentes Partial Least Squares
RBF
SMO
SVM
SVMs
SVR
SVs
VCP
WWTP Procd de traitement des eaux uses Waste Water Treatment Process
207
208
Annexes
209
210
Annexe A
A.1 Mthode Monte Carlo
La mthode Monte Carlo (Kroese et al., 2011, Krauth, 2006) utilise un grand nombre de tirages
alatoires pour calculer une valeur numrique. Elle est aujourdhui rendue possible par le fait que
les ordinateurs modernes offrent un calcul rapide et prcis dun grand nombre de donnes avec
un faible cot. On note que les rsultats dpendent fortement du type de gnrateur des nombres
alatoires, qui ne doit pas tre biais. Cette mthode est utilise dans plusieurs domaines comme
la simulation des phnomnes physiques, lanalyse du risque en finances, lanalyse de la fiabilit
des composantes et la modlisation des molcules,etc.
N n u superficie terrain
N
Le processus dapplication de Monte Carlo peut tre rsum par les points suivants :
1. Gnrer des nombres alatoires soit directement dans la loi de distribution ou partir
dune loi uniforme (permet dutiliser un gnrateur pseudo alatoire).
2. Appliquer le modle.
3. Calculer la moyenne empirique.
4. Ce processus (de 1 3) doit tre rpt o on applique une autre mthode, par exemple
Bootstraping pour calculer les intervalles de confiance.
211
Malgr que ces mthodes soient simples et faciles implmenter, elles prsentent des
inconvnients tels que la convergence lente et la ncessit dun grand nombre de rptitions. Il
est possible de rsoudre ce type de problme avec lutilisation des mthodes de rduction de
variance telles que la mthode des variables antithtiques, variable de contrle, quasi Monte
Carlo (squences Halton, Sabol). On peut citer aussi la rduction de la variance par
conditionnement, chantillonnage prfrentiel Importance sampling .
La mthode de Monte Carlo a dj t utilise dans le diagnostic de dfaut (Marseguerra and
Zio, 2009) . Dans cette thse, elle na pas t utilise pour le diagnostic de dfaut mais pour
valuer lefficacit du schma de diagnostic (valuer le taux de fausses alarmes, ou de non
dtection) ou la qualit dun modle de prdiction face des incertitudes. Ceci est fait en
ralisant un grand nombre de simulations avec des conditions alatoires (1000 fois par exemple)
en changeant par exemple le bruit et les perturbations dentre.
E I X
E ln p x
H X pxi log pxi
i 1
212
y f
m 1
yk e
i 2 fk
k 0
R per
1
2
y f
m
abs fft(xcorr y t
Lapparition de haute frquence dont un signal normalement de basse frquence peut indiquer
que le signal est soumis une perturbation ou un dfaut sur une composante.
E f k
k l
R k
per
j k
213
Les rsultats sont ensuite moyenns sur toutes les scissions. Lavantage de cette mthode
par rapport celle de k replis est que la proportion de la rpartition (scission ou division)
apprentissage/validation nest pas dpendante du nombre ditrations (plis). Son
inconvnient rside dans le fait que certaines observations peuvent ne jamais tre
slectionnes dans lensemble de validation.
Population entire
(inconnue)
Rchantillonnage
215
ou variable alatoire) par le calcul des intervalles de confiance. Bootstrap peut tre utilis aussi
comme une mesure gnrale derreur (biais dun estimateur, erreur de prdiction, tests).
Dans le cadre de lapprentissage automatique artificiel Machine Learning , cette technique
permet de rduire lcart entre le risque empirique et le risque rel fonctionnel et donc
damliorer la robustesse du nouveau modle prdictif (cela veut dire avoir des performances
dun niveau sensiblement constant face des donnes inconnues).
Cette variante utilise un autre paramtre Q >0,1@ pour remplacer le paramtre de rgularisation
C dans les SVMs classiques (Chen et al., 2005, Schlkopf et al., 2000). Ce paramtre est plus
facile interprter et rgler que C. Il permet de contrler le nombre maximal des points
Supports et les erreurs dapprentissage. Le problme primaire dans ce cas est formul comme
suit :
1
1 N
2
U
min
w
i , t 0
w,b,
2
N
i
1
>
1 T
max 2 .G.
1
T z 0 ,1T t ,et 0 d d
pour i 1,....N
i N
Dans le cas mono classe, le problme pos change puisquil ny a pas dinformation de sortie zi
proprement dite car tous les xi appartiennent une mme classe (la classe normal +1).
D
^xi `,
i 1,...N
Il sagit dune extension de lalgorithme SVM classique binaire dans le cas des donnes non
tiquetes (Mahadevan and Shah, 2009, Schlkopf et al., 2001). Cet algorithme cherche
trouver une fonction qui prend la valeur +1 dans une petite rgion capturant la plupart des
donnes dapprentissage et -1 dans le cas contraire .c..d. pour les valeurs qui se trouvent
lextrieur du cluster de donnes dapprentissage. Lobjectif de cette variante est daccueillir la
plupart de donnes dapprentissage dans un modle en maximisant la sparation entre l'origine
considre comme la classe ngative et le groupe d'chantillons normaux dans l'espace des
caractristiques. Lutilit de cette technique est la dtection de nouveauts ou la dtection des
valeurs aberrantes.
Le problme primaire dans ce cas est donn comme suit :
1 N
w2
i b , t 0
min
w,b,
N i 1
2
1 T
max 2 D .G.D
D N
1
1 T D 1, et 0 d D i d
, pour i 1,....N
QN
Dans le cas de dtection de dfaut, le cas mono-classe est motiv par le fait que les donnes dans
lindustrie ne sont pas riches en situations dfectueuses.
217
1 2
1
Minimiser
w C QH
N
2
(]
i 1
i
, ] i )
zi w, I ( xi ) b d H ] i
sujet w, I ( xi ) b yi d H ] i
] i , ] i t 0
f ( x)
(D
D i* ) K ( xi , x j ) b
i 1
218
Q optimal.
Annexe B
Termes lis au traitement de leau
Leutrophisation dun cosystme aquatique se produit lorsque le milieu reoit trop de matires
nutritives assimilables par les algues (phosphore et azote). La multiplication de ces algues va
limiter considrablement la respiration de leau et les changes de ce dernier avec la lumire qui
dsquilibre totalement le milieu [2008_Belhani].
Matire organique (MO) : Dsigne la matire dorigine humaine, animale ou vgtale, capable
dtre dgrade et dcompose par laction dorganismes vivants. Elle constitue une faible
proportion dans l'univers. Il sagit par exemple des glucides, protides, lipides, en plus du carbone
qui est le composant principal. Ces molcules contiennent des atomes dhydrogne, doxygne et
dans une moindre mesure dazote, de phosphore, de soufre et de fer.
Pollution : Dsigne lintroduction, gnralement par suite de l'activit humaine, de substances
ou de chaleur contaminantes dans un milieu naturel provoquant son instabilit, dsordre et sa
dgradation. Elle a un impact ngatif sur la sant humaine ou sur la qualit des cosystmes.
Ammonification : C'est lactivit biologique qui permet la gnration d'ammonium (NH4+) ou
d'ammoniac (NNH3) partir soit de matires organiques en dcomposition ou par la rduction de
nitrate.
Arobie : Dsigne la capacit des micro-organismes vivre et se dvelopper dans un
environnement o loxygne libre est prsent et joue son rle.
Ammoniaque : Compos gazeux dazote et dhydrogne, trs soluble dans leau.
Anarobie : Qualifie les milieux dans lesquels loxygne libre est absent sous toutes ses formes,
et donc les nitrates nitrites sont absents aussi. Un dispositif anarobie n'a pas besoin d'air ou de
dioxygne pour fonctionner.
Anoxie : Qualifie les milieux dans lesquels loxygne nest pas prsent sous forme dissoute.
Biomasse : Masse totale de micro-organismes vivants, animaux et vgtaux prsente dans un
milieu considr pouvant devenir source d'nergie par combustion.
219
Biomasse autotrophe : Organisme qui utilise le dioxyde de carbone pour la synthse cellulaire.
Biomasse htrotrophe : Organisme qui utilise le carbone organique pour la synthse cellulaire.
Boues actives : Flocons bactriens produits au cours de lpuration biologique.
Lyse : Dsigne la dissolution ou la destruction de l'intgrit physique de la cellule.
Hydrolyse : Cest une opration chimique utilisant leau pour dcomposer de grosses molcules
en plus petites molcules.
La nitrification consiste en loxydation de lazote ammoniacal en nitrites (NO2-) puis en nitrates
(NO3-) par lintermdiaire de deux espces de bactries autotrophes. Ces bactries sont dites
autotrophes car elles utilisent du carbone minral pour constituer leurs cellules. Leur taux de
croissance est plus faible que celui des bactries dgradant la pollution carbone (bactries
htrotrophes).
Substrat : Les matires formant lalimentation requises au dveloppement des microorganismes.
Lalcalinit : Lalcalinit mesure la concentration quivalente de carbonate de calcium
(CaCO3), et elle exprime la capacit de leau rsister des variations du pH.
Liqueur mixte : Le mlange eaux uses-boues (flocs de micro-organismes).
Biodgradable : Se dit d'une substance capable dtre dcompose chimiquement par des microorganismes ou d'autres moyens biologiques en lments divers dpourvus d'effet dommageable
sur le milieu naturel.
Floculation : Dsigne le processus physico-chimique par lequel les particules fines et matires
en suspension ayant le problme de ne pas sdimenter dune manire naturelle, sont dues se
regrouper dans un floc par lajout dun floculant (chlorure ferrique et d'un polymre, etc.). Le
floc peut alors soit remonter la surface du liquide ou se dposer au fond.
Les matires en suspension (MES) (mg/L): cest la fraction non dissoute de la pollution qui
influe ngativement sur le milieu aquatique, les animaux et les plantes (Gad, 2008).
La demande biologique en oxygne (DBO) est un paramtre reprsentatif de la quantit
doxygne requise pour dcomposer la somme des matires organiques biodgradables.
Lazote peut se trouver sous forme minrale (ammoniacal, nitrate) ou organique.
220
221
222
Annexe C
C.1 Le diplme de premire place dans la comptition sur la dtection des
dfauts pour les oliennes
223
La turbulence du vent
Les variations de la vitesse du vent ne sont pas incluses dans la vitesse moyenne du vent, et sont
causes par des facteurs multiples.
I
Vw
vw
u 100
224
225
226
Bibliographie
Abbasion, S., Rafsanjani, A., Farshidianfar, A., Irani, N., 2007. Rolling element bearings multifault classification based on the wavelet denoising and support vector machine.
Mechanical Systems and Signal Processing 21, 29332945.
Adachi, S., Ogawa, T., Konno, R., 2001. A System Identification Method for Linear Regression
Models Based on Support Vector Machine. Transactions of the Society of Instrument and
Control Engineers 37, 11891191.
Aggarwal, S., Aggarwal, N., 2011. Classification of Audio Data using Support Vector Machine.
International Journal of Computer Science and Technology 2, 398405.
Akaike, H., 1974. A new look at the statistical model identification. IEEE Transactions on
Automatic Control 19, 716723.
Alcorta Garca, E., Frank, P.M., 1997. Deterministic nonlinear observer-based approaches to
fault diagnosis: A survey. Control Engineering Practice 5, 663670.
Alex, J., Benedetti, L., Copp, J., Gernaey, K.V., Jeppsson, U., Nopens, I., Pons, M.N., Steyer,
J.P., Vanrolleghem, P., 2008. Benchmark Simulation Model no. 1 (BSM1).
Amirat, Y., Benbouzid, M.E.H., Al-Ahmar, E., Bensaker, B., Turri, S., 2009. A brief status on
condition monitoring and fault diagnosis in wind energy conversion systems. Renewable
and Sustainable Energy Reviews 13, 26292636.
Amirat, Y., Choqueuse, V., Benbouzid, M.E.., 2010. Failure Detection and Diagnosis in DFIGbased Wind Turbines using generator current amplitude demodulation. Presented at the
International Conference on Industrial Engineering and Manufacturing ICIEM10, Batna,
Algeria, pp. 444449.
An, X.L., Jiang, D.X., Li, S.H., Chen, J., 2011. Fault diagnosis of direct-drive wind turbine based
on support vector machine. Journal of Physics: Conference Series 305, 012030.
Ao, S.-I., Rieger, B.B., Amouzegar, M.A., 2010. Machine learning and systems engineering.
Springer, Dordrecht.
Arnanz, R., de Santiago, M.A.G., Reones, A., Rodrguez, J., Saludes, S., 2011. Monitoring and
Fault Diagnosis in Manufacturing Processes in the Automotive Industry, in: Chiaberge,
M. (Ed.), New Trends and Developments in Automotive Industry. InTech.
227
Artan, N., Orhon, D., Choi, E., 2004. Appropriate Design of Activated Sludge Systems for
Nitrogen Removal from High Strength Wastewaters. Journal of Environmental Science
and Health, Part A 39, 19131924.
Baccarini, L.M.R., Rocha e Silva, V.V., de Menezes, B.R., Caminhas, W.M., 2011. SVM
practical industrial application for mechanical faults diagnostic. Expert Systems with
Applications 38, 69806984.
Baggiani, F., Marsili-Libelli, S., 2009. Real-time fault detection and isolation in biological
wastewater treatment plants. Water Science & Technology 60, 2949-2961.
Barker, M., Rayens, W., 2003. Partial least squares for discrimination. Journal of Chemometrics
17, 166173.
Barszcz, T., Randall, R.B., 2009. Application of spectral kurtosis for detection of a tooth crack in
the planetary gear of a wind turbine. Mechanical Systems and Signal Processing 23,
13521365.
Basu, A., Walters, C., Shepherd, M., 2003. Support vector machines for text categorization.
Proceedings of the 36th Hawaii International Conference on System Sciences.
Baylar, A., Hanbay, D., Batan, M., 2009. Application of least square support vector machines in
the prediction of aeration performance of plunging overfall jets from weirs. Expert
Systems with Applications 36, 83688374.
Belia, E., Amerlinck, Y., Benedetti, L., Johnson, B., Sin, G., Vanrolleghem, P.A., Gernaey,
K.V., Gillot, S., Neumann, M.B., Rieger, L., Shaw, A., Villez, K., 2009. Wastewater
treatment modelling: dealing with uncertainties. Water Science & Technology 60, 19291941.
Beltran, B., Ahmed-Ali, T., Benbouzid, M., 2009. High-Order Sliding-Mode Control of
Variable-Speed Wind Turbines. IEEE Transactions on Industrial Electronics 56, 3314
3321.
Benhalla, A., Houssou, M., Charif, M., 2010. Linearization of the full activated sludge model No
1 for interaction analysis. Bioprocess Biosyst Eng 33, 759771.
Bermolen, P., Rossi, D., 2009. Support vector regression for link load prediction. Computer
Networks 53, 191201.
Biegel, B., Juelsgaard, M., Kraning, M., Boyd, S., Stoustrup, J., 2011. Wind Turbine Pitch
Optimization. Presented at the Proceedings 2011 IEEE Multi-conference on Systems and
Control, pp. 13271334.
Blanke, M., Kinnaert, M., Lunze, J., Staroswiecki, M., 2003. Diagnosis and Fault-Tolerant
Control, 1st ed. Springer.
228
Blanke, M., Kinnaert, M., Lunze, J., Staroswiecki, M., 2006. Diagnosis and Fault-Tolerant
Control, 2nd ed. Springer.
Bo, C., Qiao, X., Zhang, G., Bai, Y., Zhang, S., 2010. An integrated method of independent
component analysis and support vector machines for industry distillation process
monitoring. Journal of Process Control 20, 11331140.
Bornard, G., Couenne, N., Celle, F., 1989. Regularly persistent observers for bilinear systems,
in: Descusse, J., Fliess, M., Isidori, A., Leborgne, D. (Eds.), New Trends in Nonlinear
Control Theory, Lecture Notes in Control and Information Sciences. Springer Berlin /
Heidelberg, pp. 130140.
Bornard, G., Hammouri, H., 1991. A high gain observer for a class of uniformly observable
systems, in: Decision and Control, 1991., Proceedings of the 30th IEEE Conference On.
pp. 1494 1496 vol.2.
Boser, B., Guyon, I., Vapnik, V., 1992. A training algorithm for optimal margin classifiers, in:
Proceedings of the Fifth Annual Workshop on Computational Learning Theory. ACM,
Pittsburgh, Pennsylvania, United States, pp. 144152.
Boukhezzar, B., 2006. Sur les stratgies de commande pour loptimisation et la rgulation de
puissance des oliennes vitesse variable. Thse de Doctorat de lUniversit Paris-Sud.
Bozdogan, H., 2000. Akaikes information criterion and recent developments in information
complexity. J. Math. Psychol. 44, 6291.
Brandao, R.F.M., Carvalho, J.A.B., Barbosa, F.P.M., 2010. Neural networks for condition
monitoring of wind turbines, in: Modern Electric Power Systems (MEPS), Proceedings of
the International Symposium. pp. 1-4.
Brereton, R.G., Lloyd, G.R., 2010. Support Vector Machines for classification and regression.
Analyst 135, 230267.
Caccavale, F., Digiulio, P., Iamarino, M., Masi, S., Pierri, F., 2010. A neural network approach
for on-line fault detection of nitrogen sensors in alternated active sludge treatment plants.
Water Science & Technology 62, 2760- 2768.
Caccavale, F., Pierri, F., Iamarino, M., Tufano, V., 2011. Control and Monitoring of Chemical
Batch Reactors. Springer.
Camci, F., Chinnam, R.B., Ellis, R.D., 2008. Robust kernel distance multivariate control chart
using support vector principles. International Journal of Production Research 46, 5075
5095.
Canu, S., Grandvalet, Y., Guigue, V., Rakotomamonjy, A., 2005. SVM and Kernel Methods
Matlab toolbox, Perception Systmes et Information. INSA de Rouen, Rouen, France.
229
Chachuat, B., Roche, N., Latifi, M.A., 2003. Rduction du modle ASM 1 pour la commande
optimale des petites stations dpuration boues actives. Revue des sciences de leau
16, 526.
Chakraborty, U.K., 2008. Advances in differential evolution. Springer Verlag, Berlin.
Chang, C., Lin, C.-J., 2001. LIBSVM: a Library for Support Vector Machines.
Chang, C., Lin, C., 2011. LIBSVM: a library for support vector machines. Science 2, 139.
Chen, S., Wang, W., van Zuylen, H., 2009. Construct support vector machine ensemble to detect
traffic incident. Expert Systems with Applications 36, 1097610986.
Chen, W., Ding, S.X., Haghani, A., Naik, A., Khan, A.Q., Yin, S., 2011. Observer-Based FDI
Schemes for Wind Turbine Benchmark, in: IFAC. Presented at the Proceedings of the
18th IFAC World Congress, pp. 70737078.
Cheng, C.-S., Cheng, H.-P., 2008. Identifying the source of variance shifts in the multivariate
process using neural networks and support vector machines. Expert Systems with
Applications 35, 198206.
Cheng, C.-S., Chen, P.-W., Huang, K.-K., 2011. Estimating the shift size in the process mean
with support vector regression and neural networks. Expert Systems with Applications
38, 1062410630.
Cherkassky, V., Ma, Y., 2002. Selection of Meta-parameters for Support Vector Regression, in:
Proceedings of the International Conference on Artificial Neural Networks, ICANN 02.
Springer-Verlag, London, UK, UK, pp. 687693.
Cherkassky, V., Ma, Y., 2004. Practical selection of SVM parameters and noise estimation for
SVM regression. Neural Netw. 17, 113126.
Chetouani, Y., 2006. Fault Detection in a Chemical Reactor by Using the Standardized
Innovation. Process Safety and Environmental Protection 84, 2732.
Chiang, L.H., Russell, E.L., Braatz, R.D., 2000. Fault diagnosis in chemical processes using
Fisher discriminant analysis, discriminant partial least squares, and principal component
analysis. Chemometrics and Intelligent Laboratory Systems 50, 243252.
Chiang, L.H., Kotanchek, M.E., Kordon, A.K., 2004. Fault diagnosis based on Fisher
discriminant analysis and support vector machines. Computers & Chemical Engineering
28, 13891401.
Chitralekha, S.B., Shah, S.L., 2010. Application of support vector regression for developing soft
sensors for nonlinear processes. The Canadian Journal of Chemical Engineering 88, 696
709.
230
Choi, S.W., Lee, I.-B., 2004. Nonlinear dynamic process monitoring based on dynamic kernel
PCA. Chemical Engineering Science 59, 58975908.
Choi, Lee, I., 2005. Multiblock PLS-based localized process diagnosis. Journal of Process
Control 15, 295306.
Chong, H.G., Walley, W.J., 1996. Rule-based versus probabilistic approaches to the diagnosis of
faults in wastewater treatment processes. Artificial Intelligence in Engineering 10, 265
273.
Chow, E.Y., Willsky, A.S., Systems, M.I. of T.L. for I. and D., 1982. Analytic redundancy and
the design of robust failure detection systems. http://dspace.mit.edu/handle/1721.1/2828
Copp, J.B., 2002. The COST simulation benchmark: description and simulator manual. A
Product of COST Action 624 and COST Action 682, Directorate-General for Research.
Luxembourg: Office for Official Publications of the European Communities.
Corominas, L., Villez, K., Aguado, D., Rieger, L., Rosn, C., Vanrolleghem, P.A., 2011.
Performance evaluation of fault detection methods for wastewater treatment processes.
Biotechnology and Bioengineering 108, 333344.
Cortes, C., Vapnik, V., 1995. Support-vector networks. Machine Learning 20, 273297.
Crone, S.F., Kourentzes, N., 2010. Naive Support Vector Regression and Multilayer Perceptron
benchmarks for the 2010 neural network grand competition (NNGC) on time series
prediction. IEEE, pp. 18.
Das, S., Karnik, N., Santoso, S., 2011. Time-Domain Modeling of Tower Shadow and Wind
Shear in Wind Turbines. ISRN Renewable Energy 2011, 111.
David, R., Saucez, P., Vasel, J.-L., Vande Wouwer, A., 2009. Modeling and numerical
simulation of secondary settlers: A Method of Lines strategy. Water Research 43, 319
330.
David, R., Vande Wouwer, A., Vasel, J.-L., Queinnec, I., 2009. Robust control of the activated
sludge process. Biotechnology Progress 25, 701708.
Davy, M., Desobry, F., Gretton, A., Doncarli, C., 2006. An Online Support Vector Machine for
Abnormal Events Detection. Signal Processing 86, 2009 2025.
De Jong, S., 1993. SIMPLS: An alternative approach to partial least squares regression.
Chemometrics and Intelligent Laboratory Systems 18, 251263.
De Persis, C., Isidori, A., 2001. A geometric approach to nonlinear fault detection and isolation.
Automatic Control, IEEE Transactions on 46, 853 865.
231
Deswal, S., 2011. Modeling Oxygen-transfer by Multiple Plunging Jets using Support Vector
Machines and Gaussian Process Regression Techniques. International Journal of Civil
and Environmental Engineering 2833.
Detroja, K.P., Gudi, R.D., Patwardhan, S.C., 2007. Plant-wide detection and diagnosis using
correspondence analysis. Control Engineering Practice 15, 14681483.
Diehl, S., Jeppsson, U., 1998. A model of the settler coupled to the biological reactor. Water
Research 32, 331342.
Dinesh Kumar, J., Harikrishan, N., Karuppiah, S., Manoj, N., Satish, S., Vishal, L., Sunil Nag,
P.V., 2011. Wavelet based Fault Detection for Wind Turbine. Presented at the
International Symposium on Devices MEMS, Intelligent Systems & Communication
(ISDMISC) 2011, New York, Etats-Unis, pp. 710.
Ding, S.X., 2008. Model-based Fault Diagnosis Techniques: Design Schemes, Algorithms, and
Tools, 1st ed. Springer.
Dispan, J., 2003. Biodgradabilit de la matire organique dans le continuum aquatique rseau
dassainissement -station dpuration- milieu naturel rcepteur. Dveloppement dune
mthodologie pour le fractionnement de la matire organique en classes de
biodgradabilit. Thse de Doctorat de l'cole nationale des ponts et chausses.
Dolan, B., 2010. Wind Turbine Modelling, Control and Fault Detection.
Donders, S., 2002. Fault Detection and Identification for Wind Turbine Systems: a closed-loop
analysis. Masters Thesis, university of Twente.
Dong, J., Verhaegen, M., 2011. Data Driven Fault Detection and Isolation of a Wind Turbine
Benchmark. Presented at the Proceedings of the 18th IFAC World Congress, pp. 7086
7091.
Downs, J.J., Vogel, E.F., 1993. A plant-wide industrial process control problem. Computers &
Chemical Engineering 17, 245255.
Dumais, S., Platt, J., Heckerman, D., Sahami, M., 1998. Inductive learning algorithms and
representations for text categorization, in: Proceedings of the Seventh International
Conference on Information and Knowledge Management, CIKM 98. ACM, New York,
NY, USA, pp. 148155.
Dunia, R., Qin, S.J., Edgar, T.F., McAvoy, T.J., 1996. Identification of faulty sensors using
principal component analysis. AIChE Journal 42, 27972812.
Echavarria, E., Tomiyama, T., Bussel, G.J.W. van, 2007. Fault Diagnosis approach based on a
model-based reasoner and a functional designer for a wind turbine. An approach towards
self-maintenance. Journal of Physics: Conference Series 75, 012078.
232
Edwards, C., Spurgeon, S.K., Patton, R.J., 2000. Sliding mode observers for fault detection and
isolation. Automatica 36, 541553.
Efron, B., 1988. Jackknife: the Bootstrap and Other Resampling Plans. Soc. Ind. Appl. Math.,
Philadelphia.
Ekman, M., 2003. Urban Water Management - Modelling, Simulation and Control of the
Activated Sludge Process (dissertation). Uppsala University.
Ekman, M., Bjrlenius, B., Andersson, M., 2006. Control of the aeration volume in an activated
sludge process using supervisory control strategies. Water Research 40, 16681676.
Elhor, N., Bertrand, R., Postaire, J., Hamad, D., 1999. Neural networks for wind turbine
supervision. e & i Elektrotechnik und Informationstechnik 116, 366369.
Entezami, M., Hillmansen, S., Weston, P., Papaelias, M.P., 2012. Fault detection and diagnosis
within a wind turbine mechanical braking system using condition monitoring. Renewable
Energy 47, 175182.
Esbensen, T., Sloth, C., 2009. Fault Diagnosis and Fault-Tolerant Control of Wind Turbines.
Masters Thesis, Aalborg University.
Fang, F., Ni, B., Li, W., Sheng, G., Yu, H., 2011. A simulation-based integrated approach to
optimize the biological nutrient removal process in a full-scale wastewater treatment
plant. Chemical Engineering Journal 174, 635643.
Farza, M., Hammouri, H., Othman, S., Busawon, K., 1997. Nonlinear observers for parameter
estimation in bioprocesses. Chemical Engineering Science 52, 42514267.
Fei, S., Zhang, X., 2009. Fault diagnosis of power transformer based on support vector machine
with genetic algorithm. Expert Systems with Applications 36, 1135211357.
Ferrer, A., Aguado, D., VidalPuig, S., Prats, J.M., Zarzo, M., 2008. PLS: A versatile tool for
industrial process improvement and optimization. Applied Stochastic Models in Business
and Industry 24, 551567.
Flake, G.W., Lawrence, S., 2002. Efficient SVM Regression Training with SMO. Machine
Learning 46, 271290.
Fragkoulis, D., Roux, G., Dahhou, B., 2011. Detection, isolation and identification of multiple
actuator and sensor faults in nonlinear dynamic systems: Application to a waste water
treatment process. Applied Mathematical Modelling 35, 522543.
Frank, P.M., 1990. Fault diagnosis in dynamic systems using analytical and knowledge-based
redundancy: A survey and some new results. Automatica 26, 459474.
233
Frank, P.M., Kppen-Seliger, B., 1997. New developments using AI in fault diagnosis.
Engineering Applications of Artificial Intelligence 10, 314.
Frank, P.M., Garca, E.A., Kppen-Seliger, B., 2000. Modelling for fault detection and isolation
versus modelling for control. Math. Comput. Simul. 53, 259271.
Fuente, M.., Vega, P., Zarrop, M., Poch, M., 1996. Fault detection in a real wastewater plant
using parameter-estimation techniques. Control Engineering Practice 4, 10891098.
Ganyun, L.V., Haozhong, C., Haibao, Z., Lixin, D., 2005. Fault diagnosis of power transformer
based on multi-layer SVM classifier. Electric Power Systems Research 74, 17.
Gauthier, J.P., Hammouri, H., Othman, S., 1992. A simple observer for nonlinear systems
applications to bioreactors. Automatic Control, IEEE Transactions on 37, 875 880.
Ge, M., Du, R., Zhang, G., Xu, Y., 2004. Fault diagnosis using support vector machine with an
application in sheet metal stamping operations. Mechanical Systems and Signal
Processing 18, 143159.
Geladi, P., Kowalski, B.R., 1986. Partial least-squares regression: a tutorial. Analytica Chimica
Acta 185, 117.
Gernaey, K., Bogaert, H., Vanrolleghem, P., Van Vooren, L., Verstraete, W., 1998. Sensors for
Nitrogen
Removal
Monitoring
in
Wastewater
Treatment.
In:
Environmental
Gretton, A., Doucet, A., Herbrich, R., Rayner, P., Schoelkopf, B., 2001. Support Vector
Regression for Black-Box System Identification. In: Proceedings of the 11th IEEE
Workshop on Statistical Signal Processing, pp. 341 - 344.
Guermeur, Y., 2007. SVM Multiclasses, Thorie et Applications. Habilitation diriger des
recherches de lUniversit Nancy I.
Guinot, P., Sheibat-Othman, N., Fvotte, G., Mckenna, T., 2000. On-line monitoring of emulsion
copolymerisations using hardware sensors and calorimetry. Polymer Reaction
Engineering 8, 115134.
Gujer, W., Henze, M., Mino, T., Van Loosdrecht, M., 1999. Activated Sludge Model No. 3.
Water and Science Technology 39, 183193.
Gujer, W., 2010. Nitrification and me A subjective review. Water Research 44, 119.
Gunn, S., 1998. Support vector machines for classification and regression. Technical report,
University of Southampton.
Gunter, L., Zhu, J., 2007. Efficient Computation and Model Selection for the Support Vector
Regression. Neural Comput. 19, 16331655.
Gupta, S.M., 2007. Support Vector Machines based Modelling of Concrete Strength. Presented
at the Proceedings of world academy of science, engineering and technology, pp.305-311
Gustafsson, F., 2007. Statistical signal processing approaches to fault detection. Annual Reviews
in Control 31, 4154.
Haimi, H., Mulas, M., Sahlstedt, K., Vahala, R., 2009. Advanced operation and control methods
of municipal wastewater treatment processes in Finland. Helsinki University of
Technology, Water and Wastewater Engineering.
Hajiyev, C., 2012. TracyWidom distribution based fault detection approach: Application to
aircraft sensor/actuator fault detection. ISA Transactions 51, 189197.
Hameed, Z., Hong, Y.S., Cho, Y.M., Ahn, S.H., Song, C.K., 2009. Condition monitoring and
fault detection of wind turbines and related algorithms: A review. Renewable and
Sustainable Energy Reviews 13, 139.
Hammouri, H., de Leon Morales, J., 1990. Observer synthesis for state-affine systems, in:
Decision and Control, 1990., Proceedings of the 29th IEEE Conference On. pp. 784 785
vol.2.
Hammouri, H., Kinnaert, M., El Yaagoubi, E.H., 1999. Observer-based approach to fault
detection and isolation for nonlinear systems. IEEE Transactions on Automatic Control
44, 1879 1884.
235
Hammouri, H., Kabore, P., Othman, S., Biston, J., 2002. Failure diagnosis and nonlinear
observer. Application to a hydraulic process. Journal of the Franklin Institute 339, 455
478.
Han, H.-G., Qiao, J.-F., 2011. Adaptive dissolved oxygen control based on dynamic structure
neural network. Applied Soft Computing 11, 38123820.
Hauduc, H., 2010. Modles biocintiques de boues actives de type ASM: analyse thorique et
fonctionnelle, vers un jeu de paramtres par dfaut (Thse de doctorat). L'Universit
Laval, Qubec.
He, W., Wang, Z., Jiang, H., 2008. Model optimizing and feature selecting for support vector
regression in time series forecasting. Neurocomputing 72, 600611.
Henriksen, L.C., Poulsen, N.K., Hansen, M.H., 2011. Nonlinear Model Predictive Control of a
Simplified Wind Turbine. Presented at the the 18th IFAC World Congress, Milan, Italy,
pp. 551556.
Henze, M., Grady Jr, C.P.L., Gujer, W., Marais, G.V.R., Matsuo, T., 1987. A general model for
single-sludge wastewater treatment systems. Water Research 21, 505515.
Henze, M., Gujer, W.,Mino, T.,Matsuo,T.,Wentzel, M.C.,Marais, G.v.R, 1995. Activated Sludge
Model No. 2.IAWQ Scientific and Technical Reports, No.3, London.
Henze, M., Gujer, W., Mino, T., Van Loosdrecht M.C.M., 2000. Activated Sludge Models
Asm1, Asm2, Asm2d and Asm3. IWA Publishing, London.
Heymann, Y.T., 2010. A theory of the lifecycle of bacteria. Nature and Science, 121131.
Hsu, C.-C., Chen, M.-C., Chen, L.-S., 2010. Integrating independent component analysis and
support vector machine for multivariate process monitoring. Computers & Industrial
Engineering 59, 145156.
Huang, C., Davis, L.S., Townshend, J.R.G., 2002. An assessment of support vector machines for
land cover classification. International Journal of Remote Sensing 23, 725749.
Huang, Y., Reklaitis, G.V., Venkatasubramanian, V., 2003. A Heuristic Extended Kalman Filter
Based Estimator for Fault Identification in a Fluid Catalytic Cracking Unit. Industrial &
Engineering Chemistry Research 42, 33613371.
Hugo, G., Sbarbaro, D.G., 2011. Outliers Detection in Industrial Databases: An Example
Sulphur Recovery Process. IFAC World Congress 18, 16521657.
Humberstone, M.J., 2010. An Adaptive Nonparametric Modeling Technique for Expanded
Condition Monitoring of Processes (PhD diss). University of Tennessee - Knoxville.
236
Humberstone, M., Wood, B., Henkel, J., Hines, J., 2012. Differentiating between expanded and
fault conditions using principal component analysis. Journal of Intelligent Manufacturing
23, 179188.
Ingildsen, P., 2002. Realising full-scale control in wastewater treatment systems using in situ
nutrient sensors. Doctoral Dissertation in Industrial Automation, Lund University,
Sweden.
Isermann, R., Ball, P., 1997. Trends in the application of model-based fault detection and
diagnosis of technical processes. Control Engineering Practice 5, 709719.
Isermann, R., 2005. Model-based fault-detection and diagnosis status and applications. Annual
Reviews in Control 29, 7185.
Isermann, R., 2006. Fault-diagnosis systems: an introduction from fault detection to fault
tolerance. Springer.
Isermann, R., 2011. Fault-Diagnosis Applications Model-Based Condition Monitoring:
Actuators, Drives, Machinery, Plants, Sensors, and Fault-Tolerant Systems. Springer,
Berlin; Heidelberg; New York.
Ivanciuc, O., 2007. Applications of Support Vector Machines in Chemistry, in: Reviews in
Computational Chemistry. John Wiley & Sons, Inc., pp. 291400.
Jemwa, G.T., Aldrich, C., 2006. Kernel-based fault diagnosis on mineral processing plants.
Minerals Engineering 19, 11491162.
Jeppsson, U., 1996. Modelling aspects of wastewater treatment processes. Doctoral thesis, IEA,
Sweden.
Jeppsson, U., Alex, J., Pons, M.N., Spanjers, H., Vanrolleghem, P.A., 2002. Status and future
trends of ICA in wastewater treatment--a European perspective. Water Sci. Technol. 45,
485494.
Jeppsson, U., Pons, M.-N., Nopens, I., Alex, J., Copp, J.B., Gernaey, K.V., Rosen, C., Steyer, J.P., Vanrolleghem, P.A., 2007. Benchmark simulation model no 2: general protocol and
exploratory case studies. Water Science & Technology 56, 67-78.
Jianxu, L., 2011. Dynamic Optimization of Aeration Operations for a Benchmark Wastewater
Treatment Plant. Presented at the Proceedings of the 18th IFAC World Congress, 2011,
Milano, Italy, pp. 1418914194.
Joachims, T., 1999. Making large-scale support vector machine learning practical, in: Advances
in Kernel Methods: Support Vector Learning. MIT Press, pp. 169184.
237
Johnson, K.E., Pao, L.Y., Balas, M.J., Fingersh, L.J., 2006. Control of variable-speed wind
turbines: standard and adaptive techniques for maximizing energy capture. IEEE Control
Systems Magazine 26, 7081.
Jonasson, M., 2007. Energy Benchmark for Wastewater Treatment Processes - a Comparison
between Sweden and Austria, TEIE-5247, IEA.
Jonkman, J.M., 2009. Dynamics of offshore floating wind turbines-model development and
verification. Wind Energy 12, 459492.
Jun, B.H., 2011. Fault detection using dynamic time warping (DTW) algorithm and discriminant
analysis for swine wastewater treatment. Journal of Hazardous Materials 185, 262268.
Juricek, B.C., Seborg, D.E., Larimore, W.E., 2004. Fault Detection Using Canonical Variate
Analysis. Industrial & Engineering Chemistry Research 43, 458474.
Kabore, P., Othman, S., Mckenna, T.F., Hammouri, H., 2000. Observer-based fault diagnosis for
a class of non-linear systems Application to a free radical copolymerization reaction.
International Journal of Control 73, 787803.
Katipamula, S., Brambley, M.R., 2005. Review Article: Methods for Fault Detection,
Diagnostics, and Prognostics for Building SystemsA Review, Part I. HVAC&R
Research 11, 325.
Khushaba, R.N., Al-Ani, A., Al-Jumaily, A., 2011. Feature subset selection using differential
evolution and a statistical repair mechanism. Expert Systems with Applications 38,
1151511526.
Kiasi, F., Prakash, J., Shah, S.L., Lee, J.M., 2011. Fault Detection and Isolation of Benchmark
Wind Turbine Using the Likelihood Ratio Test. Presented at the Proceedings of the 18th
IFAC World Congress, 2011, Milano, Italy, pp. 70797085.
Kim, K., Lee, J.-M., Lee, I.-B., 2005. A novel multivariate regression approach based on kernel
partial least squares with orthogonal signal correction. Chemometrics and Intelligent
Laboratory Systems 79, 2230.
Kourti, T., 2005. Application of latent variable methods to process control and multivariate
statistical process control in industry. International Journal of Adaptive Control and
Signal Processing 19, 213246.
Kulkarni, A., Jayaraman, V.K., Kulkarni, B.D., 2004. Support vector classification with
parameter tuning assisted by agent-based technique. Computers & Chemical Engineering
28, 311318.
238
Kulkarni, A., Jayaraman, V.K., Kulkarni, B.D., 2005. Knowledge incorporated support vector
machines to detect faults in Tennessee Eastman Process. Computers & Chemical
Engineering 29, 21282133.
Kusiak, A., Li, W., 2011. The prediction and diagnosis of wind turbine faults. Renewable Energy
36, 1623.
Kwok, J.T., Tsang, I.W., 2003. Linear dependency between and the input noise in -support
vector regression. IEEE Transactions on Neural Networks 14, 544553.
Lahiri, S.K., Ghanta, K.C., 2008. The Support Vector Regression with the parameter tuning
assisted by a differential evolution technique: Study of the critical velocity of a slurry
flow in a pipeline. Chemical Industry and Chemical Engineering Quarterly 14, 191203.
Laouti, N., Sheibat-othman, N., Othman, S., 2011a. Support Vector Machines for Fault
Detection in Wind Turbines. Presented at the IFAC World Congress, Milano, Italy, pp.
70677072.
Laouti, N., Sheibat-Othman, N., Othman, S., 2011b. Fault diagnosis for wastewater treatment
plants using Support Vector Machines. Presented at the STIC & ENVIRONNEMENT,
France.
Lauer, F., Bloch, G., 2006. Mthodes SVM pour lidentification, in: Journes Identification Et
Modlisation Exprimentale, JIME2006, Poitiers, France, p. CDROM.
Lee, C., Choi, S.W., Lee, I.-B., 2004. Sensor fault identification based on time-lagged PCA in
dynamic processes. Chemometrics and Intelligent Laboratory Systems 70, 165178.
Lee, D.S., Vanrolleghem, P.A., Park, J.M., 2005. Parallel hybrid modeling methods for a fullscale cokes wastewater treatment plant. Journal of Biotechnology 115, 317328.
Lee, D.S., Lee, M.W., Woo, S.H., Kim, Y.-J., Park, J.M., 2006a. Nonlinear dynamic partial least
squares modeling of a full-scale biological wastewater treatment plant. Process
Biochemistry 41, 20502057.
Lee, H.W., Lee, M.W., Park, J.M., 2007. Robust Adaptive Partial Least Squares Modeling of a
Full-Scale Industrial Wastewater Treatment Process. Industrial & Engineering Chemistry
Research 46, 955964.
Lee, J., Qin, S.J., Lee, I., Lee, J., Qin, S.J., Lee, I., 2006. Fault detection and diagnosis based on
modified independent component analysis, Fault detection and diagnosis based on
modified independent component analysis. AIChE Journal 52, 35013514.
Lee, J.-M., Yoo, C., Lee, I.-B., 2004. Statistical process monitoring with independent component
analysis. Journal of Process Control 14, 467485.
239
Lee, M.W., Joung, J.Y., Lee, D.S., Park, J.M., Woo, S.H., 2005. Application of a MovingWindow-Adaptive Neural Network to the Modeling of a Full-Scale Anaerobic Filter
Process. Industrial & Engineering Chemistry Research 44, 39733982.
Lee, M.W., Hong, S.H., Choi, H., Kim, J.-H., Lee, D.S., Park, J.M., 2008. Real-time remote
monitoring of small-scaled biological wastewater treatment plants by a multivariate
statistical process control and neural network-based software sensors. Process
Biochemistry 43, 11071113.
Li, G., Qin, S.J., Zhou, D., 2010. Geometric properties of partial least squares for process
monitoring. Automatica 46, 204210.
Li, H., Liang, Y., Xu, Q., 2009. Support vector machines and its applications in chemistry.
Chemometrics and Intelligent Laboratory Systems 95, 188198.
Li, J., Cui, P., 2009. Improved kernel fisher discriminant analysis for fault diagnosis. Expert
Systems with Applications 36, 14231432.
Li, S., Wunsch, D.C., OHair, E.A., Giesselmann, M.G., 2001. Using neural networks to estimate
wind turbine power generation. Energy Conversion, IEEE Transactions on 16, 276 282.
Li, W., Shah, S.L., Xiao, D., 2008. Kalman filters in non-uniformly sampled multirate systems:
For FDI and beyond. Automatica 44, 199208.
Li, Y., Wang, Z., Yuan, J., 2006. On-line Fault Detection Using SVM-based Dynamic MPLS for
Batch Processes. Chinese Journal of Chemical Engineering 14, 754758.
Liang, J., Du, R., 2007. Model-based Fault Detection and Diagnosis of HVAC systems using
Support Vector Machine method. International Journal of Refrigeration 30, 11041114.
Liu, Y., Zheng, Y.F., 2005. One-against-all multi-class SVM classification using reliability
measures. Neural Networks, 2005. IJCNN '05. Proceedings. 2005 IEEE International
Joint Conference on, 2, pp. 849 854.
Lootsma, T.F., 1999. Observer-based Fault Detection and Isolation for Nonlinear Systems. IEEE
Transactions on Automatic Control 44, 18791884.
Lootsma, T.F., 2001. Observer-based fault detection and isolation for nonlinear systems: Ph.D.
thesis. Department of Control Engineering, Aalborg University, Aalborg.
Loureno, N.D., Menezes, J.C., Pinheiro, H.M., Diniz, D., 2008. Fuel park wastewater
monitoring with UV-VIS spectra and partial. Macedonian Journal of Chemistry and
Chemical Engineering 27, 1923.
Lu, B., Li, Y., Wu, X., Yang, Z., 2009. A review of recent advances in wind turbine condition
monitoring and fault diagnosis, in: IEEE Power Electronics and Machines in Wind
240
Applications, 2009. PEMWA 2009. Presented at the IEEE Power Electronics and
Machines in Wind Applications, 2009. PEMWA 2009, IEEE, pp. 17.
Lu, N., Wang, X., 2008. Fault Diagnosis Based on Signed Digraph Combined with Dynamic
Kernel PLS and SVR. Industrial & Engineering Chemistry Research 47, 94479456.
Lu, Y., 2012. Wind Turbine Gearbox Fault Detection Using Multiple Sensors With Features
Level Data Fusion. Transactions of the ASME - A - Engineering for Gas Turbines and
Power 134, 042501.
Ma, J., Theiler, J., Perkins, S., 2003. Accurate On-line Support Vector Regression. Neural
Computation 15, 26832703.
Maalouf, M., Khoury, N., Trafalis, T.B., 2008. Support vector regression to predict asphalt mix
performance. International Journal for Numerical and Analytical Methods in
Geomechanics 32, 19891996.
Mahadevan, S., Shah, S.L., 2009. Fault detection and diagnosis in process data using one-class
support vector machines. Journal of Process Control 19, 16271639.
Mao, Y., Xia, Z., Yin, Z., Sun, Y., Wan, Z., 2007. Fault Diagnosis Based on Fuzzy Support
Vector Machine with Parameter Tuning and Feature Selection. Chinese Journal of
Chemical Engineering 15, 233239.
Martnez-Ramn, M., Rojo-Alvarez, J.L., Camps-Valls, G., Muioz-Mar, J., Navia-Vzquez,
A., Soria-Olivas, E., Figueiras-Vidal, A.R., 2006. Support vector machines for nonlinear
kernel ARMA system identification. IEEE Trans Neural Netw 17, 16171622.
Matha, D., 2009. Model Development and Loads Analysis of an Offshore Wind Turbine on a
Tension Leg Platform, with a Comparison to Other Floating Turbine Concepts. National
Renewable Energy Laboratory, United States.
Mattera, D., Haykin, S., 1999. Advances in kernel methods, in: Schlkopf, B., Burges, C.J.C.,
Smola, A.J. (Eds.), MIT Press, Cambridge, MA, USA, pp. 211241.
Melssen, W., stn, B., Buydens, L., 2007. SOMPLS: A supervised self-organising map--partial
least squares algorithm for multivariate regression problems. Chemometrics and
Intelligent Laboratory Systems 86, 102120.
Mjalli, F.S., Al-Asheh, S., Alfadala, H.E., 2007a. Use of artificial neural network black-box
modeling for the prediction of wastewater treatment plants performance. Journal of
Environmental Management 83, 329338.
Mohamed, E.A., Rao, N.D., 1995. Artificial neural network based fault diagnostic system for
electric power distribution feeders. Electric Power Systems Research 35, 110.
241
Mohsen, A.K.A., El-Yazeed, M.F.A., 2004. Selection of Input Stimulus for Fault Diagnosis of
Analog Circuits Using ARMA Model. AEU - International Journal of Electronics and
Communications 58, 212217.
Monod, J., 1949. The Growth of Bacterial Cultures. Annual Review of Microbiology 3, 371
394.
Monroy, I., Benitez, R., Escudero, G., Graells, M., 2010. A semi-supervised approach to fault
diagnosis for chemical processes. Computers & Chemical Engineering 34, 631642.
Mujahed, A.-D., Westwick, D.T., 2011. Support Vector Machine Identification of Output Error
Hammerstein Models, in: Sergio, B. (Ed.), Presented at the the 18th IFAC World
Congress, Milano (Italy), pp. 1394813953.
Mukherjee, S., Vapnik, V., 1999. Multivariate Density Estimation: an SVM Approach.
Massachusetts Institute of Technology, Cambridge, MA, USA.
Mulas, M., 2006. Modelling and Control of Activated Sludge Processes. PhD dissertation,
University of Gagliari, Italy.
Musyafa, A., Negara, I.M.Y., Robandi, I., 2011. Design Optimal of Adaptive Control and Fuzzy
Logic Control on Torque-Shaft Small Scale Wind Turbine. Canadian Journal on
Electrical and Electronics Engineering 2, 202208.
Negre, P.L., Puig, V., Pineda, I., 2011. Fault Detection and Isolation of a Real Wind Turbine
Using LPV Observers. Presented at the the 18th IFAC World Congress, Milano, Italy, pp.
1237212379.
Nelson, M.I., Sidhu, H.S., 2009. Analysis of the activated sludge model (number 1). Applied
Mathematics Letters 22, 629635.
Nguyen, D.V., Rocke, D.M., 2002. Tumor Classification by Partial Least Squares Using
Microarray Gene Expression Data. Bioinformatics 18, 3950.
Niska, H., 2011. Predictive data-driven modeling approaches in environmental management
decision-making (Dissertation). University of Eastern Finland.
Nyberg, M., 1999. Model Based Fault Diagnosis: Methods, Theory, and Automotive Engine
Applications,PhDthesis. Linkping University, Sweden.
Odgaard, P., Stoustrup, J., 2009. Unknown Input Observer Based Scheme for Detecting Faults in
a Wind Turbine Converter, in: Proceedings of the 7th IFAC Symposium on Fault
Detection, Supervision and Safety of Technical Processes, pp. 161-166.
Odgaard, P., Stoustrup, J., Kinnaert, M., 2009. Fault Tolerant Control of Wind Turbines - a
Benchmark Model, in: Proceedings of Fault Detection, Supervision and Safety of
Technical Processes. Barcelona, pp. 155-160.
242
Odgaard, P.F., Stoustrup, J., 2010. Unknown input observer based detection of sensor faults in a
wind turbine. Presented at the 2010 IEEE International Conference on Control
Applications (CCA), IEEE, pp. 310315.
Odgaard, P.F., Stoustrup, J., 2011. Orthogonal Bases used for Feed Forward Control of Wind
Turbines. Presented at the In: Proceedings of the 18th IFAC World Congress, pp. 532537.
Odgaard, P.F., Stoustrup, J., 2012. Results of a wind turbine FDI competition. Presented at the
IFAC Workshop Series.
, G., Pappa, G.L., Mattoso, M., 2010.
Adaptive Normalization: A novel data normalization approach for non-stationary time
series, in: Neural Networks (IJCNN), The 2010 International Joint Conference On. pp. 1
8.
Olsson, G., 2007. Automation Development in Water and Wastewater Systems. Environ. Eng.
Res. 12, 197200.
stergaard, K.Z., Brath, P., Stoustrup, J., 2007. Estimation of effective wind speed. Journal of
Physics: Conference Series 75, 012082.
stergaard, K.Z., Stoustrup, J., Brath, P., 2009. Linear parameter varying control of wind
turbines covering both partial load and full load conditions. International Journal of
Robust and Nonlinear Control 19, 92116.
Ozdemir, A.A., Seiler, P., Balas, G.J., 2011. Wind Turbine Fault Detection Using Counter-Based
Residual Thresholding. Proceedings of the 18th IFAC World Congress, 2011 18, 8289
8294.
Pachet, F., Roy, P., 2009. Analytical Features: A Knowledge-Based Approach to Audio Feature
Generation. EURASIP Journal on Audio, Speech, and Music Processing 2009, 123.
Pao, L.Y., Johnson, K.E., 2009. A tutorial on the dynamics and control of wind turbines and
wind farms, in: American Control Conference, 2009. ACC 09. pp. 2076 2089.
Parrella, F., 2007. Online Support Vector Regression. PhD Thesis. University of Genoa, Italy.
Patton, R.J., 1997. Fault tolerant control systems : The 1997 situation, in: IFAC
SAFEPROCESS1997. Presented at the IFAC Symposium on Fault Detection
Supervision and Safety for Technical Processes, pp. 10331054.
Patton, R.J., Chen, J., 2000. On eigenstructure assignment for robust fault diagnosis.
International Journal of Robust and Nonlinear Control 10, 11931208.
Paviglianiti, G., Pierri, F., Caccavale, F., Mattei, M., 2010. Robust fault detection and isolation
for proprioceptive sensors of robot manipulators. Mechatronics 20, 162170.
243
Peng, H., Long, F., Ding, C., 2005. Feature selection based on mutual information: criteria of
max-dependency, max-relevance, and min-redundancy. IEEE Transactions on Pattern
Analysis and Machine Intelligence 27, 12261238.
Pierri, F., Paviglianiti, G., Caccavale, F., Mattei, M., 2008. Observer-based sensor fault detection
and isolation for chemical batch reactors. Engineering Applications of Artificial
Intelligence 21, 12041216.
Pisu, P., Ayalew, B., 2011. Robust Fault Diagnosis for a Horizontal Axis Wind Turbine.
Presented at the 18th IFAC World Congress, pp. 70557060.
Platt, J.C., 1999. Advances in kernel methods, in: Schlkopf, B., Burges, C.J.C., Smola, A.J.
(Eds.), MIT Press, Cambridge, MA, USA, pp. 185208.
Platt, J.C., Cristianini, N., Shawe-taylor, J., 2000. Large Margin DAGs for Multiclass
Classification, in: Advances in Neural Information Processing Systems. MIT Press, pp.
547553.
Pons, M.N., Belhani, M., Bourgois, J., Dupuit, E., 2008. Analyse du cycle de vie. Epuration des
eaux uses urbaines. Techniques de lingnieur. Environnement n 820, 22 pp.
Pourmohammad, S., Fekih, A., 2011. Fault-Tolerant Control of Wind Turbine Systems - A
Review, in: Green Technologies Conference (IEEE-Green), 2011 IEEE. pp. 1 6.
Pyhnen, S., Arkkio, A., Jover, P., Hytyniemi, H., 2005. Coupling pairwise support vector
machines for fault classification. Control Engineering Practice 13, 759769.
Prakash, J., Patwardhan, S.C., Narasimhan, S., 2002. A Supervisory Approach to Fault-Tolerant
Control of Linear Multivariable Systems. Industrial & Engineering Chemistry Research
41, 22702281.
Priyadarshin, D., Acharya, M., Prasad Mishra, A., 2011. Link Load Prediction using Support
Vector Regression and Optimization. International Journal of Computer Applications 24,
2225.
Pusha, S., Gudi, R., Noronha, S., 2009. Polar classification with correspondence analysis for
fault isolation. Journal of Process Control 19, 656663.
Queinnec, I., Gmez-Quintero, C.-S., 2009. Reduced modeling and state observation of an
activated sludge process. Biotechnology Progress 25, 654666.
Rduly, B., Gernaey, K.V., Capodaglio, A.G., Mikkelsen, P.S., Henze, M., 2007. Artificial
neural networks for rapid WWTP performance evaluation: Methodology and case study.
Environmental Modelling & Software 22, 12081216.
244
Ram Maurya, M., Rengaswamy, R., Venkatasubramanian, V., 2004. Application of signed
digraphs-based analysis for fault diagnosis of chemical process flowsheets. Engineering
Applications of Artificial Intelligence 17, 501518.
Ramaswami, M., Bhaskaran, R., 2009. A Study on Feature Selection Techniques in Educational
Data Mining. Journal of computing 1.
Ravikumar, B., Thukaram, D., Khincha, H.P., 2008. Application of support vector machines for
fault diagnosis in power transmission system. IET Generation, Transmission &
Distribution 2, 119-130.
Reiter, R., 1987. A theory of diagnosis from first principles. Artificial Intelligence 32, 5795.
Ren, N., Liang, J., Gu, B., Han, H., 2008. Fault diagnosis strategy for incompletely described
samples and its application to refrigeration system. Mechanical Systems and Signal
Processing 22, 436450.
Rieger, L., Takcs, I., Shaw, A., Winkler, S., Ohtsuki, T., Langergraber, G., Gillot, S., 2010.
Editorial: Status and future of wastewater treatment modelling. Water Science &
Technology 61, 821-823.
Rieger, L., Thomann, M., Gujer, W., Siegrist, H., 2005. Quantifying the uncertainty of on-line
sensors at WWTPs during field operation. Water Research 39, 51625174.
Rivas, A., Irizar, I., Ayesa, E., 2008. Model-based optimisation of Wastewater Treatment Plants
design. Environmental Modelling & Software 23, 435450.
Rocco S., C.M., Zio, E., 2007. A support vector machine integrated system for the classification
of operation anomalies in nuclear components and systems. Reliability Engineering &
System Safety 92, 593600.
Rosen, C., Jeppsson, U., Rieger, L., Vanrolleghem, P.A., 2008. Adding realism to simulated
sensors and actuators. Water Science & Technology 57, 337-344.
Rosen, C., Lennox, J.A., 2001. Multivariate and multiscale monitoring of wastewater treatment
operation. Water Research 35, 34023410.
Rosipal, R., Krmer, N., 2006. Overview and recent advances in partial least squares, in: In
Subspace, Latent Structure and Feature Selection Techniques, Lecture Notes in
Computer Science. Springer, pp. 3451.
Rosipal, R., Trejo, L.J., 2002. Kernel partial least squares regression in reproducing kernel
hilbert space. J. Mach. Learn. Res. 2, 97123.
Rosipal, R., Trejo, L.J., 2003. Kernel pls-svc for linear and nonlinear classification, in: In
Proceedings of the Twentieth International Conference on Machine Learning (ICML2003. pp. 640647.
245
Ruiz, D., Nougus, J., Caldern, Z., Espua, A., Puigjaner, L., 2000. Neural network based
framework for fault diagnosis in batch chemical plants. Computers & Chemical
Engineering 24, 777784.
Russell, E.L., Chiang, L.H., Braatz, R.D., 2000. Fault detection in industrial processes using
canonical variate analysis and dynamic principal component analysis. Chemometrics and
Intelligent Laboratory Systems 51, 8193.
Salahshoor, K., Kordestani, M., Khoshro, M.S., 2010. Fault detection and diagnosis of an
industrial steam turbine using fusion of SVM (support vector machine) and ANFIS
(adaptive neuro-fuzzy inference system) classifiers. Energy 35, 54725482.
Saludes Rodil, S., Arnanz Gmez, R., Bernrdez, J.M., Rodrguez, F., Miguel, L.J., Pern, J.R.,
2009. Laser welding defects detection in automotive industry based on radiation and
spectroscopical measurements. The International Journal of Advanced Manufacturing
Technology 49, 133145.
Saludes Rodil, S., Fuente, M.J., 2010. Fault tolerance in the framework of support vector
machines based model predictive control. Engineering Applications of Artificial
Intelligence 23, 11271139.
Samanta, B., 2004. Gear fault detection using artificial neural networks and support vector
machines with genetic algorithms. Mechanical Systems and Signal Processing 18, 625
644.
Samanta, B., Al-Balushi, K.R., Al-Araimi, S.A., 2003. Artificial neural networks and support
vector machines with genetic algorithm for bearing fault detection. Engineering
Applications of Artificial Intelligence 16, 657665.
Samanta, B., Nataraj, C., 2009. Use of particle swarm optimization for machinery fault detection.
Engineering Applications of Artificial Intelligence 22, 308316.
Samantaray, S.R., Dash, P.K., Panda, G., 2007. Distance relaying for transmission line using
support vector machine and radial basis function neural network. International Journal of
Electrical Power & Energy Systems 29, 551556.
Saravanan, N., Kumar Siddabattuni, V.N.S., Ramachandran, K.I., 2008. A comparative study on
classification of features by SVM and PSVM extracted using Morlet wavelet for fault
diagnosis of spur bevel gear box. Expert Systems with Applications 35, 13511366.
Saravanan, N., Ramachandran, K.I., 2009. A case study on classification of features by fast
single-shot multiclass PSVM using Morlet wavelet for fault diagnosis of spur bevel gear
box. Expert Systems with Applications 36, 1085410862.
246
Saravanan, N., Siddabattuni, V.N.S.K., Ramachandran, K.I., 2010. Fault diagnosis of spur bevel
gear box using artificial neural network (ANN), and proximal support vector machine
(PSVM). Applied Soft Computing 10, 344360.
Schittkowski, K., 2005. Optimal parameter selection in support vector machines. Journal of
Industrial and Management Optimization 1, 465476.
Schlechtingen, M., Ferreira Santos, I., 2011. Comparative analysis of neural network and
regression based condition monitoring approaches for wind turbine fault detection.
Mechanical Systems and Signal Processing 25, 18491875.
Schlkopf, B., Burges, C.J.C., Smola, A.J., 1999. Advances in kernel methods support vector
learning. MIT Press, Cambridge, Mass.
Schtze, M., Campisano, A., Colas, H., Schilling, W., Vanrolleghem, P.A., 2004. Real time
control of urban wastewater systems-where do we stand today? Journal of Hydrology
299, 335348.
Selvam, K., Kanev, S., van Wingerden, J.W., van Engelen, T., Verhaegen, M., 2009. Feedbackfeedforward individual pitch control for wind turbine load reduction. International
Journal of Robust and Nonlinear Control 19, 7291.
Shawe-Taylor, J., Cristianini, N., 2004. Kernel methods for pattern analysis. Cambridge
University Press, Cambridge, UK; New York.
Sheibat-Othman, N., Othman, S., 2006. Control of an Emulsion Polymerization Reactor.
Industrial & Engineering Chemistry Research 45, 206211.
Sheibat-Othman, N., Othman, S., Boyron, O., Alamir, M., 2011. Multivariable control of the
polymer molecular weight in emulsion polymerization processes. Journal of Process
Control 21, 861873.
Shevade, S.K., Keerthi, S.S., Bhattacharyya, C., Murthy, K.R.K., 2000. Improvements to the
SMO algorithm for SVM regression. IEEE Transactions on Neural Networks 11, 1188
1193.
Shinzawa, H., Ritthiruangdej, P., Ozaki, Y., 2011. Kernel Analysis of Partial Least Squares
(PLS) Regression Models. Applied Spectroscopy 65, 549556.
Shitong, W., Jiagang, Z., Chung, F.L., Qing, L., Dewen, H., 2004. Theoretically Optimal
Parameter Choices for Support Vector Regression Machines with Noisy Input. Soft
Computing 9, 732741.
Simani, S., Castaldi, P., Bonf, M., 2011. Hybrid Model-Based Fault Detection of Wind Turbine
Sensors. Proceedings of the 18th IFAC World Congress, 2011 18, 70617066.
247
Simani, S., Patton, R., Fantuzzi, C., 2003. Model-Based Fault Diagnosis in Dynamic Systems
Using Identification Techniques. Springer-Verlag New York, Inc., Secaucus, NJ, USA.
Singh, K.P., Basant, N., Malik, A., Sinha, S., Jain, G., 2009. Multi-way modeling of wastewater
data for performance evaluation of sewage treatment plantA case study. Chemometrics
and Intelligent Laboratory Systems 95, 1830.
Sloth, C., Esbensen, T., Stoustrup, J., 2011. Robust and fault-tolerant linear parameter-varying
control of wind turbines. Mechatronics 21, 645659.
Smola, A., Burges, C., Drucker, H., Golowich, S., Van Hemmen, L., Mller, K.-R., Schlkopf,
B., Vapnik, V., 1996. Regression Estimation with Support Vector Learning Machines.
Smola, A.J., Murata, N., Schlkopf, B., Mller, K.-R., 1998. Asymptotically Optimal Choice of
-Loss for Support Vector Machines, in: Proceedings of the 8th International Conference
on Artificial Neural Networks, perspectives in Neural Computing, Springer Verlag, pp.
105110.
Solomatine, D.P., Ostfeld, A., 2008. Data-driven modelling : some past experiences and new
approaches. Journal of hydroinformatics 10, 322.
Sotomayor, O.A.Z., Odloak, D., 2005. Observer-based fault diagnosis in chemical plants.
Chemical Engineering Journal 112, 93108.
Sprandio, M., Heran, M., Gillot, S., 2007. Modlisation dynamique des procds biologiques de
traitement des eaux. Techniques de lIngnieur.
Stefatos, G., Ben Hamza, A., 2010. Dynamic independent component analysis approach for fault
detection and diagnosis. Expert Systems with Applications 37, 86068617.
Sugumaran, V., Sabareesh, G.R., Ramachandran, K.I., 2008. Fault diagnostics of roller bearing
using kernel based neighborhood score multi-class support vector machine. Expert
Systems with Applications 34, 30903098.
Sun, X., Marquez, H.J., Chen, T., Riaz, M., 2005. An improved PCA method with application to
boiler leak detection. ISA Trans 44, 379397.
Sun, Y., Liu, L., Popp, M., Farmerie, W., 2006. Estimation Of Cross-Hybridization Signals
Using Support Vector Regression, in: Proceedings of the First International MultiSymposiums on Computer and Computational Sciences - Volume 1 (IMSCCS06) Volume 01, IMSCCS 06. IEEE Computer Society, Washington, DC, USA, pp. 1721.
Svard, C., Nyberg, M., 2010. Residual Generators for Fault Diagnosis Using Computation
Sequences With Mixed Causality Applied to Automotive Systems. IEEE Transactions on
Systems, Man, and Cybernetics - Part A: Systems and Humans 40, 13101328.
248
Svrd, C., Nyberg, M., 2011. Automated Design of an FDI-System for the Wind Turbine
Benchmark. Presented at the Proceedings of the 18th IFAC World Congress, 2011,
Milano, Italy, pp. 83078315.
Takcs, I., 2008. Experiments in activated sludge modelling. PhD Thesis, Ghent University,
Belgium, pp 267.
Takcs, I., Patry, G.G., Nolasco, D., 1991. A dynamic model of the clarification-thickening
process. Water Research 25, 12631271.
Tang, H.-S., Xue, S.-T., Chen, R., Sato, T., 2006. Online weighted LS-SVM for hysteretic
structural system identification. Engineering Structures 28, 17281735.
Tang, W.H., Wu, Q.H., 2011. Condition monitoring and assessment of power transformers using
computational intelligence. Springer, London; New York.
Tang, X., Zhuang, L., Cai, J., Li, C., 2010. Multi-fault classification based on support vector
machine trained by chaos particle swarm optimization. Knowledge-Based Systems 23,
486490.
Tenenhaus, A., Giron, A., Viennet, E., Bra, M., Saporta, G., Fertil, B., 2007. Kernel logistic
PLS: A tool for supervised nonlinear dimensionality reduction and binary classification.
Computational Statistics & Data Analysis 51, 40834100.
Tharrault, Y., 2008. Diagnostic de fonctionnement par analyse en composantes principales:
application une station de traitement des eaux uses. Thse de Doctorat de lInstitut
National Polytechnique de Lorraine. Universit de Nancy, France.
Theilliol, D., Ponsart, J.-C., Harmand, J., Join, C., Gras, P., 2003. On-line estimation of
unmeasured inputs for anaerobic wastewater treatment processes. Control Engineering
Practice 11, 10071019.
Tomita, R.K., Park, S.W., Sotomayor, O.A.Z., 2002. Analysis of activated sludge process using
multivariate statistical toolsa PCA approach. Chemical Engineering Journal 90, 283
290.
Ttterman, S., Toivonen, H.T., 2009. Support vector method for identification of Wiener models.
Journal of Process Control 19, 11741181.
Valle, S., Li, W., Qin, S.J., 1999. Selection of the Number of Principal Components: The
Variance of the Reconstruction Error Criterion with a Comparison to Other Methods
. Industrial & Engineering Chemistry Research 38, 43894401.
Vanrolleghem, P.A., Lee, D.S., 2003. On-line monitoring equipment for wastewater treatment
processes: state of the art. Water Sci. Technol. 47, 134.
Vapnik, V.N., 1998. Statistical Learning Theory. John Wiley & Sons Inc.
249
Vapnik, V., 1999a. The Nature of Statistical Learning Theory, 2nd ed. Springer.
Vapnik, V.N., 1999b. An overview of statistical learning theory. IEEE Transactions on Neural
Networks 10, 988999.
Vapnik, V.N., 2000. The nature of statistical learning theory. Springer.
Varol, Y., Oztop, H.F., Avci, E., 2008. Estimation of thermal and flow fields due to natural
convection using support vector machines (SVM) in a porous cavity with discrete heat
sources. International Communications in Heat and Mass Transfer 35, 928936.
Venkatasubramanian, V., 2003. A review of process fault detection and diagnosis Part III:
Process history based methods. Computers & Chemical Engineering 27, 327346.
Venkatasubramanian, V., Rengaswamy, R., Kavuri, S.N., 2003. A review of process fault
detection and diagnosis: Part II: Qualitative models and search strategies. Computers &
Chemical Engineering 27, 313326.
Venkatasubramanian, V., Rengaswamy, R., Yin, K., Kavuri, S.N., 2003. A review of process
fault detection and diagnosis - Part I: Quantitative model-based methods. Computers and
Chemical Engineering 27, 293311.
Verron, S., 2007. Diagnostic et surveillance des processus complexes par rseaux baysiens
Thse doctorat, universit d'Angers, France.
Verron, S., Tiplica, T., Kobi, A., 2007. Procedure based on mutual information and bayesian
networks for the fault diagnosis of industrial systems. IEEE, pp. 420425.
Verucchi, C.J., Acosta, G.G., Benger, F.A., 2008. A review on fault diagnosis of induction
machines. Latin American applied research 38, 113121.
Waewsak, C., Nopharatana, A., Chaiprasert, P., 2010. Neural-fuzzy control system application
for monitoring process response and control of anaerobic hybrid reactor in wastewater
treatment and biogas production. Journal of Environmental Sciences 22, 18831890.
Wang, D., Zhang, Y., Zhao, Y., 2007. Support Vector Machines for Photometric Redshift
Estimation from Broadband Photometry - researchr publication bibtex. Data Science
Journal 6, 474480.
Wang, J., Yu, T., Jin, C., 2006. On-line Estimation of Biomass in Fermentation Process Using
Support Vector Machine. Chinese Journal of Chemical Engineering 14, 383388.
Wang, L., Mu, Z., Guo, H., 2006. Application of support vector machine in the prediction of
mechanical property of steel materials. Journal of University of Science and Technology
Beijing, Mineral, Metallurgy, Material 13, 512515.
250
Wang, L., Shi, H., 2010. Multivariate statistical process monitoring using an improved
independent component analysis. Chemical Engineering Research and Design 88, 403
414.
Wang, X., Du, Z., Chen, J., Pan, F., 2009. Dynamic Modeling of Biotechnical Process Based on
Online Support Vector Machine. Journal of Computers 4, 251-258.
Wang, X., Li, A., Jiang, Z., Feng, H., 2006. Missing value estimation for DNA microarray gene
expression data by Support Vector Regression imputation and orthogonal coding scheme.
BMC Bioinformatics 7:32.
Wei, X., Verhaegen, M., van Engelen, T., 2009. Sensor fault detection and isolation for wind
turbines based on subspace identification and Kalman filter techniques. International
Journal of Adaptive Control and Signal Processing 687707.
Wei, X., 2010. Sensor fault detection and isolation for wind turbines based on subspace
identification and Kalman filter techniques. International Journal of Adaptive Control and
Signal Processing 24, 687707.
Widodo, A., Yang, B.-S., 2007. Support vector machine in machine condition monitoring and
fault diagnosis. Mechanical Systems and Signal Processing 21, 25602574.
Widodo, A., Yang, B., 2008. Wavelet support vector machine for induction machine fault
diagnosis based on transient current signal. Expert Systems with Applications 35, 307
316.
Widodo, A., Kim, E.Y., Son, J.-D., Yang, B.-S., Tan, A.C.C., Gu, D.-S., Choi, B.-K., Mathew,
J., 2009. Fault diagnosis of low speed bearing based on relevance vector machine and
support vector machine. Expert Systems with Applications 36, 72527261.
Wimberger, D., Verde, C., 2008. Fault diagnosticability for an aerobic batch wastewater
treatment process. Control Engineering Practice 16, 13441353.
Wise, B.M., Gallagher, N.B., 1996. The process chemometrics approach to process monitoring
and fault detection. Journal of Process Control 6, 329348.
Witten, I.H., Frank, E., Hall, M.A., 2011. Data Mining: Practical Machine Learning Tools and
Techniques, Third Edition, 3rd ed. Morgan Kaufmann.
Wold, H., 1966. Estimation of Principal Components and Related Models by Iterative Least
squares, in: Multivariate Analysis. Academic Press, pp. 391420.
Wu, Q., 2010. Fault diagnosis model based on Gaussian support vector classifier machine.
Expert Systems with Applications 37, 62516256.
Xiang, X., Zhou, J., An, X., Peng, B., Yang, J., 2008. Fault diagnosis based on Walsh transform
and support vector machine. Mechanical Systems and Signal Processing 22, 16851693.
251
Xue, C.X., Zhang, R.S., Liu, H.X., Liu, M.C., Hu, Z.D., Fan, B.T., 2004. Support Vector
Machines-Based Quantitative Structure-Property Relationship for the Prediction of Heat
Capacity. Journal of Chemical Information and Modeling 44, 12671274.
Yang, B.-S., Widodo, A., 2008. Support Vector Machine for Machine Fault Diagnosis and
Prognosis. Journal of System Design and Dynamics 2, 1223.
Yang, W., Tavner, P.J., Wilkinson, M., 2008. Condition monitoring and fault diagnosis of a wind
turbine with a synchronous generator using wavelet transforms. IET Conference
Publications 2008, 610.
Yang, Y., 2005. Support vector machines for environmental informatics: application to
biological nitrogen removal in wastewater treatment plants. Theses and dissertations.
Yang, Y.H., 2006. Support Vector Machines for Environmental Informatics: Application to
Modelling the Nitrogen Removal Processes in Wastewater Treatment Systems. Journal of
Environmental Informatics 7, 1423.
Ylamos, I., Escudero, G., Graells, M., Puigjaner, L., 2006. Fault diagnosis based on support
vector machines and systematic comparison to existing approaches, in: 16th European
Symposium on Computer Aided Process Engineering and 9th International Symposium
on Process Systems Engineering. Elsevier, pp. 12091214.
Ylamos, I., Graells, M., Puigjaner, L., Escudero, G., 2007. Simultaneous fault diagnosis in
chemical plants using a multilabel approach. AIChE Journal 53, 28712884.
Ylamos, I., Escudero, G., Graells, M., Puigjaner, L., 2009. Performance assessment of a novel
fault diagnosis system based on support vector machines. Computers & Chemical
Engineering 33, 244255.
Yin, S., Ding, S.X., Zhang, P., 2011. Study on Modifications of PLS Approach for Process
Monitoring. Presented at the the 18th IFAC World Congress, Milano (Italy), pp. 12389
12394.
Yoo, C.K., Choi, S.W., Lee, I.-B., 2002. Dynamic Monitoring Method for Multiscale Fault
Detection and Diagnosis in MSPC. Industrial & Engineering Chemistry Research 41,
43034317.
Yoo, C.K., Vanrolleghem, P.A., Lee, I.-B., 2006. Fault detection, monitoring and diagnosis of
sequencing batch reactor for integrated wastewater treatment management system.
Environ. Eng. Res. 11, 1-14.
Yoo, C.K., Villez, K., Lee, I.B., Hulle, S.V., Vanrolleghem, P.A., 2006. Sensor validation and
reconciliation for a partial nitrification process. Water Science & Technology 53, 513
521.
252
Yoo, C.K., Villez, K., Van Hulle, S.W.H., Vanrolleghem, P.A., 2008. Enhanced process
monitoring for wastewater treatment systems. Environmetrics 19, 602617.
Yu, J., 2012. A nonlinear kernel Gaussian mixture model based inferential monitoring approach
for fault detection and diagnosis of chemical processes. Chemical Engineering Science
68, 506519.
Yu, Z., Fu, X., Li, Y., 2005. Online Support Vector Regression for System Identification, in:
Wang, L., Chen, K., Ong, Y.S. (Eds.), Advances in Natural Computation. Springer Berlin
Heidelberg, Berlin, Heidelberg, pp. 627630.
Yuan, S.-F., Chu, F.-L., 2006. Support vector machines-based fault diagnosis for turbo-pump
rotor. Mechanical Systems and Signal Processing 20, 939952.
Yuan, S., Chu, F., 2007. Fault diagnosis based on support vector machines with parameter
optimisation by artificial immunisation algorithm. Mechanical Systems and Signal
Processing 21, 13181330.
Zeng, G.M., Li, X.D., Jiang, R., Li, J.B., Huang, G.H., 2006. Fault Diagnosis of WWTP Based
on Improved Support Vector Machine. Environmental Engineering Science 23, 1044
1054.
Zhang, J., Sato, T., Iai, S., 2007. Novel support vector regression for structural system
identification. Structural Control and Health Monitoring 14, 609626.
Zhang, X., Hoo, K.A., 2011. Effective fault detection and isolation using bond graph-based
domain decomposition. Computers & Chemical Engineering 35, 132148.
Zhang, X., Zhang, Q., Zhao, S., Ferrari, R., Polycarpou, M.M., Parisini, T., 2011. Fault
Detection and Isolation of the Wind Turbine Benchmark: An Estimation-Based
Approach. Presented at the the 18th IFAC World Congress, Milano, Italy, pp. 8295
8300.
Zhang, Y., 2008. Fault Detection and Diagnosis of Nonlinear Processes Using Improved Kernel
Independent Component Analysis (KICA) and Support Vector Machine (SVM).
Industrial & Engineering Chemistry Research 47, 69616971.
Zhang, Y., Jiang, J., 2008. Bibliographical review on reconfigurable fault-tolerant control
systems. Annual Reviews in Control 32, 229252.
Zhang, Y., 2009. Enhanced statistical analysis of nonlinear processes using KPCA, KICA and
SVM. Chemical Engineering Science 64, 801811.
Zhou, D., Li, G., Qin, S.J., 2010. Total projection to latent structures for process monitoring.
AIChE Journal 56, 168178.
253
Zumoffen, D., Basualdo, M., 2008. Improvements in Fault Tolerance Characteristics for Large
Chemical Plants: 1. Waste Water Treatment Plant with Decentralized Control. Industrial
& Engineering Chemistry Research 47, 54645481.
254
Titre
Rsum Les systmes rels sont gnralement de nature non-linaire, et leurs modlisations et
surveillance restent une tche difficile accomplir. Nanmoins, avec les progrs technologiques
on dispose maintenant d'un atout de taille sur ces systmes qui est les donnes.
Ce travail prsente une technique de diagnostic de dfaut et de modlisation base en grande
partie sur la mthode d'apprentissage automatique Les Machines Vecteurs de Support,
SVM qui est base sur les donnes. La mthodologie propose est applique diffrentes
systmes multivariables et non linaires, savoir : un procd de traitement des eaux uses, un
systme olien et un racteur chimique parfaitement agit.
L'objectif de cette thse de doctorat est d'examiner la possibilit d'extraire le maximum
d'information partir de donnes afin de surveiller efficacement le comportement de systmes
rels et de dtecter rapidement tout dfaut qui peut compromettre leur bon fonctionnement. La
mme mthode est utilise pour la modlisation des diffrents systmes. Plusieurs dfis ont t
relevs tels que la complexit du comportement des systmes, le grand nombre de mesures
variant diffrentes chelles de temps, la prsence de bruit et les perturbations. Une mthode
gnrique de diagnostic de dfauts est propose par la gnration des caractristiques de chaque
dfaut suivie dune tape d'valuation de ces caractristiques avec une amlioration du transfert
de connaissances en modlisation.
Dans cette thse ont a dmontr l'utilit de l'outil Machines Vecteurs de Support, en
classification par la construction de modles de dcision SVM ddis l'valuation des
caractristiques de dfaut, et aussi en tant qu'estimateur non linaire/ou pour la modlisation par
l'utilisation des machines vecteurs de support ddis pour la rgression (SVR).
La combinaison de SVM et dune mthode base sur le modle "observateur" a t aussi tudie
et a t ncessaire dans certains cas pour garantir un bon diagnostic de dfauts.
Mots-cls : Diagnostic de dfauts, Machines Vecteurs de Supports, Apprentissage
automatique, Modlisation, identification paramtrique, Systmes multivariables non linaires,
Observateur d'tat, Procd de traitement des eaux uses, oliennes, Racteur chimique
parfaitement agit.
255
Title
Abstract Real systems are usually nonlinear and their modeling and monitoring remains a
difficult task. However, with advances in technology and the availability of big amounts of data,
we have a facility to operate these systems.
This work presents a methodology for fault diagnosis and modeling which is in large part based
on the method of Support Vector Machines (SVM) which data-based. The proposed
methodology is applied to various nonlinear multivariable systems including: wastewater
treatment processes, wind turbines and stirred tank reactors.
The objective of this PhD is to examine the possibility of extracting the maximum of information
from data to effectively monitor the behavior of real systems and rapidly detect any faults which
may impair their proper functioning. The same method is used for modeling the different
systems. Several challenges were identified and surmounted such as the complexity of the
system behavior, large amount of data varying at different time scales, the presence of noise and
disturbances. A generic method of fault diagnosis is proposed for the generation of the fault
characteristics followed by an evaluation of these characteristics as well as an improved transfer
of knowledge in modeling.
In this thesis the usefulness of the tool Support Vector Machines in Classification has been
demonstrated by the construction of decision models dedicated to evaluating the characteristics
of faults, and also its usefulness for modeling/ or as estimator for the nonlinear systems using
support vector machines dedicated for regression (SVR).
The combination of SVM and a method based on models observer was also considered and
was found to be interesting in some cases to ensure proper fault diagnosis.
Keywords: Fault diagnosis, Support Vector Machines, Machine learning, Modeling, System
identification, Multivariable nonlinear systems, Observers, Wastewater treatment process, Wind
Turbine, Stirred tank reactor.
256