Vous êtes sur la page 1sur 43

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/333148918

Oral Probatoire Wael JABER - Detection et diagnostic des defaillances des


procedes chimiques a l'aide des reseaux neuronaux artificiels v2.0

Technical Report · May 2018


DOI: 10.13140/RG.2.2.24623.38567

CITATIONS READS

0 270

1 author:

Wael Jaber
Conservatoire National des Arts et Métiers
1 PUBLICATION   0 CITATIONS   

SEE PROFILE

Some of the authors of this publication are also working on these related projects:

Fault detection and diagnosis of chemical processes using artificial neural networks View project

All content following this page was uploaded by Wael Jaber on 16 May 2019.

The user has requested enhancement of the downloaded file.


RAPPORT

Présenté en vue d’obtenir


L’ÉXAMEN PROBATOIRE
En
GÉNIE DES PROCÉDÉS

Par
Wael JABER

Détection et diagnostic des défaillances des procédés chimiques à


l’aide des réseaux neuronaux artificiels.
CONSERVATOIRE NATIONAL DES ARTS ET DES METIERS

CENTRE REGIONAL DE BEYROUTH

RAPPORT

Présenté en vue d’obtenir


L’ÉXAMEN PROBATOIRE
En
GÉNIE DES PROCÉDÉS

Par
Wael JABER

Détection et diagnostic des défaillances des procédés chimiques à


l’aide des réseaux neuronaux artificiels.
Sommaire

i. Liste des figures....................................................................................................................................................................... i


ii. Liste des Tableaux .................................................................................................................................................................. ii
iii. Abréviations ...........................................................................................................................................................................iii

Introduction .................................................................................................................................................... 1

1 Méthodes d’apprentissage automatique ................................................................................................ 2


1.1 Types d’apprentissage ....................................................................................................................................................... 2
1.2 Réseaux neuronaux artificiels (RNA) ................................................................................................................................. 4
1.2.1 Types de RNAs ............................................................................................................................................................... 4
1.2.2 Fonctionnement mathématique d’un RNA ................................................................................................................... 5
1.2.3 Apprentissage des RNA ................................................................................................................................................. 7
1.2.4 Fonctionnement des RNRs .......................................................................................................................................... 10
1.3 Prétraitement des données ............................................................................................................................................. 11
1.4 Critères de sélection des architectures des RNA .............................................................................................................. 12

2 Détection et diagnostique des défaillances ........................................................................................... 14


2.1 Méthodes de détection des défaillances basées sur les données et les signaux ............................................................. 15
2.1.1 La méthode d’analyse en composantes principales (PCA) .......................................................................................... 15
2.1.2 La méthode d’analyse spectrale ................................................................................................................................. 15
2.1.3 Reconnaissance des formes à l’aide d’un RNA............................................................................................................ 15
2.2 Méthodes basées sur un modèle du processus ................................................................................................................ 16
2.3 Méthodes basées sur les systèmes experts ..................................................................................................................... 16

3 Études de cas ........................................................................................................................................ 17


3.1 Diagnostique des défaillances dans le cas d’un régime permanent non contrôlé ........................................................... 17
3.1.1 Principe et méthodologie ............................................................................................................................................ 17
3.1.2 Echantillonnage ........................................................................................................................................................... 18
3.1.3 Choix du modèle ......................................................................................................................................................... 19
3.1.4 Résultats et discussion ................................................................................................................................................ 20
3.2 Détection des défaillances dans le cas d’un régime dynamique contrôlé ....................................................................... 21
3.2.1 Principe et méthodologie ............................................................................................................................................ 21
3.2.2 Echantillonnage ........................................................................................................................................................... 22
3.2.3 Choix du modèle ......................................................................................................................................................... 23
3.2.4 Résultats et discussion ................................................................................................................................................ 24
3.3 Détection des défaillances par reconnaissance des signaux ........................................................................................... 25
3.3.1 Principe et méthodologie ............................................................................................................................................ 25
3.3.2 Echantillonnage ........................................................................................................................................................... 26
3.3.3 Choix du modèle ......................................................................................................................................................... 26
3.3.4 Résultats et discussion ................................................................................................................................................ 27

Conclusion ..................................................................................................................................................... 28
i. Liste des figures

FIGURE 1: TAXONOMIE DES METHODES D'APPRENTISSAGE AUTOMATIQUE .......................................................................................................... 2


FIGURE 2: ILLUSTRATION DU COMPORTEMENT DE CHAQUE METHODE POUR UNE MEME BASE DE DONNEES................................................................ 2
FIGURE 3: ALGORITHME DES METHODES D’APPRENTISSAGE PAR RENFORCEMENT ................................................................................................. 3
FIGURE 4: ALGORITHME D'APPRENTISSAGE DE RENFORCEMENT PROFOND (DRL) ................................................................................................. 3
FIGURE 5: SCHEMA REPRESENTATIF D’UN NEURONE ET D’UN PERCEPTRON .......................................................................................................... 4
FIGURE 6: SCHEMA REPRESENTATIF D'RNA .................................................................................................................................................. 4
FIGURE 7: TAXONOMIES DES RNA .............................................................................................................................................................. 4
FIGURE 8: EXEMPLE RNA .......................................................................................................................................................................... 5
FIGURE 9: METHODE DU GRADIENT CONJUGUE POUR UN SEUL POIDS « W » (RASCHKA, 2015) .............................................................................. 7
FIGURE 10: GRAPHE TRIDIMENSIONNEL D'UNE FONCTION DE COUT ................................................................................................................... 9
FIGURE 11: COMPARAISON ENTRE VALEURS DES TAUX D'APPRENTISSAGE (RASCHKA, 2015) ................................................................................... 9
FIGURE 12: ARCHITECTURE D'UN RESEAU RNR (RNN) ................................................................................................................................. 10
FIGURE 13: PERFORMANCE PID VS. NNMPC (OTERO, 1998) ...................................................................................................................... 10
FIGURE 14: METHODE ANALYSE EN COMPOSANTES PRINCIPALES (PCA) (POWELL, 2015) .................................................................................. 11
FIGURE 15: EXEMPLE DE SURAPPRENTISSAGE ET DE SOUS-APPRENTISSAGE ........................................................................................................ 12
FIGURE 16: NIVEAUX D'ABSTRACTION VS. NOMBRE DES COUCHES MASQUEES ................................................................................................... 13
FIGURE 17: DETECTION DES DEFAILLANCES A L'AIDE DE LA METHODE PCA (MILJKOVIC, 2011) ............................................................................. 15
FIGURE 18: GENERATION DES RESIDUELLES EN LIGNE (KÖPPEN-SELIGER, FRANK, 1996) (PATAN, 2008, P. 163) .................................................... 16
FIGURE 19: FONCTIONNEMENT D'UNE METHODE BASEE SUR UN MODELE (MILJKOVIC, 2011) .............................................................................. 16
FIGURE 20: DIAGRAMME D’OPERATIONS DISTILLATION FLASH D'ETHANOL ......................................................................................................... 17
FIGURE 21: VARIABLES CIBLES (Y) ............................................................................................................................................................. 18
FIGURE 22: VARIABLES EN ENTREE (X) ....................................................................................................................................................... 18
FIGURE 23: DIAGRAMME DU RNA UTILISE POUR LE DIAGNOSTIC (3, 16, 16, 3) ................................................................................................ 19
FIGURE 24: ECARTS ENTRE VALEURS REELLES ET VALEURS PREDITES AVEC LA PRECISION DU MODELE ....................................................................... 20
FIGURE 25: PREDICTIONS DU MODELE RNA ................................................................................................................................................ 20
FIGURE 26: DIAGRAMME DU PROCEDE DYNAMIQUE ..................................................................................................................................... 21
FIGURE 27: DONNEES DYNAMIQUES NORMALES ET DEFAILLANTES ................................................................................................................... 22
FIGURE 28: DONNEES DYNAMIQUES INJECTEES DANS LE RNA ........................................................................................................................ 22
FIGURE 29: TOPOLOGIE RNA EN REGIME DYNAMIQUE .................................................................................................................................. 23
FIGURE 30: PREDICTIONS DU RNA DE DETECTION DES DEFAILLANCES EN REGIME DYNAMIQUE .............................................................................. 24
FIGURE 31: GRAPHE D'APPRENTISSAGE ET DE VALIDATION DU MODELE ............................................................................................................ 24
FIGURE 32: ARCHITECTURE D'UN AUTO-ENCODEUR (AE) .............................................................................................................................. 25
FIGURE 33: DONNEES UTILISEES DANS LE MODELE AE ................................................................................................................................... 26
FIGURE 34: TOPOLOGIE DE L'AUTO-ENCODEUR UTILISE POUR LA DETECTION DES DEFAILLANCES............................................................................. 26
FIGURE 35: RESULTATS ISSUS DU MODELE AE POUR LE DEBIT ......................................................................................................................... 27
FIGURE 36: RESULTATS ISSUS DU MODELE AE POUR LA TEMPERATURE ............................................................................................................. 27

Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
ii. Liste des Tableaux

TABLEAU 1: ENTROPIES DES DONNEES CIBLES (Y) ............................................................................................................. 20


TABLEAU 2: HYPER-PARAMETRES RNA DETECTION DE DEFAILLANCE (ETAT DYNAMIQUE) ......................................................... 23
TABLEAU 3: HYPER-PARAMETRES AE ............................................................................................................................. 26

ii

Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
iii. Abréviations

IA: Intelligence Artificielle

PID: Proportionnel - Intégral – Dérivative

AA: Apprentissage Automatique

ANN: Artificial Neural Network

RNA: Réseau Neuronal Artificiel

DNN: Deep Neural Nework

RNP: Réseaux Neuronaux profonds

DRL: Deep Reinforcement Learning

ARP: Apprentissage par Renforcement Profond

RNN: Recurrent Neural Network

RNR: Réseau de Neurones Récurrents

SGD: Stochastic Gradient Descent

PCA: Principal Component Analaysis

NNMPC: Neural Network Model Predictive Control

FFT: Fast Fourrier Transform

TPOT: Tree-based Pipeline Optimization Tool

AE: Auto-Encoders

EQM: Erreur quadratique moyenne

iii

Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
Introduction

De nos jours, les recherches sur l’intelligence artificielle ont repris de la vigueur et ont
propulsé cette technologie dans de nombreuses applications modernes allant de l’imagerie
médicale aux voitures autonomes. Néanmoins, il existe des domaines scientifiques où cette
technologie peut encore apporter des contributions significatives. Parmi ces domaines figure celui
du génie chimique où les approches traditionnelles de résolution des problèmes ont souvent leurs
limites. Un bon exemple est la modélisation des systèmes hautement complexes et non linéaires
telles que les opérations de distillation (Himmelblau, 2000).
L’apprentissage automatique, couramment connu sous le nom de ‘Machine Learning’,
représente un champ d’étude de l’intelligence artificielle, cette dernière étant une discipline
relativement récente, née à l’issu de la conférence de Dartmouth en 1956 organisé par Minsky et
McCarthy. L’idée de machines intelligentes a été d’abord proposée en 1950 par Alan Turing dans
son célèbre article ‘Computing Machinery And Intelligence’, dans lequel il proposa une approche
imitative qu’il appela ‘the imitation game’.(Turing, 1950).

En 1958, inspiré par les travaux de McCulloch et Pitts sur le système visuel des grenouilles, Frank
Rosenblatt conçu le perceptron. Ce dernier est composé d’éléments ayant des entrées multipliées
par des poids et une sortie qui n’est autre que la somme des entrées pondérées.

Cependant, il a fallu attendre jusqu’aux années 1980 pour que l’IA arrive à maturité avec la
publication de plusieurs travaux sur différents types de réseaux neuronaux et leur application sous
forme de systèmes experts conçus pour avoir un rôle consultatif en industrie (Nilsson, 2009).
L’une des percées majeures dans le domaine fut l’application de la rétro-propagation, une
méthode facilitant le calcul du gradient d’erreur pour chaque neurone dans un réseau, ainsi
permettant au réseau d’apprendre (LeCun, 1985).

Dans ce qui suit, on propose de traiter le problème de détection et du diagnostic des


défaillances d’un procédé chimique à l’aide des techniques d’IA. Le but est de démontrer qu’une
telle approche se qualifie par sa versatilité et sa rapidité, sachant que les usines chimiques
modernes sont très complexes et que les méthodes classiques de contrôle des procédés
s’appuient majoritairement sur les contrôleurs PID qui maintiennent un régime opératoire
satisfaisant en compensant les effets des perturbations.

Toutefois, il existe des changements qu’un contrôleur classique n’est pas capable de gérer
convenablement. Ces changements constituent des déviations irrégulières d’une ou de plusieurs
propriétés caractéristiques du système. La cavitation hydraulique, l’empoisonnement des
catalyseurs et l’encrassement des échangeurs de chaleur sont quelques exemples de
changements de paramètres qui pourraient se manifester (Russell et al. 2012).

La détection et le diagnostic précoces et précis des défaillances de ces usines pourront


réduire les temps d'arrêt, augmenter la sécurité des opérations et diminuer les coûts de
fabrication.

1
Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
1 Méthodes d’apprentissage automatique

L’apprentissage automatique est essentiellement une manière de construire des algorithmes


ayant le pouvoir d’apprendre et de s’améliorer avec l’expérience. Ce champ s’appuie sur des
concepts de plusieurs domaines tels que la statistique, la biologie et la théorie de l’information
pour en nommer quelques-uns. Cette diversité de sources de base rend ces méthodes un outil
puissant qui s’adapte aux différents types de bases de données qu’elles soient des images,
d’ondes ou de simples entrées binaires. (Mitchell, 1997, p. 1-12)

1.1 Types d’apprentissage

Les méthodes d’apprentissage les plus courants sont classées selon les données qu’on leur
fournit. Une base de données qui contient des variables d’entrée et des valeurs ‘cibles’
nécessitera une méthode supervisée, c’est trivialement appelé une régression qui apprend des
exemples dits ‘étiquetés’. Alors que, si on introduit une base de données, sans ‘étiquettes’, dans le
but de la démêler ou la partitionner, on a recours à une méthode non supervisée.

Figure 1: Taxonomie des méthodes d'apprentissage automatique

On trouve qu’il est important de différencier la classification, qui est une méthode supervisée,
du partitionnement couramment appelé ‘clustering’, qui a son tour est une méthode non
supervisée et par conséquence ne nécessitant pas que les données soient étiquetées.

Figure 2: Illustration du comportement de chaque méthode pour une même base de données

2
Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
Il existe d’autres méthodes considérées comme étant faiblement supervisées, notamment celle
de l’apprentissage par renforcement ‘Q-Learning’ basée sur un processus Markovien où un agent
logiciel évolue de manière stochastique et adopte un comportement idéal face à ‘son
environnement’ dans le but de maximiser une fonction de performance aussi appelée fonction de
récompense. (Mavrovouniotis, 1990, p. 138).

Figure 3: Algorithme des méthodes d’apprentissage par renforcement

On trouve que cette méthode est souvent utilisée pour pousser un logiciel à apprendre les
actions nécessaires, afin de jouer en position d’adversaire face aux humains. Ce type de
méthode, couplé à des réseaux d’apprentissage profond, est de plus en plus appliqué dans le
domaine de contrôle des procédés (Spielberg et al., 2017) .

Figure 4: Algorithme d'apprentissage de renforcement profond (DRL)

Quant à la détection des défaillances, on trouve que les modèles à base des réseaux
neuronaux artificiels (RNA) sont les plus employés en raison de leur pouvoir de traiter des
données de nature quantitative aussi bien que qualitative. En outre, elles peuvent accueillir les
natures incertaines, non stationnaires et non linéaires des procédés chimiques typiques (Hoskins,
Himmelblau, 1990).

3
Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
1.2 Réseaux neuronaux artificiels (RNA)

Les RNA s’inspirent du système nerveux biologique, de sorte qu’ils sont composés de
plusieurs unités de traitement de signales comparables aux neurones.

Figure 5: Schéma représentatif d’un neurone et d’un perceptron

Figure 6: Schéma représentatif d'RNA

1.2.1 Types de RNAs

Plusieurs types de RNA ont été conçus, souvent pour combler un manque dont
souffrait le modèle précédent. Par exemple, certains types de RNA ne pouvaient pas
exprimer la complexité des données cibles, donc il a fallu incorporer plus de couches
cachées, ainsi on a abouti aux RNA multi couches ou (MLP). Cependant, les RNA de types
(MLP) ne se souvenaient pas des données dépendantes du temps, donc il a fallu introduire
les RNA récurrentes (RNR) «Recurrent Neural Networks» qui gardent une mémoire des
données qu’elles ont ‘vues’.

Figure 7: Taxonomies des RNA


4
Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
1.2.2 Fonctionnement mathématique d’un RNA
Soit une série de données (x, y), tel que :

On introduit cette série au RNA ayant la topologie (2, 3, 1), 2 nœuds d’entrée, 3 nœuds
dans la couche masquée et 1 nœud de sortie.

Figure 8: Exemple RNA

Les opérations matricielles qui vont se dérouler à l’intérieur du RNA et qui constituent
l’aspect ‘feed-forward’ qui va avancer les datas tout au long du réseau :

Les matrices des poids et des biais de la première couche :

5
Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
L’application de la fonction d’activation f de la couche masquée, qui sert à appliquer un
seuil binaire ou transformer la sortie de chaque nœud en une probabilité, qui est le cas de la
fonction logistique sigmoïde :

On obtient :

Les matrices des poids et des biais de la deuxième couche :

Les dimensions des matrices seront les suivantes :

On remarque que la sortie finale a(3) possède la même forme que la matrice des cibles « y », cela
est le résultat d’avoir un seul nœud en sortie, puisqu’on essaie de prédire une seule
caractéristique.
6
Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
1.2.3 Apprentissage des RNA
Afin d’apprendre, on doit pouvoir quantifier l’écart entre chaque exemple des données
cibles et la prédiction qu’a fait le réseau.
Soit la fonction J, appelée fonction du coût, qui va calculer l’erreur quadratique moyenne (EQM) :

On veut, qu’à chaque fois que l’algorithme d’apprentissage évalue l’erreur, qu’il fait varier
les poids w(1) et w(2) de façon à diminuer l’écart « J ». Cela se fait par la technique de retro-
propagation de l’erreur, connue son le nom « back-propagation » couplée à une méthode
d’optimisation, la méthode du gradient conjugué « Gradient Descent ».

Pratiquement, ce que le modèle va faire, c’est calculer la pente de la fonction « J », qui est
convexe « la plupart du temps », et ajuster les poids de manière à diminuer sa valeur, ainsi
diminuant l’écart.

Figure 9: Méthode du gradient conjugué pour un seul poids « w » (raschka, 2015)

On sait que :

Donc :

7
Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
On calcule le gradient de J par rapport aux variables que le modèle peut changer pour apprendre,
w(1), w(2), b(1) et b(2), en utilisant la dérivation en chaîne :
On obtient :

Afin de simplifier les calculs, on ajoutera la sommation en fin.


Sachant que, si on utilise la fonction logistique sigmoïde comme fonction d’activation :

Alors :

Puisque Z(2) est un produit d’une multiplication matricielle :

De la même façon on trouve :

8
Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
Il reste de spécifier une constante d’apprentissage « k » qui multiplia les gradients afin de
contrôler le taux d’apprentissage et actualiser les poids et les biais à chaque itération :

Jusqu’à ce que :

Les équations qu’on vient d’établir sont relativement ‘simples’, puisqu’on a à faire avec une
seule couche masquée composée de 3 nœuds. Ce qui résulte de cette topologie qui contient 4
paramètres (w(1), w(2), b(1) et b(2)) est appelé hyperplan existant dans un espace multi dimensionnel
On a remarqué que les gradients ont tous des signes négatifs indiquant que le modèle a pour but
de trouver le minimum global dans cet hyperplan.

Figure 10: Graphe tridimensionnel d'une fonction de coût

Parfois, un taux d’apprentissage trop petit peut faire en sorte que le modèle reste coincé
dans un minimum local. Par contre, un taux trop grand risquera de faire ‘glisser’ le modèle à
l’extérieur d’un minimum global. Une manière de contourner ces problèmes est d’itérer sur les
exemples au hasard, c’est la méthode d’optimisation du gradient conjugué stochastique (SGD).
(Mitchell, 1997, p. 104, 105)

Figure 11: Comparaison entre valeurs des taux d'apprentissage (raschka, 2015)

9
Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
1.2.4 Fonctionnement des RNRs
Les équations que génèrent les RNNs sont presque les mêmes que celles des RNAs, sauf
que les RNNs possèdent une matrice inter-synaptique (une matrice poids-poids). Cette dernière
est à l’origine de leur propriété de mémorisation, puisqu’elle capture les paramètres
chronologiquement communs entre les données en entrée.

Figure 12: Architecture d'un réseau RNR (RNN)

Une excellente application pour cette méthode est le contrôle prédictif d’un procède, où un
réseau de ce type peut surpasser la performance d’un contrôleur PID (Otero, 1998).

Figure 13: Performance PID vs. NNMPC (Otero, 1998)


10
Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
1.3 Prétraitement des données

Entrainer un réseau neuronal demande un nombre important de données, dépassant parfois


les centaines de milliers de points de data. Alors, il est judicieux de s’assurer que les prédictions
sont proches des valeurs réelles. Cette étape est celle de la validation.

Les datas sont d’abord normalisées et centrées (µ = 0 ; σ2 = 1) afin de rendre la plage des
valeurs plus homogène et par conséquent plus faciles à manipuler à l’intérieur du modèle.
Ensuite, elles sont divisées en un groupe d’entrainement et un groupe de validation souvent selon
un ratio de 70/30 respectivement.

Dans le cas où le modèle qu’on essaie de construire ne représente pas un processus


dépendant du temps, (les entrées ne sont pas chronologiques), le fait de mélanger les données
avant l’entrainement, aidera à éliminer les corrélations parasites préétablies qui peuvent à leur
tour influencer l’espace de recherche d’un minimum de la fonction du coût et par suite restreindre
le modèle.

Une méthode qu’on utilise pour réduire le nombre de variables en entrée et en même temps
« résumer » les relations entre celles-ci, est l’analyse en composantes principales (PCA). Cette
approche permet de réduire la dimension de recherche d’un optimum et ainsi accélère
l’entrainement du modèle. Simplement dit, la méthode PCA est principalement une transformation
orthogonale dans le sens qui maximise la variance et rend les données claires tout en les
comprimant d’une dimension ℝn a une dimension ℝk, tel que k < n.

Il est important de mentionner que la méthode PCA peut, par elle-même, être utilisée comme
une méthode d’apprentissage non-supervisée puisqu’elle partitionne les données selon leur
degré de variance.

Figure 14: Méthode Analyse en Composantes Principales (PCA) (Powell, 2015)

Il existe d’autres méthodes de prétraitement, presque toutes sont déjà inclues dans ce qu’on
appelle des « Frameworks » telles que « Scikit Learn », « TensorFlow » et « Theano » juste pour
nommer quelques-unes. Il suffit de les invoquer en quelques lignes de code et de les appliquer
facilement à la base des données.

11
Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
1.4 Critères de sélection des architectures des RNA

Certains critères pour la sélection d’un modèle de RNA doivent être mis en place afin de tirer
le plus de leur pouvoir prédictif et maximiser leur efficacité algorithmique.

Tout d’abord, il faut admettre que la nature des données et l’objectif du modèle sont les
critères les plus déterminants. Par exemple, si on veut prédire la rugosité dans des tubes en acier
à une certaine date, il faut construire un RNA capable de garder une mémoire des rugosités
antérieures. Un tel type de RNA est appelé récurrent (RNR).
Pour des données chronologiques plus complexes un modèle plus rigoureux des RNRs est
recommandé, c’est le modèle LSTM « Long Short Term Memory ». L’avantage majeur des
LSTMs est le fait qu’elles sont capables de surmonter le problème du gradient fuyant (qui
s’amenuise) dont en souffrent typiquement les RNR ordinaires.

Toutefois, en choisissant un modèle de RNA, il faut garder en esprit qu’il y a des compromis
entre les modèles simples et complexes en matière de performance et de rapidité. Les modèles
simples, avec peu de paramètres ou de degrés de liberté, sont généralement plus faciles à
calculer, mais peuvent conduire à de faibles prédictions, c'est-à-dire, ils sont censés de sous-
apprendre les données «under-fitting». En outre, des modèles complexes peuvent fournir des
prédictions plus précises, mais risquent d’être coûteuses en termes d’efficacité algorithmique tout
en augmentant le risque de sur-apprendre les données «overfitting».

Figure 15: Exemple de surapprentissage et de sous-apprentissage

Afin de réduire la probabilité de surapprentissage, on peut soit :

 Avoir un nombre important d’exemples d’apprentissage.

 Enlever, au hasard des nœuds de notre réseau pour qu’ils ne sur-apprennent pas,
une technique connue comme «drop out »

 Ajouter un terme de régularisation (terme de pénalisation) appelé L2 à la fonction du


coût : J = J0 + Σw2. Ce qui va forcer l’algorithme à préférer d’apprendre les poids de
faibles valeurs, sauf s’ils contribuent énormément à l’amélioration de l’apprentissage.

La complexité des RNA est principalement mesurée par le nombre de couches masquées
et le nombre de nœuds dans chacune d’elles, ici on parle de topologie plutôt que d’architecture.
En fait, la question de comment choisir la meilleure topologie reste sans réponse définitive.

12
Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
Néanmoins, les chercheurs ont établi quelques règles générales qui doivent être appliquées avec
précaution. On cite quelques-unes:

 Pour l'apprentissage supervisé, une règle de base est que l'on devrait avoir au moins
dix fois le nombre d'observations (exemples) que le nombre de paramètres (poids et
biais) dans son modèle. (Abu-Mostafa et al. 2012)

 Une bonne pratique consiste à suivre le principe lex parsimoniae, c'est-à-dire à


commencer par un modèle simple et à augmenter sa complexité si nécessaire.
(Chakraborty, Joseph, 2017)

 Une seule couche masquée est suffisante pour la grande majorité des problèmes.
(Dans les problèmes de traitement d’images, on a trouvé que chaque couche
masquée apprend un aspect des détails présents dans la base des données, qu’on
appelle des niveaux d’abstraction). Donc, le nombre de couches masquées est
directement proportionnel à la ‘complexité du problème’.

Figure 16: Niveaux d'abstraction vs. Nombre des couches masquées

 On peut prendre comme point de départ, le nombre de neurones dans la couche


masquée Nh suivant :

Nh = Ni + NO + 2
Ni : nombre de nœuds en entrée
No : nombre de nœuds en sortie

Ensuite on augmente Nh jusqu’à ce que la fonction du coût cesse de diminuer et


arrive à un plateau.

13
Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
2 Détection et diagnostique des défaillances

Un objectif clé dans l'usine industrielle moderne est de maintenir un fonctionnement continu et
de produire des résultats répondant aux spécifications souhaitées. Au cours des dernières
décennies, les procédés complexes sont devenus de plus en plus instrumentés produisant ainsi
une grande quantité de données facilement disponibles. Une fois stockées, ces données ont
permis le développement d'applications de haut niveau telles que le contrôle et l'optimisation ainsi
que la détection et le diagnostic prédictif.

Les avancées majeures dans ce domaine ont conduit les experts à encourager la conception
de logiciels de gestion des défaillances et de dégradation, dès le début de la phase de conception
d'un processus (Malin et al., 1990).

Une défaillance est définie comme l’inaptitude d’un ensemble à accomplir ses fonctions
requises avec les performances définies dans les spécifications techniques. Le diagnostic de cette
dernière est la recherche de sa cause probable à l’aide d’un raisonnement logique formé par un
ensemble d’informations provenant d’une inspection.

Le problème du diagnostic consiste avant tout à résoudre le problème inverse de la relation


“cause à effet” connaissant principalement l’effet par ses symptômes observables (AL ANI, 2006).
La relation cause à effet étant définie par : Y = F (X)

Où Y représente les symptômes d’une défaillance qui se manifestent par une chute de
température, de pression ou de concentration.

X représente les causes de la défaillance, par exemple, un encrassement des tubes d’un
échangeur de chaleur, cavitation des pompes ou empoisonnement du catalyseur dans un
réacteur.
Une solution triviale pour le problème du diagnostic est : X = F-1 (Y)

Mais F-1 n’est pas facile à résoudre par des méthodes conventionnelles pour les raisons
suivantes :
 F est une fonction très complexe, puisque les procédés chimiques sont de nature non
linéaire.
 La multiplicité des solutions de X dans Y. (une cause peut avoir plusieurs symptômes)
 Une grande probabilité de présence des bruits dans les données expérimentales.

C’est pour les raisons susmentionnées qu’on choisira d’étudier l’application des RNAs en
tant qu’outil de diagnostic et de détection des défaillances, puisqu’elles sont adaptées à s’attaquer
à des problèmes complexes, non linéaires et bruitées.
14
Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
2.1 Méthodes de détection des défaillances basées sur les données et les signaux

Ces méthodes utilisent les données historiques collectées du processus réel (non-modélisé).
Parmi ces méthodes, on trouve :

2.1.1 La méthode d’analyse en composantes principales (PCA)


Son avantage est qu’elle regroupe plusieurs variables en une seule série de valeurs
expérimentales, qu’on peut par la suite comparer à la série des valeurs prises sous conditions
opératoires normales et par la suite déceler les défaillances.

Figure 17: Détection des défaillances à l'aide de la méthode PCA (Miljković, 2011)

2.1.2 La méthode d’analyse spectrale


Cette méthode consiste à utiliser la transformation de Fourrier rapide (FFT) pour analyser les
fréquences des amplitudes d’un signal. Dans notre cas, ce signal peut être la variation de la
température dans un procédé. Ensuite, un logiciel va analyser le profil des fréquences générées
par le procédé dans le but de déceler celles qui sont considérées comme des signatures de
défaillances.

2.1.3 Reconnaissance des formes à l’aide d’un RNA


Applicable directement en ligne avec le procédé, dans un premier lieu, le RNA apprendra le
déroulement normal (sans défaillance).

Ensuite, le RNA sera branché au procédé, dans lequel on va intentionnellement induire des
défaillances, afin de générer ce qu’on appelle des données résiduelles (différence entre valeurs
prédites dans l’état normal et celles prédites dans le cas de défaillances) qui seront utilisées pour
entraîner le modèle. (Voir partie 3.3)

En fin, le RNA sera branché en ligne, en mode de surveillance où il comparera les données
résiduelles obtenues en temps réel (qui peuvent indiquer des défaillances) avec celles qu’il a déjà
stockées (ne contenant pas de défaillances).

15
Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
Figure 18: Génération des résiduelles en ligne (Köppen-Seliger, Frank, 1996) (Patan, 2008, p. 163)

2.2 Méthodes basées sur un modèle du processus

Ces méthodes se basent sur la comparaison des données réelles obtenues de la


surveillance d’un procédé avec les données issues d’un modèle mathématique ou d’une
simulation. Cette approche est semblable à celle de la reconnaissance de formes par les RNAs, la
seule différence est qu’on a besoin de valider le modèle (ou la simulation) avant de l’utiliser. (Voir
Ahmed, 2016)

Figure 19: Fonctionnement d'une méthode basée sur un modèle (Miljković, 2011)

2.3 Méthodes basées sur les systèmes experts

Les systèmes experts sont principalement basés sur des règles fixées par des spécialistes
dans le domaine, tel que les ingénieurs ou les opérateurs. Simplement dit, cette méthode sera
applicable en utilisant un PLC avec des règles programmées en langage Ladder.

Néanmoins, cette approche offre la simplicité et l’efficacité, quand elle est appliquée a des
procédés relativement simples. Parmi ses avantages, c’est que les règles sur lesquelles elle est
fondée, peuvent être ajoutées ou enlevées aisément.

Le majeur désavantage est qu’elle n’est pas généralisable et qu’elle n’apprend pas de ses
erreurs, ce qui force à ce que sa maintenance soit périodique et couteuse.
16
Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
3 Études de cas

Dans cette partie, on va examiner trois applications des techniques d’apprentissage


automatique que nous pensons être d'une grande importance dans le domaine du contrôle des
procédés.

Toutefois, il faut attirer l'attention sur le fait que malgré les efforts pour générer des données
aussi réalistes que possibles à l’aide du simulateur des procédés Aspen Hysys©, il reste que les
réseaux neuronaux sont extrêmement sensibles aux fluctuations et aux bruits , et par conséquent
peuvent agir différemment lors de leur application sur le champ. A ce titre, les études de cas
suivants sont à considérer comme preuve de concept.

3.1 Diagnostique des défaillances dans le cas d’un régime permanent non contrôlé

Cette méthode fut l’une des premières méthodes d’IA appliquées dans la détection et le
diagnostic des défaillances appliquées au domaine des procédés chimiques. Elle se qualifie par
sa simplicité et sa facilité à mettre en place. Son but est de quantifier la détérioration de certaines
opérations.

3.1.1 Principe et méthodologie


En premier lieu, on conçoit un procédé avec l’intention d’y incorporer 3 opérations unitaires
susceptibles de subir des défaillances quantifiables, tels que les pertes de charges dans les
réacteurs et les échangeurs de chaleur ou des diminutions de rendements des pompes
centrifuges.

En outre, on a l’intention d’utiliser seulement les données faciles à acquérir sur place, tels
que la température, la pression et le débit massique. Un autre critère de conception, est que
plusieurs défaillances peuvent avoir lieu en même temps et avec des intensités différentes. On
implémente un procédé de distillation flash d’éthanol dans Aspen Hysys :

Figure 20: Diagramme d’opérations distillation flash d'éthanol


17
Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
3.1.2 Echantillonnage
Dans Hysys, on créé une étude de sensibilité « case study » avec trois variables à
manipuler (Effpompe, DPHex et DPRes) et trois variables à calculer (Tvap, Pvap et Qvap), qui
fournit 106,640 points de data.

 Le rendement adiabatique (valeur normale : 75%)


 Perte de charge dans l’échangeur de chaleur (valeur normale : 0.2 bar)
 Perte de charge dans le réservoir (valeur normale : 0.1 bar)

Figure 21: Variables cibles (Y)

Les variables en entrée du RNA, sont:

 La température du courant ‘vap’ (valeur normale : 84.85 ℃)


 La pression du courant ‘vap’ (valeur normale : 1.009 bar)
 Le débit massique du courant ‘vap’ (valeur normale : 4.351 Kg/h)

Figure 22: Variables en entrée (X)

18
Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
3.1.3 Choix du modèle
Conformément à ce que nous avons mentionné dans la partie 1.4, et puisque les
données qu’on va utiliser ne sont pas chronologiques, on choisit le modèle le plus simple,
celui d’un RNA de type perceptron multi couche (MLP).

La topologie a été choisie après plusieurs essais, commençant par la topologie la


plus simple, (3, 8, 3) passant par (3, 16, 3), (3, 8, 8, 3), …, (3, 32, 32, 32, 3) jusqu’à ce
qu’on ait trouvé celle qui fournit le coût ‘J’ le plus bas.

Figure 23: Diagramme du RNA utilisé pour le diagnostic (3, 16, 16, 3)

Puisque le rendement varie entre 30 et 75 %, tandis que les pertes de charge varient entre 0
et 1bar, les données ont dû être mises à l’échelle.
Par exemple, un rendement de 46%  46 * (1 / 75)  0.6134
Toutes les données seront ensuite centrées et réduites à l’intérieur du réseau.
On utilise 70% des données pour entraîner le RNA et 30% pour le valider.

Après avoir syntonisé les hyper-paramètres du modèle (le taux d’apprentissage, le nombre
d’itérations, les fonctions d’activation, etc.) de manière à avoir le maximum de précision lors de la
validation et le minimum de coût lors de l’apprentissage, on a trouvé que celles qui donnent la
meilleure performance sont les suivantes :

 Taux d’apprentissage : k = 0.001


 Nombre d’itérations (époques): 10
 Fonction d’activation : ReLu :

 Optimiseur : ‘Adam’, une variante de la méthode du gradient conjugué (Kingma, Ba,


2014)
 Régularisation : L2

19
Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
3.1.4 Résultats et discussion
On a effectué plusieurs essais, afin d’obtenir des valeurs moyennes sur la précision
du modèle. A chaque essai, on choisissait une valeur appartenant aux données de
validation et on calculait sa prédiction en utilisant le modèle, ensuite on évaluait son écart
de la valeur réelle.

Figure 24: Ecarts entre valeurs réelles et valeurs prédites avec la précision du modèle

Le modèle prédit le rendement de la pompe nettement mieux qu’il prédit les pertes
de charges du réservoir et de l’échangeur de chaleur. En fait, ce défaut démontre
l’importance d’avoir des données riches de point de vue information, c’est à dire ayant des
entropies de Shannon élevées. (Entropie introduite dans le cadre de la théorie de
l’information). Plus les données introduites au RNA sont denses, plus la performance de ce
dernier va être meilleure.
Données Entropie

Rendement (Efficacité) pompe 11.553738

Perte de charge Echangeur 11.373821

Perte de charge Réservoir 11.373822

Tableau 1: Entropies des données cibles (Y)

Malgré ses défauts, un tel modèle peut être utilisé à titre indicatif, puisque sa
performance est très consistante, quant au diagnostic de la pompe (précision pompe >80%),
même si cette dernière est positionnée en amont d’autres opérations unitaires qui changent
la pression à la sortie du procédé.

Figure 25: Prédictions du modèle RNA


20
Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
3.2 Détection des défaillances dans le cas d’un régime dynamique contrôlé

Dans ce qui suit, on va essayer de détecter les défaillances plutôt que de les diagnostiquer,
puisque dans un régime dynamique sous contrôle PID, cette approche semble être plus robuste,
en sachant qu’il existe plusieurs sources de bruit dans un environnement réel qui peuvent
masquer les variations induites par un évènement tel qu’une défaillance.

3.2.1 Principe et méthodologie


On fait la simulation dynamique d’un procédé ayant une sortie, dont la température
est régulée à l’aide d’un échangeur de chaleur tubulaire. Le débit du liquide de
réchauffement est contrôlé à l’aide d’une vanne reliée au contrôleur TIC-102, tandis que le
débit de la sortie est contrôlé par la vanne VLV-101 reliée au contrôleur FIC-102. Le
contrôle de la pression est assuré par 2 pompes (P-100 et P-101) reliées en parallèle pour
des raisons de redondance.

Figure 26: Diagramme du procédé dynamique

Le but de cette étude de cas est de voir si, malgré le contrôle en boucle fermée de
ces 3 variables, un réseau neuronal peut déceler une défaillance. On s’est limité à des
défaillances qu’on simule en variant avec différentes intensités les rendements des 2
pompes P-100 et P-101. Tout essai d’induire une panne totale dans une des pompes a
éventuellement résulté en un état instable du simulateur Aspen Hysys, suite à la non
convergence des équations des bilans énergétiques.

21
Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
3.2.2 Echantillonnage
On collecte 2 séries de données, l’une durant le fonctionnement normal du procédé
et l’autre lorsqu’on implémente les défaillances. Chacune de ces séries contient la
pression, la température et le débit du courant № 6 (courant de sortie du procédé) en plus
des rendements adiabatiques des pompes.

Figure 27: Données dynamiques normales et défaillantes

Ensuite, on calcul la différence entre chacune des variables avant de les injecter
dans le RNA., et on fait la binarisation (transformer une série des valeurs en 0 ou 1 selon
un certain seuil) des rendements des pompes, où 1 signifie qu’une défaillance a eu lieu et 0
signifie un état normal.

Figure 28: Données dynamiques injectées dans le RNA

On peut voir clairement que le débit, bien qu’il soit régulé, est affecté si une
défaillance a lieu, tandis que la température est trop bruitée pour exhiber un changement
visible. Les pics du débit, bien qu’ils soient visibles à l’ œil nu, se déroulent pendant 40
secondes (les données sont collectées à des intervalles de 20 secondes), un temps très
minime pour qu’un opérateur réalise qu’une défaillance a eu lieu.

22
Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
3.2.3 Choix du modèle
Après syntonisation des hyper-paramètres, on a trouvé que la meilleure topologie est
(4, 32, 32, 1)

Figure 29: Topologie RNA en régime dynamique

Les entrées sont :


o Le débit et la température du procédé défaillant
o Les différences TN – TD et QN – QD.
La sortie est l’état binaire des pompes (1 si rendement est inférieur à 75% et 0 si le
rendement est supérieur ou égal à 75%).

Les hyper-paramètres sont :

Taux d’apprentissage 0.05


Fonction d’activation (couches masquées) Linéaire (x = y)
Fonction d’activation (couche de sortie) Sigmoïde
Pourcentage d’apprentissage 70%
Itérations (époques) 15
Optimiseur Adam

Tableau 2: Hyper-paramètres RNA Détection de défaillance (état dynamique)

23
Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
3.2.4 Résultats et discussion
Après plusieurs essais, on voit que la précision des prédictions est d’environ 67%,
ce qui n’est pas idéal étant donné que ce modèle est destiné à être utilisé dans l’industrie
où l’incertitude n’a pas de place.

Figure 30: Prédictions du RNA de détection des défaillances en régime dynamique

En fait, suite à l’inspection des graphes des prédictions, on décèle que le modèle
produit un nombre important de faux positives (points verts sur la ligne y = 1)

Figure 31: Graphe d'apprentissage et de validation du modèle

Ces marges d’incertitude peuvent être la conséquence de multiples facteurs, parmi


lesquels figure ce qu’on appelle le ‘bruit déterministe’ (Abu-Mostafa et al., 2012, p. 124), qui
n’est rien d’autre que des données réelles, dont le meilleur modèle est incapable de
modéliser à cause de leur grande complexité. Dans un tel cas, on a recours à un outil
d’apprentissage méta-heuristique ayant un algorithme ‘génétique’ qui va trouver le meilleur
modèle en fonction des données qu’on lui présente.
Un tel outil s’appelle TPOT (Olson et al., 2016). TPOT va essayer des centaines de
méthodes d’apprentissage automatique et ensuite les classer selon la valeur minimale de la
fonction de coût qu’ils donnent. À chaque génération, l’algorithme génétique choisi les
meilleurs modèles et procède à optimiser leurs hyper-paramètres, pour enfin les classer de
nouveau et éliminer ceux qui ont produit les pires coûts. Le majeur inconvénient de cette
méthode est qu’elle peut prendre des jours, voir des semaines, pour trouver le bon modèle.

24
Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
3.3 Détection des défaillances par reconnaissance des signaux

D’après ce qu’on vient de traiter dans les 2 parties précédentes (3.1 et 3.2), il est clair qu’un
majeur défi pour la détection des défaillances c’est le traitement des bruits, qu’ils soient
déterministes ou stochastiques, afin de clarifier les données et par la suite faciliter la phase
d’apprentissage des RNA.

Une méthode utilisée majoritairement dans le traitement d’images afin de les d’ébruiter, est
celle des auto-encodeurs (AE). Dans ce qui suit, on va essayer de l’exploiter pour détecter les
signaux des défaillances.

3.3.1 Principe et méthodologie


Le fonctionnement d’un auto-encodeur est presque le même que celui d’un RNA classique,
sauf que l’AE au lieu d’apprendre comment prédire des données cibles (X  Y) il va apprendre
comment reproduire les données introduites en entrée (X  X), donc c’est une approche
d’apprentissage non-supervisé.
La logique derrière cette approche est évidente lorsqu’on regarde la topologie d’un AE :

Figure 32: Architecture d'un Auto-encodeur (AE)

La couche cachée, située au centre d’un réseau AE, agit comme un goulot d’étranglement,
ainsi réduisant la dimension des données et par conséquent gardant l’essentiel de ces dernières
qui servira à leur reconstruction.

Notre approche sera de faire apprendre au réseau les données de température et de débits
normaux et puis faire la validation sur les données défaillantes. Ensuite, on calculera l’erreur
quadratique moyenne (EQM) lors de la validation qui devra montrer clairement des pics
représentants les évènements de défaillance.

Parmi les modèles qu’on a traité jusqu’à maintenant, celui-là est le plus robuste puisqu’il
apprend les variables en entrée quoi qu'elles puissent être dans un état normal, donc il ‘sait’
déceler les variations normales de celles qui sont défaillantes sur une plage plus vaste.

25
Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
3.3.2 Echantillonnage
On a utilisé les données du débit et de la température normales et défaillante du même
procédé qu’en (4.2).

Figure 33: Données utilisées dans le modèle AE

3.3.3 Choix du modèle


Le modèle optimal est facile a trouvé, dans ce cas puisqu’il suffit d’ajouter des couches
cachées jusqu’à ce que le coût d’apprentissage tend vers zéro.

Figure 34: Topologie de l'auto-encodeur utilisé pour la détection des défaillances

Taux d’apprentissage 0.0001


Fonction d’activation (couches masquées) Linéaire (x = y)
Fonction d’activation (couche de sortie) Linéaire
Pourcentage d’apprentissage Non Applicable
Itérations (époques) 4000
Optimiseur Adam
Données d’apprentissage Débit ou Température (état normal)
Données de validation Débit ou Température (état défaillant)

Tableau 3: Hyper-paramètres AE

26
Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
3.3.4 Résultats et discussion
Lorsqu’on a appris au réseau les données du débit normal et puis effectuer la validation sur
le débit défaillant, on a obtenu les résultats suivants :

Figure 35: Résultats issus du modèle AE pour le débit

Figure 36: Résultats issus du modèle AE pour la température

On remarque d’abord que l’EQM issue des données du débit est plus claire que celles
issues des données de température, cela est dû au fait que les bruits présents dans la
température éclipsent les pics des défaillances.
L’EQM Débit est un bon indicateur de l’apparition de défaillances, puisqu’il peut être
considéré comme un signal à faible bruit.

27
Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
Conclusion

Les techniques d’apprentissage automatiques malgré leur diversité et leur caractère laborieux,
sont de plus en plus accessibles aux chercheurs et aux ingénieurs travaillant dans différents
domaines, notamment suite aux innovations telles que l’auto – apprentissage automatique « Auto-
ML » qui facilite la syntonisation des hyper-paramètres et le prétraitement des données mais qui
requiert parfois des semaines pour trouver un bon modèle.

Toutefois, ces techniques sont prometteuses, surtout dans le domaine de génie des procédés
puisqu’elles peuvent agir comme une ligne de défense contre les défaillances d’une part et un
outil de prédiction et de contrôle d’autre part.

Récemment la société Aspen Tech ®, l’un des grands innovateurs dans le domaine du génie
chimique, a acheté la société Mtell spécialisée dans l’apprentissage automatique et les machines
intelligentes, afin d’incorporer les techniques d’IA dans leurs logiciels et leurs services. Cela
montre que ces méthodes sont là pour y rester.

Quant aux méthodes illustrées dans ce rapport, elles servent à démontrer que chaque type de
procédé nécessite un modèle de RNA ou une technique d’IA appropriée et capable de contourner
les difficultés techniques qu’il peut poser, telles que le bruit, la complexité ou les choix
d’échantillonnage limités.

Suite à nos recherches bibliographiques, on a remarqué l’abondance de travaux scientifiques


sur l’application des techniques d’IA à la détection et le diagnostic des défaillances des procédés
chimiques. Néanmoins, les références portant sur des lignes directrices claires et robustes quant
à l’application de l’IA aux problèmes de génie des procédés sont presque absentes.

D’après les études de cas qu’on a effectué, il est évident qu’il faut prioriser les modèles
robustes et simples à ceux qui sont généralistes et complexes, puisque le problème majeur
auquel on a dû faire face, c’est celui du bruit qui devient de plus en plus perturbateur avec
l’augmentation de la complexité des données.
Désormais, il faut adopter une nouvelle approche quant à la conception des procédés
chimiques, et cette dernière doit prendre en compte la possibilité d’intégration de systèmes de
contrôle et de collecte des données, intelligents.

28
Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
Bibliographie

ABU-MOSTAFA, Yaser S., MAGDON-ISMAIL, Malik et LIN, Hsuan-Tien, 2012. Learning From
Data. S.l. : AMLBook. ISBN 978-1-60049-006-4.

AHMED, Suman, 2016. Fault detection and diagnosis of Brahmanbaria gas processing plant using
artificial neural network analysis. In : [en ligne]. septembre 2016. [Consulté le 14 janvier 2018].
Disponible à l’adresse : http://lib.buet.ac.bd:8080/xmlui/handle/123456789/4526.

AL ANI, Tarik, 2006. Introduction au diagnostic des défaillances. In : . Cours. A2SI-ESIEE – Paris.
1 octobre 2006.

CHAKRABORTY, Chiranjit et JOSEPH, Andreas, 2017. Machine Learning at Central Banks. In :


SSRN Electronic Journal. 1 janvier 2017. DOI 10.2139/ssrn.3031796.

HIMMELBLAU, David M., 2000. Applications of Artificial Neural Networks in Chemical


Engineering. In : Korean Journal of Chemical Engineering. 2000. Vol. 17, n° 4, p. 373‑392.

HOSKINS, JOSIAH C. et HIMMELBLAU, DAVID M., 1990. 4 - Fault Detection and Diagnosis
Using Artificial Neural Networks1. In : MAVROVOUNIOTIS, MICHAEL L. (éd.), Artificial
Intelligence in Process Engineering [en ligne]. S.l. : Academic Press. p. 123‑160.
[Consulté le 14 janvier 2018]. ISBN 978-0-12-480575-0. Disponible à l’adresse :
https://www.sciencedirect.com/science/article/pii/B9780124805750500083.

KINGMA, Diederik P. et BA, Jimmy, 2014. Adam: A Method for Stochastic Optimization. In :
arXiv:1412.6980 [cs] [en ligne]. 22 décembre 2014. [Consulté le 14 janvier 2018]. Disponible à
l’adresse : http://arxiv.org/abs/1412.6980.

KÖPPEN-SELIGER, B. et FRANK, P. M., 1996. Neural Networks in Model-Based Fault Diagnosis.


In : IFAC Proceedings Volumes. 1 juin 1996. Vol. 29, n° 1, p. 6389‑6394. DOI 10.1016/S1474-
6670(17)58706-6.

LECUN, Yann, 1985. Une procedure d’apprentissage pour reseau a seuil asymmetrique (A
learning scheme for asymmetric threshold networks). In : [en ligne]. 1985.
[Consulté le 16 janvier 2018]. Disponible à l’adresse :
https://nyuscholars.nyu.edu/en/publications/une-procedure-dapprentissage-pour-reseau-a-seuil-
asymmetrique-a-l.

MALIN, JANE T., BASHAM, BRYAN D. et HARRIS, RICHARD A., 1990. 2 - Use of Qualitative
Models in Discrete Event Simulation to Analyze Malfunctions in Processing Systems. In :
MAVROVOUNIOTIS, MICHAEL L. (éd.), Artificial Intelligence in Process Engineering [en ligne].
S.l. : Academic Press. p. 37‑79. [Consulté le 24 janvier 2018]. ISBN 978-0-12-480575-0.
Disponible à l’adresse :
https://www.sciencedirect.com/science/article/pii/B978012480575050006X.

MAVROVOUNIOTIS, Michael L., 1990. Artificial intelligence in process engineering. S.l. :


Academic Press. ISBN 978-0-12-480575-0.

29
Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
MILJKOVIĆ, Dubravko, 2011. Fault detection methods: A literature survey. S.l. : s.n.

MITCHELL, Tom M., 1997. Machine Learning. S.l. : McGraw-Hill. ISBN 978-0-07-115467-3.

NILSSON, Nils J., 2009. The Quest for Artificial Intelligence. S.l. : Cambridge University Press.
ISBN 978-1-139-64282-8.

OLSON, Randal S., BARTLEY, Nathan, URBANOWICZ, Ryan J. et MOORE, Jason H., 2016.
Evaluation of a Tree-based Pipeline Optimization Tool for Automating Data Science. In :
Proceedings of the Genetic and Evolutionary Computation Conference 2016 [en ligne]. New York,
NY, USA : ACM. 2016. p. 485–492. [Consulté le 6 février 2018]. Disponible à l’adresse :
http://doi.acm.org/10.1145/2908812.2908918.

OTERO, Fernando, 1998. Use of neural networks in process engineering thermodynamics,


diffusion, and process control and simulation applications. In : CT&F - Ciencia, Tecnología y
Futuro. 1 janvier 1998. Vol. 1, p. 49‑64.

PATAN, Krzysztof, 2008. Artificial Neural Networks for the Modelling and Fault Diagnosis of
Technical Processes. S.l. : Springer. ISBN 978-3-540-79872-9.

POWELL, Victor, 2015. Principal Component Analysis explained visually. In : Explained Visually
[en ligne]. 2015. [Consulté le 22 janvier 2018]. Disponible à l’adresse : http://setosa.io/ev/principal-
component-analysis/.

RASCHKA, sebastian, 2015. Single-Layer Neural Networks and Gradient Descent. In : Dr.
Sebastian Raschka [en ligne]. 24 mars 2015. [Consulté le 18 janvier 2018]. Disponible à
l’adresse : sebastianraschka.com/Articles/2015_singlelayer_neurons.html.

RUSSELL, Evan L., CHIANG, Leo H. et BRAATZ, Richard D., 2012. Data-driven Methods for
Fault Detection and Diagnosis in Chemical Processes. S.l. : Springer Science & Business Media.
ISBN 978-1-4471-0409-4.

SPIELBERG, S. P. K., GOPALUNI, R. B. et LOEWEN, P. D., 2017. Deep reinforcement learning


approaches for process control. In : 2017 6th International Symposium on Advanced Control of
Industrial Processes (AdCONIP). S.l. : s.n. mai 2017. p. 201‑206.

TURING, A. M., 1950. I.—COMPUTING MACHINERY AND INTELLIGENCE. In : Mind. 1 octobre


1950. Vol. LIX, n° 236, p. 433‑460. DOI 10.1093/mind/LIX.236.433.

30
Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
ANNEXES

Sommaire des annexes

ANNEXE I: Algorithme TPOT ........................................................................................................................................................ 1

ANNEXE II: Résultats méthode TPOT : détection des défaillances dans le cas d’un régime dynamique contrôlé ............................ 2

ANNEXE III: Aspen Tech acquiert Mtell ........................................................................................................................................ 3

1
Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
ANNEXE I
Algorithme TPOT (epistasislab)

1
Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
ANNEXE II
Résultats méthode TPOT : détection des défaillances dans le cas d’un régime dynamique contrôlé

2
Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels
ANNEXE III
Aspen Tech acquiert Mtell

Will Add Predictive and Prescriptive Maintenance Technology to aspenONE® Software; Extends
Company’s Asset Optimization Offerings

October 27, 2016 04:02 PM Eastern Daylight Time

BEDFORD, Mass.--(BUSINESS WIRE)--Aspen Technology, Inc. (NASDAQ: AZPN), a leading provider of


software and services to the process industries, announced it has acquired Mtelligence Corporation (known as
Mtell), a San Diego, California-based pioneer in the field of predictive and prescriptive maintenance for asset
performance optimization.

Mtell products enable companies to increase asset utilization and avoid unplanned downtime by accurately
predicting when equipment failures will occur, understanding why they will occur, and prescribing what to do to
avoid the failure.

The products provide a low-touch, rapidly deployable, end-to-end solution that combines a deep understanding
of operations and maintenance processes, real-time and historical equipment data and cutting-edge machine
learning technologies. As a result, customers can:

 Monitor the health of equipment, detect early failure symptoms, diagnose their root-cause and
recommend the best responses to avoid the failure
 Continually learn and automatically adapt to changing equipment and process behaviors
 Automatically share findings across a network of similar equipment to improve the overall process
performance.
Some of the world’s largest process manufacturing companies use Mtell software to detect and avoid failures
well in advance of an actual breakdown, optimizing the performance of their assets. Customer results have
shown significant benefits including improved industrial safety, removal of risk, reduced failures, enhanced
productivity and increased profitability.

Mtell products include:

 Previse – Mtell’s flagship end-to-end machine learning solution that monitors equipment health 24/7,
detects early indicators of degradation or failures, diagnoses the root cause and prescribes responses that
prevent breakdowns and unplanned downtime.
 Basis – A connected condition monitoring application that facilitates collaboration between operations
and maintenance organizations to determine the best course of action for equipment alert conditions.
 Reservoir – A high performance, scalable, big data repository that captures, manages and synchronizes
large volumes of time series, event and asset data from multiple sources.
 Summit – A remote monitoring center application for monitoring, analyzing and benchmarking asset
performance.
The purchase price of the transaction was $37M. Additional terms are disclosed in AspenTech’s Quarterly
Report on Form 10-Q for the first quarter of Fiscal 2017 filed with the United States Securities and Exchange
Commission.

3
Wael JABER - Détection et diagnostic des défaillances des procédés chimiques à l’aide des réseaux neuronaux artificiels

View publication stats