Explorer les Livres électroniques
Catégories
Explorer les Livres audio
Catégories
Explorer les Magazines
Catégories
Explorer les Documents
Catégories
THESE
Présentée à
Anne-Sophie BELLANGER-DUJARDIN
' % ( ) * + ,- (
, $ .. / 0 $ , + . 1 2 3
22 4- 1 $ ) 56 7 )/ 8/ 7 2 9
1 2 % 2 2 2 % : &
' ( ; $ .< .7 1
1 ( ( ( 4 &
' % 42 2 ( % $ # 1
.$ . ) / - 1 " & 2 4
(1 2 ( &
' $ $ # /- ( 2 )
/ 1 ( 1 - 1 : 22
( 2 &
' % 42 %$ < 7 -
8 "0 &
% 0 - / - ' " - . - ) - -
7 - 0 = - < 1 - > (- % 1 2 2
) / 1 ( 1 8 "0 &
(( -: 2 % ?: &
2 2 :
2 7 1 %2 2 % &
' 2 2 - 2 2 -2 2 @ - A -
( >
/ ( - %! 1 ( 1
(( - % - -1
&
REMERCIEMENTS…………………………………………………………………….…...2
SOMMAIRE……………………………………………………………………………..……3
INTRODUCTION…………………………………………………………………………….6
CONCLUSION….………………………………………………………………………….112
BIBLIOGRAPHIE…………………………………………………………………………118
7
systèmes se décompose en trois fonctions : la détection d’une défaillance, qui consiste à
reconnaître une déviation par rapport au fonctionnement attendu, la localisation d’une faute,
qui consiste à déterminer la région physique du système dans lequel la défaillance s’est
produite et enfin, le diagnostic qui permet de déterminer précisément l’origine de la
défaillance détectée.
Concernant le domaine médical, l'
enjeu est un peu différent, puisque ici, le système
considéré est l'
être humain, dont la complexité est immense. L'
objectif du diagnostic est ici,
de déterminer une maladie à partir de symptômes et de résultats d'
examens complémentaires,
afin de proposer le traitement adéquat mais aussi, dans certains cas tels que les problèmes
psychologiques ou psychiatriques, de trouver les causes des troubles. La contrainte majeure
est de préserver la santé physique et morale du patient. Pour cela, les médecins disposent, à
l'
heure actuelle, de techniques à la pointe de l'
évolution technologique qui leur permettent
d'
obtenir des données, des images, des signaux pour établir leur diagnostic. Le médecin
visualise alors les résultats de ces divers examens pour établir son diagnostic. En effet, les
médecins ne disposent pas d'
outils permettant une aide au diagnostic. Mais, ne pourrait-on pas
développer des techniques d'
analyse de ces informations pour réaliser un outil d'
aide au
diagnostic?
Les systèmes de production dans le milieu industriel sont de plus en plus automatisés,
c'
est-à-dire que l'
homme est remplacé dans ses tâches répétitives par des systèmes
automatiques. La première conséquence de cette automatisation est donc de déplacer
progressivement le niveau d'
intervention de l'
homme dans le sens d'
une réduction de l'
activité
physique directe au profit d'
une activité mentale de commande et de coordination. Cependant,
ces systèmes automatisés ne sont pas sans faiblesse, et leur fragilité et leur susceptibilité aux
dysfonctionnement font que l'
intervention humaine est souvent nécessaire. Dans le milieu
médical, le rôle du médecin est aussi primordial. C'
est en lui que le patient place sa confiance.
Le caractère indispensable de l'
acteur humain dans le contexte du diagnostic médical relève
entre autre d'
un aspect "psychologique". De plus, par ses capacités de juger et de décider,
d'
analyser, de synthétiser et d'
interpréter les symptômes, le praticien joue un rôle primordial.
C'
est lui qui détient "l'
expertise" et la "connaissance". Ainsi, tant dans un contexte de
surveillance et de maintenance des systèmes industriels que dans le contexte du diagnostic
8
médical, il n'
est pas envisageable de mettre en place des outils de surveillance sans considérer
le rôle indispensable de l'
homme. Il s'
agit donc de développer, non pas des outils de
diagnostic, mais plutôt d'
aide au diagnostic.
L'
homme est un acteur incontournable dans le processus de diagnostic. Il possède en
effet les capacités indispensables à la résolution de problèmes liés à cette activité. Celles-ci
sont dues aux caractéristiques du cerveau humain qui lui confère les capacités de perception,
de mémorisation, d'
apprentissage, d'
adaptation et de raisonnement.
Le problème d'
aide au diagnostic a donc tout naturellement fait l'
objet de travaux en ce
sens, en tentant de reproduire ces performances à l'
aide d'
un système artificiel.
En effet, au cours des vingt cinq dernières années, le domaine de l'
Intelligence
Artificielle (IA) a connu un essor important, avec, en particulier, le développement des
réseaux de neurones artificiels. Ces derniers tentent de reproduire, par simulation, certains des
principes organisationnels et fonctionnels du cerveau humain. Ils permettent d'
élaborer un
nombre important de techniques originales, couvrant un large domaine d'
applications. Parmi
leurs propriétés les plus attractives, on peut citer leurs capacités d'
apprentissage et de
généralisation et, pour certain d'
entre eux, leur capacité de classification et d'
identification. Ils
ont ainsi été appliqués, par exemple, avec succès à des problèmes de reconnaissance des
formes. Toutes ces propriétés font des réseaux de neurones un outil permettant de développer
de nouvelles techniques pour l'
aide au diagnostic, et nos travaux portent sur l'
application de
ces techniques au diagnostic, tant dans le domaine industriel que dans le domaine médical.
9
Les travaux effectués au cours de cette thèse visent à apporter des éléments de réponse
au problème d'
intégration des connaissances "d'
expert" dans un processus conduisant à la
détection et au diagnostic d'
un dysfonctionnement. La classe des problèmes étudiés relève de
celles d'
identification et de catégorisation des dysfonctionnements. Pour tenter de les
résoudre, nous avons mis en œuvre des techniques basées sur le connexionnisme (structures à
base de réseaux de neurones), et nous proposons alors une structure permettant de
"catégoriser" des informations (signaux, données…), issues de différents capteurs, par des
techniques neuronales.
10
Puis, dans la conclusion, nous rappelons brièvement les différents résultats obtenus au
cours de ce travail, et présentons les perspectives qui découlent de cette thèse.
Enfin, et compte tenu du volet biomédical, pouvant sensibiliser les lecteurs liés à ce
domaine, il nous a paru important d'
inclure une rapide présentation des fondements
biologiques des réseaux de neurones (même si ces considérations peuvent présenter moins
d'
intérêt pour un lecteur initié au domaine des réseaux de neurones). Ces aspects constituent
donc le contenu de la première annexe au présent document.
D'
autre part, des travaux liés à l'
estimation quantitative de données ont été initiés au
cours de cette thèse. Ils visaient l'
évaluation de la faisabilité de l'
estimation de paramètres d'
un
système à surveiller. Cette faisabilité a été validée sur un système expérimental de mélange
diphasique et a concerné plus particulièrement l'
estimation du taux de vide dans de tels
écoulements. Toutefois, ces travaux n'
ont pas donné lieu à une intégration aux structures
neuronales hybrides proposées dans cette thèse. C'
est pourquoi nous avons préféré rapporter
ces travaux sous la forme d'
une seconde annexe au présent document.
Enfin, compte tenu de l'
utilisation de signaux biomédicaux relatifs à l'
audition, il nous
a semblé intéressant d'
inclure une présentation sommaire de l'
appareil auditif. Celle-ci
constitue donc la troisième annexe.
11
Dans la vie courante, il existe de nombreuses situations dans lesquelles l'
être humain
se trouve, en tant qu'
utilisateur, face à des systèmes qui ne fonctionnent pas de manière
attendue. Qui ne s'
est pas trouvé au volant d'
une voiture qui refuse de démarrer? Qui n'
a
jamais été confronté à un ascenseur en panne? Afin de résoudre ces problèmes divers que
pose ce genre de situation, l'
intervention humaine et un outillage approprié sont
indispensables.
La complexité des systèmes actuels rend ces interventions d'
un niveau élevé. Il est
donc nécessaire de fournir à l'
intervenant des outils d'
aide au diagnostic de la panne
rencontrée. L’ ouvrage de G. Zwingelstein, « Diagnostic des Défaillances » [ZWIN 95],
constitue une source précieuse de connaissances dans le domaine du diagnostic industriel.
Le diagnostic des fautes requiert généralement l'
élaboration d'
un modèle du système à
surveiller. Généralement, un modèle est une représentation formelle (avec un sens plutôt
mathématique) de ce système. Lorsqu’ un modèle est disponible, les techniques de diagnostic
utilisables sont appelées techniques internes. Ces méthodes de diagnostic internes sont
dérivées des techniques utilisées par les automaticiens. Elles impliquent une connaissance
approfondie du système à surveiller sous la forme d’ une représentation formelle (au sens
mathématique) : le modèle. Leur principe est le suivant : il s'
agit, à partir des observations des
entrées et des sorties de remonter aux paramètres ou au vecteur d'
état interne. La détection
d'
un état anormal se fait alors par comparaison entre les paramètres mesurés ou calculés à
l'
instant considéré et ceux associés à un fonctionnement normal. Les paramètres de l'
état
13
courant du système s'
obtiennent grâce aux méthodes d'
identification de paramètres et/ou aux
méthodes d'
estimation du vecteur d'
état.
Ces méthodes de diagnostic par identification de paramètres et d'
estimation du vecteur
d'
état ont été les premières à avoir été employées dans l'
industrie. Initiées par les
automaticiens qui recherchaient les modèles des procédés devant faire l’ objet d’ une
automatisation poussée, ces méthodes de diagnostic internes s’ appuient sur l’ existence d’ un
modèle mathématique très précis du système à surveiller. Dans le cas contraire, les résultats
d'
estimation et d'
identification sont à prendre avec beaucoup de précaution.
Ces techniques sont très utilisées dans le domaine de l’ aéronautique et de
l’ aérospatiale où les modèles de la dynamique du vol sont parfaitement connus ainsi que dans
l’ industrie électronique et électrique, lorsque l'
on dispose d'
un modèle parfaitement connu du
système étudié. Elles sont aussi appliquées dans l'
industrie nucléaire [ZWIN 95]. Cependant,
il existe certaines limites à l'
application de ces méthodes de diagnostic. Ces techniques ne
sont, en effet, applicables que lorsqu'
un modèle précis et exhaustif du système à surveiller est
disponible. Ainsi, elles ne pourront pas être utilisées dans un grand nombre d'
applications
médicales, car il est quasiment impossible d'
obtenir un modèle de toutes les fonctions du
corps humain. De même, dans le cas des circuits électroniques non linéaires, la modélisation
est une tâche ardue qui limite l'
utilisation de telles techniques. Les applications qui vont nous
intéresser dans cette thèse concernent, soit, des systèmes pour lesquels aucune représentation
formelle n'
est disponible (le cas biomédical, où il s’ agit de l’ être humain), soit, des systèmes
pour lesquels une telle représentation est difficile à obtenir (le cas de la plupart des systèmes
industriels réels). Ces techniques internes ne sont alors pas applicables et il faut donc
envisager la mise en œ uvre d’ autres techniques. D'
autres méthodes, applicables dans le cas où
aucun modèle n’ est disponible, et appelées méthodes externes, ont donc été proposées. Dans
cette catégorie, on trouve les techniques de reconnaissance des formes, les techniques à base
de systèmes experts, ainsi que les techniques neuronales.
Les techniques de reconnaissance des formes permettent de déterminer l’ appartenance
d’ un objet à une classe en déterminant de quelle forme un objet observé se rapproche le plus.
Ces méthodes constituent des outils privilégiés pour la classification de signatures associées
aux modes de fonctionnements normaux et défaillants. Le diagnostic par reconnaissance des
formes consiste donc à classer les états du système. L’ ouvrage de B. Dubuisson, « Diagnostic
et reconnaissance des formes », développe tout particulièrement ces techniques de diagnostic
[DUBU 90]. Grâce à leur capacité à discriminer des signatures caractéristiques des
fonctionnements normaux et anormaux de systèmes, les méthodes de reconnaissance des
14
formes sont des techniques à envisager lorsqu’ on souhaite procéder à une automatisation du
diagnostic. Par exemple, certains de ces algorithmes sont utilisés pour la surveillance
vibratoire de machines tournantes [GROS 92]. Elles sont applicables lorsqu’ on dispose d’ une
connaissance a priori des états de fonctionnement du système à surveiller. Elles sont
également utilisables pour le diagnostic de systèmes nouveaux et on pourra alors mettre en
œ uvre des algorithmes ayant la capacité de prendre en compte des états de fonctionnement
inconnus a priori. Dans ce cas, il faudra appliquer des algorithmes capables de rejeter ou de
détecter une ambiguïté dans les nouvelles formes rencontrées. De la même manière, dans le
cas de systèmes vieillissants, i.e. présentant une dérive lente des caractéristiques de
fonctionnement, il est utile d’ appliquer le même genre de techniques. Il faut toutefois noter
que les performances de ce type de techniques sont fortement liées au degré de
compréhension du système : la présence d’ un expert est donc quasi indispensable.
Les systèmes experts ont, quant à eux, pour fonction d’ assister l’ utilisateur non-
spécialiste pour la résolution d’ un problème en utilisant les connaissances d’ un expert.
Comme toute les nouvelles technologies, ils ont connus une sur-médiatisation qui les rendait
capables de résoudre tout type de problèmes. Avec le recul, la mise en œ uvre des systèmes
experts a trouvé un équilibre.
Les systèmes experts sont une des applications de l’ Intelligence Artificielle qui ont
quitté les laboratoires pour être utilisés dans le monde de l’ entreprise. De nombreux systèmes
ont été implantés avec succès pour résoudre des problèmes concrets notamment en médecine
[SHOR 76], pour établir des diagnostics, dans le domaine financier, les assurances, la
réparation d'
équipement. Dans le domaine de l’ aide au diagnostic, ils permettent de réaliser
aisément le diagnostic des petits systèmes [ZWIN 95]. En revanche, pour les systèmes
industriels plus complexes, la percée de ces techniques est moins rapide, compte tenu des
coûts importants de développement et de maintenance de tels systèmes.
Cependant, les grandes difficultés que l’ on rencontre lorsqu’ on cherche à extraire des
experts leur connaissance, puis, quand on tente de formaliser ces connaissances dégagées,
sont peut-être signes d’ une faiblesse intrinsèque des systèmes experts. En effet, la conception
de tels systèmes repose sur une hypothèse : la structuration de nos aptitudes en règles
symboliques parfaitement identifiables. Cette hypothèse, très répandue chez les psychologues
et les chercheurs en Intelligence Artificielle dans les années 70, est aujourd’ hui en recul et on
envisage désormais des modèles qui n’ y ont plus recours, comme les réseaux de neurones
artificiels.
15
L'
objet de cette thèse concerne la mise en œ uvre de ces dernières techniques pour la
construction d'
outils d'
aide au diagnostic quelque soit le domaine considéré. Ce chapitre est
consacré à l'
étude de la mise en œ uvre de réseaux de neurones pour l'
aide au diagnostic. Dans
un premier temps, nous aborderons les réseaux de neurones artificiels, et plus particulièrement
les trois modèles que nous avons utilisés. Dans un second temps, nous présenterons une
approche neuronale hybride pour tenter de proposer une solution d’ aide au diagnostic.
16
classification correcte de la forme présentée. De nombreux exemples d’ une telle utilisation
des réseaux neuronaux pour le diagnostic industriel sont présents dans la littérature :
classification de signaux pour le contrôle non destructif de tubes métalliques [ZWIN 91,92],
classification de signaux électriques pour le diagnostic de circuits analogiques [AMAR
96][BENG 97b], reconnaissance pannes à partir d'
observations sur le système pour la
surveillance des procédés de raffinage [VENK 89]…. Ils sont aussi utilisés et donnent de bons
résultats pour la classification d'
informations médicales : classification de données pour la
reconnaissance de cellules cervicales [BAZO 94], classification de signaux médicaux
(potentiels évoqués auditifs) [ALPS 94].
17
de généraliser et ainsi, d'
étendre ces règles à de nouveaux exemples non appris, même si les
formes présentées sont entachées de bruit ou ont des informations manquantes.
Les opérations effectuées par des opérateurs neuronaux peuvent être diverses, et nous
ne retiendrons que les tâches de classification1. La suite de cette partie est consacrée à la
présentation des modèles neuronaux. Nous présenterons ainsi les modèles utilisés pour la
construction d'
un outil d'
aide au diagnostic : le Perceptron multi-couches à une couche cachée,
le réseau Learning Vector Quantization (LVQ) et le réseau Radial Basis Function (RBF). Les
fondements biologiques des réseaux de neurones artificiels, ainsi que les premières
représentations mathématiques des modèles neuromimétiques, dont le neurone formel proposé
par Mc Cullogh et Pitts en 1943 sont rappelés en annexe (Annexe 1).
Les Perceptrons multi-couches à une couche cachée sont des réseaux dont l'
algorithme
d'
apprentissage est celui de la rétropropagation du gradient mis au point dans les années 1980
[RUME 86]. Cet algorithme est dérivé de la règle de Widrow-Hoff. Cet algorithme
d'
apprentissage par rétropropagation du gradient a contribué à la relance d'
intérêt pour les
systèmes neuronaux.
• Structure du réseau :
Le perceptron multicouche à une couche cachée est, comme son nom l’ indique un
réseau multi-couches. Il est composé d'
une couche d'
entrée, d'
une ou plusieurs couches
cachées et d'
une couche de sortie. La figure I.1 représente un réseau à trois couches (une seule
couche cachée). Le nombre d'
unités d'
entrée et de sortie dépend du problème à traiter. En
revanche, le choix du nombre de couches cachées et du nombre de neurones par couche
cachée doit faire l'
objet d'
un compromis entre performance et vitesse d'
apprentissage.
1
Un exemple d'
application des réseaux de neurones artificiels pour la quantification est présenté en Annexe 2.
18
Perceptron multicouche à une couche cachée
W'ij W''ij
s1
sm
Couche
Couche cachée
Couche
d’ entrée de sortie
Figure I. 1 - Perceptron multi-couche à une couche cachée
• Apprentissage :
La procédure d'
apprentissage repose sur l'
idée de propager vers les couches internes
l'
erreur commise en sortie pour modifier les poids synaptiques. C'
est un apprentissage
supervisé. Pour cela, on dispose d'
un ensemble d'
exemples (base d'
apprentissage), constituée
de couples (entrée, sortie désirée). Lors de l'
apprentissage, on présente les exemples au réseau
qui calcule les sorties correspondantes. Ces calculs s'
effectuent de proche en proche depuis la
couche d'
entrée vers la couche de sortie (phase de relaxation ou de propagation avant).
L'
erreur entre la sortie réelle et la sortie désirée est calculée (somme quadratique des erreurs
sur chaque neurone de sortie). Cette erreur est ensuite rétropropagée à travers le réseau
donnant lieu à une modification des poids synaptiques.
Ce processus est réitéré pour chaque exemple de la base d'
apprentissage. Si, pour tous
les exemples, l'
erreur commise est inférieure à un seuil choisi, on dit alors que le réseau a
convergé. L'
apprentissage consiste donc à minimiser l'
erreur quadratique commise sur
l'
ensemble des exemples, par ajustement des poids en diminuant le gradient.
19
kième élément Xk de l'
ensemble X, on note Xk = (xk1, xk2, …, xkn), les composantes de ce
vecteurs. De la même manière, on note Sdk = (sdk1, sdk2, …, sdkm), les composantes du kième
ensemble Sd et Sk = (sk1, sk2, …, skm) les composantes du kième élément de
élément de l'
l'
ensemble S.
On note aussi :
• la fonction d'
activation d'
un neurone (et ', sa dérivée)
• yj, la sortie du neurone j d'
une couche cachée. On a alors :
20
Le calcul des poids de la dernière couche dépend des éléments des couches
précédentes.
Considérons maintenant le cas où i est l'
indice d'
un neurone caché. Considérons la
couche de neurones suivant immédiatement l'
unité i et notons j l'
indice des neurones de cette
couche. L'
erreur quadratique E relative à la présentation d'
un exemple dépend
fonctionnellement de l'
ensemble des yc et toutes les sorties yc dépendent de yi. Dans ce cas, le
signal d'
erreur i est donné par :
j wij
Entrée ei Etat yi
(a)
Signal d'erreur
i '('ei)
ei-si
(b)
k
wki
i '('ei)
(c)
21
de ce type de réseau. Les choix des paramètres caractéristiques du réseau (nombre de couches,
nombre de neurones par couches, pas d'
apprentissage, fonction d'
activation) se font alors par
tâtonnement pour obtenir les performances recherchées.
Malgré ces difficultés, ils possèdent des capacités remarquables d'
apprentissage et de
reconnaissance des formes. Pour cela, ils sont particulièrement bien adaptés à la résolution de
problèmes de diagnostic industriel et médical, comme le montrent les exemples d'
utilisation
pour la classification de signaux en médecine [ALPS 95] (classification de Potentiels Evoqués
Auditifs), et pour le diagnostic des machines tournantes. En effet, Yang et son équipe anglaise
ont mis en œ uvre un réseau à rétropropagation du gradient pour le diagnostic de 4 catégories
de défaut d'
un roulement à billes [YANG 03]. Les signatures utilisées pour caractériser le
fonctionnement du moteur sont des signatures vibratoires et quatre approches basées sur les
analyses bi-spectrales et par ondelettes du signal vibratoire sont proposées. Le but est
l'
évaluation en continu du fonctionnement du moteur. Les résultats de ces analyses constituent
les entrées des réseaux de neurones à rétropropagation entrainés pour reconnaître les défauts
de roulement. Les résultats obtenus et présentés dans [YANG 03] montrent que le réseau peut
alors distinguer les quatre différentes conditions de fonctionnement avec des taux de
classification correcte très élevés (atteignant même les 100% dans le cas d'
une des analyses
bispectrales). Il faut toutefois noter que, pour cette étude, les défauts créés artificiellement
sont assez marqués, et qu'
une machine présentant ce type de défauts seraient alors déjà dans
un état très défaillant. Cette étude récente sur des travaux similaires à ceux menés au cours de
cette thèse montre cependant l'
intérêt donné aux réseaux de neurones artificiels dans le
domaine du diagnostic.
22
Teuvo Kohonen, est un algorithme basé sur la technique de compétition entre les neurones.
Un tel comportement est appelé "tout au vainqueur" ("Winner Take All"). Les neurones sont
donc en concurrence les uns avec les autres. On appelle ce type d’ apprentissage apprentissage
concurrentiel.
• Structure du réseau
Le réseau LVQ est un réseau multi-couches, dont la structure est schématisée par la
figure I.3. Il se compose de trois couches : une couche d'
entrée, une couche cachée, encore
appelée couche de compétition et une couche de sortie.
W1 W2
e1
s1
eS
sm
Couche cachée,
Couche dite de Couche de
d’ entrée compétition sortie
(S neurones) (S1 neurones) (S2 neurones)
Le fonctionnement d’ un tel réseau est alors le suivant : lorsqu’ un vecteur e est présenté
au réseau, ce dernier calcule la distance euclidienne entre le vecteur d’ entrée e et les vecteurs-
ligne composant la matrice des poids W1. On obtient alors un vecteur de dimension S1 qui est
présenté à la couche de compétition. Le neurone qui possède alors la plus petite entrée (c’ est-
à-dire celui dont le vecteur des poids est le plus proche du vecteur d’ entrée e) est alors désigné
comme vainqueur et sa position dans la couche de compétition est donnée par l’ équation Eq.
I.6.
C =arg min
k
(e(j)-W1(k, j))2 (Eq. I.6)
j
23
e(j) est la jième composante du vecteur d'
entrée e
W1(k,j) est la jième composante de la kième ligne de la matrice des poids W1
La réponse donnée par le Cième neurone de la couche de compétition est alors égale à 1
et les sorties des autres neurones cachés seront égales à 0. La couche de compétition classe les
vecteurs d’ entrée en S1 sous-classes.
La couche de sortie, dont la fonction de transfert est une fonction linéaire, va alors
transformer la réponse donnée par la couche de compétition afin de déterminer l’ appartenance
du vecteur d’ entrée e à l’ une des classes définies par l’ utilisateur. Si, par exemple, les
neurones 1, 2 et 3 de la couche de compétition apprennent tous des sous-classes de l’ espace
d’ entrée qui font partie de la classe 2, alors, les poids des connexions reliant les neurones
compétitifs 1, 2 et 3 au neurone de sortie 2 prendront la valeur 1, tous les autres poids
synaptiques des liaisons entre ces neurones compétitifs et les autres neurones de sortie étant
alors nuls. Ainsi, ce neurone de sortie répondra 1 si n’ importe lequel des trois neurones
compétitifs gagne la compétition.
Le nombre de neurones S de la couche d'
entrée et S2 de la couche de sortie dépend du
problème à traiter. La couche d'
entrée comprend autant de neurones que de composantes des
vecteurs de la base de données. Pour la couche de sortie, le nombre de neurones est égal au
nombre de classes désirées. Ces derniers possèdent deux états d'
activation : 0 ou 1. Par
exemple, si on présente au réseau un vecteur appartenant à la classe n°1, le neurone n°1 de la
couche de sortie sera actif (état 1), alors que les autres neurones de sortie seront inactifs (état
0). Le choix du nombre de neurones S1 de la couche cachée est un problème plus délicat. Il
doit obéir à un compromis optimisant l'
apprentissage et la capacité du réseau à généraliser.
Cependant, la couche de compétition classant les vecteurs d’ entrée au sein de S1 sous-classes,
il sera nécessaire de choisir S1 supérieur à S2.
• Initialisation
Avant d’ entraîner un réseau LVQ, il faut initialiser les matrices des poids W1 et W2.
On initialise ces poids à partir des vecteurs de la base d’ apprentissage et des classes désirées
pour ces vecteurs d’ apprentissage. La matrice des poids W1 est initialisée de la manière
suivante : chacun des poids W1(i,j) associés à l’ entrée i prend la valeur correspondant au
centre de l’ intervalle au sein duquel sont comprises toutes les valeurs que peut prendre
l’ entrée i.
24
La seconde phase de l’ initialisation consiste à assigner les neurones de la couche de
compétition à chacune des classes. Pour cela, l’ algorithme d’ initialisation recherche la
distribution des sorties désirées. Ainsi, si 35% des vecteurs de la base d’ apprentissage
appartiennent à la classe 2, 35% des neurones de la couche de compétition seront dédiés à la
reconnaissance de sous-classes formant la classe 2. Alors, comme nous l’ avons vu
précédemment, si les neurones 1, 2 et 3 de la couche de compétition sont désignés pour
former des sous-classes de la classe 2, les poids W2(2,1), W2(2,2) et W2(2,3) prendront la
valeur 1, tous les autres poids synaptiques W2(2,j), où j∈[4,S1] seront alors égaux à 0.
• Apprentissage :
Une fois le réseau initialisé, l’ apprentissage peut commencer. On recherche tout
d’ abord le vecteur des sorties désirées Sdc pour la couche de compétition, en utilisant la
matrice W2 des poids de la couche de sortie et le vecteur Sd des sorties désirées fixé par
l’ utilisateur de la manière suivante.
′
Sdc =W2 * Sd (Eq I.7)
Cette expression transforme le vecteur Sd des sorties désirées, contenant un 1 à la
position de la classe désirée, en un vecteur Sdc de sorties désirées pour la couche de
compétition contenant des 1 aux positions correspondant à tous les neurones formant les sous-
classes de la classe désirée.
Un vecteur e de la base d’ apprentissage est ensuite présenté au réseau. D’ après ce qui
précède, le neurone de la couche de compétition dont le vecteur des poids est le plus proche
(au sens de la distance Euclidienne) du vecteur d’ entrée gagne la compétition (répond la
valeur 1). Seul le vecteur des poids correspondant à ce neurone vainqueur sera alors modifié.
Si la sortie de ce neurone de la couche de compétition correspond à la valeur attendue, les
poids sont alors ajustés de la manière suivante :
25
∆W1(C, j)=−lr ⋅(e(j)−W1(C, j)) ∀j∈[1;S ] (Eq. I.9)
On répète ensuite cette procédure avec les autres couples vecteur/classe désirée de la
base d’ apprentissage. Le nombre de fois où cette procédure est répétée est fixé par
l’ utilisateur.
Dans le cadre de cette technique, il n’ existe aucun critère d’ arrêt pour l’ apprentissage,
contrairement à d’ autres méthodes comme la rétropropagation du gradient dans le cas du
Perceptron multicouches. Ainsi, d’ après Jodouin, cette technique d’ apprentissage peut
conduire à des phénomènes de surapprentissage [JODO 94]. En effet, si l’ apprentissage LVQ
est prolongé outre mesure, le réseau finit par consacrer une proportion considérable de ses
vecteurs prototypes à suivre le détail des frontières entre les classes. Le réseau obtient alors de
moins bonnes performances sur le problème en général, car, s’ il a appris correctement, ses
performances en généralisation sont dégradées. Cependant, elles sont rapides et donnent de
bons résultats dans le cadre de la classification.
Dans [VUCK 02], on trouve une application de ce type de modèle pour la
classification de signaux électroencéphalographiques (EEG) en deux catégories. Le but de
leur étude est de pouvoir détecter les états de somnolence et de vigilance d'
un être humain en
bonne santé à partir de son EEG. Pour cela, ils ont utilisé deux modèles de réseaux de
neurones artificiels : le perceptron multi-couche et le réseau Learning Vector Quantization.
Leurs résultats montrent alors de meilleures performances pour le réseau LVQ par rapport au
perceptron employé. Cette étude récente montre l'
intérêt d'
un tel modèle pour la classification
de signaux.
!
Les modèles à fonction de base radiale (RBF2) sont des modèles dans lesquels la
modélisation s'
effectue par des fonctions locales, appelées aussi fonctions noyaux. Ils
reposent sur une cartographie de l’ espace des entrées par des exemples qui ont une influence
locale. Ce sont des réseaux à couches avec comme origine, une technique d’ interpolation
nommée méthode d’ interpolation RBF (“RBF interpolation”) ou méthode des noyaux. Cette
méthode est bien connue en statistique pour l’ approximation à partir de données empiriques
de densités de probabilités. Elle a été proposée par Powell [POWE 85] et améliorée par
2
Radial Basis Function en anglais.
26
Niranjan et Fallside [NIRA 88]. Employée pour la première fois dans le contexte des réseaux
de neurones par Broomhead et Lowe [BROO 88], cette technique s’ avère être à la fois rapide
et efficace, en particulier dans le cadre de la classification.
Les réseaux à fonction de base radiale font partie des réseaux à base de distance. Les
neurones sur lesquels sont basés ces réseaux sont appelés neurones à base radiale et sont basés
sur la distance entre le vecteur d’ entrée X et le vecteur centre (vecteur de la base
d’ apprentissage, aussi appelé vecteur prototype) du neurone C. La sortie de ce type de
neurone est définie de la manière suivante :
n
y =G( X −C n )=G n X(i)−C(i) (Eq I.10)
i
où X n
est la norme n du vecteur X. La fonction G(z) est généralement une fonction non
linéaire, symétrique, monotone pour z>0. Les bornes supérieures et inférieures de cette
fonction sont respectivement notées Gmax et Gmin. Dans la plupart des cas, G(z) est une
fonction exponentielle généralisée :
m
−z
G ( z ) = Gmin + (Gmax − Gmin ) ⋅ e σ
(Eq. I.11)
où les deux paramètres m et σ sont respectivement l’ ordre et l’ écart type de la fonction. Les
frontières de décision (zone d’ influence) D(γ), qui correspondent à l'
ensemble des points de
l' entrée pour lesquels le réseau donne une réponse en sortie égale à γ∈ℜ, sont alors
espace d'
données par X − C n = G −1 (γ ) .
Le cas le plus fréquemment utilisé est le cas particulier où n=2, Gmin=0 et m=2. Dans
ce cas, la distance calculée entre le vecteur X et le vecteur centre C est la distance euclidienne
et la fonction G(z) est une fonction gaussienne. Les paramètres décrivant alors un tel neurone
à base radiale sont la position des centres et l’ écart type de la gaussienne. De plus, dans ce
cas, la frontière de décision D(γ) définie précédemment est sphérique.
27
• Structure du réseau :
Le réseau RBF est un réseau à trois couches3 : une couche d’ entrée, une couche cachée
composée des neurones à base radiale présentés précédemment et une couche de sortie de
neurones dont la fonction d’ activation est linéaire. La figure I.4 illustre l’ architecture d’ un
réseau RBF.
Le nombre de neurones des couches d’ entrée et de sortie est choisi en fonction du
problème à traiter. En ce qui concerne la couche cachée, la technique RBF prévoit une
fonction noyau, c’ est-à-dire un neurone, par point de donnée apprise. En d’ autres termes, le
nombre de neurones de la couche cachée est égal au nombre d’ exemples présentés au réseau
lors de la phase d’ apprentissage. Dans ce cas, cela assure un comportement sans erreur pour
les données connues. Toutefois, en pratique, les données peuvent être nombreuses et
redondantes. Certains algorithmes d’ apprentissage peuvent alors conduire à un nombre plus
restreint de neurones (par exemple [BROO 88]).
e1 W1 W2
e2 s1
e3
sS2
eS
Couche cachée Couche
Couche composée de de sortie
d’ entrée fonctions-noyaux S2 neurones
S neurones S1 neurones
Figure I. 4 - Structure d'un réseau RBF
• Apprentissage :
On peut distinguer deux étapes distinctes dans la phase d’ apprentissage des réseaux
RBF : la paramétrisation des fonctions à base radiale et l’ apprentissage des poids de la couche
de sortie [MOOD 89]. La première étape peut se décomposer en deux sous-étapes : la
détermination du nombre et de la position des centres Ci et le choix de la taille σi des champs
3
Pour certains auteurs, les réseaux RBF sont des réseaux à deux couches, car les entrées ne sont pas considérées
comme définissant une couche.
28
récepteurs. La position du centre Ci d’ un neurone de la couche cachée est codée par les poids
W1(i,j) d’ entrée du neurone et la dimension σi, par un paramètre interne
où y(j) représente la sortie du jème neurone à base radiale (neurone de la couche cachée).
Il existe plusieurs variantes de cet algorithme, car, en pratique, les données peuvent
être nombreuses et redondantes, ce qui conduirait à un réseau surdimensionné. On peut alors
citer :
• les algorithmes incrémentaux, où on construit une architecture de réseau
adaptée au problème en augmentant la complexité de la structure du réseau
par un ajout de neurones,
• les algorithmes décrémentaux, dont le principe est de simplifier une
architecture complexe de réseau en supprimant les paramètres (connexions
ou neurones) qui ne sont pas nécessaires à une application spécifique
[MUST 92].
29
Par exemple, F. Schwenker et al. [SCHW 02] mettent en œ uvre ce réseau pour classer
des séries temporelles acoustiques. Leur base de données contient les chants de crickets de 35
espèces enregistrés en Thaïlande et en Equateur. Des caractéristiques locales – 3 au total -
sont alors extraites des enregistrements et classées par des classifieurs neuronaux de type RBF
suivant 35 catégories. La mise en œ uvre de ces réseaux leur permet alors d'
atteindre un taux
d'
erreur de 34,65% pour la classification de l'
une des caractéristiques.
Ces réseaux, grâce à leurs perfomances en matière de classification, sont des outils
privilégiés pour l’ aide au diagnostic, ce qui justifie leur exploitation dans le cadre de mes
travaux. Cependant – et nous le montrerons au chapitre II - les approches neuronales simples,
c'
est-à-dire celles n'
impliquant qu'
un seul réseau de neurones artificiels, ne sont en général pas
suffisantes pour construire un outil performant pour l'
aide au diagnostic [DUJA 99a,b,c]. En
effet, si, depuis les deux dernières décennies, des études ont montré que les techniques à base
de réseaux de neurones présentent des avantages certains pour résoudre des problèmes pour
lesquelles les méthodes conventionnelles sont limitées, d'
autres ont aussi montré que le
comportement complexe et les performances («comportement intelligent ») des systèmes
biologiques (vivants) ne peuvent se résumer dans la simplicité actuelle de telles structures
[CHEB 97]. Partant de ce constat, inversement, il paraît invraisemblable que des approches
n’ impliquant qu’ un seul réseau neuronal soient les plus appropriées pour approcher les
performances du traitement d’ information des systèmes vivants. Nous nous sommes alors
orientés vers des structures plus complexes, pouvant impliquer plusieurs réseaux de neurones.
Dans le paragraphe suivant, nous proposons une approche neuronale hybride.
30
" "#$
Informations
d'entrée
Agent
Etape
Agent
de Etape de
Agent
Pré-traitement décision
Agent
Neuronal
L'
approche que nous proposons pour l'
élaboration d'
un outil d'
aide au diagnostic
concerne une association de différentes techniques, conventionnelles et neuronales. La
stratégie que nous envisageons de mettre en œ uvre est présentée figure I.5.
Dans de nombreux cas, afin d'
établir un diagnostic, une seule mesure ne suffit pas à
obtenir suffisamment d'
informations pertinentes pour pouvoir établir un diagnostic. En effet,
le médecin, par exemple, prendra en compte les résultats de différents examens, les
symptômes du patient, avant de donner son diagnostic. De la même manière, pour un
processus industriel, les informations relatives au fonctionnement de ce dernier peuvent être
délivrés par différents indicateurs que l'
opérateur doit analyser. Il semble alors légitime de
prendre en compte différentes informations relatives au système (industriel ou biomédical) et
de combiner ces données. L'
architecture, qui permettra ensuite de traiter l'
ensemble des
informations délivrées par les capteurs, comprend trois niveaux de traitement :
Une étape de prétraitement
Un ensemble d'
agents neuronaux
Une étape finale de décision où on réaliserait la fusion des informations de chacun
des agents neuronaux spécialisés afin de parvenir à un élément de diagnostic
31
d'
une défaillance ou d'
une dégradation fait le plus souvent appel à l'
utilisation de signatures
élaborées à partir des signaux ou des informations. Dans le domaine médical, on trouve aussi
fréquemment une chaîne de traitement des informations issues des sondes ou des examens
médicaux (par exemple, pour l'
obtention de la surface de la Dynamique Temporel du Tronc
Cérébral).
En effet, les informations brutes que fournissent les capteurs ont souvent besoin d'un
traitement afin d'
extraire des caractéristiques pertinentes pour la surveillance du système
considéré et d’ en faciliter le traitement par les structures neuronales suivantes, par des
opérations de filtrage, de normalisation… Les principales signatures utilisées pour résoudre le
problème du diagnostic dans le domaine industriel et le domaine médical sont énumérées dans
la suite de cette partie.
Le traitement du signal joue un rôle très important dans l'
établissement des signatures
associées aux fonctionnements normaux et anormaux.
Une autre opération peut être aussi envisagée dans cette étape de prétraitement : il
s’ agit de diviser le problème en sous-problèmes plus simples à partir des mesures effectuées.
Le principe de cette opération peut se résumer ainsi :"Divide to Simplify"4. (DTS). Chacun
des sous-problèmes ainsi obtenus pourrait alors être traité par une structure neuronale
adéquate, spécialisée pour chacun des sous-problèmes. La technique DTS est exposée dans
[CHEB 97]
&
Une signature est une information élaborée à partir des signaux ou des données
recueillies et doit contenir les informations jugées pertinentes par les spécialistes pour la
détection d’ une défaillance ou d’ une dégradation. La complexité d’ une signature dépend de la
nature du système à surveiller et varie suivant l’ anomalie recherchée : défaillance ou
dégradation. Parmi les principales signatures utilisées, on peut citer :
4
Diviser pour simplifier
32
• Les signatures vibratoires
Elles sont adaptées à la surveillance d’ ensembles mécaniques dont les différents
éléments sont soumis à des efforts mécaniques dynamiques qui se traduisent par des
vibrations. Elles sont principalement utilisées pour le diagnostic des machines tournantes.
33
• Les signatures par analyse des lubrifiants
Elles sont utilisées pour déterminer les caractéristiques physico-chimiques du
lubrifiant et d'
identifier une usure des éléments mécaniques. Elles peuvent être de nature
différente : spectrogramme, images, critères quantitatifs. Elles permettent une détection
précoce de mécanisme d'
usure sur des machines tournantes. Il faut cependant être très attentif
à la qualité de la prise des échantillons du lubrifiant car de là dépend la fiabilité des
conclusions.
34
Nous proposons ensuite de mettre en œ uvre un ensemble d'
agents neuronaux pour
apporter un élément de réponse au problème du diagnostic du système surveillé. Ces agents
peuvent être des modèles neuronaux similaires (architecture homogène) ou différents
(architectures hétérogènes). Une présentation générale des réseaux de neurones artificiels,
ainsi que celle des structures utilisées dans cette thèse, ont été faites au paragraphe I.2.2.
'
On peut aussi envisager de prendre en compte des informations non traitées par les
agents neuronaux. Ainsi, par exemple, les données factuelles comme les symptômes des
patients dans le domaine médical, pourrait être introduites à ce niveau de notre approche. Par
exemple, dans le cadre du problème biomédical, la prise en compte du seuil auditif
interviendra, dans cette structure, au niveau de cette étape de décision.
De plus, l'
objectif étant l'
étude d'
un outil d'
aide au diagnostic – le but n'
étant pas de se
substituer au spécialiste, notamment dans le domaine médical, où le médecin doit rester
maître de sa décision -, il paraît alors intéressant de pouvoir obtenir un indicateur de confiance
du résultat fourni par la structure hybride proposée. Différentes structures ont ainsi été mises
en œ uvre au cours de cette thèse. Elles seront présentées au chapitre III.
Les travaux de F. Schwenker [SCHW 02] peuvent constituer une application de cette
structure hybride. Rappelons que leur but est la classification de signaux bio-acoustiques. La
première étape consiste en l'
extraction de trois caractéristiques locales des signaux enregistrés
(étape de pré-traitement). Puis, chacune de ces caractéristiques est traitée par un classifieur
35
neuronal, un réseau RBF. Les résultats de classification sont ensuite fusionnés suivant 3
différentes techniques. La mise en œ uvre de telles techniques leur permet alors d'
atteindre un
taux de classification correcte de 93,78%, malgré des résultats de classifcation insuffisants
issus des réseaux de neurones utilisés seuls (9,06% de classification correcte pour la
caractéristique 1, 65,35% pour la caractéristique2 et 7,87% pour la caractéristique 3). Ces
travaux récents montrent donc une nette amélioration des performances, et ainsi, justifient
l'
emploi d'
une telle structure.
5
définition retenue par les instances nationales et internationales de normalisation (AFNOR, CEI)
6
définition étymologique du dictionnaire ROBERT faisant référence à la racine grecque du mot (dia : par,
gnosis : connaissance)
36
probables. Cependant, ces interventions comportent une contrainte temporelle : afin d'
éviter
toute situation grave, tant dans le domaine industriel que dans le domaine médical, il est
indispensable de réagir vite.
Compte tenu de la complexité des problèmes généralement rencontrés dans le domaine
de l'
aide au diagnostic – et plus particulièrement dans les domaines auxquels nous nous
sommes intéressés – l'
utilisation des techniques conventionnelles devient vite inefficace. C'
est
pourquoi nous avons consacré ce travail de thèse à l'
étude de l'
aide au diagnostic par réseaux
de neurones artificiels. Dans ce chapitre, nous avons passé en revue trois modèles neuronaux :
le réseau à rétropropagation du gradient, le réseau Learning Vector Quantization et le réseau
Radial Basis Function. Le réseau à rétropropagation du gradient est un outil performant pour
la classification non-linéaire, la compression de données, l'
approximation de fonction… Le
réseau Learning Vector Quantization, quant à lui, est un réseau classifieur. Enfin, le réseau
Radial Basis Function est utilisé lui aussi à des fins de classification. Il donne aussi de bons
résultats dans l'
approximation de fonction, et l'
identification.
Enfin, nous proposons une structure hybride neuronale multi-modèle pour l'
aide au
diagnostic. Partant de l'
hypothèse que les approches neuronales simples, c'
est-à-dire celles
n'
impliquant qu'
un seul réseau de neurones artificiels, ne sont en général pas suffisantes pour
construire un outil suffisamment performant pour l'
aide au diagnostic, nous avons donc
construit une structure plus complexe, pouvant s'
adapter à une plus large variété de domaines
d'
application.
Bien que certains travaux aient été effectués sur le mélange d'
experts neuronaux
[JORD 95][SRID99][CHEN 99], ceux-ci n'
en sont encore qu'
à un stade théorique, et ne sont
donc pas encore exploitables. De plus, l'
idée de base de ces travaux repose essentiellement sur
des techniques issues des méthodes statistiques, qui supposent un nombre suffisant et
important de données. Dans les cas réels (et aussi dans les applications traitées), cette dernière
condition n'
est pas forcément réalisable. Notre choix s'
est porté sur une architecture de
traitement des informations comprenant trois niveaux : un niveau de prétraitement, un autre
constitué d'
agent neuronaux et enfin, un niveau de décision. La phase de prétraitement des
informations doit permettre d'
extraire des caractéristiques pertinentes pour la surveillance du
système considéré et d’ en faciliter le traitement par les structures neuronales suivantes. Il peut
alors s'
agir d'
opérations de filtrage, de normalisation…Ces informations ainsi traitées sont
ensuite présentées à un ensemble d'
agents neuronaux. Ce niveau de traitement peut être
homogène (les agents neuronaux sont du même type) ou hétérogène (on utilise des modèles
différents). Dans les applications présentées et traitées dans cette thèse, ce niveau de
37
traitement permet de réaliser une classification préliminaire des informations d'
entrée. En
effet, dans le domaine du diagnostic, la classification – ou, plus exactement, la catégorisation
de signaux issus du système à surveiller en fonctionnement, c'
est à dire l'
affectation de la
catégorie de défauts à ces signaux - tient une place importante. Enfin, une phase de décision
donnera un élément de diagnostic. Ce dernier niveau de traitement peut mettre en jeu diverses
techniques, comme des opérations de seuillage, des réseaux de neurones artificiels, ou même
des systèmes experts.
Pour mettre en œ uvre une telle stratégie, et ce, quel que soit le domaine d'
application,
il est tout d'
abord nécessaire de disposer d'
une base exhaustive d'
informations relatives au
fonctionnement du système à surveiller, afin de pouvoir mettre en œ uvre les structures
neuronales (apprentissage des cas normaux et des cas de fonctionnement anormal).
Concernant les agents neuronaux, nous avons choisi de mettre en œ uvre des modèles
particulièrement adaptés à la classification : les réseaux Learning Vector Quantization et
Radial Basis Function. Une étude doit ensuite permettre de choisir la structure (nombre de
neurones, réglage de paramètres) la plus adéquate pour le traitement du problème posé. Enfin,
le choix du module de décision devra répondre aux attentes des médecins dans le cas d'
une
application médicale (obtention d'
un diagnostic, avec ou sans indice de confiance, par
exemple), ou du cahier des charges imposé par une entreprise dans le cas d'
une application
industrielle (obtention d'
un seuil d'
alerte pour une maintenance préventive, localisation d'
un
défaut…).
Le chapitre suivant est destiné à montrer les limites d'
une approche neuronale à réseau
de neurones unique dans la résolution d'
un problème d'
aide au diagnostic. Deux
problèmatiques ont ainsi été étudiées. L'
une concerne le domaine biomédical, et l'
autre, le
domaine industriel.
38
Chapitre I . ...........................................................................................................................13
Diagnostic et Réseaux de Neurones Artificiels......................................................................13
I.1. Introduction ..............................................................................................................13
I.2. Les Réseaux de Neurones Artificiels.........................................................................16
I.2.1. Réseaux de neurones artificiels et diagnostic .....................................................16
I.2.2. Le perceptron ....................................................................................................18
I.2.3. Le réseau Learning Vector Quantization............................................................22
I.2.4. Le réseau Radial Basis Function........................................................................26
I.3. Approche neuronale hybride .....................................................................................31
I.3.1. Généralités ........................................................................................................31
I.3.2. Informations d' entrée et étape de prétraitement..................................................31
• ( & & &
& ....................................................................................................32
• ( ' & " ) & & ........34
I.3.3. Les agents neuronaux ........................................................................................35
I.3.4. L' étape de décision ............................................................................................35
I.4. Conclusion................................................................................................................36
39
Comme nous l’ avons souligné précédemment, le problème du diagnostic est un
problème complexe. De nombreuses techniques ont été développées et constituent une aide
précieuse. Les travaux présentés dans cette thèse ne prétendent pas résoudre le problème du
diagnostic, mais apporter une aide pour le diagnostic dans les domaines industriel ou médical.
Ils concernent les méthodes de diagnostic externes, c’ est-à-dire celles qui ne nécessitent pas
de modèle pour être mises en œ uvre. La seule connaissance du système à surveiller repose
alors sur l'
expertise humaine confortée par un solide retour d'
expérience. Dans cette catégorie,
on trouve les techniques de reconnaissance de formes, mais aussi les techniques basées sur
l'
intelligence artificielle, qui constituent des outils privilégiés pour la catégorisation
d'
informations issues du système à surveiller en fonctionnement, c'
est à dire l'
affectation de la
catégorie de défauts à ces signaux. Dans le domaine du diagnostic – qu'
il soit industriel ou
médical – cette tâche tient une place importante1.
Ce chapitre a pour objet l'
étude de la mise en œ uvre de réseaux de neurones pour l'
aide
au diagnostic dans deux domaines, l'
un biomédical, l'
autre industriel. La première partie de ce
chapitre est consacrée au problème biomédical. Après avoir présenté la problématique ainsi
que la mise en œ uvre d'
une technique conventionnelle, nous aborderons l'
application de
techniques neuronales à réseaux de neurones unique. Deux modèles neuronaux ont été mis en
1
Remarque : pour des raisons liées aux différentes significations que peut prendre le terme « classification »
selon le domaine, dans la suite de cette thèse, nous allons utiliser ce terme dans le sens de la « catégorisation ».
Notre choix d’ usage de ce terme dans le sens précité est motivé par l’ utilisation du terme « classification » dans
ce sens dans la littérature scientifique anglophone : le terme « catégorisation » étant plutôt courant parmi les
biologistes (neurosciences).
40
œ uvre pour la classification des informations : le réseau Learning Vector Quantization et le
réseau Radial Basis Function. Nous présentons ensuite les résultats obtenus. Enfin, nous
aborderons la problématique industrielle et présenterons de la même manière les résultats des
techniques neuronales simples qui lui sont associés.
L'
objet de cette étude est le développement d’ un outil d’ aide au diagnostic pour les
médecins ORL. L’ exploration fonctionnelle otoneurologique possède aujourd’ hui une
technique permettant l’ étude objective de la conduction nerveuse le long des voies auditives :
les Potentiels Evoqués Auditifs (PEA), qui sont des signaux électriques. La classification des
PEA est une première étape dans le développement d’ un outil d’ aide au diagnostic. La
difficulté principale de cette classification réside dans la ressemblance de signaux
correspondant à des pathologies différentes, mais aussi dans la disparité des signaux au sein
d'
une même classe. Les résultats du test médical peuvent, par exemple, être différents pour
deux mesures différentes pour le même patient.
41
Figure II. 1 - Principe de génération des PEA
2
Une présentation de l'
appareil auditif est donnée en Annexe 3.
42
probable qu’ à une onde ne correspond pas un générateur unique mais un ensemble de
générateurs qui déchargent simultanément.
43
Toutefois, maintenant que l'
on peut faire un diagnostic par imagerie d'
un tout petit
neurinome, que l'
on sait être une tumeur bénigne à évolution lente, savoir si elle entraîne ou
non un retentissement sur la fonction de l'
oreille est un élément important à considérer dans la
prescription chirurgicale. Si la décision de ne pas opérer immédiatement est prise, les PEA
sont un élément important du suivi du patient, par exemple.
L'
extraction et le recueil de ces signaux sont représentés figure II.3.
On installe des électrodes sur la tête du patient en des points précis qui dépendent des
buts recherchés. Dans notre cas, on utilise quatre électrodes (3 autocollantes et une aiguille)
que l’ on place de la manière suivante :
une électrode autocollante sur le front (masse)
deux électrodes autocollantes derrière les oreilles, sur les mastoïdes,
une électrode aiguille au sommet du crâne (vertex) pour le recueil de l’ EEG.
La stimulation du système auditif est réalisée à l’ aide d’ un son bref, proche d'
un clic
acoustique, délivré par un casque que porte le patient.
44
développé pour l' appelle ELAUDY3. Celui-ci
acquisition et le traitement du signal PEA s'
permet l'
obtention du signal moyenné, appelé PEM, qui correspond à la moyenne des 800
acquisitions, et de la surface DTC.
La figure II.4 (tirée de [MOTS 87]) montre deux surfaces typiques, l'
une obtenue avec
un patient normo-entendant (II.11-A), l'
autre, avec un patient souffrant de troubles auditifs
(II.11-B). Cette dernière figure (II.11-B) montre qu'
il existe une grande variété de signaux
PEA pour un même patient. De plus, ce logiciel détermine automatiquement, à partir du PEM,
les cinq ondes significatives et donne les latences de ces ondes. Il permet aussi
l'
enregistrement, pour chaque patient, d'
un fichier contenant les informations administratives
(nom, âge… ), les résultats des tests auditifs et les conclusions du médecin ORL (pathologie,
causes, indice de confiance sur la pathologie diagnostiquée).
Pour l'
élaboration de notre base de données, nous disposions du logiciel ELAUDY et
d'
un CD-ROM contenant un ensemble de dossiers de patients (11 185 dossiers). Ces dossiers
proviennent du CREFON4. Chaque dossier contient la fiche patient (informations
administratives), la fiche surface DTC.
L'
extraction d'
une base de données utile pour notre travail peut se décomposer en deux
tâches :
3
Extraction et Lecture AUtomatique de la DYnamique temporelle du tronc cérébral
4
Centre de Recherche et d'
Exploration Fonctionnelle Oto-Neurologique
45
• une sélection des patients intéressants pour l'
étude suivant différents critères
(âge, pathologie...),
• l'
extraction des données pour chaque patient sélectionné (latences, signal
PEM...).
A partir des renseignements mentionnés par le médecin, nous avons sélectionné les
sujets à inclure dans notre base de données. Grâce à un programme en langage C, nous avons
ensuite extrait les informations utiles pour chaque patient ainsi sélectionné.
Nous avons choisi 3 catégories de patients selon le type de leur trouble. Ces catégories
sont :
• normal : ces patients ont une audition normale (classe normale)
• endocochléaire : ces patients sont atteints de troubles qui touchent la partie de
l’ oreille située au niveau de la cochlée (classe endocochléaire)
• rétrocochléaire : ces patients sont atteints de troubles qui touchent la partie de
l’ oreille située après la cochlée. (classe rétrocochléaire)
En effet, les PEA ont longtemps été le moyen le plus fiable de diagnostic précoce du
neurinome. Par exemple, M.Don et al. montrent l'
importance de définir un système qui permet
de classer les signaux caractérisant les sujets rétrocochléaires par rapport aux autres [DON
97]. De plus, il existe de nombreux travaux étudiant les différences entre les pathologies
rétrocochléaires et endocochléaires. Nous avons donc choisi de commencer notre étude en ne
retenant que ces deux classes pathologiques auxquelles nous avons adjoint la détection des
patients normo-entendants.
Nous avons ainsi sélectionné 213 vecteurs. 92 d’ entre eux appartiennent à la classe
normale, 83, à la classe endocochléaire et 38, à la classe rétrocochléaire.
46
• une approche "image", où les informations pour chaque cas sélectionné
seraient disponibles sous la forme d'
une image, qui caractériserait, par
exemple, la surface DTC présentée précédemment. (Rq : cette étude a été
amorcée il y a peu au sein du laboratoire)
! "
! ## $ %
47
autorégressive des signaux PEM. Réaliser la modélisation autorégressive à l'
ordre m d'
un
signal s revient à rechercher les m coefficients ai tels que :
m
s( n) = ai ⋅ s(n − i ) ∀n ∈ [m + 1; M ] (Eq.II.1)
i =1
! ( ## %
5
Par analogie avec la mise en œ uvre des réseaux de neurones artificiels, on pourrait appeler cette base, base
d'
apprentissage pour la classification.
48
Figure II. 5 – Modélisation AR à l'ordre 45 des signaux Moyens
Classe Réelle
Le taux de classification correcte obtenu grâce à cette structure est donc de 30% pour
la globalité de la base de données avec un taux de classification correcte de :
• 34,2% pour la classe rétrocochléaire,
• 34 ,9% pour la classe endocochléaire,
• 24% pour la classe normale.
De plus, on a pu remarquer que les vecteurs qui nous ont permis de calculer les
signaux moyens ne sont pas bien reconnus par cette technique, puisque seuls 50% de ces
49
vecteurs sont correctement classés. Le Potentiel Evoqué Moyenné Moyen n'
est donc pas une
représentation correcte.
De ce fait, nous avons envisagé une autre stratégie pour la classification des PEAs à
l'
aide d'
un modèle AR.
! ) ## %
Pour cette seconde approche, nous avons repris les vecteurs correspondant aux
pathologies certaines qui nous avaient permis d'
obtenir les signaux moyens mentionnés ci-
dessus. Pour chacun de ces signaux, nous avons recherché les coefficients AR. Comme
précédemment, un ordre 45 est nécessaire pour restituer fidèlement les signaux considérés.
Nous obtenons donc une base de référence de 24 séries de 45 coefficients AR. Puis,
nous procédons de la même manière : pour chacun des 213 signaux de notre base de données,
nous recherchons les coefficients AR à l'
ordre 45. Puis, nous comparons les coefficients
obtenus à ceux de notre base de référence en recherchant la corrélation entre les séries de
coefficients. La corrélation maximale permet alors de déterminer la classe à laquelle
appartient le signal considéré.
Les résultats sont présentés dans le Tableau II.2.
Classe Réelle
Le taux de classification correcte obtenu grâce à cette structure est donc de 37% pour
l'
ensemble de la base de données (y compris la base de référence) avec un taux de
classification correcte de :
• 68,4% pour la classe rétrocochléaire,
• 30% pour la classe endocochléaire,
• 30,4% pour la classe normale.
50
On peut ainsi noter que les résultats obtenus sont globalement très insuffisants6, et que,
par conséquent, la classification par modélisation AR n'
est pas une solution acceptable, car les
taux de classification correcte sont très faibles. En effet, les signaux sur lesquels nous
travaillons peuvent être très différents au sein d'
une même classe et présenter des similitudes
d'
une classe à l'
autre. C'
est pourquoi nous avons choisi de mettre en œ uvre des techniques
neuronales.
! & # %
L'
objet de l’ étude biomédicale est l’ obtention d’ un élément de diagnostic à partir de
signaux médicaux, les Potentiels Evoqués Auditifs (PEA) présentés précédemment. La
classification des PEA est l’ une des étapes dans le développement d’ un outil d’ aide au
diagnostic. Rappelons que la difficulté principale de cette classification réside dans la
ressemblance des signaux correspondant à des pathologies différentes, mais aussi dans la
disparité des signaux au sein d'
une même classe.
Deux traitements ont été appliqués sur les signaux PEM extraits de la base de données
du CREFON. Le premier consiste en une normalisation des signaux. En effet, deux signaux
moyennés issus de l'
examen peuvent avoir des amplitudes très différentes. De plus, il s'
avère
que, selon Motsch [MOTS 87], le praticien ne tient pas compte de l'
amplitude des signaux
pour établir son diagnostic. Ce sont ces considérations qui nous ont amenés à normaliser entre
0 et 1 les signaux d'
entrée du réseau.
Chaque PEM a été normalisé indépendamment des autres. On obtient ainsi un signal
dont les valeurs maximales et minimales sont respectivement 1 et 0. On fait ainsi abstraction
des amplitudes relatives des signaux définissant notre base de données.
Le deuxième traitement appliqué au signal PEM est une troncature. On sait, en effet,
que l'
onde I se situe après les 20 premiers points et que l'
onde V apparaît avant les 20 derniers
points de ce signal. De plus, les premiers points contiennent l'
artefact de stimulation. Il
n'
existe donc pas d'
information utile dans ces portions de signal. C'
est pourquoi, nous avons
travaillé sur des signaux tronqués. Nous avons alors supprimé les 20 premiers et les 20
derniers points de chaque signal.
6
Sauf, toutefois pour la classification des vecteurs rétrocochléaires.
51
! " & * +
, -#
Figure II. 6 - Evolution du nombre d'erreurs en fonction du nombre de neurones dans la couche cachée du
réseau LVQ pour la classification des signaux PEA
52
On peut remarquer qu'
on obtient les meilleures performances – soit, un taux de
classification correcte de 56,8% - pour un nombre de neurones dans la couche cachée égal à
12 et 20. On peut alors remarquer que la répartition des erreurs n'
est alors pas la même suivant
le nombre de neurones cachés.
, "
A partir des résultats précédents, nous avons donc mis en œ uvre les réseaux LVQ ainsi
optimisés. Nous avons pu observer que la couche cachée peut ainsi contenir 12 ou 20
neurones cachés. Les résultats obtenus sont présentés dans le tableau II.3.
Classe Réelle
Rétrocochléaire Endocochléaire Normal
Classe donnée
par le LVQ 12 n 20 n 12 n 20 n 12 n 20 n
Rétrocochléaire 25 26 9 9 7 10
Endocochléaire 5 5 50 46 39 33
Normal 8 7 24 28 46 49
Tableau II. 3 - Résultats de classification des PEA par les réseaux LVQ
On peut noter que, pour ces deux configurations (12 et 20 neurones cachés), la base
d’ apprentissage a été correctement apprise. Tous les vecteurs appris sont correctement classés
lors de la phase de généralisation. Ainsi, le taux de classification correcte obtenu grâce à ces
structures est de 56,8% pour la globalité de la base de données avec un taux de classification :
• de 65,8% (12 neurones cachés) et de 68,4% (20 neurones cachés) pour la
classe rétrocochléaire,
• de 60,2% (12 neurones cachés) et de 55,4% (20 neurones cachés) pour la
classe endocochléaire,
• de 50% (12 neurones cachés) et de 53,3% (20 neurones cachés) pour la
classe normale.
Les résultats obtenus par cette technique neuronale simple sont meilleurs que ceux des
techniques conventionnelles précédentes. Cependant, le taux de classification correcte global
de tels réseaux est nettement insuffisant pour prétendre en faire un outil d'
aide au diagnostic,
puisque, pour seulement un peu plus d'
un vecteur sur deux, la classe correcte est désignée par
le réseau LVQ.
53
! " " .
, -#
54
de la façon suivante : si, pour un vecteur d'
entrée donné, la réponse est proche de 1 (resp. 2 ou
3), le vecteur sera considéré comme appartenant à la classe 1 (resp. 2 ou 3).
Nous avons choisi de coder les classes comme pour le LVQ. Le réseau RBF comprend
donc 3 neurones en sortie.
Comme nous l'
avons déjà mentionné, contrairement au LVQ, le nombre de neurones
de la couche cachée du RBF est déterminé par apprentissage. Les neurones de la couche
cachée sont utilisés pour mémoriser un exemple et une fonction d’ activation. Chacun a une
activité locale dans l’ espace d’ entrée. Ainsi, les fonctions noyaux ne donnent des réponses
utiles que dans le cas d’ un domaine restreint, leur champ récepteur. Ce champ récepteur,
encore appelé zone d'
influence, est l'
un des paramètres caractéristiques du réseau RBF. Pour
le modèle que nous utilisons, le rayon de cette zone est fixe et nous pouvons le faire varier
grâce à un paramètre, noté sc.
Nous avons étudié, dans chacun des cas, l'
impact de la taille de la zone d'
influence des
neurones. Pour cela, nous avons fait varier le paramètre sc de 0,1 à 10 avec un pas de 0,1 pour
la classification des PEA. L'
apprentissage s'
arrête quand le nombre de neurones cachés atteint
le nombre de vecteurs de la base d'
apprentissage ou que l'
erreur commise atteint un seuil fixé
par l'
utilisateur. Les résultats obtenus en phase de généralisation sont présentés à la figure II.7.
On peut remarquer alors un minimum de 87 erreurs pour une valeur de sc de 7,5. Il est
cependant intéressant de s'
intéresser à l'
évolution de l'
erreur dans chacune des classes. En
effet, il peut être utile de choisir une valeur du paramètre sc permettant d'
optimiser la
classification d'
une des classes, par exemple, pour l'
utilisation d'
un RBF dans une structure
plus complexe. Ainsi, on pourra privilégier la reconnaissance d'
une classe par rapport à une
autre et dédier ainsi le réseau en question à la reconnaissance d'
une des catégories de
pathologie.
Les résultats obtenus ne sont valables que pour les bases d'
apprentissage définies. Ils
montrent cependant la pertinence de ce paramètre dans la construction d'
un réseau adéquat. Il
est important de rappeler que les critères d'
arrêt d'
apprentissage utilisés, mentionnés ci dessus,
restent restrictifs du fait que le rayon d'
influence a été supposé identique pour tous les
neurones de la couche cachée.
55
Figure II. 7 - Evolution de l'erreur commise en fonction du paramètre sc pour la classification des PEA
, "
A partir des résultats précédents, nous avons donc mis en œ uvre le réseau RBF ainsi
optimisé. La valeur du paramètre sc choisie est donc de 7,5. Les résultats obtenus sont
présentés dans le tableau II.4.
Classe Réelle
Le taux de classification correcte obtenu grâce à cette structure est de 59,1% pour la
globalité de la base de données avec un taux de classification correcte de :
56
• 63,1% pour la classe rétrocochléaire,
• 54,2% pour la classe endocochléaire,
• 62% pour la classe normale.
Si les résultats de classification correcte globaux sont proches pour les deux
techniques neuronales appliquées, on peut cependant noter que les 2 réseaux LVQ permet une
meilleure reconnaissance des classes rétrocochléaire et endocochléaire, alors que le réseau
RBF obtient de meilleurs résultats pour la classification des vecteurs de type "Normal".
Cependant, dans les deux cas, les taux de classification correcte sont trop insuffisants pour
pouvoir implanter en l'
état un réseau LVQ ou un réseau RBF seul comme outil d'
aide au
diagnostic.
! / & 0
1 %
!
L'
objet de cette étude concerne le développement d'
un outil d'
aide au diagnostic de la
machine asynchrone, devenue de plus en plus présente dans les applications industrielles. En
effet, ce type de moteur est très robuste, son coût est faible et il peut atteindre de hautes
performances grâce au développement de composants électroniques permettant la mise en
place de loi de commandes sophistiquées. Néanmoins, en cas de défaillance du moteur, ces
algorithmes peuvent devenir complètement inefficaces, voire dangereux pour l’ installation.
C’ est pourquoi, il est important de contrôler à tout instant l’ état de la machine et de mettre en
place des systèmes de maintenance préventive pour vérifier son bon fonctionnement.
Le problème de la surveillance de ces machines fait l’ objet de nombreuses recherches
[COMB 02][THOM 99]. L’ un des axes principaux est la recherche de modèles –
principalement des modèles du fonctionnement défaillant de la machine asynchrone, de
manière à pouvoir non seulement détecter une défaillance, mais aussi l’ identifier et la
localiser – de manière à pouvoir appliquer les techniques internes de diagnostic [CHAN 02].
57
Cependant, la diversité des conditions réelles de fonctionnement et la dérive des modèles
internes par rapport à ces conditions rendent ces techniques souvent difficilement applicables.
Nous avons décidé de faire abstraction de l’ obtention de ce modèle et de mettre alors
en œ uvre des techniques de diagnostic externes à base de réseaux de neurones. Pour cette
étude, nous avons travaillé en collaboration avec le laboratoire CERTES (Centre d’ Etudes et
de Recherche en Thermique, Environnement et Systèmes). C’ est cette équipe, experte en
mécanique, qui a constitué la base de données, à partir d’ un moteur asynchrone présent sur un
banc d’ essai pour l’ étude des vibrations. Les travaux menés par cette équipe concernent le
développement d’ outils pour la maintenance préventive de ce type de machine, mais d’ un
point de vue traitement du signal. Il n’ est cependant pas exclu que nos travaux convergent
[BARR 03] pour mettre en œ uvre la technique hybride présentée au chapitre I.3, et dont les
premiers résultats de mise en œ uvre seront présentés au chapitre suivant.
! 2
Le CERTES dispose d’ un banc d’ essai permettant de simuler un certain nombre de
dysfonctionnements mécaniques (figure II.8)
58
Ce banc est composé des éléments suivants :
• Un moteur asynchrone d’ une puissance de 1,5kW
• Un réducteur à engrenages
• Une pompe centrifuge (non représentée sur la photo)
• Un roulement à billes relié au moteur par accouplement élastique
Le banc d’ essai est alimenté par un variateur de courant qui permet de faire varier la
vitesse de 0 à 1500Tr/min (0 à 25Hz).
Sur ce banc d’ essai sont placés différents capteurs qui permettent d’ obtenir différentes
informations sur le fonctionnement du moteur. On trouve ainsi :
• Un accéléromètre qui permet de mesurer l’ accélération du rotor du moteur
• Une sonde de courant pour mesurer l’ intensité de l’ alimentation du moteur
• Un capteur de position qui permet de savoir quand le moteur a effectué un tour.
A chaque tour du rotor à l’ entrée du moteur, un réflecteur de lumière passera
devant un capteur qui signalera un tour du rotor. Nous l’ appellerons par la suite
‘Top Tour’
Plusieurs dispositifs permettent de simuler des défauts fréquemment rencontrés en
milieu industriel, tels que :
• Ecaillage de la bague extérieure d’ un roulement
• Balourd (déséquilibre dynamique)
• Défaut d’ alignement du moteur
• Cavitation dans la pompe
Tous ces défauts possèdent des signatures vibratoires qu’ on peut identifier séparément
si toutes les caractéristiques des différents éléments sont parfaitement connues (fréquences de
défauts de roulement, vitesses de rotation). Toutefois, les effets des défauts se cumulent le
plus souvent et les vibrations peuvent exciter les fréquences propres des éléments du banc.
Nous nous sommes focalisés sur la recherche et la détection de deux types de défauts :
les défauts de roulement et les balourds. Les roulements à billes sont, sans doute, les organes
les plus sensibles sur une machine. D’ après une étude menée par la société SKS, 27% des
défauts de roulement ont pour origine des maladresses de montage. On imagine donc
aisément l’ intérêt d’ avoir à remplacer le moins souvent possible et donc, d’ éviter les
59
démontages systématiques en optant pour une stratégie de surveillance appropriée. Dans la
plupart des cas, la dégradation se traduit par un écaillage d’ une des pistes d’ un élément du
roulement, provoquant un choc à chaque passage. Dans le cadre de notre simulation, le défaut
de roulement est provoqué en serrant une vis. La bague extérieure sera donc enfoncée
localement et, à chaque passage d’ une bille sur ce défaut, un choc apparaîtra.
Chaque élément d'
un ensemble tournant peut comprendre une différence de répartition
de masse. La conjugaison des différences de masse crée un balourd résultant de l'
ensemble
tournant. Pour simuler l’ apparition d’ un balourd sur le banc d’ essai dont nous disposons, nous
pouvons placer sur le rotor, une petite masse de poids variable de façon à pouvoir simuler
plusieurs niveaux de balourd.
Comme mentionné précédemment, plusieurs informations sont disponibles. Les
signaux que nous avons choisi d’ exploiter sont ceux issus de l’ accéléromètre. Les
informations provenant du ‘Top Tour’ ont aussi été considérées pour la construction de la
base de données.
Nous avons décidé de travailler, dans un premier temps, à fréquence de rotation fixe
du moteur. Nous nous sommes tout d’ abord focalisés sur la détection de défauts d’ un niveau
donné (serrage constant de la vis dans le cas de la simulation d'
un défaut de balourd, et masse
de poids constant placée sur le rotor pour la simulation du balourd). Plusieurs bases de
données ont été élaborées pour la mise en œ uvre des techniques neuronales pour la détection
de défaillance d’ un moteur. Les signaux fournis par le laboratoire CERTES comprennent
plusieurs périodes (plusieurs tours de rotation du moteur) pour un mode de fonctionnement
donné. Nous avons décidé de travailler sur une période (i.e. un tour de moteur). Les signaux
ainsi définis ont alors été obtenus de différentes manières : soit on se calle sur le signal du
Top Tour, c’ est-à-dire que l’ origine de tous les signaux de la base de données correspond à la
même position du moteur, et on prend ensuite le nombre d’ échantillons nécessaires pour que
le signal obtenu corresponde à une période (992 dans notre cas), soit, on travaille avec une
fenêtre glissante. Dans ce dernier cas, la base de données est ainsi construite : le premier
signal extrait du fichier comprend les 992 premiers points du fichier. Puis, on décale l’ origine
de 100 échantillons, et on construit le second signal en prenant les 992 points suivants, ainsi
de suite jusqu’ à épuisement du fichier.
Le tableau II.5 récapitule les différentes bases de données élaborées, pour trois
catégories : balourd, défaut de roulement et fonctionnement normal.
60
Base d’apprentissage Base de généralisation
Signaux calés sur Signaux calés sur
Base de le Top Tour le Top Tour
données 1 (64 vecteurs par classe, soit 192 (128 vecteurs par classe, soit 384
vecteurs au total) vecteurs au total)
Signaux calés sur Signaux « Fenêtre
Base de le Top Tour glissante »
données 2 (60 vecteurs par classe, soit 180 (318 vecteurs par classe soit 954
vecteurs au total) vecteurs au total)
Signaux « Fenêtre Signaux « Fenêtre
Base de glissante » glissante »
données 3 (22 vecteurs par classe, soit 66 (318 vecteurs par classe, soit 954
vecteurs au total) vecteurs au total)
Tableau II. 5 - Récapitulatif des différentes bases de données
Comme dans le cas de l’ approche bio-médicale, les différentes bases de données ont
été utilisées pour la mise en œ uvre de deux réseaux de neurones artificiels : le réseau LVQ et
le réseau RBF. L’ optimisation de ces réseaux ainsi que les résultats obtenus sont présentés
dans la partie suivante.
61
!! & # %
!! '#
!! " & * +
, -#
Classe "Balourd"
70 Classe "Défaut de Roulement"
Classe Normale
Résultats Globaux
60
Nombre d'erreurs commises
50
40
30
20
10
0
5 15 25 35 45 55 65 75 85 95 100
Nombre de Neurones dans la couche cachée
Figure II. 9 - Evolution du nombre d'erreurs en fonction du nombre de neurones dans la couche cachée du
réseau LVQ pour la base de données 1
Nous avons donc mené une étude en faisant varier le nombre de neurones dans la
couche cachée du réseau LVQ de 6 à 100. Les résultats de l'
évolution du nombre d'
erreurs en
62
phase de généralisation en fonction du nombre de neurones sont représentés par la figure II.9.
On peut remarquer qu'
on obtient les meilleures performances – soit, un taux de classification
correcte de 95,4% - pour un nombre de neurones dans la couche cachée égal à 9.
, "
A partir des résultats précédents, nous avons donc mis en œ uvre le réseau LVQ ainsi
optimisé. Le nombre de neurones cachés s’ élève alors à 9 neurones. Les résultats obtenus sont
présentés dans le tableau II.6.
On peut noter que la base d’ apprentissage a été correctement apprise. Tous les
vecteurs appris sont correctement classés lors de la phase de généralisation. Ainsi, le taux de
classification correcte obtenu grâce à cette structure est de 95,4% pour la globalité de la base
de données avec un taux de classification correcte de :
• 95,2% pour la classe normale,
• 97,5% pour la classe Balourd,
• 93,5% pour la classe Défaut de Roulement.
Classe Réelle
!! " " .
Tout comme le réseau LVQ, les nombres de neurones des couches d'
entrée et de sortie
sont déterminés par le problème à traiter. Ainsi, le réseau comprendra autant de neurones en
entrée que de composantes des vecteurs d'
entrée (992 dans notre cas).
Nous avons choisi de coder les classes comme pour le LVQ (manière disjonctive : 1
neurone par classe désirée). Le réseau RBF comprend donc 3 neurones en sortie.
63
Comme nous l'
avons déjà mentionné, contrairement au LVQ, le nombre de neurones
de la couche cachée du RBF est déterminé par apprentissage. Pour le modèle que nous
utilisons, le rayon de la zone d'
influence est fixe.
Nous avons étudié, dans chacun des cas, l'
impact de la taille de la zone d'
influence des
neurones. Pour cela, nous avons fait varier le paramètre sc de 1 à 100 avec un pas de 1 pour la
classification des signaux issus de l’ accéléromètre. L'
apprentissage s'
arrête quand le nombre
de neurones cachés atteint le nombre de vecteurs de la base d'
apprentissage ou que l'
erreur
commise atteint un seuil fixé par l'
utilisateur. Les résultats obtenus en phase de généralisation
sont présentés à la figure II.10.
0
0 10 20 30 40 50 60 70 80 90 100
Valeur du Rayon de la zone d'influence (Paramètre Sc)
Compte tenu des taux de classification particulièrement élevés, nous avons décidé de
faire abstraction du Top Tour, au moins dans un premier temps pour la base de généralisation.
Le but de cette deuxième simulation est de permettre à un utilisateur final de ne pas se soucier
64
de la position du rotor lors de l’ acquisition des signaux de test de la machine. De plus,
considérant les résultats obtenus précédemment, seul le réseau RBF a été mis en œ uvre pour
la base de données 2. Nous avons donc mis en œ uvre ce réseau, en lui apprenant les mêmes
signaux que précédemment, mais en utilisant, pour la généralisation, des signaux non calés
sur le Top Tour.
!! -#
La démarche est la même que celle décrite précédemment. Les résultats obtenus sont
présentés figure II.11.
Nombre d'erreurs commises
Réseau RBF - Base de données 2
600
Classe Normale
Classe "Balourd"
Classe" Défaut de roulement
500 Résultats Globaux
Nombre d'erreurs commises
400
300
200
100
0
0 5 10 15 20 25 30 35 40 45 50
Valeur du rayon de la zone d'influence (Paramètre Sc)
On peut remarquer alors un minimum de 352 erreurs pour une valeur de sc de 21. Il est
cependant intéressant de s'
intéresser à l'
évolution de l'
erreur dans chacune des classes. En
effet, il peut être utile de choisir une valeur du paramètre sc permettant d'
optimiser la
classification d'
une des classes, par exemple, pour l'
utilisation d'
un RBF dans une structure
plus complexe. Ainsi, on pourra privilégier la reconnaissance d'
une classe par rapport à une
65
autre et dédier ainsi le réseau en question à la reconnaissance d'
une des catégories de
défaillance.
!! "
A partir des résultats précédents, nous avons mis en œ uvre le réseau RBF ainsi
optimisé. La valeur du paramètre sc choisie est donc de 21. Les résultats obtenus sont
présentés dans le tableau II.7.
Classe Réelle
Ainsi, le taux de classification correcte obtenu grâce à cette structure est de 63,1%
pour la globalité de la base de données avec un taux de classification correcte de :
• 57,9% pour la classe normale,
• 84,9% pour la classe Balourd,
• 47,5% pour la classe Défaut de Roulement.
On peut remarquer que les performances du réseau sont les plus élevées concernant la
reconnaissance de balourds. De plus, quand le réseau se trompe sur l’ une des deux autres
classes, le vecteur mal classé est systématiquement catalogué comme étant un signal
caractérisant un balourd.
On peut noter que les performances se dégradent nettement. Ceci est tout à fait
compréhensible puisque les signaux de la base d’ apprentissage sont callés sur le Top Tour
alors que les signaux de la base de généralisation ne le sont pas. Nous avons donc décidé
d’ apprendre aux réseaux des informations similaires en leur apprenant des signaux construits
sur le principe de la fenêtre glissante.
66
!!! '# !
, -#
La démarche est la même que celle décrite précédemment. Les résultats obtenus sont
présentés figure II.12.
On peut remarquer alors un minimum de 327 erreurs pour un nombre de neurones
dans la couche cachée égal à 9.
Erreurs Commises
Réseau LVQ - Base de Données 3
600
500
Nombre d'erreurs commises
200
100
0
10 20 30 40 50 60 70 80 90 100
Nombre de Neurones dans le Couche Cachée
Figure II. 12 - Evolution de l'erreur commise en fonction du nombre de neurones cachés du LVQ (base de
données 3)
, "
A partir des résultats précédents, nous avons donc mis en œ uvre le réseau LVQ ainsi
optimisé. Le nombre de neurones cachés s’ élève alors à 9 neurones. Les résultats obtenus sont
présentés dans le tableau II.8.
67
Classe Réelle
On peut noter que la base d’ apprentissage a été correctement apprise. Tous les
vecteurs appris sont correctement classés lors de la phase de généralisation. Ainsi, le taux de
classification correcte obtenu grâce à cette structure est de 65,7% pour la globalité de la base
de données avec un taux de classification correcte de :
• 63,5% pour la classe normale,
• 62,3% pour la classe Balourd,
• 71,4% pour la classe Défaut de Roulement.
, -#
68
Nombre d'erreurs commises
Réseau RBF - Base de données 3
400
350
300
Classe "Défaut de Roulement
Classe Normale
Nombre d'erreurs commises
Erreur Globale
250 Classe "Balourd"
200
150
100
50
0
0 10 20 30 40 50 60 70 80 90 100
Valeur du rayon de la zone d'influence
, "
A partir des résultats précédents, nous avons donc mis en œ uvre le réseau RBF ainsi
optimisé. La valeur du paramètre sc choisie est donc de 2. Les résultats obtenus sont présentés
dans le tableau II.9.
Classe Réelle
69
Ainsi, le taux de classification correcte obtenu grâce à cette structure est de 86,3%
pour la globalité de la base de données avec un taux de classification correcte de :
• 84,6% pour la classe normale,
• 78,9% pour la classe Balourd,
• 95,3% pour la classe Défaut de Roulement.
Compte tenu des résultats obtenus pour la détection d’ un niveau de défaut avec les
réseaux LVQ et RBF seuls, nous nous sommes alors intéressés à la détection de l’ apparition
d’ un défaut sur une machine tournante, en utilisant ces techniques à réseau de neurones
unique.
!!4 / $ ## $
# &
Le principe de cette série de simulations est le suivant : après avoir appris au réseau
considéré (LVQ ou RBF) un ensemble de signaux correspondants soit à un fonctionnement
normal, soit à un fonctionnement défaillant, avec plusieurs niveaux de défauts, on généralise
sur un ensemble de signaux extraits d'
une mesure en continue de l'
accélération du moteur, tout
en faisant apparaître progressivement un effort sur le roulement à billes (afin de générer un
défaut de roulement de plus en plus important). Puis, il s'
agit de rechercher le moment où le
réseau commence à détecter un défaut de roulement. Chaque réseau comprend 992 neurones
d'
entrée (correspondant au nombre d'
échantillons des signaux) et 2 neurones de sortie (un par
classe).
La base d'
apprentissage utilisée comprend 718 signaux : 318 correspondent à un
fonctionnement normal et 400, à un fonctionnement défaillant de niveau fixe (4 niveaux
différents). La généralisation s'
opère sur 19389 signaux. Les résultats obtenus pour le réseau
LVQ seul et le réseau RBF seul ne sont globalement pas satisfaisants, puisque les réseaux ne
parviennent pas à détecter correctement l'
apparition du défaut. Afin de permettre une
représentation des résultats, nous les avons analysés de la manière suivante : nous connaissons
le moment où le défaut commence à apparaître. Les signaux correspondant aux instants
précédant ce moment sont donc des signaux de fonctionnement normal (classe normale).
Ceux correspondant aux instants suivant l'
apparition du défaut caractérisent donc un
fonctionnement défaillant (classe "défaut de Roulement"). Partant de ce principe, nous avons
70
donc analysé les résultats obtenus comme des résultats de classification. Ceux-ci sont
présentés ci-après.
80
Pourcentage de classification correcte
70
60
50
40
30
20
10
0 20 40 60 80 100 120
Nombre de Neurones Cachés
L'
étude de cette courbe montre que, si le réseau reconnaît correctement un
fonctionnement normal, en revanche, alors même que le défaut est installé, il ne le détecte
pas.
Nous avons procédé en faisant varier le paramètre sc du réseau RBF de 1 à 50. Les
résultats sont présentés figure II.15.
71
Pourcentage de classification correcte
Réseau RBF
100
Classe Normal (sans défaut)
Classe "Défaut de Roulement)
90
Résultats globaux
80
Pourcentage de classificartion correcte
70
60
50
40
30
20
10
0
0 5 10 15 20 25 30 35 40 45 50
Valeur du rayon de la zone d'influence (Paramètre sc)
72
4 2
Concernant l'
application industrielle, les mêmes réseaux ont été employés et les
mêmes recherches de structures adéquates ont été réalisées pour les réseaux LVQ et RBF, et
73
ce, pour trois bases de données. La construction de ces différentes bases de données a été
motivée par un souci de s'
adapter aux conditions de mesures dans l'
industrie. Si les deux
premières bases nécessitent les mesures issues de deux capteurs différents (accéléromètre et
capteur de position pour le signal Top Tour), la troisième, quant à elle, doit permettre
d'
obtenir un diagnostic à partir de la seule information issue de l'
accéléromètre, quelque soit
l'
instant de la prise de mesure. De plus, nous avons tenté de détecter l'
apparition d'
un défaut
progressif au moyen de ces mêmes structures.
Concernant la base de données 1, où les signaux d'
apprentissage et de généralisation
sont tous callés sur le Top Tour, les résultats obtenus sont satisfaisants, puisque nous
atteignons un taux de classification correcte de 95,4% pour un réseau LVQ comprenant 9
neurones cachés et même 100% pour un réseau RBF dont le paramètre sc est égal à 5, 6 ou7.
Compte tenu de ces résultats, nous avons décidé d'
évaluer les performances du réseau RBF en
phase de généralisation avec des signaux dont l'
origine ne dépend plus de l'
information
délivrée par le Top Tour (Base de Données 2). Les résultats obtenus montrent qu'
on obtient un
taux de classification de 63,1% pour un réseau RBF dont le paramètre sc vaut 21. Les
performances de ces réseaux ont ensuite été évaluées sur une troisième base de données.
L'
apprentissage et la généralisation des réseaux neuronaux sont alors réalisés en utilisant des
signaux dont l'
origine n'
est plus une même position de l'
axe de rotation du moteur. On atteint
alors des taux de classification de 65,7% pour un réseau LVQ comprenant 9 neurones cachés
et 86,3% pour un réseau RBF dont le paramètre sc est égal à 2.
En revanche, concernant la détection de l'
apparition d'
un défaut de roulement, les
résultats obtenus par un réseau de neurones seul sont très insatisfaisants, puisque l'
un et l'
autre
des réseaux ne permettent même pas la reconnaissance d'
un défaut installé.
La mise en œ uvre des structures neuronales à réseau de neurones unique est nettement
insuffisante pour la résolution de ce problème de classification et l'
élaboration d'
un outil
d'
aide au diagnostic pour les deux cas, biomédical et industriel, étudiés. Les résultats
biomédicaux permettent d'
obtenir seulement 56,2% de classification correcte dans le cas du
LVQ et 59,1% dans le cas du RBF. De la même manière, dans l'
étude de cas industriel, même
si le réseau RBF permet d'
obtenir des résultats satisfaisants (100% de classification correcte
pour la base de données1 et 86,3% pour la base de données 3), seuls 63,1% de signaux sont
correctement classés par le réseau RBF pour la base de données 2. Quant au réseau LVQ, il ne
permet pas d'
obtenir de meilleurs résultats pour les différentes bases de données. Par ailleurs;
74
les performances de ces structures dans le cadre de la reconnaissance de l'
apparition d'
un
défaut de roulement sont très insuffisantes. Compte tenu de ces différents résultats, et des
insuffisances des différents réseaux employés seuls, nous avons imaginé une structure hybride
(présentée au chapitre I) pour le traitement des informations dans un but d'
aide au diagnostic.
Le chapitre suivant est consacré à l'
étude et la mise en œ uvre de cette structure.
75
Chapitre II.................................................................................................................40
Approches Neuronales Simples pour l’ Aide au Diagnostic et leur Evaluation
Expérimentale ......................................................................................................................40
II.1. Introduction...................................................................................................40
II.2. Volet Biomédical : Les Potentiels Evoqués Auditifs ......................................41
II.2.1. Présentation ...........................................................................................41
II.2.2. Mise en œ uvre clinique et construction de la base de données................44
II.2.3. Résultats ................................................................................................47
II.2.3.1. Application d'
une technique conventionnelle : Modélisation AR des
signaux PEA 47
II.2.3.1.1. Première approche ......................................................................48
II.2.3.1.2. Seconde Approche......................................................................50
II.2.3.2. Aide au diagnostic par techniques neuronales ....................................51
II.2.3.2.1. Réseau Learning Vector Quantization.........................................52
II.2.3.2.2. Réseau Radial Basis Function .....................................................54
II.3. Volet Industriel : Diagnostic de défaillances d’ un moteur asynchrone............57
II.3.1. Introduction ...........................................................................................57
II.3.2. Construction de la base de données ........................................................58
II.3.3. Aide au diagnostic par techniques neuronales ........................................62
II.3.3.1. Exploitation de la base de données 1..................................................62
II.3.3.1.1. Réseau Learning Vector Quantization.........................................62
II.3.3.1.2. Réseau Radial Basis Function .....................................................63
II.3.3.2. Exploitation de la base de données 2 – Réseau RBF ..........................65
II.3.3.2.1. Optimisation de la structure du réseau.........................................65
II.3.3.2.2. Résultats obtenus ........................................................................66
II.3.3.3. Exploitation de la base de données 3..................................................67
II.3.3.3.1. Réseau Learning Vector Quantization.........................................67
II.3.3.3.2. Réseau Radial Basis Function .....................................................68
II.3.3.4. Détection de l'
apparition d'
un défaut de roulement progressif ............70
II.3.3.4.1. Réseau Learning Vector Quantization.........................................71
II.3.3.4.2. Réseau Radial Basis Function .....................................................71
II.4. Conclusion ....................................................................................................73
76
Nous avons montré au chapitre précédent que les approches neuronales simples –
c'
est-à-dire celles n'
impliquant qu'
un seul réseau de neurones artificiels – ne sont en général
pas suffisantes pour construire un outil performant pour l'
aide au diagnostic de systèmes
complexes tels que ceux traités dans cette thèse. Nous nous sommes alors orientés vers des
structures plus complexes, pouvant impliquer plusieurs réseaux de neurones. Dans ce
chapitre, nous proposons d'
appliquer l'
approche neuronale hybride déjà présentée au chapitre I
(I.3). Cette approche pour l'
aide au diagnostic concerne une association de différentes
techniques, conventionnelles et neuronales. La stratégie que nous envisageons de mettre en
œ uvre est présentée figure III.1.
Informations
d'entrée
Agent
Etape
Agent
de Etape de
Agent
Pré-traitement décision
Agent
Neuronal
Figure III.1 - Structure hybride Neuronale
77
processus industriel, les informations relatives au fonctionnement de ce dernier peuvent être
délivrés par différents indicateurs que l'
opérateur doit analyser. Il semble alors légitime de
prendre en compte différentes informations relatives au système (industriel ou biomédical) et
de combiner ces données. L'
architecture, qui permettra ensuite de traiter l'
ensemble des
informations délivrées par les capteurs, comprend trois niveaux de traitement :
Une étape de prétraitement
Un ensemble d'
agents neuronaux
Une étape finale de décision où on réaliserait la fusion des informations de chacun
des agents neuronaux spécialisés afin de parvenir à un élément de diagnostic.
Nous avons mis en oeuvre plusieurs variantes de cette structure dans le cadre des deux
problématiques présentées au chapitre précédent. Les résultats de validation sont présentés
dans la suite de ce mémoire. Dans la suite du texte, nous désignerons les structures hybrides
de la manière suivante : Structure Hybride [Agents Neuronaux]/[Structure de Décision].
Compte tenu des résultats présentés au chapitre II, nous avons appliqué notre approche
hybride neuronale au problème de classification des PEA.
Dans ce cas, l'
information d'
entrée provient du dispositif médical mis en œ uvre pour
l'
acquisition des signaux, présenté à la figure II.15. L'
étape de prétraitement, quant à elle, se
compose des deux traitements préliminaires effectués sur les signaux PEM, à savoir, une
normalisation et une troncature. Ces deux prétraitements ont été présentés au II.4.
Plusieurs approches ont été envisagées, mettant en jeu différents agents neuronaux et
structures de décision. Pour l’ étape de décision nous avons pris en compte un paramètre
supplémentaire : le seuil auditif. Ce paramètre est en effet un paramètre pertinent pris en
compte par le médecin pour décider si un patient fait partie de la classe normale ou
78
endocochléaire1. Afin d'
obtenir les données relatives au seuil auditif, nous nous sommes
intéressés à l'
audiogramme des patients ainsi qu'
à un paramètre présent dans leur dossier : la
perte auditive. Ces deux informations (audiogramme et perte auditive) nous ont permis de
construire une base de données constituée des valeurs 0 et 1, permettant de caractériser le
seuil auditif. La valeur 0 a été attribuée aux patients souffrant d'
une déficience auditive
supérieure à 20dB et la valeur 1, aux patients dont l'
audition est dite normale. Cette
information (seuil auditif) ainsi que la valeur normalisée2 de la perte ont été prises en compte
au niveau des structures de décision. Les différentes architectures mises en œ uvre sont
présentées ci-après.
! "
La première structure hybride proposée est présentée par la figure III.2. Cette structure
n'
implique qu'
un seul agent neuronal, un réseau LVQ ou un réseau RBF, dont le rôle est de
classer les signaux PEA traités en trois catégories. Le résultat de classification, ainsi que le
seuil auditif sont présentés au module de décision (ici, un ensemble de règles logiques qui
permet lorsque la classe désignée par le réseau est la classe 2 ou la classe 3 de prendre en
compte le seuil auditif. Si le seuil auditif est correct, la classe désignée sera la classe 3, sinon,
le vecteur sera classé en classe 2)
Les bases de données (apprentissage et généralisation) sont celles utilisées dans le
chapitre précédent (II.2.3)
Pour la phase de généralisation, nous avons utilisé la base de données globale, qui
comprend les vecteurs de la base d’ apprentissage, mais aussi les vecteurs non appris.
Lorqu'
on présente un signal au système, la classe correspondante doit être désignée.
1
A partir des résultats présentés au chapitre II, nous avons en effet pu constater que lorsqu'
une erreur
est commise sur un vecteur de type endocochléaire, il a une nette tendance à être classé comme étant un vecteur
de type normal plutôt qu'
un vecteur de type rétrocochléaire. De la même manière, un vecteur de type normal mal
classé sera étiqueté comme un vecteur de type endocochléaire.
2
Pour la normalisation, on procède de la même manière que pour le PEM afin de conserver la
dynamique de l'
information "perte auditive" (cf. Chapitre II.4)
79
Etape
PEM
De Etape de
Prétraitement RNA
Décision
Seuil Auditif (Seuillage)
# $"
Pour mettre en œ uvre la structure hybride LVQ/Seuillage, nous avons procédé de la même
manière qu'
au paragraphe II.4.1.1 pour rechercher la structure adéquate du réseau LVQ dans
cette configuration (structure hybride). Les résultats obtenus pour cette dernière sont présentés
figure III.3.
Figure III. 3 - Evolution du nombre d'erreurs commises en généralisation pour la structure hybride
LVQ/Seuillage
80
77. Dans ce cas, les résultats obtenus pour chacune des classes sont présentés dans le tableau
III.1.
Classe Réelle
Le taux de classification correcte obtenu grâce à cette structure est donc de 80,7% pour
la globalité de la base de données avec un taux de classification correcte de :
• 71% pour la classe rétrocochléaire,
• 68,7% pour la classe endocochléaire,
• 95,6% pour la classe normale.
%&"
Pour la mise en œ uvre de notre structure hybride RBF/Seuillage, nous avons procédé
de la même manière qu'
au paragraphe II.2.3.2.2.a. pour rechercher la structure adéquate du
réseau RBF dans cette structure. Les résultats obtenus pour cette dernière sont présentés
figure III.3.
On peut remarquer qu'
on obtient les meilleures performances – soit, un taux de
classification correcte de 77,5% - pour sc égal à 6,6 et compris entre 7,7 et 7,9. Dans ces cas,
les résultats obtenus pour chacune des classes sont présentés dans le tableau III.4.
Concernant le réseau, on peut noter que la base d’ apprentissage a été correctement
apprise. Le taux de classification correcte obtenu grâce à cette structure est donc de 77,5%
pour la globalité de la base de données avec un taux de classification correcte de :
• 71% pour sc = 6,6 et 68,4% pour sc compris entre 7,7 et 7,9 pour la classe
rétrocochléaire,
• 67,5% pour sc = 6,6 et 68,7% pour sc compris entre 7,7 et 7,9 pour la
classe endocochléaire,
• 89% pour la classe normale.
81
180
Erreur globale
160
Nombre d' erreurs commises sur la classe 1
Nombre d' erreurs commises sur la classe 2
Nombre d' erreurs commises sur la classe 3
140
120
erreurs
100
Nombre d'
80
60
40
20
0
0 1 2 3 4 5 6 7 8 9 10
Valeur du paramètre sc
Figure III. 4 - Evolution du nombre d'erreurs commises en généralisation pour la structure hybride
RBF/Seuillage
Classe Réelle
82
! "'
La seconde structure hybride proposée est présentée par la figure III.5. Cette structure comme
la précédente n'
implique qu'
un seul agent neuronal, un réseau RBF. Le module de décision
est, quant à lui, composé d'
un réseau de neurones artificiels et du même programme Matlab
que précédemment (programme permettant de prendre en considération le seuil auditif).
Module de décision
% & "(# $ ) *
L'
objectif visé ici est le suivant : dans un premier temps, nous voulons obtenir une
"mesure de ressemblance" du signal considéré par rapport aux différentes classes définies.
Puis, dans un second temps, un module de décision doit permettre de déterminer
l'
appartenance de ce signal à une des classes. Le réseau RBF a pour but de fournir la "mesure
de ressemblance". Le réseau LVQ, quant à lui, compose un étage de décision-classification.
Dans la structure proposée, les sorties du réseau RBF constituent les entrées du réseau
LVQ. La phase d'
apprentissage, nécessaire à la mise en œ uvre d'
une telle structure, est
effectuée de la manière suivante : on entraine tout d'
abord le réseau RBF en lui apprenant une
série d'
exemples. Une fois le réseau entraîné, les exemples de la base d'
apprentissage sont
présentés au réseau et les sorties ainsi obtenues forment les exemples de la base
d'
apprentissage du réseau LVQ. Puis, nous procédons à l'
apprentissage de ce second réseau.
Comme nous l'
avons déjà vu, le réseau RBF effectue une cartographie de l’ espace
d’ entrée en associant un ensemble de ‘catégories’ à un ensemble de ‘zones’ de l’ espace
d’ entrée. Les techniques de "Learning Vector Quantization", quant à elles, font partie des
techniques de compétition. Rappelons que l'
objectif de ces méthodes est de déterminer la
valeur optimale de vecteurs prototypes. Ceux-ci sont représentatifs des données à traiter et
83
sont codés dans les poids du réseau. L'
apprentissage permet de retrouver les valeurs
caractéristiques des vecteurs prototypes. Même si ce modèle est principalement utilisé pour la
classification, la nature compétitive de sa stratégie d’ apprentissage (basée sur le principe du
‘tout au vainqueur’ (‘Winner takes all’ )) rend son utilisation en tant qu’ opérateur de ‘décision-
classification’ possible. .
Pour choisir la structure du réseau RBF, nous nous sommes appuyés sur les résultats
précédents. Nous avons donc choisi sc = 7,7. Le réseau LVQ ayant désormais un rôle de
décision, nous avons donc entrepris de rechercher le nombre de neurones pour obtenir la
structure adéquate. Comme précédemment, nous avons fait varier le nombre de neurones
cachés de 2 à 100 et les résultats obtenus en sortie du réseau LVQ sont présentés figure III.6.
84
On atteint un nombre minimal d'
erreurs (86 erreurs) pour un réseau comportant 5
neurones cachés3. La répartition de ces erreurs au sein des trois classes est donnée par le
tableau III.3.
Classe Réelle
En tenant compte maintenant du seuil auditif pour les vecteurs classés endocochléaires
ou normaux, on obtient les résultats suivants (Tableau III.4).
Classe Réelle
Concernant les réseaux, on peut noter que la base d’ apprentissage a été correctement
apprise. Ainsi, le taux de classification correcte obtenu grâce à cette structure est de 83,1%
pour la globalité de la base de données avec un taux de classification correcte de :
• 57,9% pour la classe rétrocochléaire,
• 91,6% pour la classe endocochléaire,
• 85,9% pour la classe normale.
3
On peut remarquer que, pour un nombre plus important de neurones cachés, le nombre d' erreurs
commises en phase de généralisation varie peu (89 à 90 erreurs commises). En effet, le nombre de neurones
cachés du LVQ peut être vu comme le nombre de sous-classes qu' on peut dénombrer au sein du problème
[MATL]. L' augmentation du nombre de neurones cachés, et donc de sous-classes, ne modifie donc pas, ou peu le
comportement du réseau.
85
Nous avons ensuite mis en œ uvre la même structure, mais en injectant la perte auditive
au niveau du décideur LVQ. Ce dernier comprend maintenant 4 neurones d'
entrée (3 neurones
prenant en compte la sortie du réseau RBF + 1 pour la perte auditive normalisée).
L'
architecture de la structure mise en œ uvre est présentée figure III.7.
Module de décision
PEM Etape
Règles
de RBF LVQ Logiques
Perte Auditive Prétraitement
Pour choisir la structure du réseau RBF, nous nous sommes appuyés sur les résultats
précédents. Nous avons donc choisi sc = 7,7. Le réseau LVQ ayant désormais un rôle de
décision et prenant en compte des informations différentes, nous avons donc entrepris de
rechercher le nombre de neurones pour obtenir la structure adéquate. Comme précédemment,
nous avons fait varier le nombre de neurones cachés de 2 à 100 et les résultats obtenus en
sortie du réseau LVQ sont présentés figure III.8.
On atteint un nombre minimal d'
erreurs (81 erreurs) pour un réseau comportant 18
neurones cachés4.
La répartition de ces erreurs au sein des trois classes est donnée par le tableau III.5.
4
Pour un nombre de neurones plus important, le nombre d' erreurs varie peu. En effet, le nombre de neurones
cachés du LVQ peut être vu comme le nombre de sous-classes qu' on peut dénombrer au sein du problème
[MATL]. L' augmentation du nombre de neurones cachés, et donc de sous-classes, ne modifie donc pas, ou peu le
comportement du réseau.
86
Figure III. 8 - Evolution de l'erreur commise en phase de généralisation en fonction du nombre de
neurones du réseau LVQ pour la structure hybride RBF/LVQ prenant en compte la perte auditive
Classe Réelle
Classe Réelle
87
En tenant compte maintenant du seuil auditif pour les vecteurs classés endocochléaires
ou normaux, on obtient un taux de classification optimal (34 erreurs commises) pour un
nombre de neurones égal à 495. La répartition des erreurs au sein des trois classes est donnée
dans le tableau suivant (Tableau III.6).
Concernant les réseaux, on peut noter que la base d’ apprentissage a été correctement
apprise. Ainsi, le taux de classification correcte obtenu grâce à cette structure est de 84% pour
la globalité de la base de données avec un taux de classification correcte de :
• 57,9% pour la classe rétrocochléaire,
• 91,6% pour la classe endocochléaire,
• 88% pour la classe normale.
% & "(% +) *
Nous avons ensuite repris la même structure en remplaçant le réseau LVQ par un
réseau de type Back-Propagation, présenté au Chapitre II.2.2.4. Comme précédemment, le
réseau RBF effectue une cartographie de l’ espace d’ entrée en associant un ensemble de
‘catégories’ à un ensemble de ‘zones’ de l’ espace d’ entrée. Le réseau BP va quant à lui, jouer
le rôle d'
un expert. La structure proposée est représentée figure III.9.
Module de décision
Comme précédemment, pour choisir la structure du réseau RBF, nous nous sommes
appuyés sur les résultats précédents. Nous avons donc choisi sc = 7,7. Concernant le réseau
5
Cette différence s'
explique par la répartition différente des erreurs au sein des trois classes pour les deux
réseaux LVQ. En effet, même si le nombre d' erreurs commises par un réseau LVQ à 49 neurones cachés est le
même que celui obtenu avec une réseau à 18 neurones cachés, la répartition des erreurs au sein des classes 2
(endocochléaire) et 3 (Normale) va permettre au module de seuillage par le seuil auditif de "corriger" un plus
grand nombre d' erreurs que dans le cas du LVQ à 18 neurones cachés.
88
BP, nous avons choisi un réseau à une seule couche cachée et nous avons entrepris de
rechercher le nombre de neurones de cette couche pour obtenir la structure adéquate. Comme
précédemment, nous avons fait varier le nombre de neurones cachés de 2 à 100. Le seuil de
l'
erreur est fixé à 0,02 et le pas d'
apprentissage à 0,005. Les résultats obtenus en sortie du
réseau BP sont présentés figure III.10.
Classe Réelle
89
En tenant compte maintenant du seuil auditif pour les vecteurs classés endocochléaires
ou normaux, on obtient un taux de classification optimal (35 erreurs commises) pour un
nombre de neurones égal à 156. La répartition des erreurs au sein des trois classes est donnée
dans le tableau suivant (Tableau III.8).
Classe Réelle
Concernant les réseaux, on peut noter que la base d’ apprentissage a été correctement
apprise. Ainsi, le taux de classification correcte obtenu grâce à cette structure est de 83,6%
pour la globalité de la base de données avec un taux de classification correcte de :
• 57,9% pour la classe rétrocochléaire,
• 90,4% pour la classe endocochléaire,
• 88% pour la classe normale.
Nous avons ensuite mis en œ uvre la même structure, mais en injectant la perte auditive
au niveau du décideur BP. Ce dernier comprend maintenant 4 neurones d'
entrée (3 neurones
prenant en compte la sortie du réseau RBF + 1 pour la perte auditive normalisée).
L'
architecture de la structure mise en œ uvre est présentée figure III.11.
6
Cette différence s'
explique par la répartition différente des erreurs au sein des trois classes pour les
deux réseaux BP. En effet, si le nombre d' erreurs global est peu important pour un réseau BP à 15 neurones
cachés (83 erreurs commises, soit 11 erreurs de plus que le BP à 19 neurones cachés), la répartition des erreurs
au sein des classes 2 (endocochléaire) et 3 (Normale) va permettre au module de seuillage par le seuil auditif de
"corriger" un plus grand nombre d'erreurs que dans le cas du BP à 19 neurones cachés.
90
Module de décision
Pour choisir la structure du réseau RBF, nous nous sommes appuyés sur les résultats
précédents. Nous avons donc choisi sc = 7,7. Le réseau BP prenant désormais en compte des
informations différentes, nous avons donc entrepris de rechercher le nombre de neurones pour
obtenir la structure adéquate. Concernant le réseau BP, nous avons choisi un réseau à une
seule couche cachée et nous avons entrepris de rechercher le nombre de neurones de cette
couche pour obtenir la structure adéquate. Comme précédemment, nous avons fait varier le
nombre de neurones cachés de 2 à 100. Le seuil de l'
erreur est fixé à 0,02 et le pas
d'
apprentissage à 0,005. Les résultats obtenus en sortie du réseau BP sont présentés figure
III.12.
On atteint un nombre minimal d'
erreurs (72 erreurs) pour un réseau comportant 59
neurones cachés. On peut remarquer que la prise en compte de ce paramètre supplémentaire
améliore les performances du réseau décideur BP, contrairement au réseau LVQ. La
répartition de ces erreurs au sein des trois classes est donnée par le tableau III.9.
91
Figure III. 12 - Evolution de l'erreur commise en phase de généralisation en fonction du nombre de
neurones du réseau BP pour la structure hybride RBF/BP tenant compte de la perte auditive
Classe Réelle
7
Cette différence s'
explique par la répartition différente des erreurs au sein des trois classes pour les
deux réseaux BP. En effet, si le nombre d'
erreurs global est plus important pour un réseau BP à 15 neurones
cachés (83 erreurs commises, soit 11 erreurs de plus que le BP à 59 neurones cachés), la répartition des erreurs
au sein des classes 2 (endocochléaire) et 3 (Normale) va permettre au module de seuillage par le seuil auditif de
"corriger" un plus grand nombre d'
erreurs que dans le cas du BP à 59 neurones cachés. En revanche, les
performances concernant la classe 1 sont détériorées.
92
Classe Réelle
Concernant les réseaux, on peut noter que la base d’ apprentissage a été correctement
apprise. Ainsi, le taux de classification correcte obtenu grâce à cette structure est de 84,5%
pour la globalité de la base de données avec un taux de classification correcte de :
• 60,5% pour la classe rétrocochléaire,
• 90,4% pour la classe endocochléaire,
• 89,1% pour la classe normale.
Module de décision
RBF
PEM Etape Règles
de BP Logiques
Prétraitement
LVQ
Seuil Auditif
93
base d'
apprentissage. Puis, nous avons présenté les exemples de cette base aux deux réseaux
entraînés. Les sorties ainsi obtenues forment alors la base d'
apprentissage du réseau BP et on
peut donc procéder à l'
apprentissage de ce dernier.
Dans cette structure, les deux réseaux RBF et LVQ jouent le rôle de classifieurs.
Cependant, la nature des informations données par chacun des réseaux est différente. En effet,
le réseau RBF va donner, en sortie, une distance entre le vecteur d'
entrée et les classes
préalablement apprises. Le réseau LVQ, quant à lui, du fait de sa nature compétitive (stratégie
"Winner Takes All"8), va assigner au vecteur d'
entrée une classe. Comme précédemment, le
réseau BP va quant à lui, jouer le rôle d'
un expert. En prenant en compte les deux
informations données par les deux réseaux RBF et LVQ, il va pouvoir ainsi désigner la classe.
La structure proposée peut alors être vue comme une architecture associant un opérateur
décisionnel à deux classifieurs neuronaux donnant deux informations différentes sur la classe
d'
un vecteur d'
entrée.
Comme précédemment, pour choisir les structures des réseaux RBF et LVQ, nous
nous sommes appuyés sur les résultats précédents. Nous avons donc choisi sc = 7,7 et un
nombre de neurones cachés égal à 77 pour le réseau LVQ. Concernant le réseau BP, nous
avons choisi un réseau à une seule couche cachée et nous avons entrepris de rechercher le
nombre de neurones de cette couche pour obtenir la structure adéquate. Comme
précédemment, nous avons fait varier le nombre de neurones cachés de 2 à 100. Le seuil de
l'
erreur est fixé à 0,02 et le pas d'
apprentissage à 0,01. Le programme s'
arrête lorsque l'
erreur
commise lors de l'
apprentissage converge. Les résultats obtenus en sortie du réseau BP sont
présentés figure III.14.
8
Tout au Vainqueur
94
Figure III. 14 - Evolution de l'erreur commise en phase de généralisation en fonction du nombre de
neurones du réseau BP pour la structure hybride RBF+LVQ/BP
Classe Réelle
Tableau III. 11 - Résultats de classification des PEA par la structure hybride RBF+LVQ/BP
En tenant compte maintenant du seuil auditif pour les vecteurs classés endocochléaires
ou normaux, on obtient un taux de classification optimal (41 erreurs commises) pour un
nombre de neurones égal à 16 (on pourra se référer à la note n°4 pour la justification de la
95
différence observée avec les résultats précédents). La répartition des erreurs au sein des trois
classes est donnée dans le tableau suivant (Tableau III.12).
Classe Réelle
Tableau III. 12 - Résultats de classification des PEA par la structure hybride RBF+LVQ/BP+Seuillage
Concernant les réseaux, on peut noter que la base d’ apprentissage a été correctement
apprise. Ainsi, le taux de classification correcte obtenu grâce à cette structure est de 80,7%
pour la globalité de la base de données avec un taux de classification correcte de :
• 71% pour la classe rétrocochléaire,
• 78,3% pour la classe endocochléaire,
• 87% pour la classe normale.
Compte tenu des résultats présentés au chapitre II, nous avons appliqué notre approche
hybride neuronale au problème de diagnostic des défaillances d’ un moteur asynchrone.
Dans ce cas, le capteur est l’ accéléromètre mis en œ uvre pour l'
acquisition des
signaux. Dans l’ approche que nous proposons, les signaux dont on fait l’ acquisition sont
directement traités par les structures neuronales, sans traitement préalable.
Plusieurs approches ont été envisagées, mettant en jeu différents agents neuronaux et
structures de décision. Celles-ci sont présentées ci-après ainsi que les résultats obtenus pour
96
les bases de données 2, 3 ainsi que celle concernant l’ apparition du défaut progressif de
roulement.
Les structures hybrides que nous avons mises en œ uvre sont des structures du type :
RNA/Module de décision neuronal9, dont le principe est rappelé figure III.15.
Deux modules de décision ont été exploités : l’ un impliquant un réseau LVQ, l’ autre
un réseau à rétropropagation du gradient. Dans les deux cas, un seul agent neuronal est
utilisé : un réseau RBF. Ce choix tient compte des résultats de classification obtenus et
présentés au chapitre II.
- . % & "# $
La première structure hybride proposée pour le problème du diagnostic de défaillance
d'
un moteur asynchrone est présentée par la figure III.16. Cette structure n'
implique donc
qu'
un seul agent neuronal, un réseau RBF. Le module de décision est, quant à lui, composé
d'
un réseau LVQ.
Module de décision
Accélération Etape
de RBF LVQ
Prétraitement
9
Rappel : Les structures hybrides sont désignées de la manière suivante : Structure Hybride [Agents
Neuronaux]/[Structure de Décision].
97
Comme dans le cas de l’ application bio-médicale, l'
objectif visé ici est le suivant :
dans un premier temps, nous voulons obtenir une "mesure de ressemblance" du signal
considéré par rapport aux différentes classes définies. Puis, dans un second temps, un module
de décision doit permettre de déterminer l'
appartenance de ce signal à une des classes. Le
réseau RBF a pour but de fournir la "mesure de ressemblance". Le réseau LVQ, quant à lui,
compose un étage de décision-classification.
- % & "# $
Classe Normal
Classe "Balourd"
Classe "Défaut de Roulement"
600 Résultats Globaux
500
400
300
200
100
0
50
40
95 100
85
Val 30
75
eu r 65
d du r
zon e ayo 20 55
e d' l a n 45
inf lu 10 35
nes (LVQ)
enc 25
euro
e (P 0
15
b re de n e cachée
aram 5
Nom la couch
ètre
S c) dans
98
On peut remarquer qu’ on obtient les meilleures performances – soit un taux de
classification correcte de 63,4% - pour une valeur du paramètre sc égale à 3 pour le réseau
RBF et un nombre de neurones dans la couche cachée du réseau LVQ égal à 13. Dans ce cas,
les résultats obtenus pour chacune des classes sont présentés dans le tableau III.13.
Classe Réelle
Le taux de classification correcte obtenu grâce à cette structure est donc de 63,4%,
avec un taux de classification correcte de :
• 52,8% pour la classe normale
• 89,6% pour la classe Balourd
• 47,5% pour la classe Défaut de Roulement
On ne peut ainsi remarquer, en comparant ces résultats à ceux obtenus avec un réseau
RBF seul, aucune amélioration des performances globales (seuls 63,1% des signaux étaient
correctement classés par un RBF seul). On peut aussi noter que la variation du nombre de
neurones dans la couche cachée du LVQ a peu d'
influence sur le comportement global de la
structure, pour un réseau RBF donné.
- % & "# $
, -
99
Nombre d'erreurs Commises
Réseau RBF-LVQ - Base de données 3
Classe "Balourd"
Classe "Roulement"
Classe Normale
Résultats Globaux
400
350
erreurs commises
300
250
200
Nombre d'
150
100
100
50
80
s
ne )
uro VQ
0 60
50
45 40
e
N (L
40 de ée
Val eur d 35
u Rayon
30
25 20 b re ach
de la 20 m c
No uche
15
10
5 0
zone d' influence
0
co
(Paramè la
tre Sc) ns
da
Classe Réelle
100
Le taux de classification correcte obtenu grâce à cette structure est donc de 86,7%,
avec un taux de classification correcte de :
• 84,3% pour la classe normale
• 80,8% pour la classe Balourd
• 95% pour la classe Défaut de Roulement
On peut ainsi remarquer, en comparant ces résultats à ceux obtenus avec un réseau
RBF seul, qu'
aucune amélioration des performances globales n'
est observable (86,3% des
signaux étaient correctement classés par un RBF seul).
- - % & "# $
/ 0 0
Comme dans les cas précédents, nous avons mis en oeuvre la structure hybride
RBF/LVQ pour la détection d'
un défaut de roulement progressif. Compte tenu des résultats
précédents obtenus avec un réseau de neurones unique, qui, rappelons-le, étaient très
insuffisants, nous avons effectué une première étude de faisabilité. Pour cela, nous avons
choisi un réseau RBF dont le paramètre sc est fixé à 16 et nous avons fait varier le nombre de
neurones cachés du réseau LVQ de 6 à 100. Les résultats obtenus sont présentés figure III.19.
On peut alors remarquer que, quelle que soit la structure du réseau LVQ employé, le
pourcentage de classification correcte reste stable autour de 31%. Les résultats obtenus
précédemment par l'
utilisation du même réseau RBF mais utilisé seul étaient alors de 34%.
L'
utilisation du réseau LVQ comme module de décision ne permet donc pas d'
améliorer les
résultats du réseau RBF seul, dans le cadre de ce problème complexe
101
Figure III. 19 – Evolution du pourcentage de classification correcte en fonction du nombre de neurones
cachés du LVQ (Structure RBF/LVQ avec sc = 16)
- . % & "% +
Module de décision
Accélération Etape
de RBF BP
Prétraitement
102
‘zones’ de l’ espace d’ entrée. Le module de décision est, quant à lui, composé d'
un réseau BP
qui jouera le rôle d'
un expert.
- % & "% +
Classe Réelle
103
décideur permet d'
améliorer la reconnaissance des classes "Normale" et "Défaut de
Roulement", alors que la reconnaissance des défauts de type "Balourd" se dégrade.
- % & "% +
, -
Classe Réelle
Le taux de classification correcte obtenu grâce à cette structure est donc de 98,5%,
avec un taux de classification correcte de :
• 98,7% pour la classe normale
• 97,2% pour la classe Balourd
• 99,7% pour la classe Défaut de Roulement
On peut ainsi remarquer, en comparant ces résultats à ceux obtenus avec un réseau
RBF seul, une nette amélioration des performances (86,3% des signaux étaient correctement
classés par un RBF seul).
104
- - % & "% +
/ 0 0
Roulement progressif - Pourcentage de Classification correcte Roulement progressif - Pourcentage de Classification correcte
100 RBF (Sc=6) / BP 100 RBF (Sc=7) / BP
90 90
Classe Normal
40
40
30
30
20
20
10
10
0
1 2 3 4 5 6 7 8 9
0
1 2 3 4 5 6 7 8 9 Nombre de Neurones dans le couche cachée du BP
Nombre de Neurones dans le couche cachée du BP
Roulement progressif - Pourcentage de Classification correcte
Roulement progressif - Pourcentage de Classification correcte 100 RBF (Sc=9) / BP
100 RBF (Sc=8) / BP
90
90
Pourcentage de classification correcte
80
Pourcentage de classification correcte
80
Classe Normal 70
Classe Normal
Classe "Défaut de Roulement" Classe "Défaut de Roulement"
70
Résultats Globaux 60
Résultats Globaux
Résultats RBF seul Résultats RBF seul
60
50
50
40
40
30
30
20
20
10
10
0
1 2 3 4 5 6 7 8 9
0
1 2 3 4 5 6 7 8 9 Nombre de Neurones dans le couche cachée du BP
Nombre de Neurones dans le couche cachée du BP
Roulement progressif - Pourcentage de Classification correcte
Roulement progressif - Pourcentage de Classification correcte 100 RBF (Sc=11) / BP
90 RBF (Sc=10) / BP
90
Pourcentage de classification correcte
80
80
Pourcentage de classification correcte
70 70
Classe Normal
Classe "Défaut de Roulement"
Classe Normal 60 Résultats Globaux
60
Classe "Défaut de Roulement" Résultats RBF seul
Résultats Globaux 50
40
30
30 20
10
20
0
1 2 3 4 5 6 7 8 9
10
1 2 3 4 5 6 7 8 9 Nombre de Neurones dans le couche cachée du BP
Nombre de Neurones dans le couche cachée du BP
105
Roulement progressif - Pourcentage de Classification correcte Roulement progressif - Pourcentage de Classification correcte
100 RBF (Sc=12) / BP 100 RBF (Sc=13) / BP
90 90
Classe Normal
70 Classe Normal 70 Classe "Défaut de Roulement"
Classe "Défaut de Roulement" Résultats Globaux
60 Résultats Globaux 60 Résultats RBF seul
Résultats RBF seul
50 50
40 40
30 30
20 20
10 10
0 0
1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9
Nombre de Neurones dans le couche cachée du BP Nombre de Neurones dans le couche cachée du BP
Roulement progressif - Pourcentage de Classification correcte Roulement progressif - Pourcentage de Classification correcte
RBF (Sc=14) / BP RBF (Sc=15) / BP
100 100
90 90
Pourcentage de classification correcte
70
Classe Normal 70
40
30
30
20
10 20
0 10
1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9
Nombre de Neurones dans le couche cachée du BP Nombre de Neurones dans le couche cachée du BP
Sur ces différentes courbes, nous avons aussi tracé les résultats globaux obtenus par le
réseau RBF seul. On peut ainsi remarquer qu'
à nouveau, la structure hybride ne permet pas
d'
obtenir les améliorations escomptées. De plus, lorsqu'
on peut observer une amélioration du
pourcentage global de classification correcte (par exemple, pour sc égal à 11), on note une
inversion dans la reconnaissance des classes. Cette tendance est probablement lié au
comportement quasi-aléatoire du réseau RBF déjà observé au chapitre précédent.
106
Concernant le comportement des réseaux de neurones artificiels, nous avons déjà pu
noter, au chapitre II, un fonctionnement quasi-aléatoire du réseau RBF, et envisager un
apprentissage avec zone d'
influence variable. Une des perspectives de travail serait alors la
mise en œ uvre d'
une structure hybride RNAs/Module de décision neuronale présentée figure
III.22.
RBF
(Classe
Normale)
RBF
(Défaut
Niveau1)
Etape RBF
Accélération BP
de (Défaut
Prétraitement Niveau2)
RBF
(Défaut
Niveau3)
RBF
(Défaut
Niveau4)
Figure III. 22 - Perspectives : Structure Hybride de type RNAs/Module de décision neuronal pour la
détection de défaut progressif
Dans une telle structure, chacun des réseaux RBF serait dédié à la reconnaissance d'
un
niveau de défaut. Lors de la présentation d'
un vecteur, chacun des réseaux va donner en sortie
une probabilité d'
appartenance à la classe pour laquelle il est spécialisé. Le réseau décideur
(un réseau BP par exemple) devra ensuite, à partir de toutes les informations délivrées par les
réseaux spécialistes, désigner la classe correspondante.
1 2
Dans ce chapitre, nous avons appliqué la structure neuronale hybride multi-modèle
pour l'
aide au diagnostic présentée au chapitre I. Partant en effet du constat que les structures
neuronales simples ne permettaient pas d'
obtenir des performances suffisantes pour la
107
réalisation d'
un outil d'
aide au diagnostic (cf. résultats su chapitre II), nous avons alors
construit une structure plus complexe, pouvant s'
adapter à une plus large variété de domaines
d'
application.
Nous avons appliqué cette stratégie aux problématiques exposées dans le chapitre II.
Concernant le problème biomédical, plusieurs variantes ont ainsi été mises en œ uvre. Leur
philosophie reste cependant la même : plusieurs informations sont utilisées: le PEM, obtenu
grâce au dispositif médical présenté Figure II.15, la perte auditive, extraite du dossier du
patient et le seuil auditif, estimé grâce à l'
audiogramme et à l'
information "perte auditive". Le
PEM est ensuite prétraité (troncature+normalisation) et est présenté à un agent neuronal
(réseau RBF et/ou réseau LVQ) dont le rôle est de classer ces signaux. Les réponses des
agents neuronaux sont ensuite présentées au module de décision. Différents modules de
décision ont alors été mis en œ uvre : si tous comportent une étape de seuillage pour la prise en
compte du seuil auditif, l'
implication ou non d'
un autre réseau de neurones et la prise en
compte ou non de la perte auditive font leur différence. Lorsque le module de décision fait
intervenir un réseau de neurones, nous avons choisi d'
utiliser les réseaux LVQ et BP. En effet,
même si le réseau LVQ est un réseau dédié à la classification, la nature compétitive de sa
stratégie autorise son utilisation en tant qu'
opérateur de '
décision-classification'
. Son
utilisation dans la structure hybride RBF/LVQ+Seuillage doit permettre, à partir de la mesure
de ressemblance à chacune des classes fournie par le RBF, et, éventuellement de la perte
auditive, de désigner la classe correspondante. Concernant le réseau BP, ce dernier va, à partir
des informations de classification fournies par le ou les agents neuronaux (RBF dans le cas de
la structure hybride RBF/BP+Seuillage, RBF et LVQ dans le cas de la structure hybride
RBF+LVQ/BP+Seuillage) et, éventuellement, la perte auditive, jouer le rôle d'
un expert.
On peut alors noter une amélioration conséquente des performances par rapport aux
structures simples. Alors qu'
un réseau LVQ seul permettait de classer correctement 56,8% des
vecteurs de notre base de données, la mise en œ uvre de notre structure LVQ/Seuillage permet
d'
atteindre 80,7% de classification. De la même manière, si un réseau RBF seul ne permettait
de classer correctement que 59,1% des vecteurs de notre base de données, on atteint des taux
de classification correcte de:
• 77,5% dans le cas de la structure hybride RBF/Seuillage,
• 83,1% dans le cas de la structure hybride RBF/LVQ+Seuillage et 84% avec prise
en compte de la perte auditive
• 83,6% dans le cas de la structure hybride RBF/BP+Seuillage et 84,5% avec prise
en compte de la perte auditive.
108
Enfin, la mise en œ uvre de la structure hybride RBF+LVQ/BP+Seuillage permet
d'
obtenir un taux de classification correcte de 80,7%, avec un taux de reconnaissance
équilibré pour chacune des trois classes.
On peut donc constater que :
• la prise en compte du seuil auditif dans le module de décision permet une
amélioration notable des résultats, en reclassant les vecteurs de type
endocochléaire et de type normal,
• la prise en compte de la perte auditive au niveau du réseau de neurones dans le
cadre d'
un module de décision hybride (RNA+Seuillage) permet la prise en compte
de ce paramètre utilisé par les médecins pour la catégorisation des patients
souffrant d'
une atteinte endocochléaire et ayant une audition normale et ainsi,
d'
améliorer les résultats de classification concernant ces deux classes. En revanche,
la prise en compte de ce paramètre ne permet pas d'
obtenir une meilleure
reconnaissance de la classe 1 (patients souffrant d'
une atteinte de type
rétrocochléaire).
La préférence d'
une structure par rapport à une autre n'
est donc pas simple à obtenir. Il
faut savoir s'
il est primordial d'
obtenir un taux de classification optimal – dans ce cas, le choix
se porterait sur la structure hybride RBF/BP+Seuillage - ou si on préfère avoir une
reconnaissance correcte et "équilibrée" pour chacune des classes – dans ce cas, le choix se
porterait sur la structure hybride RBF+LVQ/BP+Seuillage. L'
ajout d'
un indice de confiance
sur le résultat pourrait alors permettre de trancher. Le médecin saurait alors quel crédit
accorder à la réponse donnée par l'
outil d'
aide au diagnostic.
Concernant le volet industriel – rappelons qu'
il s'
agit de détecter des défaillances d'
un
moteur asynchrone – la mise en œ uvre des structures hybrides proposées permet dans de
nombreux cas, d'
observer une amélioration des résultats de classification par rapport aux
techniques neuronales simples. Deux structures, du type RNA/Décision neuronale ont ainsi
été proposées. Toutes les deux ne comprennent qu'
un seul agent neuronal, le réseau RBF. Le
module de décision neuronal est constitué, quant à lui, d'
un réseau LVQ dans un cas, et d'
un
réseau à rétropropagation du gradient dans l'
autre cas. Ces deux structures ont été mises en
œ uvre pour les bases de données 2 et 310 présentées au chapitre II.3.2 ainsi que pour essayer
10
Base de données 2 :
• Base d' apprentissage : Signaux callés sur le Top Tour
• Base de généralisation : Signaux "Fenêtre Glissante"
Base de données 3 : Signaux "Fenêtre Glissante" (base d'
apprentissage et de généralisation).
109
de détecter l'
apparition d'
un défaut progressif survenant sur un roulement à billes. Dans le cas
d'
un module de décision neuronal de type LVQ, les améliorations observées sont peu
significatives. En revanche, on observe une nette amélioration des performances par rapport
aux résultats obtenus avec un réseau RBF seul dans le cas d'
un module de décision de type
BP. Ainsi, lors de l'
exploitation de la base de données 2, si le réseau RBF seul permettait
d'
obtenir 63,1% de classification correcte, l'
utilisation des structures hybrides permet
d'
atteindre :
• 63,4% de classification correcte pour la structure RBF/LVQ
• 81,1% de classification correcte pour la structure RBF/BP
Dans le cadre de l'
exploitation de la base de données 3, si le réseau RBF seul
permettait d'
atteindre 86,3% de classification correcte, on atteint des taux de classification
correcte de :
• 86,7% pour la structure RBF/LVQ
• 98,5% pour la structure RBF/BP
En revanche, lorsqu'
il s'
agit de détecter l'
apparition progressive d'
un défaut, les
résultats donnés par les structures RNA/Module de décision neuronal restent très insuffisants.
Dans le cas de ce problème complexe, l'
architecture proposée ne permet pas une
discrimination correcte des classes. Rappelons que le réseau utilisé pour la classification est
un réseau RBF pour lequel le rayon des zones d'
influence des neurones cachés est fixe. Il
semble judicieux alors d'
envisager un rayon différent pour chacune des classes. Une
architecture à envisager pour améliorer les performances de la structure hybride
RNAs/Module de décision neuronale (figure III.22) où chacun des réseaux RBF utilisés serait
dédié à la reconnaissance d'
une et une seule classe (normale, défaut de roulement niveau 1,
défaut de roulement niveau 2… .). Le module de décision neuronal devra alors, à partir des
informations données par chacun des réseaux RBF spécialisés (rappelons que le RBF donne
une distance à une classe) désigner la classe correspondante.
De plus, compte tenu de la complexité du problème abordé, il est aussi envisageable
que l'
utilisation de l'
accélération comme seule signature caractérisant le fonctionnement du
système ne soit pas suffisante. Il convient alors d'
envisager l'
utilisation d'
informations
provenant d'
autres capteurs et/ou le prétraitement de ces signatures par d'
autres techniques
afin d'
extraire des caractéristiques pertinentes à présenter aux agents neuronaux constituant la
structure hybride.
110
Cependant, la structure neuronale hybride que nous proposons permet une
amélioration des résultats par rapport aux techniques neuronales simples dans la majorité des
cas présentés. De plus, elle est adaptée aux problèmes d'
aide au diagnostic, et ce, quelque soit
le domaine abordé, qu'
il soit industriel ou médical.
111
Chapitre III. ..............................................................................................................77
Vers des techniques neuronales hybrides...................................................................77
III.1. Introduction...................................................................................................77
III.2. Validation de la structure neuronale hybride proposée : Application au
problème d'
aide au diagnostic biomédical.............................................................................78
III.2.1. Structures n'
impliquant qu'
un seul agent neuronal ..................................79
III.2.1.1. Structures hybrides RNA/Seuillage ..................................................79
III.2.1.1.1. Structure hybride LVQ/Seuillage...............................................80
III.2.1.1.2. Structure hybride RBF/Seuillage ...............................................81
III.2.1.2. Structures hybrides RNA/Module de décision neuronal....................83
III.2.1.2.1. Structure hybride RBF/(LVQ+Seuillage)...................................83
III.2.1.2.2. Structure hybride RBF/(BP+Seuillage)......................................88
III.2.2. Structure hybride impliquant 2 agents neuronaux...................................93
III.3. Validation de la structure neuronale hybride proposée :Application au
problème d'
aide au diagnostic industriel ...............................................................................96
III.3.1. Structure Hybride RBF/LVQ .................................................................97
III.3.1.1. Application de la structure hybride RBF/LVQ : exploitation de la base
de données 2 98
III.3.1.2. Application de la structure hybride RBF/LVQ : exploitation de la base
de données 3 99
III.3.1.3. Application de la structure hybride RBF/LVQ : Détection de
l'
apparition d'
un défaut progressif ...............................................................................101
III.3.2. Structure Hybride RBF/BP ..................................................................102
III.3.2.1. Application de la structure hybride RBF/BP : exploitation de la base
de données 2 103
III.3.2.2. Application de la structure hybride RBF/BP : exploitation de la base
de données 3 104
III.3.2.3. Application de la structure hybride RBF/LVQ : Détection de
l'
apparition d'
un défaut progressif ...............................................................................105
III.4. Conclusion ..................................................................................................107
112
L'
objet de l'
étude que nous venons de présenter concerne le domaine de l'
aide au
diagnostic, qu'
il soit industriel ou médical. Partant du constat que l'
homme est un acteur
incontournable dans l'
activité de diagnostic, nous nous sommes penchés sur le développement
de techniques d'
aide au diagnostic. L'
objectif des travaux présentés dans cette thèse est de
proposer des éléments de réponse au problème d'
intégration des connaissances d'
experts dans
un processus permettant de détecter et de faire le diagnostic d'
un dysfonctionnement. Les
problèmes étudiés relèvent de l'
identification et de la catégorisation des dysfonctionnements.
Pour tenter de les résoudre, nous avons mis en œ uvre des techniques impliquant des structures
neuronales. Deux problématiques ont ainsi été abordées : l'
une relevant du domaine médical et
l'
autre du domaine industriel.
Les différentes techniques employées pour le diagnostic s'
appuient sur l'
existence ou
non d'
un modèle du système à surveiller. Lorsqu'
un modèle peut être obtenu, les méthodes de
diagnostic, encore appelées méthodes internes, ont pour principe de comparer l'
état théorique
du système fournit par le modèle avec son état réel courant donné par les observations. Si on
ne peut pas obtenir de modèle, les techniques mises en œ uvre sont appelées techniques
externes. Parmi celles-ci, on trouve les techniques de reconnaissance des formes, ainsi que les
techniques de l'
intelligence artificielle (systèmes experts et techniques neuromimétiques).
Nous nous sommes intéressés au diagnostic des systèmes pour lesquels on ne dispose pas de
modèle. Dans ce cas, la seule connaissance du système repose alors sur l'
expertise humaine
confortée par un solide retour d'
expériences. Une des tâches principales est alors la
catégorisation des informations issues du système à surveiller, c'
est-à-dire l'
affectation de la
catégorie de défauts à ces informations. Si les techniques de reconnaissance des formes sont
adaptées à ce genre de problème, dans de nombreux cas, cette catégorisation présente de
nombreuses difficultés. Ces difficultés peuvent être dues de la grande ressemblance des
113
informations de classes différentes d'
une part, et, d'
autre part, elles peuvent reposer sur la
grande disparité de ces informations au sein d'
une même classe. Durant les dernières
décennies, des études ont montré que lorsqu'
une approche de diagnostic par reconnaissance
des formes est adoptée, les réseaux de neurones artificiels sont des outils performants pour
réaliser cette catégorisation. Nos efforts se sont donc focalisés sur la mise en œ uvre de
techniques neuronales.
Le premier chapitre a été consacré au diagnostic par des techniques basées sur les
réseaux de neurones artificiels. Nous avons présenté trois modèles neuronaux1 fréquemment
utilisés pour le problème du diagnostic : le réseau à rétropropagation du gradient (ou
BackPropagation), le réseau Learning Vector Quantization et le réseau Radial Basis Function.
Puis, nous avons proposé et présenté la mise en œ uvre d'
une strucutre neuronale hybride pour
le diagnostic des systèmes complexes tels que ceux que nous avons étudiés dans cette thèse.
Cette structure comprend trois niveaux de traitement : tout d'
abord une phase de prétraitement
des informations qui permet d'
extraire les informations pertinentes des données brutes et d'
en
faciliter le traitement par les structures neuronales suivantes. Puis, un ensemble d’ agents
neuronaux, pouvant être d'
un même type (architecture homogène) ou de types différents
(architecture hétérogène), permet la réalisation d'
une classification préliminaire des
informations prétraitées. Enfin, le dernier niveau de traitement est constitué d'
un module de
décision qui fournira un élément de diagnostic. La réalisation de celui-ci peut faire appel à
diverses techniques, telles que des opérations de seuillage, des réseaux de neurones artificiels,
ou des systèmes experts, par exemple.
Dans un deuxième chapitre, nous avons présenté les résultats obtenus par la mise en
œ uvre des réseaux LVQ et RBF pour deux domaines, l'
un biomédical, et l'
autre, industriel. Le
volet biomédical concerne l'
aide au diagnostic de pathologies auditives en utilisant des
signaux caractéristiques : les Potentiels Evoqués Auditifs (PEA). Pour réaliser l'
outil d'
aide au
diagnostic, nous disposions ici d'
une base de données mise à notre disposition par un centre
médical, le CREFON2. Le volet industriel aborde le problème du diagnostic de défaillances
1
Il est important de noter que ces modèles ne doivent pas être considérés comme des solutions concurrentes,
mais comme des systèmes ayant des caractéristiques différentes.
2
Centre de Recherche et d'Exploration Fonctionnelle Oto-Neurologique
114
un moteur asynchrone. La base de données a été réalisée au sein du laboratoire CERTES3 et
d'
nous nous sommes focalisés sur la signature vibratoire donnée par l'
accélération du moteur.
L'
étude a concerné la catégorisation de signaux PEM dans le cas biomédical et
vibratoires dans le cas industriel. Nous nous sommes focalisés sur la mise en œ uvre des
réseaux LVQ et RBF et la recherche des structures adéquates pour le traitement de ces
informations en faisant varier un paramètre caractéristique pour chacun des réseaux : le
nombre de neurones cachés pour le réseau LVQ et la valeur d'
un paramètre caractéristique du
rayon de la zone d'
influence (sc) pour le réseau RBF. Concernant l'
application biomédicale,
les résultats obtenus ont été assez insuffisants puisqu'
on atteint des taux de classification
correcte de 56,2% pour un réseau LVQ comprenant 12 ou 20 neurones cachés et 59,1% pour
un réseau RBF où le paramètre sc vaut 7,5. Ces résultats ont été cependant meilleurs que ceux
obtenus dans le cadre de la mise en œ uvre d'
une approche conventionnelle (modélisation
autorégressive) puisque, dans ce cas, seuls 37% des vecteurs de notre base de données étaient
correctement classés. Concernant l'
application industrielle, plusieurs bases de données ont été
construites pour la mise en œ uvre de ces techniques neuronales simples. Les différences entre
les trois premières bases utilisées concernaient l'
origine des signaux des bases d'
apprentissage
et de généralisation (origine prise au moment du "Top Tour" ou non). La quatrième base
employée devait permettre la détection de l'
apparition d'
un défaut progressif apparaissant sur
un des organes du moteur asynchrone (roulement à billes). Concernant la première base de
données, les signaux des bases d'
apprentissage et de généralisation étaient calés sur le Top
Tour. On a alors obtenu d'
excellents résultats, avec des taux de classification correcte de
95,4% pour un réseau LVQ comprenant 9 neurones cachés et de 100% pour un réseau RBF
où le paramètre sc est compris entre 5 et 7. Nous avons décidé d'
étendre notre étude en
construisant une deuxième base de données pour laquelle l'
origine des signaux de la base de
généralisation n'
était pas forcément en phase avec le Top Tour. Dans ce cas, compte tenu des
résultats précédents, seul le réseau RBF a été mis en oeuvre. Les résultats obtenus étaient
alors assez insuffisants puisqu'
on a atteint un taux de classification correcte de 63,1% pour un
réseau RBF où le paramètre sc valait 21. La troisième base de données comprenait quant à
elle, des signaux dont l'
origine ne dépendait pas de l'
information délivrée par le Top Tour, et
ce, tant pour la base d'
apprentissage que pour la base de généralisation. On a alors obtenu des
taux de classification correcte de 65,7% pour un réseau LVQ comprenant 9 neurones cachés
et de 86,3% pour un réseau RBF où le paramètre sc est égal à 2. Si le réseau LVQ n'
a pas
3
Centre d’ Etudes et de Recherche en Thermique, Environnement et Systèmes
115
permis d'
obtenir des résultats satisfaisants, la mise en œ uvre d'
un réseau RBF pour la
classification de ces signaux a semblé adaptée.
Compte tenu de ces résultats prometteurs, nous avons décidé de détecter l'
apparition
progressive d'
un défaut de roulement sur la machine tournante. Les résultats ont alors été très
insuffisants: le réseau LVQ n'
est pas parvenu à détecter ce défaut, même quand celui-ci est
installé sur la machine. Le même constat a pu être fait pour le réseau RBF.
Les résultats obtenus ont montré que globalement, des structures neuronales simples
ne sont pas suffisantes pour réaliser un outil d'
aide au diagnostic fiable [DUJA 01b], nous
nous sommes alors tournés vers la structure plus complexe, présentée au chapitre I.
116
dans le cadre plus complexe de la détection de défaut progressif, la structure hybride ne
permet pas d'
améliorer les résultats obtenus par un réseau RBF utilisé seul.
117
"It is not absolutely necessary to believe that neural network model have anything to
do with the nervous system, but it helps. Because, if they do, we are able to use a large body
of ideas, experiments, and facts from cognitive science and neuroscience to design, construct
and test networks. Otherwise, we would have to suggest functions and mechanism for
intelligent behaviour without any examples of successful operation."1 [ANDE 95]
Le cerveau humain possède une fantastique puissance de traitement de l'
information si
l'
on considère ses capacités à prendre en charge certaines tâches nécessaires pour obtenir un
comportement intelligent. A la base de ce formidable outil, on trouve les neurones. Ce sont les
éléments fonctionnels de base des systèmes nerveux. S'
il existe une grande variété de
neurones (entre 100 et 1 000 pour le cerveau humain) et s'
ils différent beaucoup d'
une espèce
animale à l'
autre, ils possèdent néanmoins le même comportement global.
• Les neurones
L'
accomplissement de tâches par le cerveau est lié à l'
activité électrochimique des
cellules nerveuses. Un neurone est une cellule assurant cinq fonctions spécialisées :
1
"Il n'
est pas absolument nécessaire de croire que les réseaux de neurones artificiels ont un rapport avec le
système nerveux, mais cela aide. Dans ce cas, nous sommes capables d' utiliser beaucoup d'
idées, d'expériences et
de concepts des sciences cognitives et des neurosciences pour modéliser, construire et tester des réseaux. Dans le
cas contraire, il nous faut inventer des fonctions et des mécanismes de comportement intelligent sans aucun
exemple."
124
• recevoir des signaux en provenance des neurones voisins,
• intégrer ces signaux,
• engendrer un influx nerveux,
• le conduire,
• le transmettre à un autre neurone capable de le recevoir.
Il est constitué principalement de trois parties qui, vis-à-vis des transferts
d'
information, ont un rôle fonctionnel bien précis :
• un réseau d'
entrée, les dendrites, qui capte les signaux des autres neurones
ou de l'
extérieur dans le cas des neurones sensoriels,
• un élément de traitement de l'
information, le corps cellulaire, ou soma,
• un réseau de sortie, l'
axone qui achemine l'
impulsion nerveuse vers les
autres neurones.
125
Figure A1. 1 - Neurone Biologique
2
A l’ exception des systèmes endocriniens et exocriniens.
126
date du début du XIXème siècle, mais des études plus récentes ont montré que ces
découpages n'
étaient pas aussi nets que l'
on pensait. Les travaux de Cajal [CAJA 52] ont
permis de montrer que le cortex est organisé en couches. De plus, de nombreuses observations
prouvent que les cellules sont organisées en unités fonctionnelles et anatomiques, appelées
colonnes corticales en raison du caractère ascendant et descendant de la transmission des
signaux à l'
intérieur de ces cellules.
Si les systèmes nerveux simples tels que l'
arc réflexe monosynaptique dans lequel
seules trois cellules interviennent sont bien connus, il subsiste bien des questions concernant
les systèmes plus complexes dans lesquels plusieurs capteurs sensoriels interviennent. Le fait
de reconnaître une personne que l'
on ne connaît pas bien n'
est pas lié uniquement à une de ses
caractéristiques (visage, voix, façon de marcher...). Il existe une coopération complexe entre
les cellules fonctionnelles. Par exemple, après un accident vasculaire cérébral, qui entraîne
souvent une hémiplégie, une hémiparésie ou une aphasie, on a pu observer une récupération
partielle ou totale grâce à une réorganisation opérée au sein du cortex cérébral.
• La plasticité neuronale
La plasticité neuronale, propriété particulièrement remarquable du système nerveux,
recouvre la faculté d'
évolution des cellules nerveuses et de leurs interconnexions. Les notions
d'
apprentissage et de mémoire sont étroitement liées à cette propriété.
Si le système nerveux d'
un nouveau-né est caractérisé par une architecture complexe
due à un "précâblage" redondant, un enfant de quatre ans possède déjà un système mature. En
effet, les circuits neuronaux se spécialisent pendant cette période par sélection, élimination ou
renforcement des connexions, grâce aux stimuli extérieurs. L'
apprentissage, ou adaptation des
réseaux neuronaux à court terme, consiste en une modification des liens synaptiques. Un bon
exemple de cette plasticité neuronale est celui évoqué plus haut concernant les accidents
vasculaires cérébraux. Des études récentes utilisant la tomographie par émission de photons
par exemple ont permis de mettre en évidence une récupération importante, parfois même
totale des fonctions perdues, suite à une lésion partielle du cerveau, soit par restauration des
circuits endommagés, soit par transfert de la fonction de la région lésée sur une région voisine
saine.
Pour comprendre ce phénomène d'
apprentissage, de nombreuses études ont été
réalisées sur l'
Aplysia Californica, un mollusque marin dont le système nerveux ne comporte
qu'
environ 20 000 cellules nerveuses de très grosse taille (elles atteignent 1 mm de diamètre).
Par exemple, on provoque une habituation des ouïes au toucher. C'
est un réflexe
127
monosynaptique. Si ce stimulus est suffisamment répété, il se produit un phénomène
d'
habituation, c'
est-à-dire que la réponse diminue et reste affaiblie durant un certain temps.
L'
effet physiologique associé à ce phénomène est une décroissance de l'
émission
présynaptique du neurotransmetteur aux synapses. Alors, l'
arrivée d'
un potentiel d'
action
provoque une dépolarisation moindre et l'
efficacité synaptique diminue. On peut, de façon
analogue, provoquer un accroissement de l'
efficacité synaptique.
C'
est à Hebb qu'
on doit, en 1949, le premier énoncé d'
une règle qualitative régissant la
plasticité synaptique : "When an axon of cell A is near enough to excite cell B and repeatedly
or persistently takes part in firing it, some growth process or metabolic change takes place in
s efficiency, as one of the cells firing B, is increased."3 [HEBB
one or both cells such that A'
49].
• Le neurone formel
C'
est en 1943 que McCulloch & Pitts ont modélisé une cellule nerveuse par un
automate à seuil, appelé neurone formel. Un neurone formel est une modélisation très
simplifiée du neurone biologique. Il en reprend les caractéristiques de fonctionnement
principales. Sa fonction est d'
intégrer les entrées et d'
en calculer une transformation non-
linéaire. La modélisation d'
un tel neurone est représentée figure A1.2.
3
"Quand une cellule A excite par son axone une cellule B et que, de manière répétée et persistante, elle participe
à la genèse d'une impulsion dans B, un processus de croissance ou un changement métabolique a lieu dans l' une
ou dans les deux cellules, de telle sorte que l'
efficacité de A à déclencher une impulsion dans B est, parmi les
autres cellules qui ont cet effet, accrue."
128
Synapse
Corps cellulaire
Axone
xi wij xj
Dendrites oj = wij . xi x j = ϕ (o j )
i
Neurone j
(oi)
(oi)
oi
oi
0 si o i ≤ θ
Linéaire : ϕ(oi)= oi seuil : ϕ ( oi ) =
1 si o i ≥ θ
(oi) (oi)
1
1
1 2
oi oi
semi-linéaire : sigmoïde :
0 si oi < θ1 oi − θ
exp
oi − θ1 T
ϕ( oi ) = si θ1 ≤ oi ≤ θ 2 ϕ(oi ) =
θ 2 − θ1 oi − θ
1 + exp
1 si oi > θ2 T
129
Le potentiel oj de sortie du neurone j, auquel sont connectés les neurones i en entrée,
se calcule à l'
aide de la relation suivante :
x j = ϕ (o j ) (Eq. A1.2)
Par analogie avec le système nerveux, un réseau de neurones artificiels est équivalent à
un graphe dont les nœ uds sont des neurones et dont les arêtes orientées et pondérées sont les
connexions (ou synapses). La mise en œ uvre d’ un tel réseau peut être comparée à la formation
d’ un étudiant. En effet, un étudiant qui assiste à un cours apprend, grâce à un professeur, les
notions essentielles dans des matières précises. Il est entraîné grâce à des exemples
caractéristiques et évalué sur des choses connues. Quand il entre dans la vie active, il doit
généraliser les connaissances acquises de façon à résoudre les problèmes réels qui lui sont
posés. De la même manière, la mise en œ uvre d’ un réseau de neurones artificiels passe par les
mêmes étapes.
130
Le réseau, ainsi entraîné, peut alors être utilisé comme outil pour effectuer une tâche
précise qui lui a été apprise. Il est alors capable de répondre très rapidement ce qui rend leur
utilisation possible pour des traitements en temps réel.
131
Les travaux présentés dans cette annexe concernent l'
estimation quantitative de
paramètres d'
un système à surveiller. Le problème sur lequel se sont focalisés nos efforts
concerne l'
estimation du taux de vide dans un écoulement diphasique [DUJA 01a]. Il ne s'
agit
que d'
une étude de faisabilité et la structure neuronale hybride présentée précédemment n'
a
pas été mise en œ uvre. Les résultats obtenus pour un système expérimental sont présentés ici.
La présence d'
impuretés (gaz, corps étranger) dans un liquide peut avoir des
répercussions sur le bon fonctionnement d'
un système. Le phénomène complexe des
écoulements diphasiques (mélange de deux substances dans deux phases thermodynamiques
différentes), est étudié depuis 1910 par de nombreux travaux de recherche. Les problèmes liés
à ce phénomène se rencontrent dans de nombreux processus industriels. Un exemple
fréquemment observé dans l'
industrie est celui des écoulements à bulles, où l'
une des
substances est présente sous forme liquide et l'
autre sous forme gazeuse. Parmi les industries
concernées par ce problème, on peut ainsi citer les industries chimiques, métallurgique,
pétrolières (production et transport), nucléaires…
Le problème principal, encore à l'
étude aujourd'
hui, est la mesure du taux de vide,
rapport entre volume de gaz et volume de liquide, dans un contexte dynamique. En effet, si la
mesure du volume de liquide est en général aisée, celle du volume de gaz présent dans le
liquide est plus délicate et constitue encore aujourd’ hui un problème ouvert. C’ est pourquoi,
133
dans un écoulement à bulles, l’ intérêt principal réside dans les bulles et il semble donc
judicieux de s’ intéresser aux caractéristiques de celles-ci (taille, vitesse… ).
De nombreuses études ont été menées pour tenter de résoudre ce problème [LEUT 98],
et de nombreuses techniques ont été proposées parmi lesquelles : la photographie, le laser
[DURS 75], des techniques mettant en œ uvre des capteurs capacitifs… Cependant, les
limitations de ces méthodes sont grandes et sont dues, d'
une part, à la nécessité de connaître
un modèle très fin de l'
écoulement à bulles (qui est un problème très difficile et encore non
résolu à ce jour), et d'
autre part, aux difficultés liées aux conditions expérimentales et de
mesure. Quelques auteurs proposent aussi des techniques ultrasonores [BONN 87][LEMO
98].
Compte tenu des difficultés d'
une telle mesure (taux de vide) – notamment à cause du
contexte dynamique dans lequel elle intervient –, nous pensons qu'
il sera nécessaire d'
associer
les mesures obtenues par plusieurs capteurs différents afin de parvenir à une estimation de ce
taux de vide. La technique à développer doit être non invasive et non destructive, car elle doit
pouvoir s'
adapter, par exemple, sur des tuyauteries existantes, comme par exemple des
pipelines. Nous avons choisi de travailler dans un premier temps avec des techniques
ultrasonores. Nous nous sommes alors focalisés sur la mesure fournie par un capteur
ultrasonore, dans un contexte statique. Dans un premier temps, nous nous sommes intéressés à
la classification des signaux fournis par ce capteur, afin d’ obtenir une information qualitative.
Puis, nous nous sommes penchés sur l'
estimation du taux de vide présent entre les deux
capteurs ultrasonores. La partie suivante concerne le dispositif mis en œ uvre pour l'
acquisition
des signaux et la construction des bases de données pour les deux problématiques soulevées.
Puis, nous présentons les résultats obtenus lors de la mise en œ uvre des techniques neuronales
simples (cf. Chapitre I&II)
Les ultrasons sont des ondes acoustiques dont la fréquence varie de 20khz à 200Mhz.
Ces ondes ne peuvent se propager que dans un milieu matériel et leur propagation dépend du
milieu dans lequel elles se propagent. L'
intensité de ces ondes a aussi son importance,
puisque, dans le cas d'
ultrasons dit de puissance, des bulles dites de cavitations peuvent
apparaître.
134
L'
analyse par ultrasons repose sur l'
analyse des échos observés après émission d'
un
faisceau d'
ondes ultrasonores. Un capteur envoie un train d'
ondes ultrasonores qui se
propagent dans le milieu à contrôler où elles font l'
objet de phénomènes de diffraction et de
réflexion. L'
analyse de l'
écho obtenu au moyen, soit d'
un autre capteur placé en regard de
l'
émetteur, soit par l'
émetteur lui-même qui peut recevoir l'
onde réfléchie, peut alors permettre
de détecter un défaut.
Cette méthode de contrôle non destructif et non invasif est en général utilisée pour la
détection de fissure dans différents matériaux. Dans ce cas, une analyse spectrale des échos
peut être suffisante. En revanche, dans le cas de la détection d'
impuretés dans un liquide, une
analyse classique des signaux ne permet pas de conclure.
Ondes émises
Emetteur
Ultrasonore
Valve
Pompe à air
135
l'
eau, ceci afin de s'
affranchir de la propagation de l'
onde ultrasonore à travers le
plastique. Les capteurs sont pilotés par un logiciel qui gère à la fois l'
émission et la
réception des ondes. Celles-ci se font en continu ce qui permet la visualisation en temps
réel de l'
évolution des signaux en fonction de la quantité d'
air émise par la pompe.
L'
acquisition, quant à elle, se fait au moment choisi par l'
expérimentateur.
Le mode expérimental permettant de faire varier le débit de la pompe, nous
avons, dans un premier temps, choisi de définir trois classes de signaux, en fonction du
volume d'
air émis. Nous avons alors procédé à l'
acquisition de 61 signaux répartis de la
manière suivante :
• 20 signaux pour la classe 1, correspondant à de l'
eau seule,
• 20 signaux pour la classe 2, correspondant à un faible débit d'
air,
• 21 signaux pour la classe 3, correspondant à un fort débit d'
air.
Un exemple de signal correspondant à chacune des classes est présenté figure A2.2.
Amplitude
Numéro de composante
La base d'
apprentissage, que nous avons constituée pour la mise en œ uvre des
structures neuronales, comprend 14 signaux, dont quatre correspondant à la classe 1,
cinq, à la classe 2 et cinq, à la classe 3. Pour la phase de généralisation, nous avons utilisé
la base de données globale, qui comprend les vecteurs de la base d’ apprentissage, mais
aussi les vecteurs non appris.
136
Cette première base de données nous permet d’ obtenir des renseignements
qualitatifs concernant la quantité d’ air présent dans l’ eau. Le but de cette première étude
est la classification des signaux ultrasonores relevés suivant 3 catégories. Il est cependant
nécessaire, dans certains cas, d'
avoir une estimation quantitative de ce taux de vide. Pour
évaluer la faisabilité d'
une telle estimation par l'
association du capteur ultrasonore et des
réseaux de neurones artificiels, nous avons donc mis en place une seconde
expérimentation afin de construire une seconde base de données. Le protocole
d'
acquisition des signaux diffère un peu du précédent. Comme précédemment, nous
disposons du même récipient et des deux capteurs ultrasonores placés en regard l'
un de
l'
autre. En revanche, nous ne générons plus de bulles. Le principe de cette
expérimentation consiste à accroître progressivement le niveau d’ eau entre les deux
capteurs, en partant d’ un niveau minimum jusqu’ au total recouvrement des capteurs.
Connaissant le diamètre de chacun des capteurs et le niveau d'
eau dans le récipient, nous
pouvons alors estimer le volume d'
eau – et donc, le volume d'
air – présent entre les deux
capteurs. Nous avons alors construit une seconde base de données de la manière suivante.
Nous avons procédé à l'
acquisition de 56 signaux ultrasonores correspondant à des
volumes d’ air compris entre 0 et 14,66cm3.
Afin d'
effectuer l'
étude de faisabilité d'
une telle estimation, nous avons construit à
partir de cette base de données, plusieurs bases d'
apprentissage comportant un nombre
variable d'
exemples. Cette étude est présentée dans le paragraphe suivant.
• ! "
L'
objet de cette étude concerne, dans un premier temps, la classification de signaux
ultrasonores permettant de déterminer, de façon qualitative, la quantité d'
air dans un récipient
rempli d'
eau. L'
objectif de cette étude est de parvenir à un outil permettant l'
estimation du
taux de vide dans un écoulement dynamique. Nous nous sommes ensuite penchés sur la
quantification de ce taux de vide. L'
objectif de cette étude est l’ estimation du volume d’ air
[AMAR 02].
Dans les deux cas, les composantes des vecteurs d'
entrées sont les échantillons des
signaux ultrasonores. Les signaux ultrasonores n’ ont ici subit aucun prétraitement avant leur
présentation aux différents réseaux neuronaux.
137
• # " $ %
Figure A2.3 - Evolution du nombre d'erreurs en fonction du nombre de neurones dans la couche cachée
du réseau LVQ pour la classification ultrasonores.
138
• &
• '
Tout comme le réseau LVQ, les nombres de neurones des couches d'
entrée et de sortie
sont déterminés par le problème à traiter. Ainsi, le réseau comprendra autant de neurones en
entrée que de composantes des vecteurs d'
entrée, soit 128.
Pour le nombre de neurones de sortie, on peut envisager le problème de deux manières
différentes, suivant la manière dont on code les classes (voir II.2.3.2.2.a.). Pour la
classification des signaux ultrasonores, la classe sera codée de la seconde manière et le réseau
RBF comprend donc 1 seul neurone de sortie.
Comme nous l'
avons déjà mentionné, contrairement au LVQ, le nombre de neurones
de la couche cachée du RBF est déterminé par apprentissage. Les neurones de la couche
cachée sont utilisés pour mémoriser un exemple et une fonction d’ activation. Chacun a une
activité locale dans l’ espace d’ entrée. Ainsi, les fonctions noyaux ne donnent des réponses
utiles que dans le cas d’ un domaine restreint, leur champ récepteur. Ce champ récepteur,
encore appelé zone d'
influence, est l'
un des paramètres caractéristiques du réseau RBF. Pour
le modèle que nous utilisons, le rayon de cette zone est fixe et nous pouvons le faire varier
grâce à un paramètre, noté sc.
Nous avons étudié, dans chacun des cas, l'
impact de la taille de la zone d'
influence des
neurones. Pour cela, nous avons fait varier le paramètre sc de 0,1 à 10 avec un pas de 0,01..
L'
apprentissage s'
arrête quand le nombre de neurones cachés atteint le nombre de vecteurs de
la base d'
apprentissage ou que l'
erreur commise atteint un seuil fixé par l'
utilisateur. Les
résultats obtenus en phase de généralisation sont présentés à la figure A2.4.
Pour le problème de classification des signaux ultrasonores; on peut remarquer un taux
de classification correct élevé de 98% pour un intervalle précis, à savoir [1,59 ; 1,64]. Cet
intervalle, valable pour les vecteurs de cette base d'
apprentissage, permet alors d'
optimiser
dans ces conditions la couverture de l'
espace des paramètres. Pour un rayon inférieur, le
nombre d'
erreurs diminue jusqu'
à atteindre le minimum. Puis, au-delà de cet intervalle, le
nombre d'
erreurs s'
accroît à nouveau et finit par rester stable. En effet, la taille de la zone
d'
influence intervient directement sur la cartographie que réalise le réseau RBF au cours de
son apprentissage. Un rayon d'
influence trop faible peut alors conduire à une cartographie trop
lacunaire, tandis qu'
un rayon trop élevé risque de provoquer des recouvrements de zones de
classification. Si on analyse les résultats obtenus, on peut remarquer que, pour l'
intervalle
139
optimal du rayon, l'
erreur commise est toujours la même. Le réseau ne parvient pas à
déterminer la classe d'
un vecteur de la classe 3. Le résultat fourni alors correspond à une
classe non définie. Cependant, cet excellent taux de classification ne doit pas occulter le fait
que les résultats obtenus ne concernent qu'
une étude assez éloignée de la réalité.
Les résultats obtenus ne sont valables que pour les bases d'
apprentissage définies. Ils
montrent cependant la pertinence de ce paramètre dans la construction d'
un réseau adéquat. Il
est important de rappeler que les critères d'
arrêt d'
apprentissage utilisés, mentionnés ci dessus,
restent restrictifs du fait que le rayon d'
influence a été supposé identique pour tous les
neurones de la couche cachée.
RBF
35
30
Nombre d'erreurs
25
20
15
10
5
0
0 1 2 3 4 5 6 7 8 9 10
Rayon zone d'influence
Figure A2.4 - Evolution de l'erreur commise en fonction du paramètre sc pour la classification des
signaux ultrasonores
• $
140
La figure A2.5 (a) présente les résultats obtenus en phase de généralisation après
apprentissage par le RNA de 28 prototypes de la base de données, soit un vecteur sur deux.
Les deux courbes correspondant au volume d’ air attendu (croix) et au volume d’ air estimé par
le RNA (ligne) sont pratiquement confondues. On obtient donc, avec cette approche, une
bonne estimation du volume d’ air compris entre les deux capteurs même pour des valeurs non
apprises par le RNA.
Nous avons également procédé à la même expérimentation avec un nombre de
prototypes appris par le RNA plus faible, soit 9 vecteurs au lieu de 28. Les résultats obtenus
sont présentés figure A2.5 (b). Les valeurs d’ estimation fournies par le RNA restent
satisfaisantes, malgré le peu de prototypes appris.
(a)
(b)
Figure A2.5 - Estimation par le réseau RBF du volume d’air en phase de généralisation
(a) pour une base d'apprentissage comprenant 28 vecteurs
(b) pour une base d'apprentissage comprenant 9 vecteurs
141
Nous avons ensuite fait l'
expérimentation suivante : nous avons supprimé les deux
extrêmes de la base d'
apprentissage et nous avons alors obtenus les résultats présentés Figure
A2.6.
Les résultats obtenus sont nettement insuffisants. On remarque que les volumes non
compris dans l'
intervalle appris ne sont pas estimés correctement. Il sera donc nécessaire de
connaître l'
intervalle dans lequel se situera l'
ensemble des volumes à estimer.
Figure A2.6 - Estimation par le réseau RBF du volume d’air en phase de généralisation
(Extrêmes non appris)
142
signaux de cette classe, le volume d'
air compris entre les deux capteurs est nul. Or, pour 5
air compris entre 4 et 6 cm3. Cette
signaux de cette classe, le réseau estime un volume d'
mauvaise estimation peut venir du fait que l'
acquisition des signaux de ces deux bases
d'
informations n'
a pas été faite le même jour et que, par conséquent, les conditions,
notamment de température, ne sont pas identiques. Nous avons donc ajouté à la base
d'
apprentissage précédente un signal de la classe 1, puisque, dans ce cas, nous connaissons le
volume d'
air correspondant à cette mesure. Les résultats obtenus sont présentés figure A2.8.
Figure A2.7 - Estimation du volume d'air pour les signaux de la première base de données
L'
estimation est alors beaucoup plus satisfaisante. On peut ainsi estimer que :
• Le volume d'
air compris entre les capteurs dans le cas de la classe 3 (fort
air de la pompe) est supérieur à 2 cm3.
débit d'
• Le volume d'
air compris entre les capteurs dans le cas de la classe 2 (faible
air de la pompe) est inférieur à 2 cm3.
débit d'
Même si nous n'
avons qu'
une connaissance quantitative du volume des bulles, et
même si le protocole expérimental d'
acquisition de nos bases de données est assez
rudimentaire et reste assez éloigné du problème réel, les résultats montrent cependant la
faisabilité d'
un outil d'
estimation du taux de vide à l'
aide de réseaux de neurones.
143
Figure A2.8 - Estimation du volume d'air (base d'apprentissage modifiée)
144
On peut décomposer l'
appareil auditif en trois parties : l'
oreille externe, moyenne et
interne. La figure A3.1 est une vue d'
ensemble du système auditif à laquelle on pourra se
reporter tout au long de cette partie.
146
association avec le rôle diffracteur de la tête. L'
oreille externe est responsable d'
un gain auditif
substantiel sur les hautes fréquences.
L'
oreille moyenne comprend le tympan et la chaîne ossiculaire – ou osselets (marteau,
enclume, étrier) – logés dans un espace osseux du rocher appelé caisse du tympan. C'
est un
espace rempli d'
air qui communique avec le pharynx par l'
intermédiaire de la trompe
d'
Eustache, un conduit musculo-membraneux. Le rôle de ce conduit est de maintenir
l'
équipression de part et d'
autre du tympan grâce à son ouverture régulière au cours des
mouvements de bâillement ou de déglutition. Il permet ainsi la vibration optimale de la chaîne
tympano-ossiculaire.
La membrane tympanique est une structure élastique, fibrillaire dans laquelle est
inclus le marteau par sa longue apophyse, encore appelée manche du marteau. La tête du
marteau est articulée avec l'
enclume. Il est suspendu dans l'
oreille moyenne par un puissant
ligament qui s'
insère sur sa courte apophyse, sa longue apophyse est, elle, en relation avec
l'
étrier. L'
étrier, quant à lui, est constitué de deux branches, et d'
une partie plate – ou platine –
qui repose dans la fenêtre ovale, par laquelle il est en contact avec l'
oreille interne.
Le développement fonctionnel de l'
oreille moyenne, qui a commencé chez les
amphibiens, a considérablement amélioré la transmission sonore en agissant comme un
adaptateur d'
impédance. Cet effet est accompli principalement à travers la grande différence
de surface entre le tympan (65 mm²) et la platine de l'
étrier (3,2 mm²) et, à moindre degré, à
travers l'
action de levier de la chaîne ossiculaire.
Les osselets sont maintenus en place par un système complexe de ligaments et de
muscles. Parmi ces derniers, les plus importants sont le muscle du marteau et le muscle de
l'
étrier – ou muscle stapédien – dont le rôle est de tendre la chaîne ossiculaire. Il est
notamment mis en jeu par voir réflexe, lors de fortes stimulations auditives. C'
est un réflexe
bilatéral, sous contrôle du nerf facial. Un de ses rôles serait de protéger l'
oreille interne des
sons de forte intensité en limitant la pénétration de la chaîne des osselets dans l'
oreille interne.
L'
onde sonore atteint le conduit auditif externe et met le tympan en vibration.
L'
énergie sonore est transférée à la chaîne ossiculaire dont les déplacements sont de l'
ordre de
quelques angströms, puis au liquide de l'
oreille interne par l'
intermédiaire de la platine de
l'
étrier.
147
•
L'
oreille interne est constituée d'
une partie responsable de l'
audition, la cochlée et
d'
une partie responsable de l'
équilibre, le vestibule.
La cochlée, plus familièrement appelée limaçon en raison de sa forme de tube enroulé
sur deux trous de demi de spire, est entouré d'
une capsule osseuse et remplie de liquide. Ce
tube est cloisonné par deux membranes constituant trois rampes, qu'
on distingue bien sur une
coupe transversale : les rampes vestibulaires, tympaniques et surtout cochléaire qui nous
intéresse particulièrement, car c'
est là que se situe l'
organe sensoriel de l'
audition : l'
organe de
Corti.
L'
organe de Corti est constitué d'
une architecture complexe de cellules sensorielles et
de cellules de soutien. On trouve deux types de cellules sensorielles : les cellules ciliées
internes (CCI), disposées sur une seule rangée, et les cellules ciliées externes (CCE),
disposées, elles, sur trois rangs.
Ces cellules ciliées ont la particularité de présenter à leur extrémité apicale des
expansions cytoplasmiques en doigts de gants appelées stéréocils. Il existe plusieurs rangées
de stéréocils par cellule, les plus courts étant disposés à l'
intérieur de la cochlée, les plus
longs, à l'
extérieur. Ces stéréocils sont rangés en ligne dans les CCI et le long d'
un W dans les
CCE.
Les CCE ont la propriété de se contracter en réponse à une stimulation sonore. Elles
ont avant tout une activité musculaire, les CCI étant, quant à elles, les véritables cellules
sensorielles qui transmettent l'
information sonore au nerf auditif. Lorsque l'
onde sonore est
transmise à l'
oreille interne, elle fait vibrer la membrane basilaire, sur laquelle repose l'
organe
de Corti. En se contractant, les CCE permettent une amplification très localisée de la vibration
de la membrane basilaire, ce qui permet de ne stimuler qu'
un nombre limité de CCI,
améliorant ainsi la sélection fréquentielle.
Quand il y a destruction de CCE, comme dans le cas d'
un traumatisme sonore, il faut
de fortes intensités sonores pour stimuler directement les CCI. Alors, de nombreuses CCI sont
stimulées, entraînant une perte de sélectivité fréquentielle. Les CCI ont un rôle de
transduction en transformant la stimulation vibratoire en influx nerveux destiné aux dendrites
des axones du nerf auditif qui font synapse au niveau du pôle inférieur de la cellule. Il s'
agit
d'
une innervation afférente.
148
Il existe, au niveau de la cochlée, une répartition fréquentielle tonotopique, les aigus
étant codés à la base et les graves à l'
apex, qui a fait comparer la cochlée à un clavier de
piano. On parle du clavier cochléaire.
L'
ensemble est 30 000 axones innervant l'
organe de Corti constitue le nerf auditif. Il
chemine dans le conduit auditif interne et rejoint le tronc cérébral.
Il existe, au niveau du nerf auditif, une organisation tonotopique, chaque fibre
répondant de manière préférentielle à une fréquence particulière, dite fréquence
caractéristique. Au niveau des fibres auditives, on observe une activité spontanée en dehors de
toute stimulation auditive. Pour une fibre donnée, le niveau d'
activité est assez stable, en
revanche, il varie beaucoup d'
une fibre à l'
autre.
Les neurones auditifs primaires répondent tous de manière univoque à la stimulation
sonore, en augmentant leur activité. Il existe une brusque augmentation des décharges au
début du stimulus, suivie d'
une diminution de l'
activité qui se stabilise en plateau durant la
deuxième partie de la stimulation.
Le premier relais des neurones du nerf auditif se situe au niveau des noyaux
cochléaires du bulbe qui contiennent les neurones auditifs secondaires. Il existe une grande
variété de types cellulaires dans les noyaux cochléaires, corrélée avec une grande variété de
types de réponses qui contraste avec l'
activité univoque des neurones primaires. Comme au
niveau du nerf auditif, on observe une organisation tonotopique au niveau des noyaux
cochléaires.
Puis, les relais des voies auditives se trouvent au niveau de la protubérance. Il s'
agit du
complexe olivaire supérieur. Au sein de ces noyaux, les différents neurones n'
ont pas tous les
mêmes caractéristiques physiologiques. Il s'
agit du niveau le plus bas du système auditif.
Le relais suivant est le colliculus inférieur. Quand le signal atteint ce relais, il a déjà
subi plusieurs modifications, non seulement dues aux transformations synaptiques survenues
entre la cochlée et le colliculus inférieur, mais aussi à la convergence des fibres provenant des
deux oreilles au niveau d'
un même neurone à des niveaux inférieurs. La mise en jeu des
excitations et des inhibitions devient de plus en plus complexe.
Le corps grenouillé médian est le dernier relais sous cortical. Il est composé de deux
parties : une partie principale et un noyau ventral. Les fibres en provenance du colliculus
149
inférieur se terminent essentiellement dans la partie principale. Enfin, les ondes auditives se
projettent sur le cortex auditif.
150
[ALPS 94] D.Alpsan, “Auditory Evoked Potential Classification by Unsupervised
Art 2-A and Supervised Fuzzy Artmap Networks”, IEEE International
Conference on Neural Networks (ICNN), Orlando, July, 1994.
[ALPS 95] Alpsan, D., Towsey, M., Özdamar, Ö., Tsoi, A., Ghista, D.N., "Efficacy
of modified back-propagation and optimization methods on a real-world
medical problem", Neural Networks, 8:945:962, 1995.
[ANDE 95] J.A. Andersen, "An Introduction to Neural Network", MIT Press,
Cambridge, 1995
[BARR 03] M. Barret, A-S. Dujardin, V. Amarger, K. Madani, J-F. Durastanti, "
"Mechanical faults recognition using wavelet transform and artificial
neural network techniques", CISIM'
03, 2003.
[BONN 87] J.C. Bonnet, L.L. Tavlarides, "Ultrasonic technique for dispersed-phase
holdup measurements", Ind. Eng. Chem. Res. Vol. 26, N°4,1987, pp 811-
815.
118
[CAJA 52] R. Cajal, "Histologie du système nerveux de l’homme et des vertébrés",
Vol. 1 et 2, traduit de l’ espagnol par L. Azoulay, Madrid 1952
[CHEN 99] K. Chen, L. Xu, H. Chi, "Improved Learning Algorithms for mixture of
experts in multiclass classification", Neural Networks 12, pp1229-1252,
1999.
[DUJA 99a] A-S Dujardin, V. Amarger, K. Madani, O. Adam, J-F. Motsch. "Multi-
Neural Network approach for Classification of Brainstem Evoked
Response Auditory". Lecture Notes in Computer Science - Biological and
Artificial Computation : From Neuroscience to Technology, Edité par :
Jose Mira, Roberto M. Diaz et Joan Cabestany - Springer Verlag Berlin
Heidelberg 1999.
119
[DUJA 01a] A-S Dujardin, V. Amarger, K. Madani, "Approches Neuronales pour
Diagnostic Industriel : Application à la Classification de Signaux
Ultrasonores", CNRIUT' 01, Roanne, ouvrage Ed. par les Publications de
l'
Université de Saint-Étienne, 2001
[DUJA 01b] A-S Dujardin, "Pertinence d'une approche hybride multi-neuronale dans
la résolution de problèmes liés au diagnostic industriel ou médical",
Valgo n°01-02 , octobre 2001, ISSN 1625-9661. (http://www.supelec-
rennes.fr/acth/valgo/Valgo_Numero-01-02.html)
[HEBB 49] S. Hebb, "The Organization of Behaviour", Wiley and Sons, New York,
USA, 1949
[KOHO 89] T. Kohonen, "Self Organising and Associative Memoy", 3rd ed., Springer-
Verlag, Germany, 1989.
[MOOD 89] J. Moody, C.J. Darken, "Fast Learning in networks of Locally Tuned
Processing Units", Neural Computation, Vol.1, pp. 281-294, 1989.
120
[MOTS 87] J.-F. Motsch, "La dynamique Temporelle du Tronc Cérébral : Recueil,
extraction et analyse optimale des Potentiels Evoqués Auditifs du Tronc
Cérébral", Thèse d' Etat de doctorat, Université de Créteil-Paris XII,
1987.
[MUST 92] M. T. Mustawi et al., "On the taining of Radial Basis Functions
Classifiers", Neural Networks, Vol. 5, pp.595-603, 1992.
[NIRA 88] M. Niranjan, F. Fallside, "Neural Networks and Radial Basis Function in
classifying-static speech pattern", Report CUED/FINFENG/TR22,
Cambridge University, England, 1988.
[RUME 86] D.E. Rumelhart, G.E. Hinton, R.J. Williams, "Parallel Distributed
Processing", MIT Press, 1986.
[SCHW 02] F.Scwenker, C. Dietrich, H.A. Kestler, K. Riede, G. Palm, "Radial Basis
Function Neural Networks and Temporal Fusion for the Classification of
Bioacoustic Time Series", Neurocomputing, vol 51, pp 265-275, 2002
[SRID 99] D.V. Sridhar, E.B. Bartlett, R.C. Seagrave, "An Information Theoretic
Approach for Combining Neural Network Process Model", Neural
Networks 12, pp 915-926, 1999.
[THOM 99] W.T. Thomson, "A Review of On-line Condition Monitoring Techniques
for Three-Phase squirrel-Cage Inductor Motors – Past, Present and
Future", IEEE SDEMPED' 99, Gijon, Spain, pp3-18, 1999.
[YANG 03] D.M. Yang, A.F. Stronach, P. MacConnell, "The Application of Advances
Signal Processing Techniques to Induction Motor Bearing Condition
Diagnosis", Meccanica 38, pp297-308, Kluwer Academic Puvlishers.
121
[ZWIN 91] G. Zwingelstein, M.H. Masson, B. Dubuisson, M. Pavard, J. Mazaleyrat,
"The applications of neural netaworks for the predicitve maintenace of
nuclear plants", Proceedings of the 3rd Symposium on Expert System
Application te Power Systems, Tokyo, April 1992.
122
Le problème du diagnostic se rencontre dans de nombreux domaines, notamment
médical et industriel, et l’ homme y joue un rôle indispensable. La difficulté majeure liée à ce
problème repose sur la similitude des signatures qui permettent de faire un diagnostic. De
plus, on dispose souvent d’ une connaissance empirique du système, et donc, d’ un modèle
incomplet, nécessitant le recours à un expert. Nos efforts se sont concentrés sur des
techniques à base de réseaux de neurones artificiels (RNA) pour l' aide au diagnostic. En effet,
en ce qui concerne les tâches de reconnaissance, de classification et de décision, les
techniques proposées représentent un certain nombre d' avantages par rapport aux approches
conventionnelles grâce à leur capacité d' apprentissage et de généralisation. Constatant de plus
que les techniques neuronales simples ne permettent pas d’ obtenir de bons résultats, nous
proposons une structure neuronale hybride. Deux volets ont alors été considérés : l' un lié au
domaine biomédical et l' autre, concernant le domaine industriel.
The problem of diagnosis occurs in many fields, especially medical and industrial,
where operator has a key role. The major difficulty bound to this problem lies on the
resemblance between the signatures which allow to make a diagnosis. Furthermore, we often
have an empirical knowledge of the system, and thus, an incomplete model, requiring the
appeal to an expert. Our efforts were focused on techniques based on neural techniques for
computer aided diagnosis. For the tasks of pattern recognition, classification and decision, the
proposed techniques indeed presents a number of advantages over classical models because of
their abilities of learning and generalization. Moreover, noticing that simple neural techniques
do not allow obtaining good results, we propose a neural hybrid structure. Two applications
have been considered: one linked to the biomedical field and the other concerning the
industrial domain.