Vous êtes sur la page 1sur 154

Année 2003

THESE

Présentée à

L’UNIVERSITE PARIS XII VAL DE MARNE – CRETEIL

En vue de l’obtention du titre de Docteur de l’Université


Spécialité Génie Informatique, Automatique
et Traitement du Signal
par

Anne-Sophie BELLANGER-DUJARDIN

CONTRIBUTION A L’ETUDE DE STRUCTURES


NEURONALES POUR LA CLASSIFICATION DE
SIGNATURES : APPLICATION AU DIAGNOSTIC DE
PANNES DES SYSTEMES INDUSTRIELS ET A L’AIDE AU
DIAGNOSTIC MEDICAL

Soutenue le ?? devant la Commission d’Examen :

Mme V. AMARGER MCF Examinatrice


M. G. BLOCH Professeur Rapporteur
M. H. COUSILLAS MCF Rapporteur
M. H. MAAREF Professeur Rapporteur
M. K. MADANI Professeur Examinateur
M. G. ZWINGELSTEIN Professeur Associé/EDF Examinateur
! "# $ %
&

' % ( ) * + ,- (
, $ .. / 0 $ , + . 1 2 3
22 4- 1 $ ) 56 7 )/ 8/ 7 2 9
1 2 % 2 2 2 % : &

' ( ; $ .< .7 1
1 ( ( ( 4 &

' % 42 2 ( % $ # 1
.$ . ) / - 1 " & 2 4
(1 2 ( &

' $ $ # /- ( 2 )
/ 1 ( 1 - 1 : 22
( 2 &

' % 42 %$ < 7 -
8 "0 &

% 0 - / - ' " - . - ) - -
7 - 0 = - < 1 - > (- % 1 2 2
) / 1 ( 1 8 "0 &
(( -: 2 % ?: &

2 2 :
2 7 1 %2 2 % &

' 2 2 - 2 2 -2 2 @ - A -
( >

/ ( - %! 1 ( 1
(( - % - -1
&
REMERCIEMENTS…………………………………………………………………….…...2

SOMMAIRE……………………………………………………………………………..……3

INTRODUCTION…………………………………………………………………………….6

CHAPITRE I. DIAGNOSTIC ET RESEAUX DE NEURONES ARTIFICIELS ...........12

I.1. Introduction ............................................................................................................13

I.2. Les Réseaux de Neurones Artificiels ......................................................................16


I.2.1. Réseaux de neurones artificiels et diagnostic ......................................................16
I.2.2. Le perceptron .....................................................................................................18
I.2.3. Le réseau Learning Vector Quantization.............................................................22
I.2.4. Le réseau Radial Basis Function.........................................................................26

I.3. Approche neuronale hybride..................................................................................31


I.3.1. Généralités .........................................................................................................31
I.3.2. Informations d'entrée et étape de prétraitement ...................................................31
I.3.3. Les agents neuronaux .........................................................................................35
I.3.4. L'étape de décision .............................................................................................35

I.4. Conclusion ...............................................................................................................36

CHAPITRE II. APPROCHES NEURONALES SIMPLES POUR L’AIDE AU


DIAGNOSTIC ET LEUR EVALUATION EXPERIMENTALE ....................................39

II.1. Introduction ............................................................................................................40

II.2. Volet Biomédical : Les Potentiels Evoqués Auditifs ..............................................41


II.2.1. Présentation........................................................................................................41
II.2.2. Mise en œuvre clinique et construction de la base de données ............................44
II.2.3. Résultats.............................................................................................................47
II.2.3.1. Application d'une technique conventionnelle : Modélisation AR des signaux
PEA ..........................................................................................................47
II.2.3.1.1. Première approche ......................................................................48
II.2.3.1.2. Seconde Approche......................................................................50
II.2.3.2. Aide au diagnostic par techniques neuronales...................................................51
II.2.3.2.1. Réseau Learning Vector Quantization.........................................52
II.2.3.2.2. Réseau Radial Basis Function .....................................................54
II.3. Volet Industriel : Diagnostic de défaillances d’un moteur asynchrone ................57
II.3.1. Introduction........................................................................................................57
II.3.2. Construction de la base de données.....................................................................58
II.3.3. Aide au diagnostic par techniques neuronales.....................................................62
II.3.3.1. Exploitation de la base de données 1 ................................................................62
II.3.3.1.1. Réseau Learning Vector Quantization.........................................62
II.3.3.1.2. Réseau Radial Basis Function .....................................................63
II.3.3.2. Exploitation de la base de données 2 – Réseau RBF .........................................65
II.3.3.2.1. Optimisation de la structure du réseau.........................................65
II.3.3.2.2. Résultats obtenus ........................................................................66
II.3.3.3. Exploitation de la base de données 3 ................................................................67
II.3.3.3.1. Réseau Learning Vector Quantization.........................................67
II.3.3.3.2. Réseau Radial Basis Function .....................................................68
II.3.3.4. Détection de l'apparition d'un défaut de roulement progressif ...........................70
II.3.3.4.1. Réseau Learning Vector Quantization.........................................71
II.3.3.4.2. Réseau Radial Basis Function .....................................................71

II.4. Conclusion ...............................................................................................................73

CHAPITRE III. VERS DES TECHNIQUES NEURONALES HYBRIDES ...................76

III.1. Introduction ............................................................................................................77

III.2. Validation de la structure neuronale hybride proposée : Application au problème


d'aide au diagnostic biomédical .........................................................................................78
III.2.1. Structures n'impliquant qu'un seul agent neuronal...............................................79
III.2.1.1. Structures hybrides RNA/Seuillage ..................................................................79
III.2.1.1.1. Structure hybride LVQ/Seuillage...............................................80
III.2.1.1.2. Structure hybride RBF/Seuillage ...............................................81
III.2.1.2. Structures hybrides RNA/Module de décision neuronal....................................83
III.2.1.2.1. Structure hybride RBF/(LVQ+Seuillage)...................................83
III.2.1.2.2. Structure hybride RBF/(BP+Seuillage)......................................88
III.2.2. Structure hybride impliquant 2 agents neuronaux ...............................................93

III.3. Validation de la structure neuronale hybride proposée :Application au problème


d'aide au diagnostic industriel ...........................................................................................98
III.3.1. Structure Hybride RBF/LVQ..............................................................................97
III.3.1.1. Application de la structure hybride RBF/LVQ : exploitation de la base de
données 2 ........................................................................................................98
III.3.1.2. Application de la structure hybride RBF/LVQ : exploitation de la base de
données 3 ........................................................................................................99
III.3.1.3. Application de la structure hybride RBF/LVQ : Détection de l'apparition d'un
défaut progressif ......................................................................................................101
III.3.2. Structure Hybride RBF/BP ...............................................................................102
III.3.2.1. Application de la structure hybride RBF/BP : exploitation de la base de données
2 ......................................................................................................103
III.3.2.2. Application de la structure hybride RBF/BP : exploitation de la base de données
3 ......................................................................................................104
III.3.2.3. Application de la structure hybride RBF/LVQ : Détection de l'apparition d'un
défaut progressif ......................................................................................................105

III.4. Conclusion .............................................................................................................107

CONCLUSION….………………………………………………………………………….112

BIBLIOGRAPHIE…………………………………………………………………………118

ANNEXE 1 : Les fondements biologiques des réseaux de neurones artificiels..……….123

ANNEXE 2 : Ecoulements diphasiques : Problème du Taux de Vide………………….132

ANNEXE 3 : L'appareil auditif………………………………………...…………………145


Le problème du diagnostic se rencontre dans de nombreux domaines, notamment dans
le domaine médical et le domaine industriel. Pour le diagnostic médical, l'
objectif est de
déterminer une maladie à partir de symptômes, et de résultats d'
examens. Le diagnostic
industriel, quant à lui, consiste à trouver la cause d'
une défaillance. Dans l'
un et l'
autre des
cas, l'
objectif est de parvenir à une solution destinée à assurer le bon fonctionnement du
système surveillé – être humain dans le cas médical et système de production – dans le cas
industriel.
Dans le domaine industriel, la production est caractérisée par une complexité
croissante qui s'
explique par la considération de contraintes à respecter. D'
un point de vue
économique, par exemple, ces contraintes concernent l'
obligation de rendement et surtout de
diminution des coûts en raison du contexte de plus en plus concurrentiel dans lequel les
entreprises évoluent. D'
un point de vue technique, les contraintes portent sur le
développement des technologies, de l'
informatisation et de l'
automatisation. Enfin, il ne faut
pas oublier la nécessité d'
assurer la sécurité des hommes qui assurent cette production. Cette
complexité se traduit par la présence inévitable d'
aléas de fonctionnement, qu'
il sera alors
nécessaire de détecter et corriger le plus rapidement possible. Ces aléas se traduisent par la
présence d'
écarts entre production réelle et production prévue. Ces aléas sont indéniablement
néfastes. Le diagnostic doit alors permettre de préserver la sécurité des hommes, et d'
éviter la
détérioration des matériels. Mais, il doit aussi permettre de réduire les coûts financiers qui
pourraient immanquablement découler d'
une avarie sur le système de production, et ainsi de
maintenir la compétitivité de l'
industrie sur son marché. Pour cela, il est nécessaire de mettre
en place un dispositif de surveillance permettant d'
avoir une représentation de l'
état de l'
outil
de fonctionnement. Un certain nombre de capteurs donneront alors les informations
nécessaires (données, images, signal) pour caractériser l'
état du système. La surveillance des

7
systèmes se décompose en trois fonctions : la détection d’une défaillance, qui consiste à
reconnaître une déviation par rapport au fonctionnement attendu, la localisation d’une faute,
qui consiste à déterminer la région physique du système dans lequel la défaillance s’est
produite et enfin, le diagnostic qui permet de déterminer précisément l’origine de la
défaillance détectée.
Concernant le domaine médical, l'
enjeu est un peu différent, puisque ici, le système
considéré est l'
être humain, dont la complexité est immense. L'
objectif du diagnostic est ici,
de déterminer une maladie à partir de symptômes et de résultats d'
examens complémentaires,
afin de proposer le traitement adéquat mais aussi, dans certains cas tels que les problèmes
psychologiques ou psychiatriques, de trouver les causes des troubles. La contrainte majeure
est de préserver la santé physique et morale du patient. Pour cela, les médecins disposent, à
l'
heure actuelle, de techniques à la pointe de l'
évolution technologique qui leur permettent
d'
obtenir des données, des images, des signaux pour établir leur diagnostic. Le médecin
visualise alors les résultats de ces divers examens pour établir son diagnostic. En effet, les
médecins ne disposent pas d'
outils permettant une aide au diagnostic. Mais, ne pourrait-on pas
développer des techniques d'
analyse de ces informations pour réaliser un outil d'
aide au
diagnostic?

Les systèmes de production dans le milieu industriel sont de plus en plus automatisés,
c'
est-à-dire que l'
homme est remplacé dans ses tâches répétitives par des systèmes
automatiques. La première conséquence de cette automatisation est donc de déplacer
progressivement le niveau d'
intervention de l'
homme dans le sens d'
une réduction de l'
activité
physique directe au profit d'
une activité mentale de commande et de coordination. Cependant,
ces systèmes automatisés ne sont pas sans faiblesse, et leur fragilité et leur susceptibilité aux
dysfonctionnement font que l'
intervention humaine est souvent nécessaire. Dans le milieu
médical, le rôle du médecin est aussi primordial. C'
est en lui que le patient place sa confiance.
Le caractère indispensable de l'
acteur humain dans le contexte du diagnostic médical relève
entre autre d'
un aspect "psychologique". De plus, par ses capacités de juger et de décider,
d'
analyser, de synthétiser et d'
interpréter les symptômes, le praticien joue un rôle primordial.
C'
est lui qui détient "l'
expertise" et la "connaissance". Ainsi, tant dans un contexte de
surveillance et de maintenance des systèmes industriels que dans le contexte du diagnostic

8
médical, il n'
est pas envisageable de mettre en place des outils de surveillance sans considérer
le rôle indispensable de l'
homme. Il s'
agit donc de développer, non pas des outils de
diagnostic, mais plutôt d'
aide au diagnostic.

L'
homme est un acteur incontournable dans le processus de diagnostic. Il possède en
effet les capacités indispensables à la résolution de problèmes liés à cette activité. Celles-ci
sont dues aux caractéristiques du cerveau humain qui lui confère les capacités de perception,
de mémorisation, d'
apprentissage, d'
adaptation et de raisonnement.
Le problème d'
aide au diagnostic a donc tout naturellement fait l'
objet de travaux en ce
sens, en tentant de reproduire ces performances à l'
aide d'
un système artificiel.
En effet, au cours des vingt cinq dernières années, le domaine de l'
Intelligence
Artificielle (IA) a connu un essor important, avec, en particulier, le développement des
réseaux de neurones artificiels. Ces derniers tentent de reproduire, par simulation, certains des
principes organisationnels et fonctionnels du cerveau humain. Ils permettent d'
élaborer un
nombre important de techniques originales, couvrant un large domaine d'
applications. Parmi
leurs propriétés les plus attractives, on peut citer leurs capacités d'
apprentissage et de
généralisation et, pour certain d'
entre eux, leur capacité de classification et d'
identification. Ils
ont ainsi été appliqués, par exemple, avec succès à des problèmes de reconnaissance des
formes. Toutes ces propriétés font des réseaux de neurones un outil permettant de développer
de nouvelles techniques pour l'
aide au diagnostic, et nos travaux portent sur l'
application de
ces techniques au diagnostic, tant dans le domaine industriel que dans le domaine médical.

Dans de nombreux cas, la grande difficulté inhérente au problème du diagnostic


repose sur la similitude des caractéristiques à partir desquelles est effectué un diagnostic. On
dispose souvent d'
une connaissance empirique du système, et de ce fait, d'
un modèle
incomplet du système, nécessitant le recours à un "expert". La difficulté du diagnostic dans le
domaine médical en est un exemple significatif : plusieurs diagnostics contradictoires
pourraient être formulés à partir d'
un même examen clinique. On peut aussi établir le même
type de constat concernant la faible efficacité des systèmes de supervision et de détection de
pannes utilisés dans l'
industrie.

9
Les travaux effectués au cours de cette thèse visent à apporter des éléments de réponse
au problème d'
intégration des connaissances "d'
expert" dans un processus conduisant à la
détection et au diagnostic d'
un dysfonctionnement. La classe des problèmes étudiés relève de
celles d'
identification et de catégorisation des dysfonctionnements. Pour tenter de les
résoudre, nous avons mis en œuvre des techniques basées sur le connexionnisme (structures à
base de réseaux de neurones), et nous proposons alors une structure permettant de
"catégoriser" des informations (signaux, données…), issues de différents capteurs, par des
techniques neuronales.

Ce mémoire est organisé en trois chapitres. Le premier chapitre concerne la


présentation du diagnostic par réseaux de neurones artificiels. Nous y présentons différents
modèles neuromimétiques utilisés dans le cadre du présent travail. Leur structure, leur
algorithme d'
apprentissage et leurs caractéristiques sont alors abordés. Nous y présentons
aussi la structure hybride neuronale que nous proposons pour tenter de résoudre le problème
d'
aide au diagnostic, quel que soit le domaine d'
étude considéré.
Le chapitre suivant concerne la mise en œuvre de techniques neuronales simples pour
la résolution de problèmes liés à l'
aide au diagnostic. Nous y présentons les deux
problématiques sur lesquelles portent nos travaux, et qui concernent les deux domaines déjà
cités : le domaine médical et le domaine industriel. Dans le domaine médical, nos travaux
concernent l'
aide au diagnostic à partir de résultats d'
un examen permettant de déceler des
troubles auditifs. Les informations principales utilisées dans ce cas sont les Potentiels
Evoqués Auditifs. Dans le domaine industriel, nous nous sommes intéressés au problème du
diagnostic de défaillances d'
un moteur asynchrone. Enfin, les résultats obtenus lors de la mise
en œuvre des techniques neuronales exposées dans le premier chapitre sont présentés. Ceux-ci
permettront de montrer les limites des techniques neuronales simples dans la résolution de
problèmes d'
aide au diagnostic de systèmes complexes.
Les limites montrées au chapitre II nous ont amenés à mettre en oeuvre une technique
plus complexe pour tenter de répondre au problème d'
aide au diagnostic. Le dernier chapitre
est donc consacré à la présentation des résultats obtenus grâce à cette technique neuronale
hybride pour les deux problématiques considérées.

10
Puis, dans la conclusion, nous rappelons brièvement les différents résultats obtenus au
cours de ce travail, et présentons les perspectives qui découlent de cette thèse.
Enfin, et compte tenu du volet biomédical, pouvant sensibiliser les lecteurs liés à ce
domaine, il nous a paru important d'
inclure une rapide présentation des fondements
biologiques des réseaux de neurones (même si ces considérations peuvent présenter moins
d'
intérêt pour un lecteur initié au domaine des réseaux de neurones). Ces aspects constituent
donc le contenu de la première annexe au présent document.
D'
autre part, des travaux liés à l'
estimation quantitative de données ont été initiés au
cours de cette thèse. Ils visaient l'
évaluation de la faisabilité de l'
estimation de paramètres d'
un
système à surveiller. Cette faisabilité a été validée sur un système expérimental de mélange
diphasique et a concerné plus particulièrement l'
estimation du taux de vide dans de tels
écoulements. Toutefois, ces travaux n'
ont pas donné lieu à une intégration aux structures
neuronales hybrides proposées dans cette thèse. C'
est pourquoi nous avons préféré rapporter
ces travaux sous la forme d'
une seconde annexe au présent document.
Enfin, compte tenu de l'
utilisation de signaux biomédicaux relatifs à l'
audition, il nous
a semblé intéressant d'
inclure une présentation sommaire de l'
appareil auditif. Celle-ci
constitue donc la troisième annexe.

11
Dans la vie courante, il existe de nombreuses situations dans lesquelles l'
être humain
se trouve, en tant qu'
utilisateur, face à des systèmes qui ne fonctionnent pas de manière
attendue. Qui ne s'
est pas trouvé au volant d'
une voiture qui refuse de démarrer? Qui n'
a
jamais été confronté à un ascenseur en panne? Afin de résoudre ces problèmes divers que
pose ce genre de situation, l'
intervention humaine et un outillage approprié sont
indispensables.
La complexité des systèmes actuels rend ces interventions d'
un niveau élevé. Il est
donc nécessaire de fournir à l'
intervenant des outils d'
aide au diagnostic de la panne
rencontrée. L’ ouvrage de G. Zwingelstein, « Diagnostic des Défaillances » [ZWIN 95],
constitue une source précieuse de connaissances dans le domaine du diagnostic industriel.
Le diagnostic des fautes requiert généralement l'
élaboration d'
un modèle du système à
surveiller. Généralement, un modèle est une représentation formelle (avec un sens plutôt
mathématique) de ce système. Lorsqu’ un modèle est disponible, les techniques de diagnostic
utilisables sont appelées techniques internes. Ces méthodes de diagnostic internes sont
dérivées des techniques utilisées par les automaticiens. Elles impliquent une connaissance
approfondie du système à surveiller sous la forme d’ une représentation formelle (au sens
mathématique) : le modèle. Leur principe est le suivant : il s'
agit, à partir des observations des
entrées et des sorties de remonter aux paramètres ou au vecteur d'
état interne. La détection
d'
un état anormal se fait alors par comparaison entre les paramètres mesurés ou calculés à
l'
instant considéré et ceux associés à un fonctionnement normal. Les paramètres de l'
état

13
courant du système s'
obtiennent grâce aux méthodes d'
identification de paramètres et/ou aux
méthodes d'
estimation du vecteur d'
état.
Ces méthodes de diagnostic par identification de paramètres et d'
estimation du vecteur
d'
état ont été les premières à avoir été employées dans l'
industrie. Initiées par les
automaticiens qui recherchaient les modèles des procédés devant faire l’ objet d’ une
automatisation poussée, ces méthodes de diagnostic internes s’ appuient sur l’ existence d’ un
modèle mathématique très précis du système à surveiller. Dans le cas contraire, les résultats
d'
estimation et d'
identification sont à prendre avec beaucoup de précaution.
Ces techniques sont très utilisées dans le domaine de l’ aéronautique et de
l’ aérospatiale où les modèles de la dynamique du vol sont parfaitement connus ainsi que dans
l’ industrie électronique et électrique, lorsque l'
on dispose d'
un modèle parfaitement connu du
système étudié. Elles sont aussi appliquées dans l'
industrie nucléaire [ZWIN 95]. Cependant,
il existe certaines limites à l'
application de ces méthodes de diagnostic. Ces techniques ne
sont, en effet, applicables que lorsqu'
un modèle précis et exhaustif du système à surveiller est
disponible. Ainsi, elles ne pourront pas être utilisées dans un grand nombre d'
applications
médicales, car il est quasiment impossible d'
obtenir un modèle de toutes les fonctions du
corps humain. De même, dans le cas des circuits électroniques non linéaires, la modélisation
est une tâche ardue qui limite l'
utilisation de telles techniques. Les applications qui vont nous
intéresser dans cette thèse concernent, soit, des systèmes pour lesquels aucune représentation
formelle n'
est disponible (le cas biomédical, où il s’ agit de l’ être humain), soit, des systèmes
pour lesquels une telle représentation est difficile à obtenir (le cas de la plupart des systèmes
industriels réels). Ces techniques internes ne sont alors pas applicables et il faut donc
envisager la mise en œ uvre d’ autres techniques. D'
autres méthodes, applicables dans le cas où
aucun modèle n’ est disponible, et appelées méthodes externes, ont donc été proposées. Dans
cette catégorie, on trouve les techniques de reconnaissance des formes, les techniques à base
de systèmes experts, ainsi que les techniques neuronales.
Les techniques de reconnaissance des formes permettent de déterminer l’ appartenance
d’ un objet à une classe en déterminant de quelle forme un objet observé se rapproche le plus.
Ces méthodes constituent des outils privilégiés pour la classification de signatures associées
aux modes de fonctionnements normaux et défaillants. Le diagnostic par reconnaissance des
formes consiste donc à classer les états du système. L’ ouvrage de B. Dubuisson, « Diagnostic
et reconnaissance des formes », développe tout particulièrement ces techniques de diagnostic
[DUBU 90]. Grâce à leur capacité à discriminer des signatures caractéristiques des
fonctionnements normaux et anormaux de systèmes, les méthodes de reconnaissance des

14
formes sont des techniques à envisager lorsqu’ on souhaite procéder à une automatisation du
diagnostic. Par exemple, certains de ces algorithmes sont utilisés pour la surveillance
vibratoire de machines tournantes [GROS 92]. Elles sont applicables lorsqu’ on dispose d’ une
connaissance a priori des états de fonctionnement du système à surveiller. Elles sont
également utilisables pour le diagnostic de systèmes nouveaux et on pourra alors mettre en
œ uvre des algorithmes ayant la capacité de prendre en compte des états de fonctionnement
inconnus a priori. Dans ce cas, il faudra appliquer des algorithmes capables de rejeter ou de
détecter une ambiguïté dans les nouvelles formes rencontrées. De la même manière, dans le
cas de systèmes vieillissants, i.e. présentant une dérive lente des caractéristiques de
fonctionnement, il est utile d’ appliquer le même genre de techniques. Il faut toutefois noter
que les performances de ce type de techniques sont fortement liées au degré de
compréhension du système : la présence d’ un expert est donc quasi indispensable.
Les systèmes experts ont, quant à eux, pour fonction d’ assister l’ utilisateur non-
spécialiste pour la résolution d’ un problème en utilisant les connaissances d’ un expert.
Comme toute les nouvelles technologies, ils ont connus une sur-médiatisation qui les rendait
capables de résoudre tout type de problèmes. Avec le recul, la mise en œ uvre des systèmes
experts a trouvé un équilibre.
Les systèmes experts sont une des applications de l’ Intelligence Artificielle qui ont
quitté les laboratoires pour être utilisés dans le monde de l’ entreprise. De nombreux systèmes
ont été implantés avec succès pour résoudre des problèmes concrets notamment en médecine
[SHOR 76], pour établir des diagnostics, dans le domaine financier, les assurances, la
réparation d'
équipement. Dans le domaine de l’ aide au diagnostic, ils permettent de réaliser
aisément le diagnostic des petits systèmes [ZWIN 95]. En revanche, pour les systèmes
industriels plus complexes, la percée de ces techniques est moins rapide, compte tenu des
coûts importants de développement et de maintenance de tels systèmes.
Cependant, les grandes difficultés que l’ on rencontre lorsqu’ on cherche à extraire des
experts leur connaissance, puis, quand on tente de formaliser ces connaissances dégagées,
sont peut-être signes d’ une faiblesse intrinsèque des systèmes experts. En effet, la conception
de tels systèmes repose sur une hypothèse : la structuration de nos aptitudes en règles
symboliques parfaitement identifiables. Cette hypothèse, très répandue chez les psychologues
et les chercheurs en Intelligence Artificielle dans les années 70, est aujourd’ hui en recul et on
envisage désormais des modèles qui n’ y ont plus recours, comme les réseaux de neurones
artificiels.

15
L'
objet de cette thèse concerne la mise en œ uvre de ces dernières techniques pour la
construction d'
outils d'
aide au diagnostic quelque soit le domaine considéré. Ce chapitre est
consacré à l'
étude de la mise en œ uvre de réseaux de neurones pour l'
aide au diagnostic. Dans
un premier temps, nous aborderons les réseaux de neurones artificiels, et plus particulièrement
les trois modèles que nous avons utilisés. Dans un second temps, nous présenterons une
approche neuronale hybride pour tenter de proposer une solution d’ aide au diagnostic.

L’ une des tâches principales à effectuer en diagnostic est la reconnaissance et la


classification de signatures. Cette tâche est souvent effectuée de façon visuelle par les
spécialistes de maintenance. De la même manière, lors du fonctionnement d’ un système
complexe, comme une centrale nucléaire, les informations visuelles délivrées par les
indicateurs présents dans la salle de commande constituent des formes visuelles que les
opérateurs utilisent pour identifier les modes de fonctionnement. Quand une anomalie de
fonctionnement apparaît, les informations se modifient et les opérateurs doivent alors
identifier la situation de fonctionnement. Ainsi, les opérateurs, de façon consciente ou non,
mettent en oeuvre la reconnaissance visuelle des formes.
Les réseaux de neurones sont des outils bien adaptés pour aider les spécialistes dans
cette activité de reconnaissance et de classification. Ils sont en effet particulièrement
performants pour effectuer des tâches de reconnaissance des formes et de classification
automatique de signatures. Dans le domaine industriel, ils sont presque exclusivement utilisés
pour la classification automatique de formes à partir de données bruitées et incomplètes
[ZWIN 95].
Lorsqu’ ils sont utilisés pour le diagnostic par reconnaissance des formes, l’ approche
consiste à apprendre aux réseaux un certain nombre de situations de fonctionnement normal et
anormal du système. A l’ issu de cet apprentissage, le réseau est ensuite mis en place et il peut
être confronté à des situations, ou plutôt des formes, qu’ il n’ a jamais rencontrées. C’ est la
capacité de généralisation des réseaux qui est alors sollicité afin qu’ il effectue une

16
classification correcte de la forme présentée. De nombreux exemples d’ une telle utilisation
des réseaux neuronaux pour le diagnostic industriel sont présents dans la littérature :
classification de signaux pour le contrôle non destructif de tubes métalliques [ZWIN 91,92],
classification de signaux électriques pour le diagnostic de circuits analogiques [AMAR
96][BENG 97b], reconnaissance pannes à partir d'
observations sur le système pour la
surveillance des procédés de raffinage [VENK 89]…. Ils sont aussi utilisés et donnent de bons
résultats pour la classification d'
informations médicales : classification de données pour la
reconnaissance de cellules cervicales [BAZO 94], classification de signaux médicaux
(potentiels évoqués auditifs) [ALPS 94].

Une autre application des réseaux de neurones artificiels dans le domaine du


diagnostic concerne les problèmes d’ identification et de modélisation. Il s’ agit alors, après
avoir appris au réseau différentes valeurs pour certains paramètres du système à surveiller,
d’ obtenir, lors de la phase de généralisation, la ou les valeurs des paramètres à surveiller. En
comparant ensuite les valeurs obtenues à celles correspondant à un fonctionnement normal,
on peut alors détecter un fonctionnement anormal. [BENG 97a].
L’ application des réseaux de neurones au problème du diagnostic peut donc se faire
suivant deux démarches. La première démarche considère le diagnostic comme un problème
de reconnaissance de formes où il s’ agit de déterminer la classe à laquelle appartient la forme
en présence. La seconde approche permet d’ identifier les paramètres du système à surveiller.
Puis, en comparant les valeurs obtenues avec celles des paramètres correspondant à un
fonctionnement normal du système, on peut aboutir à un diagnostic.
Quelle que soit la démarche considérée, la capacité de généralisation et le temps de
réponse court des réseaux de neurones s’ avèrent très utiles au problème du diagnostic.
Cependant, la paramétrisation de tels outils est une étape délicate, car il n’ existe pas de
règles permettant de fixer les paramètres caractéristiques des réseaux (nombre de couches,
nombre de neurones par couches…). Ces choix devront se faire empiriquement pour obtenir
les résultats recherchés [ZWIN 95].

Les réseaux neuronaux présentent des avantages majeurs pour la résolution de


problèmes complexes qui peuvent se heurter aux limites rencontrées en informatique
classique grâce à leurs propriétés liées à leur capacité d'
apprentissage. Ils peuvent en effet
apprendre des règles à partir d'
exemples. Puis, sur la base de règles apprises, ils sont capables

17
de généraliser et ainsi, d'
étendre ces règles à de nouveaux exemples non appris, même si les
formes présentées sont entachées de bruit ou ont des informations manquantes.
Les opérations effectuées par des opérateurs neuronaux peuvent être diverses, et nous
ne retiendrons que les tâches de classification1. La suite de cette partie est consacrée à la
présentation des modèles neuronaux. Nous présenterons ainsi les modèles utilisés pour la
construction d'
un outil d'
aide au diagnostic : le Perceptron multi-couches à une couche cachée,
le réseau Learning Vector Quantization (LVQ) et le réseau Radial Basis Function (RBF). Les
fondements biologiques des réseaux de neurones artificiels, ainsi que les premières
représentations mathématiques des modèles neuromimétiques, dont le neurone formel proposé
par Mc Cullogh et Pitts en 1943 sont rappelés en annexe (Annexe 1).

Les Perceptrons multi-couches à une couche cachée sont des réseaux dont l'
algorithme
d'
apprentissage est celui de la rétropropagation du gradient mis au point dans les années 1980
[RUME 86]. Cet algorithme est dérivé de la règle de Widrow-Hoff. Cet algorithme
d'
apprentissage par rétropropagation du gradient a contribué à la relance d'
intérêt pour les
systèmes neuronaux.

• Structure du réseau :
Le perceptron multicouche à une couche cachée est, comme son nom l’ indique un
réseau multi-couches. Il est composé d'
une couche d'
entrée, d'
une ou plusieurs couches
cachées et d'
une couche de sortie. La figure I.1 représente un réseau à trois couches (une seule
couche cachée). Le nombre d'
unités d'
entrée et de sortie dépend du problème à traiter. En
revanche, le choix du nombre de couches cachées et du nombre de neurones par couche
cachée doit faire l'
objet d'
un compromis entre performance et vitesse d'
apprentissage.

1
Un exemple d'
application des réseaux de neurones artificiels pour la quantification est présenté en Annexe 2.

18
Perceptron multicouche à une couche cachée

W'ij W''ij

s1

sm

Couche
Couche cachée
Couche
d’ entrée de sortie
Figure I. 1 - Perceptron multi-couche à une couche cachée

• Apprentissage :
La procédure d'
apprentissage repose sur l'
idée de propager vers les couches internes
l'
erreur commise en sortie pour modifier les poids synaptiques. C'
est un apprentissage
supervisé. Pour cela, on dispose d'
un ensemble d'
exemples (base d'
apprentissage), constituée
de couples (entrée, sortie désirée). Lors de l'
apprentissage, on présente les exemples au réseau
qui calcule les sorties correspondantes. Ces calculs s'
effectuent de proche en proche depuis la
couche d'
entrée vers la couche de sortie (phase de relaxation ou de propagation avant).
L'
erreur entre la sortie réelle et la sortie désirée est calculée (somme quadratique des erreurs
sur chaque neurone de sortie). Cette erreur est ensuite rétropropagée à travers le réseau
donnant lieu à une modification des poids synaptiques.
Ce processus est réitéré pour chaque exemple de la base d'
apprentissage. Si, pour tous
les exemples, l'
erreur commise est inférieure à un seuil choisi, on dit alors que le réseau a
convergé. L'
apprentissage consiste donc à minimiser l'
erreur quadratique commise sur
l'
ensemble des exemples, par ajustement des poids en diminuant le gradient.

Pour formaliser, de façon très sommaire, ce principe, prenons un réseau à n neurones


d'
entrée et m neurones de sortie. On note X={X1, X2, …, Xp} un ensemble de p vecteurs
d'
entrée, Sd={Sd1, Sd2, …, Sdp}, l'
ensemble des p sorties désirées et S={S1, S2, …, Sp},
l'
ensemble des sorties obtenues effectivement à l'
issue de la propagation avant des vecteurs de
l'
ensemble X. Le couple (X, Sd) constitue la base d'
apprentissage du réseau. Considérons le

19
kième élément Xk de l'
ensemble X, on note Xk = (xk1, xk2, …, xkn), les composantes de ce
vecteurs. De la même manière, on note Sdk = (sdk1, sdk2, …, sdkm), les composantes du kième
ensemble Sd et Sk = (sk1, sk2, …, skm) les composantes du kième élément de
élément de l'
l'
ensemble S.
On note aussi :
• la fonction d'
activation d'
un neurone (et ', sa dérivée)
• yj, la sortie du neurone j d'
une couche cachée. On a alors :

yj =ϕ wij ei − θ j (Eq. I.1)


i

où wij, sont les poids de la connexion entre le neurone j et le neurone i de la couche


précédente
ei est l'
entrée n°i du neurone j
j est un biais éventuel.
Après la présentation du kième exemple, on veut minimiser l'
erreur quadratique
observée, qui est définie par :
m
E = 1 sdki − ski
2
(Eq.I.2)
2 i =1

Cette erreur sera alors minimisée par la méthode du gradient, c'


est-à-dire en faisant
évoluer les poids dans la direction indiquée par le gradient de E. La règle de modification des
poids de la connexion reliant un neurone j à un neurone i pour l'
itération k est donnée par :
wijk = wijk −1 − αδ i y j (Eq.I.3)

où est le taux d'


apprentissage.
i est le signal d'
erreur de l'
unité i, i.e. la contribution de l'
entrée de l'
unité i à l'
erreur
quadratique constatée en sortie. Le calcul de ce signal d'
erreur se fait par le principe de
rétropropagation.

Considérons la couche de sortie, c'


est-à-dire que l'
indice i caractérise la couche de
sortie. On obtient alors :
δ i = ( si − s di )ϕ '(ei ) (Eq.I.4)

20
Le calcul des poids de la dernière couche dépend des éléments des couches
précédentes.
Considérons maintenant le cas où i est l'
indice d'
un neurone caché. Considérons la
couche de neurones suivant immédiatement l'
unité i et notons j l'
indice des neurones de cette
couche. L'
erreur quadratique E relative à la présentation d'
un exemple dépend
fonctionnellement de l'
ensemble des yc et toutes les sorties yc dépendent de yi. Dans ce cas, le
signal d'
erreur i est donné par :

δ i = ϕ '(ei ) δ c wij (Eq.I.5)


c

La figure I.2 schématise les différentes étapes de l'


algorithme de rétropropagation.

j wij
Entrée ei Etat yi

(a)

Signal d'erreur
i '('ei)
ei-si

(b)
k
wki

i '('ei)

(c)

Figure I. 2 - Apprentissage par rétropropagation :


• Propagation avant du signal d'entrée
• Calcul du signal d'erreur i relatif à un
neurone de sortie
• Calcul par rétropropagation du signal d'erreur
d'un neurone caché

Les réseaux multicouches à rétropropagation du gradient sont des outils performants


pour la classification non-linéaire, la compression de données, l'
approximation de fonction…
Cependant, ces réseaux présentent certains inconvénients. En effet, le temps d'
apprentissage
peut être long (de quelques minutes à plusieurs heures suivant la complexité du problème
traité). De plus, il n'
existe pas de méthodologie formelle pour la conception et la construction

21
de ce type de réseau. Les choix des paramètres caractéristiques du réseau (nombre de couches,
nombre de neurones par couches, pas d'
apprentissage, fonction d'
activation) se font alors par
tâtonnement pour obtenir les performances recherchées.
Malgré ces difficultés, ils possèdent des capacités remarquables d'
apprentissage et de
reconnaissance des formes. Pour cela, ils sont particulièrement bien adaptés à la résolution de
problèmes de diagnostic industriel et médical, comme le montrent les exemples d'
utilisation
pour la classification de signaux en médecine [ALPS 95] (classification de Potentiels Evoqués
Auditifs), et pour le diagnostic des machines tournantes. En effet, Yang et son équipe anglaise
ont mis en œ uvre un réseau à rétropropagation du gradient pour le diagnostic de 4 catégories
de défaut d'
un roulement à billes [YANG 03]. Les signatures utilisées pour caractériser le
fonctionnement du moteur sont des signatures vibratoires et quatre approches basées sur les
analyses bi-spectrales et par ondelettes du signal vibratoire sont proposées. Le but est
l'
évaluation en continu du fonctionnement du moteur. Les résultats de ces analyses constituent
les entrées des réseaux de neurones à rétropropagation entrainés pour reconnaître les défauts
de roulement. Les résultats obtenus et présentés dans [YANG 03] montrent que le réseau peut
alors distinguer les quatre différentes conditions de fonctionnement avec des taux de
classification correcte très élevés (atteignant même les 100% dans le cas d'
une des analyses
bispectrales). Il faut toutefois noter que, pour cette étude, les défauts créés artificiellement
sont assez marqués, et qu'
une machine présentant ce type de défauts seraient alors déjà dans
un état très défaillant. Cette étude récente sur des travaux similaires à ceux menés au cours de
cette thèse montre cependant l'
intérêt donné aux réseaux de neurones artificiels dans le
domaine du diagnostic.

La structure de "Learning Vector Quantization" (LVQ) a été proposée à la fin des


années 80 par Teuvo Kohonen [KOHO 88], [KOHO 89]. Elle fait partie des techniques de
compétition les plus simples. Toutefois, malgré sa simplicité, elle est très efficace et présente
donc un intérêt pratique non négligeable.
L'
objectif de ce type de méthodes est de déterminer des vecteurs (appelés aussi
vecteurs prototypes) qui sont représentatifs des données à traiter et servent ensuite à la
classification et à la compression de données. Les vecteurs prototypes sont codés par les poids
du réseau. L'
apprentissage permet de retrouver les valeurs caractéristiques de ces vecteurs
prototypes. Cet apprentissage est de type supervisé. L'
algorithme d’ apprentissage, proposé par

22
Teuvo Kohonen, est un algorithme basé sur la technique de compétition entre les neurones.
Un tel comportement est appelé "tout au vainqueur" ("Winner Take All"). Les neurones sont
donc en concurrence les uns avec les autres. On appelle ce type d’ apprentissage apprentissage
concurrentiel.

• Structure du réseau
Le réseau LVQ est un réseau multi-couches, dont la structure est schématisée par la
figure I.3. Il se compose de trois couches : une couche d'
entrée, une couche cachée, encore
appelée couche de compétition et une couche de sortie.

W1 W2

e1
s1

eS
sm

Couche cachée,
Couche dite de Couche de
d’ entrée compétition sortie
(S neurones) (S1 neurones) (S2 neurones)

où W1 est une matrice de dimension S1xS


W2 est une matrice de dimension S2xS1
Figure I. 3 - Structure d'un réseau LVQ

Le fonctionnement d’ un tel réseau est alors le suivant : lorsqu’ un vecteur e est présenté
au réseau, ce dernier calcule la distance euclidienne entre le vecteur d’ entrée e et les vecteurs-
ligne composant la matrice des poids W1. On obtient alors un vecteur de dimension S1 qui est
présenté à la couche de compétition. Le neurone qui possède alors la plus petite entrée (c’ est-
à-dire celui dont le vecteur des poids est le plus proche du vecteur d’ entrée e) est alors désigné
comme vainqueur et sa position dans la couche de compétition est donnée par l’ équation Eq.
I.6.

C =arg min
k
(e(j)-W1(k, j))2 (Eq. I.6)
j

où C est la réponse donnée par le Cième neurone de la couche de compétition,

23
e(j) est la jième composante du vecteur d'
entrée e
W1(k,j) est la jième composante de la kième ligne de la matrice des poids W1

La réponse donnée par le Cième neurone de la couche de compétition est alors égale à 1
et les sorties des autres neurones cachés seront égales à 0. La couche de compétition classe les
vecteurs d’ entrée en S1 sous-classes.
La couche de sortie, dont la fonction de transfert est une fonction linéaire, va alors
transformer la réponse donnée par la couche de compétition afin de déterminer l’ appartenance
du vecteur d’ entrée e à l’ une des classes définies par l’ utilisateur. Si, par exemple, les
neurones 1, 2 et 3 de la couche de compétition apprennent tous des sous-classes de l’ espace
d’ entrée qui font partie de la classe 2, alors, les poids des connexions reliant les neurones
compétitifs 1, 2 et 3 au neurone de sortie 2 prendront la valeur 1, tous les autres poids
synaptiques des liaisons entre ces neurones compétitifs et les autres neurones de sortie étant
alors nuls. Ainsi, ce neurone de sortie répondra 1 si n’ importe lequel des trois neurones
compétitifs gagne la compétition.
Le nombre de neurones S de la couche d'
entrée et S2 de la couche de sortie dépend du
problème à traiter. La couche d'
entrée comprend autant de neurones que de composantes des
vecteurs de la base de données. Pour la couche de sortie, le nombre de neurones est égal au
nombre de classes désirées. Ces derniers possèdent deux états d'
activation : 0 ou 1. Par
exemple, si on présente au réseau un vecteur appartenant à la classe n°1, le neurone n°1 de la
couche de sortie sera actif (état 1), alors que les autres neurones de sortie seront inactifs (état
0). Le choix du nombre de neurones S1 de la couche cachée est un problème plus délicat. Il
doit obéir à un compromis optimisant l'
apprentissage et la capacité du réseau à généraliser.
Cependant, la couche de compétition classant les vecteurs d’ entrée au sein de S1 sous-classes,
il sera nécessaire de choisir S1 supérieur à S2.

• Initialisation
Avant d’ entraîner un réseau LVQ, il faut initialiser les matrices des poids W1 et W2.
On initialise ces poids à partir des vecteurs de la base d’ apprentissage et des classes désirées
pour ces vecteurs d’ apprentissage. La matrice des poids W1 est initialisée de la manière
suivante : chacun des poids W1(i,j) associés à l’ entrée i prend la valeur correspondant au
centre de l’ intervalle au sein duquel sont comprises toutes les valeurs que peut prendre
l’ entrée i.

24
La seconde phase de l’ initialisation consiste à assigner les neurones de la couche de
compétition à chacune des classes. Pour cela, l’ algorithme d’ initialisation recherche la
distribution des sorties désirées. Ainsi, si 35% des vecteurs de la base d’ apprentissage
appartiennent à la classe 2, 35% des neurones de la couche de compétition seront dédiés à la
reconnaissance de sous-classes formant la classe 2. Alors, comme nous l’ avons vu
précédemment, si les neurones 1, 2 et 3 de la couche de compétition sont désignés pour
former des sous-classes de la classe 2, les poids W2(2,1), W2(2,2) et W2(2,3) prendront la
valeur 1, tous les autres poids synaptiques W2(2,j), où j∈[4,S1] seront alors égaux à 0.

• Apprentissage :
Une fois le réseau initialisé, l’ apprentissage peut commencer. On recherche tout
d’ abord le vecteur des sorties désirées Sdc pour la couche de compétition, en utilisant la
matrice W2 des poids de la couche de sortie et le vecteur Sd des sorties désirées fixé par
l’ utilisateur de la manière suivante.

Sdc =W2 * Sd (Eq I.7)
Cette expression transforme le vecteur Sd des sorties désirées, contenant un 1 à la
position de la classe désirée, en un vecteur Sdc de sorties désirées pour la couche de
compétition contenant des 1 aux positions correspondant à tous les neurones formant les sous-
classes de la classe désirée.
Un vecteur e de la base d’ apprentissage est ensuite présenté au réseau. D’ après ce qui
précède, le neurone de la couche de compétition dont le vecteur des poids est le plus proche
(au sens de la distance Euclidienne) du vecteur d’ entrée gagne la compétition (répond la
valeur 1). Seul le vecteur des poids correspondant à ce neurone vainqueur sera alors modifié.
Si la sortie de ce neurone de la couche de compétition correspond à la valeur attendue, les
poids sont alors ajustés de la manière suivante :

∆W1(C, j)=lr ⋅(e(j)−W1(C, j)) ∀j∈[1;S ] (Eq. I.8)

où lr est le pas d’ apprentissage, fixé par l’ utilisateur.


Sinon, si la sortie désirée du neurone vainqueur est 0 (c’ est-à-dire si ce neurone
correspond à une sous-classe n’ appartenant pas à la classe désirée), la règle de Kohonen est
appliquée, mais avec un signe opposé.

25
∆W1(C, j)=−lr ⋅(e(j)−W1(C, j)) ∀j∈[1;S ] (Eq. I.9)

On répète ensuite cette procédure avec les autres couples vecteur/classe désirée de la
base d’ apprentissage. Le nombre de fois où cette procédure est répétée est fixé par
l’ utilisateur.
Dans le cadre de cette technique, il n’ existe aucun critère d’ arrêt pour l’ apprentissage,
contrairement à d’ autres méthodes comme la rétropropagation du gradient dans le cas du
Perceptron multicouches. Ainsi, d’ après Jodouin, cette technique d’ apprentissage peut
conduire à des phénomènes de surapprentissage [JODO 94]. En effet, si l’ apprentissage LVQ
est prolongé outre mesure, le réseau finit par consacrer une proportion considérable de ses
vecteurs prototypes à suivre le détail des frontières entre les classes. Le réseau obtient alors de
moins bonnes performances sur le problème en général, car, s’ il a appris correctement, ses
performances en généralisation sont dégradées. Cependant, elles sont rapides et donnent de
bons résultats dans le cadre de la classification.
Dans [VUCK 02], on trouve une application de ce type de modèle pour la
classification de signaux électroencéphalographiques (EEG) en deux catégories. Le but de
leur étude est de pouvoir détecter les états de somnolence et de vigilance d'
un être humain en
bonne santé à partir de son EEG. Pour cela, ils ont utilisé deux modèles de réseaux de
neurones artificiels : le perceptron multi-couche et le réseau Learning Vector Quantization.
Leurs résultats montrent alors de meilleures performances pour le réseau LVQ par rapport au
perceptron employé. Cette étude récente montre l'
intérêt d'
un tel modèle pour la classification
de signaux.

!
Les modèles à fonction de base radiale (RBF2) sont des modèles dans lesquels la
modélisation s'
effectue par des fonctions locales, appelées aussi fonctions noyaux. Ils
reposent sur une cartographie de l’ espace des entrées par des exemples qui ont une influence
locale. Ce sont des réseaux à couches avec comme origine, une technique d’ interpolation
nommée méthode d’ interpolation RBF (“RBF interpolation”) ou méthode des noyaux. Cette
méthode est bien connue en statistique pour l’ approximation à partir de données empiriques
de densités de probabilités. Elle a été proposée par Powell [POWE 85] et améliorée par

2
Radial Basis Function en anglais.

26
Niranjan et Fallside [NIRA 88]. Employée pour la première fois dans le contexte des réseaux
de neurones par Broomhead et Lowe [BROO 88], cette technique s’ avère être à la fois rapide
et efficace, en particulier dans le cadre de la classification.
Les réseaux à fonction de base radiale font partie des réseaux à base de distance. Les
neurones sur lesquels sont basés ces réseaux sont appelés neurones à base radiale et sont basés
sur la distance entre le vecteur d’ entrée X et le vecteur centre (vecteur de la base
d’ apprentissage, aussi appelé vecteur prototype) du neurone C. La sortie de ce type de
neurone est définie de la manière suivante :

n
y =G( X −C n )=G n X(i)−C(i) (Eq I.10)
i

où X n
est la norme n du vecteur X. La fonction G(z) est généralement une fonction non

linéaire, symétrique, monotone pour z>0. Les bornes supérieures et inférieures de cette
fonction sont respectivement notées Gmax et Gmin. Dans la plupart des cas, G(z) est une
fonction exponentielle généralisée :

m
−z
G ( z ) = Gmin + (Gmax − Gmin ) ⋅ e σ
(Eq. I.11)

où les deux paramètres m et σ sont respectivement l’ ordre et l’ écart type de la fonction. Les
frontières de décision (zone d’ influence) D(γ), qui correspondent à l'
ensemble des points de
l' entrée pour lesquels le réseau donne une réponse en sortie égale à γ∈ℜ, sont alors
espace d'
données par X − C n = G −1 (γ ) .

Le cas le plus fréquemment utilisé est le cas particulier où n=2, Gmin=0 et m=2. Dans
ce cas, la distance calculée entre le vecteur X et le vecteur centre C est la distance euclidienne
et la fonction G(z) est une fonction gaussienne. Les paramètres décrivant alors un tel neurone
à base radiale sont la position des centres et l’ écart type de la gaussienne. De plus, dans ce
cas, la frontière de décision D(γ) définie précédemment est sphérique.

27
• Structure du réseau :
Le réseau RBF est un réseau à trois couches3 : une couche d’ entrée, une couche cachée
composée des neurones à base radiale présentés précédemment et une couche de sortie de
neurones dont la fonction d’ activation est linéaire. La figure I.4 illustre l’ architecture d’ un
réseau RBF.
Le nombre de neurones des couches d’ entrée et de sortie est choisi en fonction du
problème à traiter. En ce qui concerne la couche cachée, la technique RBF prévoit une
fonction noyau, c’ est-à-dire un neurone, par point de donnée apprise. En d’ autres termes, le
nombre de neurones de la couche cachée est égal au nombre d’ exemples présentés au réseau
lors de la phase d’ apprentissage. Dans ce cas, cela assure un comportement sans erreur pour
les données connues. Toutefois, en pratique, les données peuvent être nombreuses et
redondantes. Certains algorithmes d’ apprentissage peuvent alors conduire à un nombre plus
restreint de neurones (par exemple [BROO 88]).

e1 W1 W2

e2 s1

e3
sS2

eS
Couche cachée Couche
Couche composée de de sortie
d’ entrée fonctions-noyaux S2 neurones
S neurones S1 neurones
Figure I. 4 - Structure d'un réseau RBF

• Apprentissage :
On peut distinguer deux étapes distinctes dans la phase d’ apprentissage des réseaux
RBF : la paramétrisation des fonctions à base radiale et l’ apprentissage des poids de la couche
de sortie [MOOD 89]. La première étape peut se décomposer en deux sous-étapes : la
détermination du nombre et de la position des centres Ci et le choix de la taille σi des champs

3
Pour certains auteurs, les réseaux RBF sont des réseaux à deux couches, car les entrées ne sont pas considérées
comme définissant une couche.

28
récepteurs. La position du centre Ci d’ un neurone de la couche cachée est codée par les poids
W1(i,j) d’ entrée du neurone et la dimension σi, par un paramètre interne

L’ algorithme d’ apprentissage de base du réseau à fonction de base radiale est le


suivant : on associe à chacun des vecteurs de la base d’ apprentissage un neurone à base
radiale. Ces vecteurs sont alors codés dans les poids d’ entrée et constituent les centres Ci de
ces neurones. Puis, on procède à l’ ajustement des poids de la couche de sortie. Pour ce calcul,
des auteurs préconisent des techniques d’ apprentissage linéaires [JODO 94]. Le rôle de la
couche cachée est de recoder son entrée de manière à ce que les différentes classes puissent
être reconnues par des séparateurs linéaires. Dans le cadre des réseaux RBF, ce recodage se
fait de façon naturelle : chaque neurone à base radiale vient décrire par son champ récepteur
un nuage de données appartenant toutes à la même classe. La couche de sortie choisit alors,
parmi les neurones actifs de la couche cachée, la classe la mieux représentée. La réponse si du
ième neurone de sortie est alors donnée par la relation suivante :
si = W2 (i, j ) ⋅ y ( j ) (Eq. I.12)
j

où y(j) représente la sortie du jème neurone à base radiale (neurone de la couche cachée).
Il existe plusieurs variantes de cet algorithme, car, en pratique, les données peuvent
être nombreuses et redondantes, ce qui conduirait à un réseau surdimensionné. On peut alors
citer :
• les algorithmes incrémentaux, où on construit une architecture de réseau
adaptée au problème en augmentant la complexité de la structure du réseau
par un ajout de neurones,
• les algorithmes décrémentaux, dont le principe est de simplifier une
architecture complexe de réseau en supprimant les paramètres (connexions
ou neurones) qui ne sont pas nécessaires à une application spécifique
[MUST 92].

Les réseaux RBF effectuent une cartographie de l’ espace d’ entrée en associant un


ensemble de ‘catégories’ à un ensemble de ‘zones’ de l’ espace d’ entrée. Ils sont capables de
calculs très puissants. De plus, leur apprentissage est rapide et simple. Ces qualités font de ces
réseaux des outils de choix pour de multiples applications, dont la classification et la
quantification.

29
Par exemple, F. Schwenker et al. [SCHW 02] mettent en œ uvre ce réseau pour classer
des séries temporelles acoustiques. Leur base de données contient les chants de crickets de 35
espèces enregistrés en Thaïlande et en Equateur. Des caractéristiques locales – 3 au total -
sont alors extraites des enregistrements et classées par des classifieurs neuronaux de type RBF
suivant 35 catégories. La mise en œ uvre de ces réseaux leur permet alors d'
atteindre un taux
d'
erreur de 34,65% pour la classification de l'
une des caractéristiques.

Ces réseaux, grâce à leurs perfomances en matière de classification, sont des outils
privilégiés pour l’ aide au diagnostic, ce qui justifie leur exploitation dans le cadre de mes
travaux. Cependant – et nous le montrerons au chapitre II - les approches neuronales simples,
c'
est-à-dire celles n'
impliquant qu'
un seul réseau de neurones artificiels, ne sont en général pas
suffisantes pour construire un outil performant pour l'
aide au diagnostic [DUJA 99a,b,c]. En
effet, si, depuis les deux dernières décennies, des études ont montré que les techniques à base
de réseaux de neurones présentent des avantages certains pour résoudre des problèmes pour
lesquelles les méthodes conventionnelles sont limitées, d'
autres ont aussi montré que le
comportement complexe et les performances («comportement intelligent ») des systèmes
biologiques (vivants) ne peuvent se résumer dans la simplicité actuelle de telles structures
[CHEB 97]. Partant de ce constat, inversement, il paraît invraisemblable que des approches
n’ impliquant qu’ un seul réseau neuronal soient les plus appropriées pour approcher les
performances du traitement d’ information des systèmes vivants. Nous nous sommes alors
orientés vers des structures plus complexes, pouvant impliquer plusieurs réseaux de neurones.
Dans le paragraphe suivant, nous proposons une approche neuronale hybride.

30
" "#$

Informations
d'entrée
Agent
Etape
Agent
de Etape de
Agent
Pré-traitement décision
Agent
Neuronal

Figure I. 5 - Structure hybride Neuronale

L'
approche que nous proposons pour l'
élaboration d'
un outil d'
aide au diagnostic
concerne une association de différentes techniques, conventionnelles et neuronales. La
stratégie que nous envisageons de mettre en œ uvre est présentée figure I.5.
Dans de nombreux cas, afin d'
établir un diagnostic, une seule mesure ne suffit pas à
obtenir suffisamment d'
informations pertinentes pour pouvoir établir un diagnostic. En effet,
le médecin, par exemple, prendra en compte les résultats de différents examens, les
symptômes du patient, avant de donner son diagnostic. De la même manière, pour un
processus industriel, les informations relatives au fonctionnement de ce dernier peuvent être
délivrés par différents indicateurs que l'
opérateur doit analyser. Il semble alors légitime de
prendre en compte différentes informations relatives au système (industriel ou biomédical) et
de combiner ces données. L'
architecture, qui permettra ensuite de traiter l'
ensemble des
informations délivrées par les capteurs, comprend trois niveaux de traitement :
Une étape de prétraitement
Un ensemble d'
agents neuronaux
Une étape finale de décision où on réaliserait la fusion des informations de chacun
des agents neuronaux spécialisés afin de parvenir à un élément de diagnostic

& ' &

Les informations d'


entrée et l'
étape de prétraitement sont deux éléments quasi-
indissociables de la structure hybride proposée. Dans le domaine industriel, le diagnostic

31
d'
une défaillance ou d'
une dégradation fait le plus souvent appel à l'
utilisation de signatures
élaborées à partir des signaux ou des informations. Dans le domaine médical, on trouve aussi
fréquemment une chaîne de traitement des informations issues des sondes ou des examens
médicaux (par exemple, pour l'
obtention de la surface de la Dynamique Temporel du Tronc
Cérébral).
En effet, les informations brutes que fournissent les capteurs ont souvent besoin d'un
traitement afin d'
extraire des caractéristiques pertinentes pour la surveillance du système
considéré et d’ en faciliter le traitement par les structures neuronales suivantes, par des
opérations de filtrage, de normalisation… Les principales signatures utilisées pour résoudre le
problème du diagnostic dans le domaine industriel et le domaine médical sont énumérées dans
la suite de cette partie.
Le traitement du signal joue un rôle très important dans l'
établissement des signatures
associées aux fonctionnements normaux et anormaux.

Une autre opération peut être aussi envisagée dans cette étape de prétraitement : il
s’ agit de diviser le problème en sous-problèmes plus simples à partir des mesures effectuées.
Le principe de cette opération peut se résumer ainsi :"Divide to Simplify"4. (DTS). Chacun
des sous-problèmes ainsi obtenus pourrait alors être traité par une structure neuronale
adéquate, spécialisée pour chacun des sous-problèmes. La technique DTS est exposée dans
[CHEB 97]

• ( & & &

&

Une signature est une information élaborée à partir des signaux ou des données
recueillies et doit contenir les informations jugées pertinentes par les spécialistes pour la
détection d’ une défaillance ou d’ une dégradation. La complexité d’ une signature dépend de la
nature du système à surveiller et varie suivant l’ anomalie recherchée : défaillance ou
dégradation. Parmi les principales signatures utilisées, on peut citer :

4
Diviser pour simplifier

32
• Les signatures vibratoires
Elles sont adaptées à la surveillance d’ ensembles mécaniques dont les différents
éléments sont soumis à des efforts mécaniques dynamiques qui se traduisent par des
vibrations. Elles sont principalement utilisées pour le diagnostic des machines tournantes.

• Les signatures acoustiques


Elles sont principalement utilisées pour la détection de fuites qui peuvent survenir
dans des matériels sous pression comme les tuyauteries, les raccords, les réservoirs et les
dispositifs d’ arrêt de fluide comme les robinets ou les vannes. Cependant, elles ne permettent
pas de quantifier le débit de la fuite, en raison de l’ importance des bruits de fond qui existent
dans les installations industrielles. Leur interprétation est souvent délicate.

• Les signatures ultrasonores


Elles sont principalement utilisées pour détecter des défauts dans les matériaux avec
lesquels sont réalisés les équipements industriels. Mais elles peuvent aussi permettre la
détection d’ impuretés dans un liquide. L’ utilisation de capteurs ultrasonores permet un
contrôle non destructif. Cette méthode est aujourd’ hui très utilisée pour la détection de
fissures dans différents éléments des matériels tels que les tuyauteries, les enceintes sous
pression, les soudures, les boulons… [ZWIN 95].

• Les signatures thermiques


Elles peuvent s'
obtenir de deux manières : soit par mesure de température par contact
(utilisation de thermocouples et de sondes à résistance), soit sans contact (détection du flux
infrarouge émis par le matériel à surveiller, par thermographie infrarouge, par exemple). Ces
signatures permettent la surveillance thermique des machines ou des points chauds dans les
installations électriques.

• Les signatures radiographiques, gammagraphiques et neutrographiques


Elles sont très utilisées pour la détection de défauts volumiques dans de grosses pièces
métalliques ou dans des soudures. Ces techniques permettent l'
obtention d'
une image (cliché
bidimensionnel) contenant l'
information pertinente.

33
• Les signatures par analyse des lubrifiants
Elles sont utilisées pour déterminer les caractéristiques physico-chimiques du
lubrifiant et d'
identifier une usure des éléments mécaniques. Elles peuvent être de nature
différente : spectrogramme, images, critères quantitatifs. Elles permettent une détection
précoce de mécanisme d'
usure sur des machines tournantes. Il faut cependant être très attentif
à la qualité de la prise des échantillons du lubrifiant car de là dépend la fiabilité des
conclusions.

• ( ' & " ) & &

Pour le problème du diagnostic médical, les informations sont tout d'


abord des
données factuelles. Le patient décrit ses symptômes au médecin (intensité et localisation d'
une
douleur, apparition de troubles, sensations….). Ce dernier va ensuite, après auscultation,
déterminer la cause des symptômes décrits ou observés ou, si besoin est, orienter le patient
vers des examens complémentaires.
Les capteurs susceptibles d’ être alors utilisés correspondent à ceux mis en œ uvre pour
réaliser les différents examens que les médecins ont à leur disposition. Suivant le trouble dont
il s'
agit de trouver la cause, les examens – et donc les capteurs mis en jeu – sont différents. Il
peut alors s’ agir d’ appareils d’ imagerie (radio, scanner, IRM…), mais aussi d’ électrodes pour
le recueil de signaux tels que les électrocardiogrammes, électro-encéphalogramme, ou
potentiels évoqués (réponse électrique provoquée par la stimulation brève d'
un organe
sensoriel). Les potentiels évoqués les plus connus sont les somesthésiques, les visuels et les
auditifs, dont nous parlerons plus en détail dans la suite de ce mémoire.
Les données factuelles, dont nous parlions précédemment, pourraient faire aussi l'
objet
d'
une formalisation afin de traiter ces informations par les agents neuronaux mis en œ uvre
dans l'
étage suivant de l'
approche proposée.
Les informations permettant de caractériser le fonctionnement du système surveillé
sont maintenant recueillies par les capteurs et traitées de façon à extraire l'
information
pertinente contenues dans ces données ou signaux bruts. Il s'
agit maintenant de fournir des
éléments de diagnostic.

34
Nous proposons ensuite de mettre en œ uvre un ensemble d'
agents neuronaux pour
apporter un élément de réponse au problème du diagnostic du système surveillé. Ces agents
peuvent être des modèles neuronaux similaires (architecture homogène) ou différents
(architectures hétérogènes). Une présentation générale des réseaux de neurones artificiels,
ainsi que celle des structures utilisées dans cette thèse, ont été faites au paragraphe I.2.2.

'

La phase de décision, quant à elle, doit permettre de donner un élément de diagnostic à


partir des informations fournies par l’ ensemble des agents neuronaux spécialisés. Pour cela,
plusieurs solutions semblent être acceptables. On peut ainsi envisager la mise en œ uvre d’ un
certain nombre de techniques :
théorie de la décision,
systèmes experts,
systèmes neuronaux.

On peut aussi envisager de prendre en compte des informations non traitées par les
agents neuronaux. Ainsi, par exemple, les données factuelles comme les symptômes des
patients dans le domaine médical, pourrait être introduites à ce niveau de notre approche. Par
exemple, dans le cadre du problème biomédical, la prise en compte du seuil auditif
interviendra, dans cette structure, au niveau de cette étape de décision.
De plus, l'
objectif étant l'
étude d'
un outil d'
aide au diagnostic – le but n'
étant pas de se
substituer au spécialiste, notamment dans le domaine médical, où le médecin doit rester
maître de sa décision -, il paraît alors intéressant de pouvoir obtenir un indicateur de confiance
du résultat fourni par la structure hybride proposée. Différentes structures ont ainsi été mises
en œ uvre au cours de cette thèse. Elles seront présentées au chapitre III.
Les travaux de F. Schwenker [SCHW 02] peuvent constituer une application de cette
structure hybride. Rappelons que leur but est la classification de signaux bio-acoustiques. La
première étape consiste en l'
extraction de trois caractéristiques locales des signaux enregistrés
(étape de pré-traitement). Puis, chacune de ces caractéristiques est traitée par un classifieur

35
neuronal, un réseau RBF. Les résultats de classification sont ensuite fusionnés suivant 3
différentes techniques. La mise en œ uvre de telles techniques leur permet alors d'
atteindre un
taux de classification correcte de 93,78%, malgré des résultats de classifcation insuffisants
issus des réseaux de neurones utilisés seuls (9,06% de classification correcte pour la
caractéristique 1, 65,35% pour la caractéristique2 et 7,87% pour la caractéristique 3). Ces
travaux récents montrent donc une nette amélioration des performances, et ainsi, justifient
l'
emploi d'
une telle structure.

Qu’ il s’ agisse d’ "identifier la cause probable de la (ou des) défaillance(s) à l’aide


d'un raisonnement logique fondé sur un ensemble d'informations provenant d'une inspection,
d'un contrôle ou d'un test"5 dans le cas du diagnostic industriel, ou de "déterminer une
maladie d'après ses symptômes"6 dans le cas du diagnostic médical, le problème du diagnostic
est un problème complexe.
Le choix d'
une technique d'
aide au diagnostic dépend donc fortement des
connaissances dont on dispose sur le système, mais pas uniquement. Il faut en effet aussi tenir
compte de la façon dont les connaissances peuvent être formalisées, mais aussi des critères de
fonctionnement. Ainsi, il est important de savoir si ces connaissances caractérisent un
fonctionnement normal ou anormal du système. Leur accessibilité et leur fiabilité sont aussi
des aspects dont il faut tenir compte. Enfin, concernant la formalisation des connaissances, le
problème porte sur le type dont il s'
agit (système d'
équation, graphe…). Parmi les critères de
fonctionnement, on peut citer la rapidité du temps de réponse, la robustesse au bruit, aux
erreurs de modélisation, la capacité de prédiction…
Enfin, il n'
est pas envisageable de penser la mise en place d'
un système de diagnostic
en dehors de toute présence humaine. L'
homme est un acteur incontournable dans la
procédure de diagnostic. Il possède en effet les capacités de juger et de décider en cas
d'
incertitude, d'
anticiper un dérèglement à partir d'
indices avant son effet sur le système,
d’ évaluer, de synthétiser, d'
interpréter, et de raisonner rapidement en fonction des cas les plus

5
définition retenue par les instances nationales et internationales de normalisation (AFNOR, CEI)
6
définition étymologique du dictionnaire ROBERT faisant référence à la racine grecque du mot (dia : par,
gnosis : connaissance)

36
probables. Cependant, ces interventions comportent une contrainte temporelle : afin d'
éviter
toute situation grave, tant dans le domaine industriel que dans le domaine médical, il est
indispensable de réagir vite.
Compte tenu de la complexité des problèmes généralement rencontrés dans le domaine
de l'
aide au diagnostic – et plus particulièrement dans les domaines auxquels nous nous
sommes intéressés – l'
utilisation des techniques conventionnelles devient vite inefficace. C'
est
pourquoi nous avons consacré ce travail de thèse à l'
étude de l'
aide au diagnostic par réseaux
de neurones artificiels. Dans ce chapitre, nous avons passé en revue trois modèles neuronaux :
le réseau à rétropropagation du gradient, le réseau Learning Vector Quantization et le réseau
Radial Basis Function. Le réseau à rétropropagation du gradient est un outil performant pour
la classification non-linéaire, la compression de données, l'
approximation de fonction… Le
réseau Learning Vector Quantization, quant à lui, est un réseau classifieur. Enfin, le réseau
Radial Basis Function est utilisé lui aussi à des fins de classification. Il donne aussi de bons
résultats dans l'
approximation de fonction, et l'
identification.
Enfin, nous proposons une structure hybride neuronale multi-modèle pour l'
aide au
diagnostic. Partant de l'
hypothèse que les approches neuronales simples, c'
est-à-dire celles
n'
impliquant qu'
un seul réseau de neurones artificiels, ne sont en général pas suffisantes pour
construire un outil suffisamment performant pour l'
aide au diagnostic, nous avons donc
construit une structure plus complexe, pouvant s'
adapter à une plus large variété de domaines
d'
application.
Bien que certains travaux aient été effectués sur le mélange d'
experts neuronaux
[JORD 95][SRID99][CHEN 99], ceux-ci n'
en sont encore qu'
à un stade théorique, et ne sont
donc pas encore exploitables. De plus, l'
idée de base de ces travaux repose essentiellement sur
des techniques issues des méthodes statistiques, qui supposent un nombre suffisant et
important de données. Dans les cas réels (et aussi dans les applications traitées), cette dernière
condition n'
est pas forcément réalisable. Notre choix s'
est porté sur une architecture de
traitement des informations comprenant trois niveaux : un niveau de prétraitement, un autre
constitué d'
agent neuronaux et enfin, un niveau de décision. La phase de prétraitement des
informations doit permettre d'
extraire des caractéristiques pertinentes pour la surveillance du
système considéré et d’ en faciliter le traitement par les structures neuronales suivantes. Il peut
alors s'
agir d'
opérations de filtrage, de normalisation…Ces informations ainsi traitées sont
ensuite présentées à un ensemble d'
agents neuronaux. Ce niveau de traitement peut être
homogène (les agents neuronaux sont du même type) ou hétérogène (on utilise des modèles
différents). Dans les applications présentées et traitées dans cette thèse, ce niveau de

37
traitement permet de réaliser une classification préliminaire des informations d'
entrée. En
effet, dans le domaine du diagnostic, la classification – ou, plus exactement, la catégorisation
de signaux issus du système à surveiller en fonctionnement, c'
est à dire l'
affectation de la
catégorie de défauts à ces signaux - tient une place importante. Enfin, une phase de décision
donnera un élément de diagnostic. Ce dernier niveau de traitement peut mettre en jeu diverses
techniques, comme des opérations de seuillage, des réseaux de neurones artificiels, ou même
des systèmes experts.
Pour mettre en œ uvre une telle stratégie, et ce, quel que soit le domaine d'
application,
il est tout d'
abord nécessaire de disposer d'
une base exhaustive d'
informations relatives au
fonctionnement du système à surveiller, afin de pouvoir mettre en œ uvre les structures
neuronales (apprentissage des cas normaux et des cas de fonctionnement anormal).
Concernant les agents neuronaux, nous avons choisi de mettre en œ uvre des modèles
particulièrement adaptés à la classification : les réseaux Learning Vector Quantization et
Radial Basis Function. Une étude doit ensuite permettre de choisir la structure (nombre de
neurones, réglage de paramètres) la plus adéquate pour le traitement du problème posé. Enfin,
le choix du module de décision devra répondre aux attentes des médecins dans le cas d'
une
application médicale (obtention d'
un diagnostic, avec ou sans indice de confiance, par
exemple), ou du cahier des charges imposé par une entreprise dans le cas d'
une application
industrielle (obtention d'
un seuil d'
alerte pour une maintenance préventive, localisation d'
un
défaut…).
Le chapitre suivant est destiné à montrer les limites d'
une approche neuronale à réseau
de neurones unique dans la résolution d'
un problème d'
aide au diagnostic. Deux
problèmatiques ont ainsi été étudiées. L'
une concerne le domaine biomédical, et l'
autre, le
domaine industriel.

38
Chapitre I . ...........................................................................................................................13
Diagnostic et Réseaux de Neurones Artificiels......................................................................13
I.1. Introduction ..............................................................................................................13
I.2. Les Réseaux de Neurones Artificiels.........................................................................16
I.2.1. Réseaux de neurones artificiels et diagnostic .....................................................16
I.2.2. Le perceptron ....................................................................................................18
I.2.3. Le réseau Learning Vector Quantization............................................................22
I.2.4. Le réseau Radial Basis Function........................................................................26
I.3. Approche neuronale hybride .....................................................................................31
I.3.1. Généralités ........................................................................................................31
I.3.2. Informations d' entrée et étape de prétraitement..................................................31
• ( & & &
& ....................................................................................................32
• ( ' & " ) & & ........34
I.3.3. Les agents neuronaux ........................................................................................35
I.3.4. L' étape de décision ............................................................................................35
I.4. Conclusion................................................................................................................36

39
Comme nous l’ avons souligné précédemment, le problème du diagnostic est un
problème complexe. De nombreuses techniques ont été développées et constituent une aide
précieuse. Les travaux présentés dans cette thèse ne prétendent pas résoudre le problème du
diagnostic, mais apporter une aide pour le diagnostic dans les domaines industriel ou médical.
Ils concernent les méthodes de diagnostic externes, c’ est-à-dire celles qui ne nécessitent pas
de modèle pour être mises en œ uvre. La seule connaissance du système à surveiller repose
alors sur l'
expertise humaine confortée par un solide retour d'
expérience. Dans cette catégorie,
on trouve les techniques de reconnaissance de formes, mais aussi les techniques basées sur
l'
intelligence artificielle, qui constituent des outils privilégiés pour la catégorisation
d'
informations issues du système à surveiller en fonctionnement, c'
est à dire l'
affectation de la
catégorie de défauts à ces signaux. Dans le domaine du diagnostic – qu'
il soit industriel ou
médical – cette tâche tient une place importante1.
Ce chapitre a pour objet l'
étude de la mise en œ uvre de réseaux de neurones pour l'
aide
au diagnostic dans deux domaines, l'
un biomédical, l'
autre industriel. La première partie de ce
chapitre est consacrée au problème biomédical. Après avoir présenté la problématique ainsi
que la mise en œ uvre d'
une technique conventionnelle, nous aborderons l'
application de
techniques neuronales à réseaux de neurones unique. Deux modèles neuronaux ont été mis en

1
Remarque : pour des raisons liées aux différentes significations que peut prendre le terme « classification »
selon le domaine, dans la suite de cette thèse, nous allons utiliser ce terme dans le sens de la « catégorisation ».
Notre choix d’ usage de ce terme dans le sens précité est motivé par l’ utilisation du terme « classification » dans
ce sens dans la littérature scientifique anglophone : le terme « catégorisation » étant plutôt courant parmi les
biologistes (neurosciences).

40
œ uvre pour la classification des informations : le réseau Learning Vector Quantization et le
réseau Radial Basis Function. Nous présentons ensuite les résultats obtenus. Enfin, nous
aborderons la problématique industrielle et présenterons de la même manière les résultats des
techniques neuronales simples qui lui sont associés.

L'
objet de cette étude est le développement d’ un outil d’ aide au diagnostic pour les
médecins ORL. L’ exploration fonctionnelle otoneurologique possède aujourd’ hui une
technique permettant l’ étude objective de la conduction nerveuse le long des voies auditives :
les Potentiels Evoqués Auditifs (PEA), qui sont des signaux électriques. La classification des
PEA est une première étape dans le développement d’ un outil d’ aide au diagnostic. La
difficulté principale de cette classification réside dans la ressemblance de signaux
correspondant à des pathologies différentes, mais aussi dans la disparité des signaux au sein
d'
une même classe. Les résultats du test médical peuvent, par exemple, être différents pour
deux mesures différentes pour le même patient.

Lorsqu’ on stimule un organe sensoriel, il engendre une série de processus


neurologiques, d’ une grande complexité. Les processus nerveux, quelle qu’ en soit leur
origine, mettent en jeu de minuscules décharges électriques que l’ on nomme potentiel
d’ action et qui se propagent le long des voies nerveuses. Lorsqu'
un grand nombre de
potentiels d’ action est émis en même temps, il apparaît par sommation un potentiel électrique.
Les potentiels évoqués sont des réponses électriques provoquées par la stimulation
brève d’ un système sensoriel. Ce stimulus provoque le départ d’ une volée de potentiels
d’ action qui peuvent être enregistrés sur le trajet des nerfs, ou plus à distance des structures
activées. Les électrodes exploratrices enregistrent la réponse évoquée sous l’ aspect de
variations de potentiel successivement positives et négatives.

41
Figure II. 1 - Principe de génération des PEA

Le processus de génération d’ un Potentiel Evoqué Auditif (PEA) consiste à stimuler


l’ oreille avec un écouteur attaqué par un clic électrique. Sous l’ effet de cette stimulation, les
fibres nerveuses sont excitées et génèrent un potentiel d’ action. La somme de ces potentiels
d’ action, synchrones de la stimulation, est recueillie à distance et constitue le PEA. La figure
II.1 est un schéma de principe qui résume la génération des PEA.
Les potentiels évoqués auditifs sont des signaux d’ amplitude très faible, quelques
centaines de nanovolts, noyés dans un bruit de fond d’ amplitude très supérieure, de plusieurs
centaines de millivolts. Ce bruit de fond est constitué de l’ activité électro-encéphalographique
(EEG), à laquelle se rajoute l’ activité électro-myographique due au fait que l’ on recueille ces
potentiels à distance de leur lieu d’ émission, à travers les espaces méningés, la boîte
crânienne, les muscles d’ insertion céphalique et cervicale et le cuir chevelu. C’ est en raison de
cette difficulté d’ extraction que de nombreuses techniques de traitement du signal ont été
mises en œ uvre.
Ces potentiels reflètent l’ activité de l’ oreille interne, du nerf auditif et d’ une partie du
tronc cérébral. Ils sont composés essentiellement de cinq ondes, désignées de I à V. Le temps
d’ apparition d’ une onde par rapport à l’ émission du clic est appelé latence de cette onde. La
figure II.2 représente un PEA parfait. L’ origine de ces ondes a longtemps été sujette à
discussion. On s’ accorde généralement pour admettre que les ondes I reflète l’ activité du nerf
auditif, l’ onde II, celle des noyaux cochléaires, l’ onde III, de l’ olive supérieure, l’ onde IV du
lemnisque latéral et l’ onde V, celle du colliculus inférieur2. C’ est du moins le schéma qui
prévaut en clinique courante. Toutefois, il ne s’ agit que d’ une approximation puisqu’ il est

2
Une présentation de l'
appareil auditif est donnée en Annexe 3.

42
probable qu’ à une onde ne correspond pas un générateur unique mais un ensemble de
générateurs qui déchargent simultanément.

Figure II. 2 - PEA Parfait

Les PEAs nous renseignent donc sur l'


activité des voies auditives, depuis l'
oreille
interne jusqu'
au tronc cérébral. De ce fait, ils ont deux domaines d'
applications : la
détermination objective du seuil auditif et le diagnostic des pathologies du nerf auditif ou des
voies centrales :
les PEA permettent de situer objectivement le seuil auditif sur la zone des aigus, de
2 000 à 4 000 Hz, par le repérage de l'
onde V que l'
on suit jusqu'
à 10 à 20 dB du seuil
auditif. Ceci est utile chaque fois que l'
audiométrie tonale n'
est pas réalisable (très
jeunes enfants, personnes souffrant de retard mental ou simulant une surdité...)
une altération du fonctionnement du nerf auditif ou du tronc cérébral va modifier
les PEA. C'
est ainsi qu'
ils aident au diagnostic des tumeurs du nerf auditif
(neurinome), des atteintes vasculaires ou tumorales du tronc cérébral ou encore
dégénératives telles que la sclérose en plaque, par exemple.
L'
examen des PEA a longtemps été celui qui permettait le diagnostic précoce du
neurinome de l'
acoustique, tumeur bénigne développée à partir de la gaine de Schwann du
nerf cochléo-vestibulaire. Les PEA sont entrés dans la pratique clinique quotidienne du
diagnostic étiologique d'
une surdité à partir des années 70. A cette époque, ils se montraient
même supérieurs au scanner. Avec le développement de l'
imagerie par résonance magnétique
(IRM), dont le pouvoir de résolution théorique est de 2 mm, ils ont perdu leur suprématie dans
ce domaine.

43
Toutefois, maintenant que l'
on peut faire un diagnostic par imagerie d'
un tout petit
neurinome, que l'
on sait être une tumeur bénigne à évolution lente, savoir si elle entraîne ou
non un retentissement sur la fonction de l'
oreille est un élément important à considérer dans la
prescription chirurgicale. Si la décision de ne pas opérer immédiatement est prise, les PEA
sont un élément important du suivi du patient, par exemple.

L'
extraction et le recueil de ces signaux sont représentés figure II.3.
On installe des électrodes sur la tête du patient en des points précis qui dépendent des
buts recherchés. Dans notre cas, on utilise quatre électrodes (3 autocollantes et une aiguille)
que l’ on place de la manière suivante :
une électrode autocollante sur le front (masse)
deux électrodes autocollantes derrière les oreilles, sur les mastoïdes,
une électrode aiguille au sommet du crâne (vertex) pour le recueil de l’ EEG.
La stimulation du système auditif est réalisée à l’ aide d’ un son bref, proche d'
un clic
acoustique, délivré par un casque que porte le patient.

Figure II. 3 - Extraction et Recueil des PEA

Une technique d'


extraction, proposée par J-F. Motsch [MOTS 87] et M. Ohresser,
permet, suite à 800 acquisitions de signaux, la visualisation de l'
estimation des PEA sur des
moyennes de 16 acquisitions. Ainsi, une surface, composée de 50 estimations de PEA, et
appelée Dynamique Temporelle du Tronc Cérébral (DTC), peut-être visualisée. Le logiciel

44
développé pour l' appelle ELAUDY3. Celui-ci
acquisition et le traitement du signal PEA s'
permet l'
obtention du signal moyenné, appelé PEM, qui correspond à la moyenne des 800
acquisitions, et de la surface DTC.

La figure II.4 (tirée de [MOTS 87]) montre deux surfaces typiques, l'
une obtenue avec
un patient normo-entendant (II.11-A), l'
autre, avec un patient souffrant de troubles auditifs
(II.11-B). Cette dernière figure (II.11-B) montre qu'
il existe une grande variété de signaux
PEA pour un même patient. De plus, ce logiciel détermine automatiquement, à partir du PEM,
les cinq ondes significatives et donne les latences de ces ondes. Il permet aussi
l'
enregistrement, pour chaque patient, d'
un fichier contenant les informations administratives
(nom, âge… ), les résultats des tests auditifs et les conclusions du médecin ORL (pathologie,
causes, indice de confiance sur la pathologie diagnostiquée).

Figure II. 4 - Surfaces DTC (A – Patient Normo-entendant


B – Patient souffrant d'un trouble Auditif

Pour l'
élaboration de notre base de données, nous disposions du logiciel ELAUDY et
d'
un CD-ROM contenant un ensemble de dossiers de patients (11 185 dossiers). Ces dossiers
proviennent du CREFON4. Chaque dossier contient la fiche patient (informations
administratives), la fiche surface DTC.
L'
extraction d'
une base de données utile pour notre travail peut se décomposer en deux
tâches :

3
Extraction et Lecture AUtomatique de la DYnamique temporelle du tronc cérébral
4
Centre de Recherche et d'
Exploration Fonctionnelle Oto-Neurologique

45
• une sélection des patients intéressants pour l'
étude suivant différents critères
(âge, pathologie...),
• l'
extraction des données pour chaque patient sélectionné (latences, signal
PEM...).
A partir des renseignements mentionnés par le médecin, nous avons sélectionné les
sujets à inclure dans notre base de données. Grâce à un programme en langage C, nous avons
ensuite extrait les informations utiles pour chaque patient ainsi sélectionné.

Nous avons choisi 3 catégories de patients selon le type de leur trouble. Ces catégories
sont :
• normal : ces patients ont une audition normale (classe normale)
• endocochléaire : ces patients sont atteints de troubles qui touchent la partie de
l’ oreille située au niveau de la cochlée (classe endocochléaire)
• rétrocochléaire : ces patients sont atteints de troubles qui touchent la partie de
l’ oreille située après la cochlée. (classe rétrocochléaire)

En effet, les PEA ont longtemps été le moyen le plus fiable de diagnostic précoce du
neurinome. Par exemple, M.Don et al. montrent l'
importance de définir un système qui permet
de classer les signaux caractérisant les sujets rétrocochléaires par rapport aux autres [DON
97]. De plus, il existe de nombreux travaux étudiant les différences entre les pathologies
rétrocochléaires et endocochléaires. Nous avons donc choisi de commencer notre étude en ne
retenant que ces deux classes pathologiques auxquelles nous avons adjoint la détection des
patients normo-entendants.
Nous avons ainsi sélectionné 213 vecteurs. 92 d’ entre eux appartiennent à la classe
normale, 83, à la classe endocochléaire et 38, à la classe rétrocochléaire.

Plusieurs approches peuvent alors être envisagées :


• une approche "signal", où les informations relatives à chaque vecteur
sélectionné sont sous la forme d'
un signal temporel (ex : le potentiel moyenné)
• une approche "données", où les informations constituant la base de données
des techniques neuronales seraient les informations accessibles du logiciel
ELAUDY

46
• une approche "image", où les informations pour chaque cas sélectionné
seraient disponibles sous la forme d'
une image, qui caractériserait, par
exemple, la surface DTC présentée précédemment. (Rq : cette étude a été
amorcée il y a peu au sein du laboratoire)

Nous avons décidé, dans un premier temps, de travailler à l'


aide du potentiel moyenné
(approche signal). En effet, nous savons que le praticien détermine la pathologie en observant
les latences - lesquelles sont directement extraites du PEM - et l'
aspect de la surface
(synchronisation des différentes ondes). En travaillant directement sur le PEM, nous faisons
abstraction de la détermination des ondes et des latences et nous nous intéressons directement
au signal source.
Pour construire notre base d’ apprentissage, nous avons choisi des signaux
correspondant à des pathologies indiquées comme étant certaines par le médecin. Tous les
signaux PEA proviennent du même système expérimental. La base d’ apprentissage contient
24 signaux, dont 11 correspondant à la classe rétrocochléaire, 6, à la classe endocochléaire et
7, à la classe normale.
Il y a aussi d'
autres paramètres dont le médecin tient compte pour l'
élaboration de son
diagnostic et dont la prise en compte s'
est révélée indispensable pour l'
obtention d'
une
classification correcte. Ainsi, l'
examen du seuil auditif est une étape nécessaire au médecin
pour permettre de distinguer les patients de la classe normale des patients souffrant d'
une
atteinte de type endocochléaire. Nous avons donc décidé d'
inclure ce paramètre dans notre
étude. Les premiers résultats obtenus dans ce travail ont en effet montré la difficulté de
séparer les classes endocochléaire et normale. La prise en compte du seuil auditif permet alors
d'
améliorer de façon conséquente les résultats obtenus.

! "

! ## $ %

" & '

Dans un premier temps, nous avons tenté d'


évaluer la pertinence de l'
utilisation de
techniques conventionnelles. Pour cela, nous nous sommes penchés sur la modélisation

47
autorégressive des signaux PEM. Réaliser la modélisation autorégressive à l'
ordre m d'
un
signal s revient à rechercher les m coefficients ai tels que :

m
s( n) = ai ⋅ s(n − i ) ∀n ∈ [m + 1; M ] (Eq.II.1)
i =1

où M est la taille du signal s à modéliser.


Nous avons alors modélisé certains signaux, qui constitueront alors une base connue5,
puis, par recherche de la corrélation entre les coefficients obtenus pour des signaux
"inconnus" et ceux obtenus pour la constitution de notre base initiale, classer ces signaux
suivant les trois pathologies.

! ( ## %

Pour cette première approche, nous avons tout d'


abord recherché un Potentiel Evoqué
Moyenné Moyen pour chacune des trois classes. Pour cela, nous avons pris au hasard un
certain nombre de signaux dont la pathologie était indiquée comme étant certaine par le
médecin et nous avons calculé le signal moyen.
Pour chacun des trois signaux obtenus, nous avons recherché les coefficients AR. Une
étude de la corrélation du signal réel avec le signal reconstitué ou moyen de l'
équation Eq.II.1,
nous a permis de constater qu'
un ordre 45 était nécessaire pour permettre de reconstituer
fidèlement le signal à l'
aide des coefficients AR (Figure II.5).
Ces trois séries de 45 coefficients AR vont donc constituer notre base de référence
pour la classification des signaux de notre base de données. Pour chacun des 213 signaux,
nous avons donc recherché les 45 coefficients AR. Puis, nous avons calculé la corrélation de
ces coefficients avec chacune des trois séries de coefficients de notre base de référence. La
corrélation maximale nous donne alors la classe du signal considéré. Les résultats sont
présentés dans le Tableau II.1.

5
Par analogie avec la mise en œ uvre des réseaux de neurones artificiels, on pourrait appeler cette base, base
d'
apprentissage pour la classification.

48
Figure II. 5 – Modélisation AR à l'ordre 45 des signaux Moyens

Classe Réelle

Rétrocochléaire Endocochléaire Normal


Classe obtenue
Par l’ approche
conventionnelle
Rétrocochléaire 13 36 42
Endocochléaire 15 29 28
Normal 10 18 22

Tableau II. 1 – Résultats de classification par modélisationAR (première approche)

Le taux de classification correcte obtenu grâce à cette structure est donc de 30% pour
la globalité de la base de données avec un taux de classification correcte de :
• 34,2% pour la classe rétrocochléaire,
• 34 ,9% pour la classe endocochléaire,
• 24% pour la classe normale.
De plus, on a pu remarquer que les vecteurs qui nous ont permis de calculer les
signaux moyens ne sont pas bien reconnus par cette technique, puisque seuls 50% de ces

49
vecteurs sont correctement classés. Le Potentiel Evoqué Moyenné Moyen n'
est donc pas une
représentation correcte.
De ce fait, nous avons envisagé une autre stratégie pour la classification des PEAs à
l'
aide d'
un modèle AR.

! ) ## %

Pour cette seconde approche, nous avons repris les vecteurs correspondant aux
pathologies certaines qui nous avaient permis d'
obtenir les signaux moyens mentionnés ci-
dessus. Pour chacun de ces signaux, nous avons recherché les coefficients AR. Comme
précédemment, un ordre 45 est nécessaire pour restituer fidèlement les signaux considérés.
Nous obtenons donc une base de référence de 24 séries de 45 coefficients AR. Puis,
nous procédons de la même manière : pour chacun des 213 signaux de notre base de données,
nous recherchons les coefficients AR à l'
ordre 45. Puis, nous comparons les coefficients
obtenus à ceux de notre base de référence en recherchant la corrélation entre les séries de
coefficients. La corrélation maximale permet alors de déterminer la classe à laquelle
appartient le signal considéré.
Les résultats sont présentés dans le Tableau II.2.
Classe Réelle

Rétrocochléaire Endocochléaire Normal


Classe donnée
Par l’ approche
conventionnelle
Rétrocochléaire 26 38 45
Endocochléaire 4 25 19
Normal 8 20 28
Tableau II. 2 – Résultats de classification par modélisation AR (Deuxième approche)

Le taux de classification correcte obtenu grâce à cette structure est donc de 37% pour
l'
ensemble de la base de données (y compris la base de référence) avec un taux de
classification correcte de :
• 68,4% pour la classe rétrocochléaire,
• 30% pour la classe endocochléaire,
• 30,4% pour la classe normale.

50
On peut ainsi noter que les résultats obtenus sont globalement très insuffisants6, et que,
par conséquent, la classification par modélisation AR n'
est pas une solution acceptable, car les
taux de classification correcte sont très faibles. En effet, les signaux sur lesquels nous
travaillons peuvent être très différents au sein d'
une même classe et présenter des similitudes
d'
une classe à l'
autre. C'
est pourquoi nous avons choisi de mettre en œ uvre des techniques
neuronales.

! & # %

L'
objet de l’ étude biomédicale est l’ obtention d’ un élément de diagnostic à partir de
signaux médicaux, les Potentiels Evoqués Auditifs (PEA) présentés précédemment. La
classification des PEA est l’ une des étapes dans le développement d’ un outil d’ aide au
diagnostic. Rappelons que la difficulté principale de cette classification réside dans la
ressemblance des signaux correspondant à des pathologies différentes, mais aussi dans la
disparité des signaux au sein d'
une même classe.
Deux traitements ont été appliqués sur les signaux PEM extraits de la base de données
du CREFON. Le premier consiste en une normalisation des signaux. En effet, deux signaux
moyennés issus de l'
examen peuvent avoir des amplitudes très différentes. De plus, il s'
avère
que, selon Motsch [MOTS 87], le praticien ne tient pas compte de l'
amplitude des signaux
pour établir son diagnostic. Ce sont ces considérations qui nous ont amenés à normaliser entre
0 et 1 les signaux d'
entrée du réseau.
Chaque PEM a été normalisé indépendamment des autres. On obtient ainsi un signal
dont les valeurs maximales et minimales sont respectivement 1 et 0. On fait ainsi abstraction
des amplitudes relatives des signaux définissant notre base de données.
Le deuxième traitement appliqué au signal PEM est une troncature. On sait, en effet,
que l'
onde I se situe après les 20 premiers points et que l'
onde V apparaît avant les 20 derniers
points de ce signal. De plus, les premiers points contiennent l'
artefact de stimulation. Il
n'
existe donc pas d'
information utile dans ces portions de signal. C'
est pourquoi, nous avons
travaillé sur des signaux tronqués. Nous avons alors supprimé les 20 premiers et les 20
derniers points de chaque signal.

6
Sauf, toutefois pour la classification des vecteurs rétrocochléaires.

51
! " & * +

, -#

Comme nous l'


avons vu précédemment, le réseau LVQ est un réseau classifieur. C'
est
un réseau multi-couche à une couche cachée. Le nombre de neurones de la couche d'
entrée
correspond au nombre de composantes des vecteurs d'
entrée, soit 88 neurones. Le nombre de
sortie correspond quant à lui au nombre de classes que l'
on souhaite obtenir. On souhaite
classer les vecteurs d'
entrée dans 3 catégories. Ainsi, le réseau LVQ comprendra 3 neurones
de sortie.
Le nombre de neurones dans la couche cachée est un des paramètres à ajuster pour ce
modèle. Comme mentionné précédemment, le choix du nombre de neurones cachés est un
problème délicat.
Nous avons donc mené une étude en faisant varier le nombre de neurones dans la
couche cachée du réseau LVQ de 2 à 100. Les résultats de l'
évolution du nombre d'
erreurs en
phase de généralisation en fonction du nombre de neurones sont représentés par la figure II.6.

Figure II. 6 - Evolution du nombre d'erreurs en fonction du nombre de neurones dans la couche cachée du
réseau LVQ pour la classification des signaux PEA

52
On peut remarquer qu'
on obtient les meilleures performances – soit, un taux de
classification correcte de 56,8% - pour un nombre de neurones dans la couche cachée égal à
12 et 20. On peut alors remarquer que la répartition des erreurs n'
est alors pas la même suivant
le nombre de neurones cachés.

, "

A partir des résultats précédents, nous avons donc mis en œ uvre les réseaux LVQ ainsi
optimisés. Nous avons pu observer que la couche cachée peut ainsi contenir 12 ou 20
neurones cachés. Les résultats obtenus sont présentés dans le tableau II.3.
Classe Réelle
Rétrocochléaire Endocochléaire Normal

Classe donnée
par le LVQ 12 n 20 n 12 n 20 n 12 n 20 n
Rétrocochléaire 25 26 9 9 7 10
Endocochléaire 5 5 50 46 39 33
Normal 8 7 24 28 46 49
Tableau II. 3 - Résultats de classification des PEA par les réseaux LVQ

On peut noter que, pour ces deux configurations (12 et 20 neurones cachés), la base
d’ apprentissage a été correctement apprise. Tous les vecteurs appris sont correctement classés
lors de la phase de généralisation. Ainsi, le taux de classification correcte obtenu grâce à ces
structures est de 56,8% pour la globalité de la base de données avec un taux de classification :
• de 65,8% (12 neurones cachés) et de 68,4% (20 neurones cachés) pour la
classe rétrocochléaire,
• de 60,2% (12 neurones cachés) et de 55,4% (20 neurones cachés) pour la
classe endocochléaire,
• de 50% (12 neurones cachés) et de 53,3% (20 neurones cachés) pour la
classe normale.

Les résultats obtenus par cette technique neuronale simple sont meilleurs que ceux des
techniques conventionnelles précédentes. Cependant, le taux de classification correcte global
de tels réseaux est nettement insuffisant pour prétendre en faire un outil d'
aide au diagnostic,
puisque, pour seulement un peu plus d'
un vecteur sur deux, la classe correcte est désignée par
le réseau LVQ.

53
! " " .

, -#

Comme nous l'


avons vu au chapitre I, le réseau Radial Basis Function est aussi un
réseau multi-couche, dont la particularité est le caractère évolutif de son architecture. En effet,
la couche cachée de ce réseau est construite durant l'
apprentissage et la structure finale, à
savoir le nombre de neurones dans la couche cachée, n'
est connu que lorsque cette première
phase de mise en œ uvre du réseau est terminée. Tout comme le réseau LVQ, les nombres de
neurones des couches d'
entrée et de sortie sont déterminés par le problème à traiter. Ainsi, le
réseau comprendra autant de neurones en entrée que de composantes des vecteurs d'
entrée (80
dans le cas des PEM).

Pour le nombre de neurones de sortie, on peut envisager le problème de deux manières


différentes, suivant la manière dont on code les classes. En effet, on peut coder les classes de
la même manière que pour le LVQ, c’ est-à-dire de manière disjonctive. Ainsi, le vecteur
(1,0,0)t représentera la classe 1, (0,1,0)t représentera la classe 2 et (0,0,1)t représentera la
classe 3.
Le réseau RBF comprendra dans ce cas 3 neurones de sortie. La réponse du réseau
sera alors un vecteur comprenant 3 composantes. Chacune des composantes contient la
distance du vecteur appliqué en entrée aux différentes classes. Plus la distance n°i est proche
de 1, plus le vecteur est proche de la classe i. Si, par exemple, la sortie du réseau pour un
vecteur d'
entrée donné est :
0,0800
0,6890
0,2310

le vecteur est alors classé dans la classe 2.


On peut aussi choisir de coder la classe de la manière suivante :
* 1, pour la classe 1,
* 2, pour la classe 2,
* 3, pour la classe 3.
Dans ce cas, le réseau RBF ne comprendra qu'
un seul neurone de sortie. Compte tenu
du fonctionnement du réseau (le réseau RBF fournit une distance), on interprétera la réponse

54
de la façon suivante : si, pour un vecteur d'
entrée donné, la réponse est proche de 1 (resp. 2 ou
3), le vecteur sera considéré comme appartenant à la classe 1 (resp. 2 ou 3).

Nous avons choisi de coder les classes comme pour le LVQ. Le réseau RBF comprend
donc 3 neurones en sortie.
Comme nous l'
avons déjà mentionné, contrairement au LVQ, le nombre de neurones
de la couche cachée du RBF est déterminé par apprentissage. Les neurones de la couche
cachée sont utilisés pour mémoriser un exemple et une fonction d’ activation. Chacun a une
activité locale dans l’ espace d’ entrée. Ainsi, les fonctions noyaux ne donnent des réponses
utiles que dans le cas d’ un domaine restreint, leur champ récepteur. Ce champ récepteur,
encore appelé zone d'
influence, est l'
un des paramètres caractéristiques du réseau RBF. Pour
le modèle que nous utilisons, le rayon de cette zone est fixe et nous pouvons le faire varier
grâce à un paramètre, noté sc.
Nous avons étudié, dans chacun des cas, l'
impact de la taille de la zone d'
influence des
neurones. Pour cela, nous avons fait varier le paramètre sc de 0,1 à 10 avec un pas de 0,1 pour
la classification des PEA. L'
apprentissage s'
arrête quand le nombre de neurones cachés atteint
le nombre de vecteurs de la base d'
apprentissage ou que l'
erreur commise atteint un seuil fixé
par l'
utilisateur. Les résultats obtenus en phase de généralisation sont présentés à la figure II.7.
On peut remarquer alors un minimum de 87 erreurs pour une valeur de sc de 7,5. Il est
cependant intéressant de s'
intéresser à l'
évolution de l'
erreur dans chacune des classes. En
effet, il peut être utile de choisir une valeur du paramètre sc permettant d'
optimiser la
classification d'
une des classes, par exemple, pour l'
utilisation d'
un RBF dans une structure
plus complexe. Ainsi, on pourra privilégier la reconnaissance d'
une classe par rapport à une
autre et dédier ainsi le réseau en question à la reconnaissance d'
une des catégories de
pathologie.
Les résultats obtenus ne sont valables que pour les bases d'
apprentissage définies. Ils
montrent cependant la pertinence de ce paramètre dans la construction d'
un réseau adéquat. Il
est important de rappeler que les critères d'
arrêt d'
apprentissage utilisés, mentionnés ci dessus,
restent restrictifs du fait que le rayon d'
influence a été supposé identique pour tous les
neurones de la couche cachée.

55
Figure II. 7 - Evolution de l'erreur commise en fonction du paramètre sc pour la classification des PEA

, "

A partir des résultats précédents, nous avons donc mis en œ uvre le réseau RBF ainsi
optimisé. La valeur du paramètre sc choisie est donc de 7,5. Les résultats obtenus sont
présentés dans le tableau II.4.

Classe Réelle

Rétrocochléaire Endocochléaire Normal


Classe donnée
Par le RBF
Rétrocochléaire 24 5 7
Endocochléaire 8 45 28
Normal 6 33 57
Tableau II. 4 - Résultats de classification des PEA par le réseau RBF

Le taux de classification correcte obtenu grâce à cette structure est de 59,1% pour la
globalité de la base de données avec un taux de classification correcte de :

56
• 63,1% pour la classe rétrocochléaire,
• 54,2% pour la classe endocochléaire,
• 62% pour la classe normale.

Si les résultats de classification correcte globaux sont proches pour les deux
techniques neuronales appliquées, on peut cependant noter que les 2 réseaux LVQ permet une
meilleure reconnaissance des classes rétrocochléaire et endocochléaire, alors que le réseau
RBF obtient de meilleurs résultats pour la classification des vecteurs de type "Normal".
Cependant, dans les deux cas, les taux de classification correcte sont trop insuffisants pour
pouvoir implanter en l'
état un réseau LVQ ou un réseau RBF seul comme outil d'
aide au
diagnostic.

! / & 0

1 %

!
L'
objet de cette étude concerne le développement d'
un outil d'
aide au diagnostic de la
machine asynchrone, devenue de plus en plus présente dans les applications industrielles. En
effet, ce type de moteur est très robuste, son coût est faible et il peut atteindre de hautes
performances grâce au développement de composants électroniques permettant la mise en
place de loi de commandes sophistiquées. Néanmoins, en cas de défaillance du moteur, ces
algorithmes peuvent devenir complètement inefficaces, voire dangereux pour l’ installation.
C’ est pourquoi, il est important de contrôler à tout instant l’ état de la machine et de mettre en
place des systèmes de maintenance préventive pour vérifier son bon fonctionnement.
Le problème de la surveillance de ces machines fait l’ objet de nombreuses recherches
[COMB 02][THOM 99]. L’ un des axes principaux est la recherche de modèles –
principalement des modèles du fonctionnement défaillant de la machine asynchrone, de
manière à pouvoir non seulement détecter une défaillance, mais aussi l’ identifier et la
localiser – de manière à pouvoir appliquer les techniques internes de diagnostic [CHAN 02].

57
Cependant, la diversité des conditions réelles de fonctionnement et la dérive des modèles
internes par rapport à ces conditions rendent ces techniques souvent difficilement applicables.
Nous avons décidé de faire abstraction de l’ obtention de ce modèle et de mettre alors
en œ uvre des techniques de diagnostic externes à base de réseaux de neurones. Pour cette
étude, nous avons travaillé en collaboration avec le laboratoire CERTES (Centre d’ Etudes et
de Recherche en Thermique, Environnement et Systèmes). C’ est cette équipe, experte en
mécanique, qui a constitué la base de données, à partir d’ un moteur asynchrone présent sur un
banc d’ essai pour l’ étude des vibrations. Les travaux menés par cette équipe concernent le
développement d’ outils pour la maintenance préventive de ce type de machine, mais d’ un
point de vue traitement du signal. Il n’ est cependant pas exclu que nos travaux convergent
[BARR 03] pour mettre en œ uvre la technique hybride présentée au chapitre I.3, et dont les
premiers résultats de mise en œ uvre seront présentés au chapitre suivant.

! 2
Le CERTES dispose d’ un banc d’ essai permettant de simuler un certain nombre de
dysfonctionnements mécaniques (figure II.8)

Figure II. 8 - Banc d'essai

58
Ce banc est composé des éléments suivants :
• Un moteur asynchrone d’ une puissance de 1,5kW
• Un réducteur à engrenages
• Une pompe centrifuge (non représentée sur la photo)
• Un roulement à billes relié au moteur par accouplement élastique

Le banc d’ essai est alimenté par un variateur de courant qui permet de faire varier la
vitesse de 0 à 1500Tr/min (0 à 25Hz).
Sur ce banc d’ essai sont placés différents capteurs qui permettent d’ obtenir différentes
informations sur le fonctionnement du moteur. On trouve ainsi :
• Un accéléromètre qui permet de mesurer l’ accélération du rotor du moteur
• Une sonde de courant pour mesurer l’ intensité de l’ alimentation du moteur
• Un capteur de position qui permet de savoir quand le moteur a effectué un tour.
A chaque tour du rotor à l’ entrée du moteur, un réflecteur de lumière passera
devant un capteur qui signalera un tour du rotor. Nous l’ appellerons par la suite
‘Top Tour’
Plusieurs dispositifs permettent de simuler des défauts fréquemment rencontrés en
milieu industriel, tels que :
• Ecaillage de la bague extérieure d’ un roulement
• Balourd (déséquilibre dynamique)
• Défaut d’ alignement du moteur
• Cavitation dans la pompe

Tous ces défauts possèdent des signatures vibratoires qu’ on peut identifier séparément
si toutes les caractéristiques des différents éléments sont parfaitement connues (fréquences de
défauts de roulement, vitesses de rotation). Toutefois, les effets des défauts se cumulent le
plus souvent et les vibrations peuvent exciter les fréquences propres des éléments du banc.

Nous nous sommes focalisés sur la recherche et la détection de deux types de défauts :
les défauts de roulement et les balourds. Les roulements à billes sont, sans doute, les organes
les plus sensibles sur une machine. D’ après une étude menée par la société SKS, 27% des
défauts de roulement ont pour origine des maladresses de montage. On imagine donc
aisément l’ intérêt d’ avoir à remplacer le moins souvent possible et donc, d’ éviter les

59
démontages systématiques en optant pour une stratégie de surveillance appropriée. Dans la
plupart des cas, la dégradation se traduit par un écaillage d’ une des pistes d’ un élément du
roulement, provoquant un choc à chaque passage. Dans le cadre de notre simulation, le défaut
de roulement est provoqué en serrant une vis. La bague extérieure sera donc enfoncée
localement et, à chaque passage d’ une bille sur ce défaut, un choc apparaîtra.
Chaque élément d'
un ensemble tournant peut comprendre une différence de répartition
de masse. La conjugaison des différences de masse crée un balourd résultant de l'
ensemble
tournant. Pour simuler l’ apparition d’ un balourd sur le banc d’ essai dont nous disposons, nous
pouvons placer sur le rotor, une petite masse de poids variable de façon à pouvoir simuler
plusieurs niveaux de balourd.
Comme mentionné précédemment, plusieurs informations sont disponibles. Les
signaux que nous avons choisi d’ exploiter sont ceux issus de l’ accéléromètre. Les
informations provenant du ‘Top Tour’ ont aussi été considérées pour la construction de la
base de données.
Nous avons décidé de travailler, dans un premier temps, à fréquence de rotation fixe
du moteur. Nous nous sommes tout d’ abord focalisés sur la détection de défauts d’ un niveau
donné (serrage constant de la vis dans le cas de la simulation d'
un défaut de balourd, et masse
de poids constant placée sur le rotor pour la simulation du balourd). Plusieurs bases de
données ont été élaborées pour la mise en œ uvre des techniques neuronales pour la détection
de défaillance d’ un moteur. Les signaux fournis par le laboratoire CERTES comprennent
plusieurs périodes (plusieurs tours de rotation du moteur) pour un mode de fonctionnement
donné. Nous avons décidé de travailler sur une période (i.e. un tour de moteur). Les signaux
ainsi définis ont alors été obtenus de différentes manières : soit on se calle sur le signal du
Top Tour, c’ est-à-dire que l’ origine de tous les signaux de la base de données correspond à la
même position du moteur, et on prend ensuite le nombre d’ échantillons nécessaires pour que
le signal obtenu corresponde à une période (992 dans notre cas), soit, on travaille avec une
fenêtre glissante. Dans ce dernier cas, la base de données est ainsi construite : le premier
signal extrait du fichier comprend les 992 premiers points du fichier. Puis, on décale l’ origine
de 100 échantillons, et on construit le second signal en prenant les 992 points suivants, ainsi
de suite jusqu’ à épuisement du fichier.
Le tableau II.5 récapitule les différentes bases de données élaborées, pour trois
catégories : balourd, défaut de roulement et fonctionnement normal.

60
Base d’apprentissage Base de généralisation
Signaux calés sur Signaux calés sur
Base de le Top Tour le Top Tour
données 1 (64 vecteurs par classe, soit 192 (128 vecteurs par classe, soit 384
vecteurs au total) vecteurs au total)
Signaux calés sur Signaux « Fenêtre
Base de le Top Tour glissante »
données 2 (60 vecteurs par classe, soit 180 (318 vecteurs par classe soit 954
vecteurs au total) vecteurs au total)
Signaux « Fenêtre Signaux « Fenêtre
Base de glissante » glissante »
données 3 (22 vecteurs par classe, soit 66 (318 vecteurs par classe, soit 954
vecteurs au total) vecteurs au total)
Tableau II. 5 - Récapitulatif des différentes bases de données

Nous nous sommes aussi intéressés à la détection de l’ apparition progressive d’ un


défaut de roulement. Pour cette étude, la base de données a été construite de la manière
suivante :
• Base d’ apprentissage : nous disposons d'
un ensemble de fichiers correspondant
à quatre différents niveaux de défauts (serrage de la vis sur le roulement plus
ou moins fort) ainsi qu'
à un fonctionnement normal. Nous avons extrait de ces
fichiers les signaux qui constituent alors notre base d’ apprentissage
• Base de généralisation : nous disposons d'
une mesure simulant un
fonctionnement avec apparition progressive d’ un défaut de roulement. Ce
signal nous permet d'
effectuer la phase de généralisation.

Comme dans le cas de l’ approche bio-médicale, les différentes bases de données ont
été utilisées pour la mise en œ uvre de deux réseaux de neurones artificiels : le réseau LVQ et
le réseau RBF. L’ optimisation de ces réseaux ainsi que les résultats obtenus sont présentés
dans la partie suivante.

61
!! & # %

!! '#

!! " & * +

, -#

Le nombre de neurones de la couche d'


entrée correspond au nombre de composantes
des vecteurs d'
entrée, soit 992 neurones. Le nombre de sorties correspond quant à lui au
nombre de classes que l'
on souhaite obtenir. On souhaite classer les vecteurs d'
entrée dans 3
catégories. Ainsi, le réseau LVQ comprendra 3 neurones de sortie.
Le nombre de neurones dans la couche cachée est un des paramètres à ajuster pour ce
modèle. Comme mentionné précédemment, le choix du nombre de neurones cachés est un
problème délicat.
Erreurs commises
Réseau LVQ - Base de données 1
80

Classe "Balourd"
70 Classe "Défaut de Roulement"
Classe Normale
Résultats Globaux
60
Nombre d'erreurs commises

50

40

30

20

10

0
5 15 25 35 45 55 65 75 85 95 100
Nombre de Neurones dans la couche cachée

Figure II. 9 - Evolution du nombre d'erreurs en fonction du nombre de neurones dans la couche cachée du
réseau LVQ pour la base de données 1

Nous avons donc mené une étude en faisant varier le nombre de neurones dans la
couche cachée du réseau LVQ de 6 à 100. Les résultats de l'
évolution du nombre d'
erreurs en

62
phase de généralisation en fonction du nombre de neurones sont représentés par la figure II.9.
On peut remarquer qu'
on obtient les meilleures performances – soit, un taux de classification
correcte de 95,4% - pour un nombre de neurones dans la couche cachée égal à 9.

, "

A partir des résultats précédents, nous avons donc mis en œ uvre le réseau LVQ ainsi
optimisé. Le nombre de neurones cachés s’ élève alors à 9 neurones. Les résultats obtenus sont
présentés dans le tableau II.6.
On peut noter que la base d’ apprentissage a été correctement apprise. Tous les
vecteurs appris sont correctement classés lors de la phase de généralisation. Ainsi, le taux de
classification correcte obtenu grâce à cette structure est de 95,4% pour la globalité de la base
de données avec un taux de classification correcte de :
• 95,2% pour la classe normale,
• 97,5% pour la classe Balourd,
• 93,5% pour la classe Défaut de Roulement.
Classe Réelle

Normal Balourd Défaut de Roulement


Classe donnée
Par le RBF
Normal 118 0 6
Balourd 4 117 2
Défaut de Roulement 2 3 116
Tableau II. 6 - Résultats de classification par le réseau LVQ (Base de Données 1)

!! " " .

Tout comme le réseau LVQ, les nombres de neurones des couches d'
entrée et de sortie
sont déterminés par le problème à traiter. Ainsi, le réseau comprendra autant de neurones en
entrée que de composantes des vecteurs d'
entrée (992 dans notre cas).

Nous avons choisi de coder les classes comme pour le LVQ (manière disjonctive : 1
neurone par classe désirée). Le réseau RBF comprend donc 3 neurones en sortie.

63
Comme nous l'
avons déjà mentionné, contrairement au LVQ, le nombre de neurones
de la couche cachée du RBF est déterminé par apprentissage. Pour le modèle que nous
utilisons, le rayon de la zone d'
influence est fixe.
Nous avons étudié, dans chacun des cas, l'
impact de la taille de la zone d'
influence des
neurones. Pour cela, nous avons fait varier le paramètre sc de 1 à 100 avec un pas de 1 pour la
classification des signaux issus de l’ accéléromètre. L'
apprentissage s'
arrête quand le nombre
de neurones cachés atteint le nombre de vecteurs de la base d'
apprentissage ou que l'
erreur
commise atteint un seuil fixé par l'
utilisateur. Les résultats obtenus en phase de généralisation
sont présentés à la figure II.10.

Nombre d'erreurs Commises


Réseau RBF - Base de données 1
9
Classe"Balourd"
Classe "Défaut de Roulement
8 Classe Normale
Résultats Globaux
7
Nombre d'erreurs commises

0
0 10 20 30 40 50 60 70 80 90 100
Valeur du Rayon de la zone d'influence (Paramètre Sc)

Figure II. 10 - Evolution de l'erreur commise en fonction du paramètre sc (base de données 1)

On peut remarquer alors que, si le paramètre sc est égal à 5, 6 ou 7, le réseau ne


commet aucune erreur. Le taux de classification atteint donc les 100% pour chacune des
classes

Compte tenu des taux de classification particulièrement élevés, nous avons décidé de
faire abstraction du Top Tour, au moins dans un premier temps pour la base de généralisation.
Le but de cette deuxième simulation est de permettre à un utilisateur final de ne pas se soucier

64
de la position du rotor lors de l’ acquisition des signaux de test de la machine. De plus,
considérant les résultats obtenus précédemment, seul le réseau RBF a été mis en œ uvre pour
la base de données 2. Nous avons donc mis en œ uvre ce réseau, en lui apprenant les mêmes
signaux que précédemment, mais en utilisant, pour la généralisation, des signaux non calés
sur le Top Tour.

!! '# 3" " .

!! -#

La démarche est la même que celle décrite précédemment. Les résultats obtenus sont
présentés figure II.11.
Nombre d'erreurs commises
Réseau RBF - Base de données 2
600
Classe Normale
Classe "Balourd"
Classe" Défaut de roulement
500 Résultats Globaux
Nombre d'erreurs commises

400

300

200

100

0
0 5 10 15 20 25 30 35 40 45 50
Valeur du rayon de la zone d'influence (Paramètre Sc)

Figure II. 11 - Evolution de l'erreur commise en fonction du paramètre sc (base de données 2)

On peut remarquer alors un minimum de 352 erreurs pour une valeur de sc de 21. Il est
cependant intéressant de s'
intéresser à l'
évolution de l'
erreur dans chacune des classes. En
effet, il peut être utile de choisir une valeur du paramètre sc permettant d'
optimiser la
classification d'
une des classes, par exemple, pour l'
utilisation d'
un RBF dans une structure
plus complexe. Ainsi, on pourra privilégier la reconnaissance d'
une classe par rapport à une

65
autre et dédier ainsi le réseau en question à la reconnaissance d'
une des catégories de
défaillance.

!! "

A partir des résultats précédents, nous avons mis en œ uvre le réseau RBF ainsi
optimisé. La valeur du paramètre sc choisie est donc de 21. Les résultats obtenus sont
présentés dans le tableau II.7.

Classe Réelle

Normal Balourd Défaut de Roulement


Classe donnée
Par le RBF
Normal 181 24 0
Balourd 137 270 167
Défaut de Roulement 0 24 151
Tableau II. 7 - Résultats de classification par le réseau RBF (base de données 2)

Ainsi, le taux de classification correcte obtenu grâce à cette structure est de 63,1%
pour la globalité de la base de données avec un taux de classification correcte de :
• 57,9% pour la classe normale,
• 84,9% pour la classe Balourd,
• 47,5% pour la classe Défaut de Roulement.
On peut remarquer que les performances du réseau sont les plus élevées concernant la
reconnaissance de balourds. De plus, quand le réseau se trompe sur l’ une des deux autres
classes, le vecteur mal classé est systématiquement catalogué comme étant un signal
caractérisant un balourd.

On peut noter que les performances se dégradent nettement. Ceci est tout à fait
compréhensible puisque les signaux de la base d’ apprentissage sont callés sur le Top Tour
alors que les signaux de la base de généralisation ne le sont pas. Nous avons donc décidé
d’ apprendre aux réseaux des informations similaires en leur apprenant des signaux construits
sur le principe de la fenêtre glissante.

66
!!! '# !

!!! " & * +

, -#

La démarche est la même que celle décrite précédemment. Les résultats obtenus sont
présentés figure II.12.
On peut remarquer alors un minimum de 327 erreurs pour un nombre de neurones
dans la couche cachée égal à 9.
Erreurs Commises
Réseau LVQ - Base de Données 3
600

500
Nombre d'erreurs commises

400 Classe Normale


Classe "Balourd"
Classe "Défaut de Roulement"
Erreur Globale
300

200

100

0
10 20 30 40 50 60 70 80 90 100
Nombre de Neurones dans le Couche Cachée

Figure II. 12 - Evolution de l'erreur commise en fonction du nombre de neurones cachés du LVQ (base de
données 3)

, "

A partir des résultats précédents, nous avons donc mis en œ uvre le réseau LVQ ainsi
optimisé. Le nombre de neurones cachés s’ élève alors à 9 neurones. Les résultats obtenus sont
présentés dans le tableau II.8.

67
Classe Réelle

Normal Balourd Défaut de Roulement


Classe donnée
Par le RBF
Normal 202 82 42
Balourd 51 198 49
Défaut de Roulement 65 38 227
Tableau II. 8 - Résultats de classification par le réseau LVQ (Base de Données 3)

On peut noter que la base d’ apprentissage a été correctement apprise. Tous les
vecteurs appris sont correctement classés lors de la phase de généralisation. Ainsi, le taux de
classification correcte obtenu grâce à cette structure est de 65,7% pour la globalité de la base
de données avec un taux de classification correcte de :
• 63,5% pour la classe normale,
• 62,3% pour la classe Balourd,
• 71,4% pour la classe Défaut de Roulement.

!!! " " .

, -#

La démarche est la même que celle décrite précédemment (variation du paramètre sc


de 1 à 100). Les résultats obtenus sont présentés figure II.13. On peut remarquer alors un
minimum de 131 erreurs pour une valeur de sc de 2.

68
Nombre d'erreurs commises
Réseau RBF - Base de données 3
400

350

300
Classe "Défaut de Roulement
Classe Normale
Nombre d'erreurs commises

Erreur Globale
250 Classe "Balourd"

200

150

100

50

0
0 10 20 30 40 50 60 70 80 90 100
Valeur du rayon de la zone d'influence

Figure II. 13 - Evolution de l'erreur commise en fonction du paramètre sc (base de données 3)

, "

A partir des résultats précédents, nous avons donc mis en œ uvre le réseau RBF ainsi
optimisé. La valeur du paramètre sc choisie est donc de 2. Les résultats obtenus sont présentés
dans le tableau II.9.

Classe Réelle

Normal Balourd Défaut de Roulement


Classe donnée
Par le RBF
Normal 269 30 0
Balourd 49 251 15
Défaut de Roulement 0 37 303
Tableau II. 9 - Résultats de classification par le réseau RBF (base de données 3)

69
Ainsi, le taux de classification correcte obtenu grâce à cette structure est de 86,3%
pour la globalité de la base de données avec un taux de classification correcte de :
• 84,6% pour la classe normale,
• 78,9% pour la classe Balourd,
• 95,3% pour la classe Défaut de Roulement.

Compte tenu des résultats obtenus pour la détection d’ un niveau de défaut avec les
réseaux LVQ et RBF seuls, nous nous sommes alors intéressés à la détection de l’ apparition
d’ un défaut sur une machine tournante, en utilisant ces techniques à réseau de neurones
unique.

!!4 / $ ## $

# &

Le principe de cette série de simulations est le suivant : après avoir appris au réseau
considéré (LVQ ou RBF) un ensemble de signaux correspondants soit à un fonctionnement
normal, soit à un fonctionnement défaillant, avec plusieurs niveaux de défauts, on généralise
sur un ensemble de signaux extraits d'
une mesure en continue de l'
accélération du moteur, tout
en faisant apparaître progressivement un effort sur le roulement à billes (afin de générer un
défaut de roulement de plus en plus important). Puis, il s'
agit de rechercher le moment où le
réseau commence à détecter un défaut de roulement. Chaque réseau comprend 992 neurones
d'
entrée (correspondant au nombre d'
échantillons des signaux) et 2 neurones de sortie (un par
classe).
La base d'
apprentissage utilisée comprend 718 signaux : 318 correspondent à un
fonctionnement normal et 400, à un fonctionnement défaillant de niveau fixe (4 niveaux
différents). La généralisation s'
opère sur 19389 signaux. Les résultats obtenus pour le réseau
LVQ seul et le réseau RBF seul ne sont globalement pas satisfaisants, puisque les réseaux ne
parviennent pas à détecter correctement l'
apparition du défaut. Afin de permettre une
représentation des résultats, nous les avons analysés de la manière suivante : nous connaissons
le moment où le défaut commence à apparaître. Les signaux correspondant aux instants
précédant ce moment sont donc des signaux de fonctionnement normal (classe normale).
Ceux correspondant aux instants suivant l'
apparition du défaut caractérisent donc un
fonctionnement défaillant (classe "défaut de Roulement"). Partant de ce principe, nous avons

70
donc analysé les résultats obtenus comme des résultats de classification. Ceux-ci sont
présentés ci-après.

!!4 " & * +

Nous avons procédé comme précédemment, en faisant varier le nombre de neurones


de la couche cachée de 6 à 100. Les résultats sont présentés figure II.14.

Pourcentage de Classification Correcte


réseau LVQ
100
Classe Normale
Classe "Défaut de Roulement"
90 Résultats globaux

80
Pourcentage de classification correcte

70

60

50

40

30

20

10
0 20 40 60 80 100 120
Nombre de Neurones Cachés

Figure II. 14 – Evolution du pourcentage de classifcation correcte en fonction du nombre de neurones


cachés

L'
étude de cette courbe montre que, si le réseau reconnaît correctement un
fonctionnement normal, en revanche, alors même que le défaut est installé, il ne le détecte
pas.

!!4 " " .

Nous avons procédé en faisant varier le paramètre sc du réseau RBF de 1 à 50. Les
résultats sont présentés figure II.15.

71
Pourcentage de classification correcte
Réseau RBF
100
Classe Normal (sans défaut)
Classe "Défaut de Roulement)
90
Résultats globaux

80
Pourcentage de classificartion correcte

70

60

50

40

30

20

10

0
0 5 10 15 20 25 30 35 40 45 50
Valeur du rayon de la zone d'influence (Paramètre sc)

Figure II. 15 -Evolution du pourcentage de classifcation correcte en fonction du paramètre sc

Comme précédemment, on peut noter que la reconnaissance du défaut de roulement


n'
est pas du tout satisfaisante par un réseau RBF seul. De plus, si l'
augmentation du rayon de
la zone d'
influence permet une amélioration du taux de classification globale, le
comportement général du réseau demeure décevant (reconnaissance en moyenne de près d'
un
vecteur sur deux : comportement quasi aléatoire). En effet, les deux classes à discriminer sont
trop proches pour être dissociées correctement par le mappage réalisé par un réseau RBF dont
le paramètre sc est grand. On assiste alors à un recouvrement des zones d'
influence des
neurones cachés qui explique ce comportement aléatoire. Dans ce cas, il faudrait sans doute
envisager un apprentissage avec zone d'
influence variable selon le type de vecteur appris
(normal ou défaillance).

72
4 2

Dans ce chapitre, nous avons présenté la mise en œ uvre de techniques neuronales à


réseau de neurones unique dans le cadre de deux applications, l'
une biomédicale, l'
autre
industrielle. L'
application biomédicale concerne les Potentiels Evoqués Auditifs (PEA).
L'
étude industrielle aborde le problème de diagnostic de défaillances d'
un moteur asynchrone.
Dans ce dernier cas, nous avons travaillé sur les données issues d'
un point de mesure du
moteur : l'
accélération.
Notre première étude a porté sur la catégorisation des signaux PEA. La principale
difficulté de cette catégorisation est liée à la catégorisation de vecteurs très similaires
correspondant à des classes différentes et à la grande variété de vecteurs au sein d’ une même
classe. Nous avons dans un premier temps appliqué une technique conventionnelle
(modélisation autorégressive). Les résultats alors obtenus étant très insuffisants (seuls 37%
des vecteurs sont correctement classés grâce à cette approche), nous avons alors choisi de
mettre en œ uvre les réseaux LVQ et RBF. La première phase de cette étude concerne l'
étude
du comportement des réseaux de neurones LVQ et RBF pour la classification de ces signaux.
Concernant le réseau LVQ, nos efforts se sont concentrés sur la recherche du nombre
de neurones cachés. Nous avons donc fait varier le nombre de neurones cachés de 2 à 100 afin
de rechercher la structure permettant d'
obtenir les meilleurs taux de classification. Dans le
cadre de l'
application biomédicale, nous avons ainsi pu observer un taux de classification
correcte "optimal" de 56,8% pour un nombre de neurones cachés égal à 12 et à 20. Pour ces
deux structures, la répartition des erreurs au sein des trois classes est quasiment la même.
De la même manière, nous avons étudié le comportement du réseau RBF. Un tel
réseau faisant partie des modèles à architecture évolutive, le nombre de neurones de la couche
cachée est fixé par l'
apprentissage. Nous nous sommes donc penchés sur l'
influence du rayon
de la zone d'
influence de ce réseau. Nous avons donc fait varier le paramètre sc, rayon de la
zone d'
influence, et étudié l'
évolution du nombre d'
erreurs commises par le réseau en phase de
généralisation en fonction de ce paramètre. Dans le cadre de l'
application biomédicale, les
meilleurs résultats sont obtenus pour sc égal à 7,5. On atteint alors 59,1% de classification
correcte sur l'
ensemble de la base de données.

Concernant l'
application industrielle, les mêmes réseaux ont été employés et les
mêmes recherches de structures adéquates ont été réalisées pour les réseaux LVQ et RBF, et

73
ce, pour trois bases de données. La construction de ces différentes bases de données a été
motivée par un souci de s'
adapter aux conditions de mesures dans l'
industrie. Si les deux
premières bases nécessitent les mesures issues de deux capteurs différents (accéléromètre et
capteur de position pour le signal Top Tour), la troisième, quant à elle, doit permettre
d'
obtenir un diagnostic à partir de la seule information issue de l'
accéléromètre, quelque soit
l'
instant de la prise de mesure. De plus, nous avons tenté de détecter l'
apparition d'
un défaut
progressif au moyen de ces mêmes structures.
Concernant la base de données 1, où les signaux d'
apprentissage et de généralisation
sont tous callés sur le Top Tour, les résultats obtenus sont satisfaisants, puisque nous
atteignons un taux de classification correcte de 95,4% pour un réseau LVQ comprenant 9
neurones cachés et même 100% pour un réseau RBF dont le paramètre sc est égal à 5, 6 ou7.
Compte tenu de ces résultats, nous avons décidé d'
évaluer les performances du réseau RBF en
phase de généralisation avec des signaux dont l'
origine ne dépend plus de l'
information
délivrée par le Top Tour (Base de Données 2). Les résultats obtenus montrent qu'
on obtient un
taux de classification de 63,1% pour un réseau RBF dont le paramètre sc vaut 21. Les
performances de ces réseaux ont ensuite été évaluées sur une troisième base de données.
L'
apprentissage et la généralisation des réseaux neuronaux sont alors réalisés en utilisant des
signaux dont l'
origine n'
est plus une même position de l'
axe de rotation du moteur. On atteint
alors des taux de classification de 65,7% pour un réseau LVQ comprenant 9 neurones cachés
et 86,3% pour un réseau RBF dont le paramètre sc est égal à 2.
En revanche, concernant la détection de l'
apparition d'
un défaut de roulement, les
résultats obtenus par un réseau de neurones seul sont très insatisfaisants, puisque l'
un et l'
autre
des réseaux ne permettent même pas la reconnaissance d'
un défaut installé.

La mise en œ uvre des structures neuronales à réseau de neurones unique est nettement
insuffisante pour la résolution de ce problème de classification et l'
élaboration d'
un outil
d'
aide au diagnostic pour les deux cas, biomédical et industriel, étudiés. Les résultats
biomédicaux permettent d'
obtenir seulement 56,2% de classification correcte dans le cas du
LVQ et 59,1% dans le cas du RBF. De la même manière, dans l'
étude de cas industriel, même
si le réseau RBF permet d'
obtenir des résultats satisfaisants (100% de classification correcte
pour la base de données1 et 86,3% pour la base de données 3), seuls 63,1% de signaux sont
correctement classés par le réseau RBF pour la base de données 2. Quant au réseau LVQ, il ne
permet pas d'
obtenir de meilleurs résultats pour les différentes bases de données. Par ailleurs;

74
les performances de ces structures dans le cadre de la reconnaissance de l'
apparition d'
un
défaut de roulement sont très insuffisantes. Compte tenu de ces différents résultats, et des
insuffisances des différents réseaux employés seuls, nous avons imaginé une structure hybride
(présentée au chapitre I) pour le traitement des informations dans un but d'
aide au diagnostic.
Le chapitre suivant est consacré à l'
étude et la mise en œ uvre de cette structure.

75
Chapitre II.................................................................................................................40
Approches Neuronales Simples pour l’ Aide au Diagnostic et leur Evaluation
Expérimentale ......................................................................................................................40
II.1. Introduction...................................................................................................40
II.2. Volet Biomédical : Les Potentiels Evoqués Auditifs ......................................41
II.2.1. Présentation ...........................................................................................41
II.2.2. Mise en œ uvre clinique et construction de la base de données................44
II.2.3. Résultats ................................................................................................47
II.2.3.1. Application d'
une technique conventionnelle : Modélisation AR des
signaux PEA 47
II.2.3.1.1. Première approche ......................................................................48
II.2.3.1.2. Seconde Approche......................................................................50
II.2.3.2. Aide au diagnostic par techniques neuronales ....................................51
II.2.3.2.1. Réseau Learning Vector Quantization.........................................52
II.2.3.2.2. Réseau Radial Basis Function .....................................................54
II.3. Volet Industriel : Diagnostic de défaillances d’ un moteur asynchrone............57
II.3.1. Introduction ...........................................................................................57
II.3.2. Construction de la base de données ........................................................58
II.3.3. Aide au diagnostic par techniques neuronales ........................................62
II.3.3.1. Exploitation de la base de données 1..................................................62
II.3.3.1.1. Réseau Learning Vector Quantization.........................................62
II.3.3.1.2. Réseau Radial Basis Function .....................................................63
II.3.3.2. Exploitation de la base de données 2 – Réseau RBF ..........................65
II.3.3.2.1. Optimisation de la structure du réseau.........................................65
II.3.3.2.2. Résultats obtenus ........................................................................66
II.3.3.3. Exploitation de la base de données 3..................................................67
II.3.3.3.1. Réseau Learning Vector Quantization.........................................67
II.3.3.3.2. Réseau Radial Basis Function .....................................................68
II.3.3.4. Détection de l'
apparition d'
un défaut de roulement progressif ............70
II.3.3.4.1. Réseau Learning Vector Quantization.........................................71
II.3.3.4.2. Réseau Radial Basis Function .....................................................71
II.4. Conclusion ....................................................................................................73

76
Nous avons montré au chapitre précédent que les approches neuronales simples –
c'
est-à-dire celles n'
impliquant qu'
un seul réseau de neurones artificiels – ne sont en général
pas suffisantes pour construire un outil performant pour l'
aide au diagnostic de systèmes
complexes tels que ceux traités dans cette thèse. Nous nous sommes alors orientés vers des
structures plus complexes, pouvant impliquer plusieurs réseaux de neurones. Dans ce
chapitre, nous proposons d'
appliquer l'
approche neuronale hybride déjà présentée au chapitre I
(I.3). Cette approche pour l'
aide au diagnostic concerne une association de différentes
techniques, conventionnelles et neuronales. La stratégie que nous envisageons de mettre en
œ uvre est présentée figure III.1.

Informations
d'entrée
Agent
Etape
Agent
de Etape de
Agent
Pré-traitement décision
Agent
Neuronal
Figure III.1 - Structure hybride Neuronale

Dans de nombreux cas, afin d'


établir un diagnostic, une seule mesure ne suffit pas à
obtenir suffisamment d'
informations pertinentes pour pouvoir établir un diagnostic. En effet,
le médecin, par exemple, prendra en compte les résultats de différents examens, les
symptômes du patient, avant de donner son diagnostic. De la même manière, pour un

77
processus industriel, les informations relatives au fonctionnement de ce dernier peuvent être
délivrés par différents indicateurs que l'
opérateur doit analyser. Il semble alors légitime de
prendre en compte différentes informations relatives au système (industriel ou biomédical) et
de combiner ces données. L'
architecture, qui permettra ensuite de traiter l'
ensemble des
informations délivrées par les capteurs, comprend trois niveaux de traitement :
Une étape de prétraitement
Un ensemble d'
agents neuronaux
Une étape finale de décision où on réaliserait la fusion des informations de chacun
des agents neuronaux spécialisés afin de parvenir à un élément de diagnostic.

Nous avons mis en oeuvre plusieurs variantes de cette structure dans le cadre des deux
problématiques présentées au chapitre précédent. Les résultats de validation sont présentés
dans la suite de ce mémoire. Dans la suite du texte, nous désignerons les structures hybrides
de la manière suivante : Structure Hybride [Agents Neuronaux]/[Structure de Décision].

Compte tenu des résultats présentés au chapitre II, nous avons appliqué notre approche
hybride neuronale au problème de classification des PEA.
Dans ce cas, l'
information d'
entrée provient du dispositif médical mis en œ uvre pour
l'
acquisition des signaux, présenté à la figure II.15. L'
étape de prétraitement, quant à elle, se
compose des deux traitements préliminaires effectués sur les signaux PEM, à savoir, une
normalisation et une troncature. Ces deux prétraitements ont été présentés au II.4.
Plusieurs approches ont été envisagées, mettant en jeu différents agents neuronaux et
structures de décision. Pour l’ étape de décision nous avons pris en compte un paramètre
supplémentaire : le seuil auditif. Ce paramètre est en effet un paramètre pertinent pris en
compte par le médecin pour décider si un patient fait partie de la classe normale ou

78
endocochléaire1. Afin d'
obtenir les données relatives au seuil auditif, nous nous sommes
intéressés à l'
audiogramme des patients ainsi qu'
à un paramètre présent dans leur dossier : la
perte auditive. Ces deux informations (audiogramme et perte auditive) nous ont permis de
construire une base de données constituée des valeurs 0 et 1, permettant de caractériser le
seuil auditif. La valeur 0 a été attribuée aux patients souffrant d'
une déficience auditive
supérieure à 20dB et la valeur 1, aux patients dont l'
audition est dite normale. Cette
information (seuil auditif) ainsi que la valeur normalisée2 de la perte ont été prises en compte
au niveau des structures de décision. Les différentes architectures mises en œ uvre sont
présentées ci-après.

! "

La première structure hybride proposée est présentée par la figure III.2. Cette structure
n'
implique qu'
un seul agent neuronal, un réseau LVQ ou un réseau RBF, dont le rôle est de
classer les signaux PEA traités en trois catégories. Le résultat de classification, ainsi que le
seuil auditif sont présentés au module de décision (ici, un ensemble de règles logiques qui
permet lorsque la classe désignée par le réseau est la classe 2 ou la classe 3 de prendre en
compte le seuil auditif. Si le seuil auditif est correct, la classe désignée sera la classe 3, sinon,
le vecteur sera classé en classe 2)
Les bases de données (apprentissage et généralisation) sont celles utilisées dans le
chapitre précédent (II.2.3)
Pour la phase de généralisation, nous avons utilisé la base de données globale, qui
comprend les vecteurs de la base d’ apprentissage, mais aussi les vecteurs non appris.
Lorqu'
on présente un signal au système, la classe correspondante doit être désignée.

1
A partir des résultats présentés au chapitre II, nous avons en effet pu constater que lorsqu'
une erreur
est commise sur un vecteur de type endocochléaire, il a une nette tendance à être classé comme étant un vecteur
de type normal plutôt qu'
un vecteur de type rétrocochléaire. De la même manière, un vecteur de type normal mal
classé sera étiqueté comme un vecteur de type endocochléaire.
2
Pour la normalisation, on procède de la même manière que pour le PEM afin de conserver la
dynamique de l'
information "perte auditive" (cf. Chapitre II.4)

79
Etape
PEM
De Etape de
Prétraitement RNA
Décision
Seuil Auditif (Seuillage)

Figure III. 2 - Structure hybride RNA/Seuillage

# $"

Pour mettre en œ uvre la structure hybride LVQ/Seuillage, nous avons procédé de la même
manière qu'
au paragraphe II.4.1.1 pour rechercher la structure adéquate du réseau LVQ dans
cette configuration (structure hybride). Les résultats obtenus pour cette dernière sont présentés
figure III.3.

Figure III. 3 - Evolution du nombre d'erreurs commises en généralisation pour la structure hybride
LVQ/Seuillage

On peut remarquer qu'


on obtient les meilleures performances – soit, un taux de
classification correcte de 80,7% - pour un nombre de neurones dans la couche cachée égal à

80
77. Dans ce cas, les résultats obtenus pour chacune des classes sont présentés dans le tableau
III.1.

Classe Réelle

Rétrocochléaire Endocochléaire Normal


Classe donnée
Par la structure proposée
Rétrocochléaire 27 7 3
Endocochléaire 11 57 1
Normal 0 19 88

Tableau III. 1 - Résultats relatifs à la structure hybride LVQ/Seuillage

Le taux de classification correcte obtenu grâce à cette structure est donc de 80,7% pour
la globalité de la base de données avec un taux de classification correcte de :
• 71% pour la classe rétrocochléaire,
• 68,7% pour la classe endocochléaire,
• 95,6% pour la classe normale.

%&"

Pour la mise en œ uvre de notre structure hybride RBF/Seuillage, nous avons procédé
de la même manière qu'
au paragraphe II.2.3.2.2.a. pour rechercher la structure adéquate du
réseau RBF dans cette structure. Les résultats obtenus pour cette dernière sont présentés
figure III.3.
On peut remarquer qu'
on obtient les meilleures performances – soit, un taux de
classification correcte de 77,5% - pour sc égal à 6,6 et compris entre 7,7 et 7,9. Dans ces cas,
les résultats obtenus pour chacune des classes sont présentés dans le tableau III.4.
Concernant le réseau, on peut noter que la base d’ apprentissage a été correctement
apprise. Le taux de classification correcte obtenu grâce à cette structure est donc de 77,5%
pour la globalité de la base de données avec un taux de classification correcte de :
• 71% pour sc = 6,6 et 68,4% pour sc compris entre 7,7 et 7,9 pour la classe
rétrocochléaire,
• 67,5% pour sc = 6,6 et 68,7% pour sc compris entre 7,7 et 7,9 pour la
classe endocochléaire,
• 89% pour la classe normale.

81
180
Erreur globale
160
Nombre d' erreurs commises sur la classe 1
Nombre d' erreurs commises sur la classe 2
Nombre d' erreurs commises sur la classe 3
140

120
erreurs

100
Nombre d'

80

60

40

20

0
0 1 2 3 4 5 6 7 8 9 10
Valeur du paramètre sc

Figure III. 4 - Evolution du nombre d'erreurs commises en généralisation pour la structure hybride
RBF/Seuillage

Classe Réelle

Rétrocochléaire Endocochléaire Normal


Classe donnée
Parla structure proposée
Rétrocochléaire 27 26 6 6 1 1
Endocochléaire 11 12 56 57 9 9
Normal 0 0 21 20 82 82
Valeur du paramètre
6,6 [7,7;7,9] 6,6 [7,7;7,9] 6,6 [7,7;7,9]
sc
Tableau III. 2 - Résultats relatifs à la structure hybride RBF/Seuillage

82
! "'

La seconde structure hybride proposée est présentée par la figure III.5. Cette structure comme
la précédente n'
implique qu'
un seul agent neuronal, un réseau RBF. Le module de décision
est, quant à lui, composé d'
un réseau de neurones artificiels et du même programme Matlab
que précédemment (programme permettant de prendre en considération le seuil auditif).
Module de décision

PEM Etape Règles


de RBF RNA Logiques
Prétraitement
Seuil Auditif

Figure III. 5 - Structure hybride RBF/LVQ+Seuillage

% & "(# $ ) *

L'
objectif visé ici est le suivant : dans un premier temps, nous voulons obtenir une
"mesure de ressemblance" du signal considéré par rapport aux différentes classes définies.
Puis, dans un second temps, un module de décision doit permettre de déterminer
l'
appartenance de ce signal à une des classes. Le réseau RBF a pour but de fournir la "mesure
de ressemblance". Le réseau LVQ, quant à lui, compose un étage de décision-classification.
Dans la structure proposée, les sorties du réseau RBF constituent les entrées du réseau
LVQ. La phase d'
apprentissage, nécessaire à la mise en œ uvre d'
une telle structure, est
effectuée de la manière suivante : on entraine tout d'
abord le réseau RBF en lui apprenant une
série d'
exemples. Une fois le réseau entraîné, les exemples de la base d'
apprentissage sont
présentés au réseau et les sorties ainsi obtenues forment les exemples de la base
d'
apprentissage du réseau LVQ. Puis, nous procédons à l'
apprentissage de ce second réseau.
Comme nous l'
avons déjà vu, le réseau RBF effectue une cartographie de l’ espace
d’ entrée en associant un ensemble de ‘catégories’ à un ensemble de ‘zones’ de l’ espace
d’ entrée. Les techniques de "Learning Vector Quantization", quant à elles, font partie des
techniques de compétition. Rappelons que l'
objectif de ces méthodes est de déterminer la
valeur optimale de vecteurs prototypes. Ceux-ci sont représentatifs des données à traiter et

83
sont codés dans les poids du réseau. L'
apprentissage permet de retrouver les valeurs
caractéristiques des vecteurs prototypes. Même si ce modèle est principalement utilisé pour la
classification, la nature compétitive de sa stratégie d’ apprentissage (basée sur le principe du
‘tout au vainqueur’ (‘Winner takes all’ )) rend son utilisation en tant qu’ opérateur de ‘décision-
classification’ possible. .

Figure III. 6 - Evolution de l'erreur commise en phase de généralisation en fonction du nombre de


neurones du réseau LVQ pour la structure hybride RBF/LVQ

Pour choisir la structure du réseau RBF, nous nous sommes appuyés sur les résultats
précédents. Nous avons donc choisi sc = 7,7. Le réseau LVQ ayant désormais un rôle de
décision, nous avons donc entrepris de rechercher le nombre de neurones pour obtenir la
structure adéquate. Comme précédemment, nous avons fait varier le nombre de neurones
cachés de 2 à 100 et les résultats obtenus en sortie du réseau LVQ sont présentés figure III.6.

84
On atteint un nombre minimal d'
erreurs (86 erreurs) pour un réseau comportant 5
neurones cachés3. La répartition de ces erreurs au sein des trois classes est donnée par le
tableau III.3.

Classe Réelle

Rétrocochléaire Endocochléaire Normal


Classe donnée
Parla structure proposée
Rétrocochléaire 22 2 9
Endocochléaire 12 49 27
Normal 4 32 56
Tableau III. 3 - Résultats de classification des PEA par la structure hybride RBF/LVQ

En tenant compte maintenant du seuil auditif pour les vecteurs classés endocochléaires
ou normaux, on obtient les résultats suivants (Tableau III.4).

Classe Réelle

Rétrocochléaire Endocochléaire Normal


Classe donnée
Parla structure proposée
Rétrocochléaire 22 2 9
Endocochléaire 12 76 4
Normal 4 5 79
Tableau III. 4 - Résultats de classification des PEA par la structure hybride RBF/LVQ+Seuillage

Concernant les réseaux, on peut noter que la base d’ apprentissage a été correctement
apprise. Ainsi, le taux de classification correcte obtenu grâce à cette structure est de 83,1%
pour la globalité de la base de données avec un taux de classification correcte de :
• 57,9% pour la classe rétrocochléaire,
• 91,6% pour la classe endocochléaire,
• 85,9% pour la classe normale.

3
On peut remarquer que, pour un nombre plus important de neurones cachés, le nombre d' erreurs
commises en phase de généralisation varie peu (89 à 90 erreurs commises). En effet, le nombre de neurones
cachés du LVQ peut être vu comme le nombre de sous-classes qu' on peut dénombrer au sein du problème
[MATL]. L' augmentation du nombre de neurones cachés, et donc de sous-classes, ne modifie donc pas, ou peu le
comportement du réseau.

85
Nous avons ensuite mis en œ uvre la même structure, mais en injectant la perte auditive
au niveau du décideur LVQ. Ce dernier comprend maintenant 4 neurones d'
entrée (3 neurones
prenant en compte la sortie du réseau RBF + 1 pour la perte auditive normalisée).
L'
architecture de la structure mise en œ uvre est présentée figure III.7.

Module de décision

PEM Etape
Règles
de RBF LVQ Logiques
Perte Auditive Prétraitement

Seuil Auditif Perte Auditive Normalisée

Figure III. 7 – Structure hybride RBF/LVQ+Seuillage prenant en compte la perte auditive

Pour choisir la structure du réseau RBF, nous nous sommes appuyés sur les résultats
précédents. Nous avons donc choisi sc = 7,7. Le réseau LVQ ayant désormais un rôle de
décision et prenant en compte des informations différentes, nous avons donc entrepris de
rechercher le nombre de neurones pour obtenir la structure adéquate. Comme précédemment,
nous avons fait varier le nombre de neurones cachés de 2 à 100 et les résultats obtenus en
sortie du réseau LVQ sont présentés figure III.8.
On atteint un nombre minimal d'
erreurs (81 erreurs) pour un réseau comportant 18
neurones cachés4.
La répartition de ces erreurs au sein des trois classes est donnée par le tableau III.5.

4
Pour un nombre de neurones plus important, le nombre d' erreurs varie peu. En effet, le nombre de neurones
cachés du LVQ peut être vu comme le nombre de sous-classes qu' on peut dénombrer au sein du problème
[MATL]. L' augmentation du nombre de neurones cachés, et donc de sous-classes, ne modifie donc pas, ou peu le
comportement du réseau.

86
Figure III. 8 - Evolution de l'erreur commise en phase de généralisation en fonction du nombre de
neurones du réseau LVQ pour la structure hybride RBF/LVQ prenant en compte la perte auditive

Classe Réelle

Rétrocochléaire Endocochléaire Normal


Classe donnée
Parla structure proposée
Rétrocochléaire 22 2 8
Endocochléaire 12 50 24
Normal 4 31 60
Tableau III. 5 - Résultats de classification des PEA par la structure hybride RBF/LVQ prenant en compte
la perte auditive

Classe Réelle

Rétrocochléaire Endocochléaire Normal


Classe donnée
Parla structure proposée
Rétrocochléaire 22 1 7
Endocochléaire 13 76 4
Normal 3 6 81
Tableau III. 6 - Résultats de classification des PEA par la structure hybride RBF/LVQ+Seuillage prenant
en compte la perte auditive

87
En tenant compte maintenant du seuil auditif pour les vecteurs classés endocochléaires
ou normaux, on obtient un taux de classification optimal (34 erreurs commises) pour un
nombre de neurones égal à 495. La répartition des erreurs au sein des trois classes est donnée
dans le tableau suivant (Tableau III.6).
Concernant les réseaux, on peut noter que la base d’ apprentissage a été correctement
apprise. Ainsi, le taux de classification correcte obtenu grâce à cette structure est de 84% pour
la globalité de la base de données avec un taux de classification correcte de :
• 57,9% pour la classe rétrocochléaire,
• 91,6% pour la classe endocochléaire,
• 88% pour la classe normale.

On peut remarquer que la prise en compte de l'


information "perte auditive" n'
améliore
que très peu les performances de la structure proposée.

% & "(% +) *

Nous avons ensuite repris la même structure en remplaçant le réseau LVQ par un
réseau de type Back-Propagation, présenté au Chapitre II.2.2.4. Comme précédemment, le
réseau RBF effectue une cartographie de l’ espace d’ entrée en associant un ensemble de
‘catégories’ à un ensemble de ‘zones’ de l’ espace d’ entrée. Le réseau BP va quant à lui, jouer
le rôle d'
un expert. La structure proposée est représentée figure III.9.

Module de décision

PEM Etape Règles


de RBF BP Logiques
Prétraitement
Seuil Auditif

Figure III. 9 - Structure hybride RBF/BP+Seuillage

Comme précédemment, pour choisir la structure du réseau RBF, nous nous sommes
appuyés sur les résultats précédents. Nous avons donc choisi sc = 7,7. Concernant le réseau

5
Cette différence s'
explique par la répartition différente des erreurs au sein des trois classes pour les deux
réseaux LVQ. En effet, même si le nombre d' erreurs commises par un réseau LVQ à 49 neurones cachés est le
même que celui obtenu avec une réseau à 18 neurones cachés, la répartition des erreurs au sein des classes 2
(endocochléaire) et 3 (Normale) va permettre au module de seuillage par le seuil auditif de "corriger" un plus
grand nombre d' erreurs que dans le cas du LVQ à 18 neurones cachés.

88
BP, nous avons choisi un réseau à une seule couche cachée et nous avons entrepris de
rechercher le nombre de neurones de cette couche pour obtenir la structure adéquate. Comme
précédemment, nous avons fait varier le nombre de neurones cachés de 2 à 100. Le seuil de
l'
erreur est fixé à 0,02 et le pas d'
apprentissage à 0,005. Les résultats obtenus en sortie du
réseau BP sont présentés figure III.10.

Figure III. 10 - Evolution de l'erreur commise en phase de généralisation en fonction du nombre de


neurones du réseau BP pour la structure hybride RBF/BP
On atteint un nombre minimal d'
erreurs (84 erreurs) pour un réseau comportant 19
neurones cachés. La répartition de ces erreurs au sein des trois classes est donnée par le
tableau III.7.

Classe Réelle

Rétrocochléaire Endocochléaire Normal


Classe donnée
Parla structure proposée
Rétrocochléaire 21 5 5
Endocochléaire 10 40 19
Normal 7 38 68
Tableau III. 7 - Résultats de classification des PEA par la structure hybride RBF/BP

89
En tenant compte maintenant du seuil auditif pour les vecteurs classés endocochléaires
ou normaux, on obtient un taux de classification optimal (35 erreurs commises) pour un
nombre de neurones égal à 156. La répartition des erreurs au sein des trois classes est donnée
dans le tableau suivant (Tableau III.8).

Classe Réelle

Rétrocochléaire Endocochléaire Normal


Classe donnée
Parla structure proposée
Rétrocochléaire 22 2 7
Endocochléaire 14 75 4
Normal 2 6 81
Tableau III. 8 - Résultats de classification des PEA par la structure hybride RBF/BP+Seuillage

Concernant les réseaux, on peut noter que la base d’ apprentissage a été correctement
apprise. Ainsi, le taux de classification correcte obtenu grâce à cette structure est de 83,6%
pour la globalité de la base de données avec un taux de classification correcte de :
• 57,9% pour la classe rétrocochléaire,
• 90,4% pour la classe endocochléaire,
• 88% pour la classe normale.
Nous avons ensuite mis en œ uvre la même structure, mais en injectant la perte auditive
au niveau du décideur BP. Ce dernier comprend maintenant 4 neurones d'
entrée (3 neurones
prenant en compte la sortie du réseau RBF + 1 pour la perte auditive normalisée).
L'
architecture de la structure mise en œ uvre est présentée figure III.11.

6
Cette différence s'
explique par la répartition différente des erreurs au sein des trois classes pour les
deux réseaux BP. En effet, si le nombre d' erreurs global est peu important pour un réseau BP à 15 neurones
cachés (83 erreurs commises, soit 11 erreurs de plus que le BP à 19 neurones cachés), la répartition des erreurs
au sein des classes 2 (endocochléaire) et 3 (Normale) va permettre au module de seuillage par le seuil auditif de
"corriger" un plus grand nombre d'erreurs que dans le cas du BP à 19 neurones cachés.

90
Module de décision

PEA Etape Règles


de RBF BP Logiques
Perte Auditive Prétraitement

Seuil Auditif Perte Auditive Normalisée

Figure III. 11 - Structure hybride RBF/BP+Seuillage prenant en compte la perte auditive

Pour choisir la structure du réseau RBF, nous nous sommes appuyés sur les résultats
précédents. Nous avons donc choisi sc = 7,7. Le réseau BP prenant désormais en compte des
informations différentes, nous avons donc entrepris de rechercher le nombre de neurones pour
obtenir la structure adéquate. Concernant le réseau BP, nous avons choisi un réseau à une
seule couche cachée et nous avons entrepris de rechercher le nombre de neurones de cette
couche pour obtenir la structure adéquate. Comme précédemment, nous avons fait varier le
nombre de neurones cachés de 2 à 100. Le seuil de l'
erreur est fixé à 0,02 et le pas
d'
apprentissage à 0,005. Les résultats obtenus en sortie du réseau BP sont présentés figure
III.12.
On atteint un nombre minimal d'
erreurs (72 erreurs) pour un réseau comportant 59
neurones cachés. On peut remarquer que la prise en compte de ce paramètre supplémentaire
améliore les performances du réseau décideur BP, contrairement au réseau LVQ. La
répartition de ces erreurs au sein des trois classes est donnée par le tableau III.9.

91
Figure III. 12 - Evolution de l'erreur commise en phase de généralisation en fonction du nombre de
neurones du réseau BP pour la structure hybride RBF/BP tenant compte de la perte auditive

Classe Réelle

Rétrocochléaire Endocochléaire Normal


Classe donnée
Parla structure proposée
Rétrocochléaire 28 12 8
Endocochléaire 6 48 19
Normal 4 23 65
Tableau III. 9 - Résultats de classification des PEA par la structure hybride RBF/BP prenant en compte la
perte auditive
En tenant compte maintenant du seuil auditif pour les vecteurs classés endocochléaires
ou normaux, on obtient un taux de classification optimal (33 erreurs commises) pour un
nombre de neurones égal à 157. La répartition des erreurs au sein des trois classes est donnée
dans le tableau suivant (Tableau III.10).

7
Cette différence s'
explique par la répartition différente des erreurs au sein des trois classes pour les
deux réseaux BP. En effet, si le nombre d'
erreurs global est plus important pour un réseau BP à 15 neurones
cachés (83 erreurs commises, soit 11 erreurs de plus que le BP à 59 neurones cachés), la répartition des erreurs
au sein des classes 2 (endocochléaire) et 3 (Normale) va permettre au module de seuillage par le seuil auditif de
"corriger" un plus grand nombre d'
erreurs que dans le cas du BP à 59 neurones cachés. En revanche, les
performances concernant la classe 1 sont détériorées.

92
Classe Réelle

Rétrocochléaire Endocochléaire Normal


Classe donnée
Parla structure proposée
Rétrocochléaire 23 4 6
Endocochléaire 12 75 4
Normal 3 4 82
Tableau III. 10 - Résultats de classification des PEA par la structure hybride RBF/BP+Seuillage prenant
en compte la perte auditive

Concernant les réseaux, on peut noter que la base d’ apprentissage a été correctement
apprise. Ainsi, le taux de classification correcte obtenu grâce à cette structure est de 84,5%
pour la globalité de la base de données avec un taux de classification correcte de :
• 60,5% pour la classe rétrocochléaire,
• 90,4% pour la classe endocochléaire,
• 89,1% pour la classe normale.

Module de décision

RBF
PEM Etape Règles
de BP Logiques
Prétraitement
LVQ

Seuil Auditif

Figure III. 13 - Structure hybride RBF+LVQ/BP+Seuillage


La structure hybride proposée ici est présentée par la figure III.13. Cette structure
implique deux agents neuronaux, un réseau RBF et un réseau LVQ. Le module de décision
est, quant à lui, composé d'
un réseau à rétropropagation du gradient et du même programme
Matlab que précédemment (programme permettant de prendre en considération le seuil
auditif).
Les bases de données utilisées sont celles déjà présentées au paragraphe II.2.3. Pour la
phase d'
apprentissage de cette structure, nous avons procédé de la manière suivante : nous
avons entraîné les deux réseaux RBF et LVQ indépendament l'
un de l'
autre avec la même

93
base d'
apprentissage. Puis, nous avons présenté les exemples de cette base aux deux réseaux
entraînés. Les sorties ainsi obtenues forment alors la base d'
apprentissage du réseau BP et on
peut donc procéder à l'
apprentissage de ce dernier.

Dans cette structure, les deux réseaux RBF et LVQ jouent le rôle de classifieurs.
Cependant, la nature des informations données par chacun des réseaux est différente. En effet,
le réseau RBF va donner, en sortie, une distance entre le vecteur d'
entrée et les classes
préalablement apprises. Le réseau LVQ, quant à lui, du fait de sa nature compétitive (stratégie
"Winner Takes All"8), va assigner au vecteur d'
entrée une classe. Comme précédemment, le
réseau BP va quant à lui, jouer le rôle d'
un expert. En prenant en compte les deux
informations données par les deux réseaux RBF et LVQ, il va pouvoir ainsi désigner la classe.
La structure proposée peut alors être vue comme une architecture associant un opérateur
décisionnel à deux classifieurs neuronaux donnant deux informations différentes sur la classe
d'
un vecteur d'
entrée.
Comme précédemment, pour choisir les structures des réseaux RBF et LVQ, nous
nous sommes appuyés sur les résultats précédents. Nous avons donc choisi sc = 7,7 et un
nombre de neurones cachés égal à 77 pour le réseau LVQ. Concernant le réseau BP, nous
avons choisi un réseau à une seule couche cachée et nous avons entrepris de rechercher le
nombre de neurones de cette couche pour obtenir la structure adéquate. Comme
précédemment, nous avons fait varier le nombre de neurones cachés de 2 à 100. Le seuil de
l'
erreur est fixé à 0,02 et le pas d'
apprentissage à 0,01. Le programme s'
arrête lorsque l'
erreur
commise lors de l'
apprentissage converge. Les résultats obtenus en sortie du réseau BP sont
présentés figure III.14.

8
Tout au Vainqueur

94
Figure III. 14 - Evolution de l'erreur commise en phase de généralisation en fonction du nombre de
neurones du réseau BP pour la structure hybride RBF+LVQ/BP

On atteint un nombre minimal d'


erreurs (87 erreurs) pour un réseau BP comportant 7
neurones cachés. La répartition de ces erreurs au sein des trois classes est donnée par le
tableau III.11.

Classe Réelle

Rétrocochléaire Endocochléaire Normal


Classe donnée
Par la structure proposée
Rétrocochléaire 26 10 12
Endocochléaire 8 37 17
Normal 4 36 63

Tableau III. 11 - Résultats de classification des PEA par la structure hybride RBF+LVQ/BP

En tenant compte maintenant du seuil auditif pour les vecteurs classés endocochléaires
ou normaux, on obtient un taux de classification optimal (41 erreurs commises) pour un
nombre de neurones égal à 16 (on pourra se référer à la note n°4 pour la justification de la

95
différence observée avec les résultats précédents). La répartition des erreurs au sein des trois
classes est donnée dans le tableau suivant (Tableau III.12).

Classe Réelle

Rétrocochléaire Endocochléaire Normal


Classe donnée
Par la structure proposée
Rétrocochléaire 27 12 9
Endocochléaire 7 65 3
Normal 4 6 80

Tableau III. 12 - Résultats de classification des PEA par la structure hybride RBF+LVQ/BP+Seuillage

Concernant les réseaux, on peut noter que la base d’ apprentissage a été correctement
apprise. Ainsi, le taux de classification correcte obtenu grâce à cette structure est de 80,7%
pour la globalité de la base de données avec un taux de classification correcte de :
• 71% pour la classe rétrocochléaire,
• 78,3% pour la classe endocochléaire,
• 87% pour la classe normale.

Compte tenu des résultats présentés au chapitre II, nous avons appliqué notre approche
hybride neuronale au problème de diagnostic des défaillances d’ un moteur asynchrone.
Dans ce cas, le capteur est l’ accéléromètre mis en œ uvre pour l'
acquisition des
signaux. Dans l’ approche que nous proposons, les signaux dont on fait l’ acquisition sont
directement traités par les structures neuronales, sans traitement préalable.
Plusieurs approches ont été envisagées, mettant en jeu différents agents neuronaux et
structures de décision. Celles-ci sont présentées ci-après ainsi que les résultats obtenus pour

96
les bases de données 2, 3 ainsi que celle concernant l’ apparition du défaut progressif de
roulement.
Les structures hybrides que nous avons mises en œ uvre sont des structures du type :
RNA/Module de décision neuronal9, dont le principe est rappelé figure III.15.

Accélération Etape Module de


de RNA Décision
Prétraitement Neuronal

Figure III. 15 – Structure Hybride RNA/Module de décision neuronal

Deux modules de décision ont été exploités : l’ un impliquant un réseau LVQ, l’ autre
un réseau à rétropropagation du gradient. Dans les deux cas, un seul agent neuronal est
utilisé : un réseau RBF. Ce choix tient compte des résultats de classification obtenus et
présentés au chapitre II.

- . % & "# $
La première structure hybride proposée pour le problème du diagnostic de défaillance
d'
un moteur asynchrone est présentée par la figure III.16. Cette structure n'
implique donc
qu'
un seul agent neuronal, un réseau RBF. Le module de décision est, quant à lui, composé
d'
un réseau LVQ.

Module de décision

Accélération Etape
de RBF LVQ
Prétraitement

Figure III. 16 - Structure hybride RBF/LVQ

9
Rappel : Les structures hybrides sont désignées de la manière suivante : Structure Hybride [Agents
Neuronaux]/[Structure de Décision].

97
Comme dans le cas de l’ application bio-médicale, l'
objectif visé ici est le suivant :
dans un premier temps, nous voulons obtenir une "mesure de ressemblance" du signal
considéré par rapport aux différentes classes définies. Puis, dans un second temps, un module
de décision doit permettre de déterminer l'
appartenance de ce signal à une des classes. Le
réseau RBF a pour but de fournir la "mesure de ressemblance". Le réseau LVQ, quant à lui,
compose un étage de décision-classification.

- % & "# $

Comme précédemment, nous avons cherché à optimiser la structure proposée. Nous


avons ici fait varier à la fois le rayon de la zone d’ influence (paramètre sc) de 1 à 50 avec un
pas de 1 pour le réseau RBF et le nombre de neurones de la couche cachée de 6 à 100 pour le
réseau LVQ du module de décision. Les résultats obtenus sont présentés figure III.17.

Nombre d'erreurs commises


Réseau RBF-LVQ - Base de données 2

Classe Normal
Classe "Balourd"
Classe "Défaut de Roulement"
600 Résultats Globaux

500

400

300

200

100

0
50

40
95 100
85
Val 30
75
eu r 65
d du r
zon e ayo 20 55
e d' l a n 45
inf lu 10 35
nes (LVQ)
enc 25
euro
e (P 0
15
b re de n e cachée
aram 5
Nom la couch
ètre
S c) dans

Figure III. 17 - Evolution de l'erreur commise en phase de généralisation en fonction de la valeur du


paramètre sc et du nombre de neurones cachés du réseau LVQ pour la structure hybride RBF/LVQ (base
de données 2)

98
On peut remarquer qu’ on obtient les meilleures performances – soit un taux de
classification correcte de 63,4% - pour une valeur du paramètre sc égale à 3 pour le réseau
RBF et un nombre de neurones dans la couche cachée du réseau LVQ égal à 13. Dans ce cas,
les résultats obtenus pour chacune des classes sont présentés dans le tableau III.13.

Classe Réelle

Normal Balourd Défaut de Roulement


Classe donnée
Par la structure
RBF/LVQ
Normal 168 26 0
Balourd 150 285 167
Défaut de Roulement 0 7 151

Tableau III. 13 - Résultats relatifs à la structure RBF/LVQ (Base de données 2)

Le taux de classification correcte obtenu grâce à cette structure est donc de 63,4%,
avec un taux de classification correcte de :
• 52,8% pour la classe normale
• 89,6% pour la classe Balourd
• 47,5% pour la classe Défaut de Roulement
On ne peut ainsi remarquer, en comparant ces résultats à ceux obtenus avec un réseau
RBF seul, aucune amélioration des performances globales (seuls 63,1% des signaux étaient
correctement classés par un RBF seul). On peut aussi noter que la variation du nombre de
neurones dans la couche cachée du LVQ a peu d'
influence sur le comportement global de la
structure, pour un réseau RBF donné.

- % & "# $

, -

Nous avons procédé de la même manière que précédemment et recherché la structure


optimale RBF/LVQ, mais avec notre base de données 3, en faisant varier le paramètre sc du
réseau RBF et le nombre de neurones de la couche cachée du réseau LVQ. Les résultats
obtenus sont présentés figure III.18.

99
Nombre d'erreurs Commises
Réseau RBF-LVQ - Base de données 3
Classe "Balourd"
Classe "Roulement"
Classe Normale
Résultats Globaux

400

350
erreurs commises

300

250

200
Nombre d'

150

100

100
50
80
s
ne )
uro VQ
0 60
50
45 40
e
N (L
40 de ée
Val eur d 35
u Rayon
30
25 20 b re ach
de la 20 m c
No uche
15
10
5 0
zone d' influence
0
co
(Paramè la
tre Sc) ns
da

Figure III. 18 - Evolution de l'erreur commise en phase de généralisation en fonction de la valeur du


paramètre sc et du nombre de neurones cachés du réseau LVQ pour la structure hybride RBF/LVQ (base
de données 3)

On peut remarquer qu’ on obtient les meilleures performances – soit un taux de


classification correcte de 86,7% - pour une valeur du paramètre sc égale à 2 pour le réseau
RBF et un nombre de neurones dans la couche cachée du réseau LVQ égal à 84. Dans ce cas,
les résultats obtenus pour chacune des classes sont présentés dans le tableau III.14.

Classe Réelle

Normal Balourd Défaut de Roulement


Classe donnée
Par la structure
RBF/LVQ
Normal 268 26 0
Balourd 50 257 16
Défaut de Roulement 0 35 302

Tableau III. 14 - Résultats relatifs à la structure RBF/LVQ (Base de données 3)

100
Le taux de classification correcte obtenu grâce à cette structure est donc de 86,7%,
avec un taux de classification correcte de :
• 84,3% pour la classe normale
• 80,8% pour la classe Balourd
• 95% pour la classe Défaut de Roulement

On peut ainsi remarquer, en comparant ces résultats à ceux obtenus avec un réseau
RBF seul, qu'
aucune amélioration des performances globales n'
est observable (86,3% des
signaux étaient correctement classés par un RBF seul).

- - % & "# $

/ 0 0

Comme dans les cas précédents, nous avons mis en oeuvre la structure hybride
RBF/LVQ pour la détection d'
un défaut de roulement progressif. Compte tenu des résultats
précédents obtenus avec un réseau de neurones unique, qui, rappelons-le, étaient très
insuffisants, nous avons effectué une première étude de faisabilité. Pour cela, nous avons
choisi un réseau RBF dont le paramètre sc est fixé à 16 et nous avons fait varier le nombre de
neurones cachés du réseau LVQ de 6 à 100. Les résultats obtenus sont présentés figure III.19.
On peut alors remarquer que, quelle que soit la structure du réseau LVQ employé, le
pourcentage de classification correcte reste stable autour de 31%. Les résultats obtenus
précédemment par l'
utilisation du même réseau RBF mais utilisé seul étaient alors de 34%.
L'
utilisation du réseau LVQ comme module de décision ne permet donc pas d'
améliorer les
résultats du réseau RBF seul, dans le cadre de ce problème complexe

101
Figure III. 19 – Evolution du pourcentage de classification correcte en fonction du nombre de neurones
cachés du LVQ (Structure RBF/LVQ avec sc = 16)

- . % & "% +

Module de décision

Accélération Etape
de RBF BP
Prétraitement

Figure III. 20 - Structure hybride RBF/BP


La seconde structure hybride proposée pour le problème du diagnostic de défaillance
d'
un moteur asynchrone est présentée par la figure III.20. Comme précédemment, cette
structure n'
implique qu'
un seul agent neuronal, un réseau RBF, qui va effectuer une
cartographie de l’ espace d’ entrée en associant un ensemble de ‘catégories’ à un ensemble de

102
‘zones’ de l’ espace d’ entrée. Le module de décision est, quant à lui, composé d'
un réseau BP
qui jouera le rôle d'
un expert.

- % & "% +

Comme précédemment, nous avons cherché à optimiser la structure proposée. Nous


avons ici fait varier à la fois le rayon de la zone d’ influence (paramètre sc) de 1 à 30 avec un
pas de 1 pour le réseau RBF et le nombre de neurones de la couche cachée de 1 à 100 pour le
réseau BP du module de décision.
On obtient les meilleures performances – soit un taux de classification correcte de
81,1% - pour une valeur du paramètre sc égale à 10 pour le réseau RBF et un nombre de
neurones dans la couche cachée du réseau BP égal à 35. Dans ce cas, les résultats obtenus
pour chacune des classes sont présentés dans le tableau III.15.

Classe Réelle

Normal Balourd Défaut de Roulement


Classe donnée
Par la structure
RBF/LVQ
Normal 268 37 0
Balourd 50 241 53
Défaut de Roulement 0 40 265

Tableau III. 15 - Résultats relatifs à la structure RBF/BP (Base de données 2)


Le taux de classification correcte obtenu grâce à cette structure est donc de 81,1%,
avec un taux de classification correcte de :
• 84,3% pour la classe normale
• 75,8% pour la classe Balourd
• 81,3% pour la classe Défaut de Roulement
On peut ainsi remarquer, en comparant ces résultats à ceux obtenus avec un réseau
RBF seul, une amélioration des performances globales (seuls 63,1% des signaux étaient
correctement classés par un RBF seul). A l'
inverse des résultats observés pour la structure
RBF/LVQ, on peut noter que l'
utilisation du réseau à rétropropagation du gradient comme

103
décideur permet d'
améliorer la reconnaissance des classes "Normale" et "Défaut de
Roulement", alors que la reconnaissance des défauts de type "Balourd" se dégrade.

- % & "% +

, -

Nous avons procédé de la même manière que précédemment et recherché la structure


optimale RBF/BP, mais avec notre base de données 3, en faisant varier le paramètre sc du
réseau RBF et le nombre de neurones de la couche cachée du réseau BP.
On obtient dans ce cas les meilleures performances – soit un taux de classification
correcte de 98,5% - pour une valeur du paramètre sc égale à 3 pour le réseau RBF et un
nombre de neurones dans la couche cachée du réseau BP égal à 15 neurones. Dans ce cas, les
résultats obtenus pour chacune des classes sont présentés dans le tableau III.16.

Classe Réelle

Normal Balourd Défaut de Roulement


Classe donnée
Par la structure
RBF/LVQ
Normal 314 4 0
Balourd 4 309 1
Défaut de Roulement 0 5 317

Tableau III. 16 - Résultats relatifs à la structure RBF/BP (Base de données 3)

Le taux de classification correcte obtenu grâce à cette structure est donc de 98,5%,
avec un taux de classification correcte de :
• 98,7% pour la classe normale
• 97,2% pour la classe Balourd
• 99,7% pour la classe Défaut de Roulement

On peut ainsi remarquer, en comparant ces résultats à ceux obtenus avec un réseau
RBF seul, une nette amélioration des performances (86,3% des signaux étaient correctement
classés par un RBF seul).

104
- - % & "% +

/ 0 0

Comme précédemment, nous avons appliqué cette structure RBF/BP au problème de


détection de l'
apparition d'
un défaut de roulement progressif. En s'
appuyant sur les résultats
obtenus par la mise en œ uvre d'
un réseau RBF seul (II.3.3.4.2), nous avons décidé de faire
varier le paramètre sc entre 6 et 15, le comportement du réseau RBF devenant quasi-aléatoire
au-delà. Concernant le réseau BP, le nombre de neurones dans la couche cachée varie de 2
à10. Les résultats obtenus sont présentés figure III.21.

Roulement progressif - Pourcentage de Classification correcte Roulement progressif - Pourcentage de Classification correcte
100 RBF (Sc=6) / BP 100 RBF (Sc=7) / BP

90 90

Classe Normal

Pourcentage de classification correcte


Pourcentage de classification correcte

80 80 Classe "Défaut de Roulement"


Résultats Globaux
70
70 Résultats RBF seul
Classe Normal
Classe "Défaut de Roulement" 60
60
Résultats Globaux
Résultats RBF seul 50
50

40
40

30
30

20
20

10
10

0
1 2 3 4 5 6 7 8 9
0
1 2 3 4 5 6 7 8 9 Nombre de Neurones dans le couche cachée du BP
Nombre de Neurones dans le couche cachée du BP
Roulement progressif - Pourcentage de Classification correcte
Roulement progressif - Pourcentage de Classification correcte 100 RBF (Sc=9) / BP
100 RBF (Sc=8) / BP
90

90
Pourcentage de classification correcte

80
Pourcentage de classification correcte

80

Classe Normal 70
Classe Normal
Classe "Défaut de Roulement" Classe "Défaut de Roulement"
70
Résultats Globaux 60
Résultats Globaux
Résultats RBF seul Résultats RBF seul
60
50

50
40

40
30

30
20

20
10

10
0
1 2 3 4 5 6 7 8 9
0
1 2 3 4 5 6 7 8 9 Nombre de Neurones dans le couche cachée du BP
Nombre de Neurones dans le couche cachée du BP
Roulement progressif - Pourcentage de Classification correcte
Roulement progressif - Pourcentage de Classification correcte 100 RBF (Sc=11) / BP
90 RBF (Sc=10) / BP
90
Pourcentage de classification correcte

80
80
Pourcentage de classification correcte

70 70
Classe Normal
Classe "Défaut de Roulement"
Classe Normal 60 Résultats Globaux
60
Classe "Défaut de Roulement" Résultats RBF seul
Résultats Globaux 50

50 Résultats RBF seul


40

40
30

30 20

10
20

0
1 2 3 4 5 6 7 8 9
10
1 2 3 4 5 6 7 8 9 Nombre de Neurones dans le couche cachée du BP
Nombre de Neurones dans le couche cachée du BP

105
Roulement progressif - Pourcentage de Classification correcte Roulement progressif - Pourcentage de Classification correcte
100 RBF (Sc=12) / BP 100 RBF (Sc=13) / BP

90 90

Pourcentage de classification correcte


Pourcentage de classification correcte
80 80

Classe Normal
70 Classe Normal 70 Classe "Défaut de Roulement"
Classe "Défaut de Roulement" Résultats Globaux
60 Résultats Globaux 60 Résultats RBF seul
Résultats RBF seul
50 50

40 40

30 30

20 20

10 10

0 0
1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9

Nombre de Neurones dans le couche cachée du BP Nombre de Neurones dans le couche cachée du BP

Roulement progressif - Pourcentage de Classification correcte Roulement progressif - Pourcentage de Classification correcte
RBF (Sc=14) / BP RBF (Sc=15) / BP
100 100

90 90
Pourcentage de classification correcte

Pourcentage de classification correcte


80
80

70

Classe Normal 70

Classe "Défaut de Roulement" Classe Normal


60
Résultats Globaux 60
Classe "Défaut de Roulement"
Résultats RBF seul Résultats Globaux
50
Résultats RBF seul
50
40

40
30

30
20

10 20

0 10
1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9

Nombre de Neurones dans le couche cachée du BP Nombre de Neurones dans le couche cachée du BP

Figure III. 21 – Evolution du pourcentage de classification correcte en fonction du nombre de neurones


dans la couche cachée du réseau BP pour différentes valeurs du paramètre sc du réseau RBF (Structure
hybride RBF/BP).

Sur ces différentes courbes, nous avons aussi tracé les résultats globaux obtenus par le
réseau RBF seul. On peut ainsi remarquer qu'
à nouveau, la structure hybride ne permet pas
d'
obtenir les améliorations escomptées. De plus, lorsqu'
on peut observer une amélioration du
pourcentage global de classification correcte (par exemple, pour sc égal à 11), on note une
inversion dans la reconnaissance des classes. Cette tendance est probablement lié au
comportement quasi-aléatoire du réseau RBF déjà observé au chapitre précédent.

Compte tenu des résultats obtenus par l'


une et l'
autre des structures hybrides
RNA/module de décision neuronale dans le cadre de la détection d'
un défaut progressif, il
apparaît clairement que la configuration employée (une seule signature, pas de prétraitement)
ne permet pas de résoudre ce problème complexe. On peut alors envisager plusieurs
perspectives pour améliorer ces performances : tout d'
abord, compte tenu de la complexité du
problème, on peut imaginer que l'
utilisation de l'
accélération comme seule signature n'
est pas
suffisante pour caractériser le fonctionnement de la machine tournante. Une solution pourrait
alors être l'
utilisation d'
autres informations, voire, une extraction d'
informations pertinentes du
signal d'
accélération par d'
autres techniques, comme le traitement par ondelettes.

106
Concernant le comportement des réseaux de neurones artificiels, nous avons déjà pu
noter, au chapitre II, un fonctionnement quasi-aléatoire du réseau RBF, et envisager un
apprentissage avec zone d'
influence variable. Une des perspectives de travail serait alors la
mise en œ uvre d'
une structure hybride RNAs/Module de décision neuronale présentée figure
III.22.

RBF
(Classe
Normale)

RBF
(Défaut
Niveau1)

Etape RBF
Accélération BP
de (Défaut
Prétraitement Niveau2)

RBF
(Défaut
Niveau3)

RBF
(Défaut
Niveau4)

Figure III. 22 - Perspectives : Structure Hybride de type RNAs/Module de décision neuronal pour la
détection de défaut progressif

Dans une telle structure, chacun des réseaux RBF serait dédié à la reconnaissance d'
un
niveau de défaut. Lors de la présentation d'
un vecteur, chacun des réseaux va donner en sortie
une probabilité d'
appartenance à la classe pour laquelle il est spécialisé. Le réseau décideur
(un réseau BP par exemple) devra ensuite, à partir de toutes les informations délivrées par les
réseaux spécialistes, désigner la classe correspondante.

1 2
Dans ce chapitre, nous avons appliqué la structure neuronale hybride multi-modèle
pour l'
aide au diagnostic présentée au chapitre I. Partant en effet du constat que les structures
neuronales simples ne permettaient pas d'
obtenir des performances suffisantes pour la

107
réalisation d'
un outil d'
aide au diagnostic (cf. résultats su chapitre II), nous avons alors
construit une structure plus complexe, pouvant s'
adapter à une plus large variété de domaines
d'
application.
Nous avons appliqué cette stratégie aux problématiques exposées dans le chapitre II.
Concernant le problème biomédical, plusieurs variantes ont ainsi été mises en œ uvre. Leur
philosophie reste cependant la même : plusieurs informations sont utilisées: le PEM, obtenu
grâce au dispositif médical présenté Figure II.15, la perte auditive, extraite du dossier du
patient et le seuil auditif, estimé grâce à l'
audiogramme et à l'
information "perte auditive". Le
PEM est ensuite prétraité (troncature+normalisation) et est présenté à un agent neuronal
(réseau RBF et/ou réseau LVQ) dont le rôle est de classer ces signaux. Les réponses des
agents neuronaux sont ensuite présentées au module de décision. Différents modules de
décision ont alors été mis en œ uvre : si tous comportent une étape de seuillage pour la prise en
compte du seuil auditif, l'
implication ou non d'
un autre réseau de neurones et la prise en
compte ou non de la perte auditive font leur différence. Lorsque le module de décision fait
intervenir un réseau de neurones, nous avons choisi d'
utiliser les réseaux LVQ et BP. En effet,
même si le réseau LVQ est un réseau dédié à la classification, la nature compétitive de sa
stratégie autorise son utilisation en tant qu'
opérateur de '
décision-classification'
. Son
utilisation dans la structure hybride RBF/LVQ+Seuillage doit permettre, à partir de la mesure
de ressemblance à chacune des classes fournie par le RBF, et, éventuellement de la perte
auditive, de désigner la classe correspondante. Concernant le réseau BP, ce dernier va, à partir
des informations de classification fournies par le ou les agents neuronaux (RBF dans le cas de
la structure hybride RBF/BP+Seuillage, RBF et LVQ dans le cas de la structure hybride
RBF+LVQ/BP+Seuillage) et, éventuellement, la perte auditive, jouer le rôle d'
un expert.
On peut alors noter une amélioration conséquente des performances par rapport aux
structures simples. Alors qu'
un réseau LVQ seul permettait de classer correctement 56,8% des
vecteurs de notre base de données, la mise en œ uvre de notre structure LVQ/Seuillage permet
d'
atteindre 80,7% de classification. De la même manière, si un réseau RBF seul ne permettait
de classer correctement que 59,1% des vecteurs de notre base de données, on atteint des taux
de classification correcte de:
• 77,5% dans le cas de la structure hybride RBF/Seuillage,
• 83,1% dans le cas de la structure hybride RBF/LVQ+Seuillage et 84% avec prise
en compte de la perte auditive
• 83,6% dans le cas de la structure hybride RBF/BP+Seuillage et 84,5% avec prise
en compte de la perte auditive.

108
Enfin, la mise en œ uvre de la structure hybride RBF+LVQ/BP+Seuillage permet
d'
obtenir un taux de classification correcte de 80,7%, avec un taux de reconnaissance
équilibré pour chacune des trois classes.
On peut donc constater que :
• la prise en compte du seuil auditif dans le module de décision permet une
amélioration notable des résultats, en reclassant les vecteurs de type
endocochléaire et de type normal,
• la prise en compte de la perte auditive au niveau du réseau de neurones dans le
cadre d'
un module de décision hybride (RNA+Seuillage) permet la prise en compte
de ce paramètre utilisé par les médecins pour la catégorisation des patients
souffrant d'
une atteinte endocochléaire et ayant une audition normale et ainsi,
d'
améliorer les résultats de classification concernant ces deux classes. En revanche,
la prise en compte de ce paramètre ne permet pas d'
obtenir une meilleure
reconnaissance de la classe 1 (patients souffrant d'
une atteinte de type
rétrocochléaire).
La préférence d'
une structure par rapport à une autre n'
est donc pas simple à obtenir. Il
faut savoir s'
il est primordial d'
obtenir un taux de classification optimal – dans ce cas, le choix
se porterait sur la structure hybride RBF/BP+Seuillage - ou si on préfère avoir une
reconnaissance correcte et "équilibrée" pour chacune des classes – dans ce cas, le choix se
porterait sur la structure hybride RBF+LVQ/BP+Seuillage. L'
ajout d'
un indice de confiance
sur le résultat pourrait alors permettre de trancher. Le médecin saurait alors quel crédit
accorder à la réponse donnée par l'
outil d'
aide au diagnostic.
Concernant le volet industriel – rappelons qu'
il s'
agit de détecter des défaillances d'
un
moteur asynchrone – la mise en œ uvre des structures hybrides proposées permet dans de
nombreux cas, d'
observer une amélioration des résultats de classification par rapport aux
techniques neuronales simples. Deux structures, du type RNA/Décision neuronale ont ainsi
été proposées. Toutes les deux ne comprennent qu'
un seul agent neuronal, le réseau RBF. Le
module de décision neuronal est constitué, quant à lui, d'
un réseau LVQ dans un cas, et d'
un
réseau à rétropropagation du gradient dans l'
autre cas. Ces deux structures ont été mises en
œ uvre pour les bases de données 2 et 310 présentées au chapitre II.3.2 ainsi que pour essayer

10
Base de données 2 :
• Base d' apprentissage : Signaux callés sur le Top Tour
• Base de généralisation : Signaux "Fenêtre Glissante"
Base de données 3 : Signaux "Fenêtre Glissante" (base d'
apprentissage et de généralisation).

109
de détecter l'
apparition d'
un défaut progressif survenant sur un roulement à billes. Dans le cas
d'
un module de décision neuronal de type LVQ, les améliorations observées sont peu
significatives. En revanche, on observe une nette amélioration des performances par rapport
aux résultats obtenus avec un réseau RBF seul dans le cas d'
un module de décision de type
BP. Ainsi, lors de l'
exploitation de la base de données 2, si le réseau RBF seul permettait
d'
obtenir 63,1% de classification correcte, l'
utilisation des structures hybrides permet
d'
atteindre :
• 63,4% de classification correcte pour la structure RBF/LVQ
• 81,1% de classification correcte pour la structure RBF/BP
Dans le cadre de l'
exploitation de la base de données 3, si le réseau RBF seul
permettait d'
atteindre 86,3% de classification correcte, on atteint des taux de classification
correcte de :
• 86,7% pour la structure RBF/LVQ
• 98,5% pour la structure RBF/BP
En revanche, lorsqu'
il s'
agit de détecter l'
apparition progressive d'
un défaut, les
résultats donnés par les structures RNA/Module de décision neuronal restent très insuffisants.
Dans le cas de ce problème complexe, l'
architecture proposée ne permet pas une
discrimination correcte des classes. Rappelons que le réseau utilisé pour la classification est
un réseau RBF pour lequel le rayon des zones d'
influence des neurones cachés est fixe. Il
semble judicieux alors d'
envisager un rayon différent pour chacune des classes. Une
architecture à envisager pour améliorer les performances de la structure hybride
RNAs/Module de décision neuronale (figure III.22) où chacun des réseaux RBF utilisés serait
dédié à la reconnaissance d'
une et une seule classe (normale, défaut de roulement niveau 1,
défaut de roulement niveau 2… .). Le module de décision neuronal devra alors, à partir des
informations données par chacun des réseaux RBF spécialisés (rappelons que le RBF donne
une distance à une classe) désigner la classe correspondante.
De plus, compte tenu de la complexité du problème abordé, il est aussi envisageable
que l'
utilisation de l'
accélération comme seule signature caractérisant le fonctionnement du
système ne soit pas suffisante. Il convient alors d'
envisager l'
utilisation d'
informations
provenant d'
autres capteurs et/ou le prétraitement de ces signatures par d'
autres techniques
afin d'
extraire des caractéristiques pertinentes à présenter aux agents neuronaux constituant la
structure hybride.

110
Cependant, la structure neuronale hybride que nous proposons permet une
amélioration des résultats par rapport aux techniques neuronales simples dans la majorité des
cas présentés. De plus, elle est adaptée aux problèmes d'
aide au diagnostic, et ce, quelque soit
le domaine abordé, qu'
il soit industriel ou médical.

111
Chapitre III. ..............................................................................................................77
Vers des techniques neuronales hybrides...................................................................77
III.1. Introduction...................................................................................................77
III.2. Validation de la structure neuronale hybride proposée : Application au
problème d'
aide au diagnostic biomédical.............................................................................78
III.2.1. Structures n'
impliquant qu'
un seul agent neuronal ..................................79
III.2.1.1. Structures hybrides RNA/Seuillage ..................................................79
III.2.1.1.1. Structure hybride LVQ/Seuillage...............................................80
III.2.1.1.2. Structure hybride RBF/Seuillage ...............................................81
III.2.1.2. Structures hybrides RNA/Module de décision neuronal....................83
III.2.1.2.1. Structure hybride RBF/(LVQ+Seuillage)...................................83
III.2.1.2.2. Structure hybride RBF/(BP+Seuillage)......................................88
III.2.2. Structure hybride impliquant 2 agents neuronaux...................................93
III.3. Validation de la structure neuronale hybride proposée :Application au
problème d'
aide au diagnostic industriel ...............................................................................96
III.3.1. Structure Hybride RBF/LVQ .................................................................97
III.3.1.1. Application de la structure hybride RBF/LVQ : exploitation de la base
de données 2 98
III.3.1.2. Application de la structure hybride RBF/LVQ : exploitation de la base
de données 3 99
III.3.1.3. Application de la structure hybride RBF/LVQ : Détection de
l'
apparition d'
un défaut progressif ...............................................................................101
III.3.2. Structure Hybride RBF/BP ..................................................................102
III.3.2.1. Application de la structure hybride RBF/BP : exploitation de la base
de données 2 103
III.3.2.2. Application de la structure hybride RBF/BP : exploitation de la base
de données 3 104
III.3.2.3. Application de la structure hybride RBF/LVQ : Détection de
l'
apparition d'
un défaut progressif ...............................................................................105
III.4. Conclusion ..................................................................................................107

112
L'
objet de l'
étude que nous venons de présenter concerne le domaine de l'
aide au
diagnostic, qu'
il soit industriel ou médical. Partant du constat que l'
homme est un acteur
incontournable dans l'
activité de diagnostic, nous nous sommes penchés sur le développement
de techniques d'
aide au diagnostic. L'
objectif des travaux présentés dans cette thèse est de
proposer des éléments de réponse au problème d'
intégration des connaissances d'
experts dans
un processus permettant de détecter et de faire le diagnostic d'
un dysfonctionnement. Les
problèmes étudiés relèvent de l'
identification et de la catégorisation des dysfonctionnements.
Pour tenter de les résoudre, nous avons mis en œ uvre des techniques impliquant des structures
neuronales. Deux problématiques ont ainsi été abordées : l'
une relevant du domaine médical et
l'
autre du domaine industriel.
Les différentes techniques employées pour le diagnostic s'
appuient sur l'
existence ou
non d'
un modèle du système à surveiller. Lorsqu'
un modèle peut être obtenu, les méthodes de
diagnostic, encore appelées méthodes internes, ont pour principe de comparer l'
état théorique
du système fournit par le modèle avec son état réel courant donné par les observations. Si on
ne peut pas obtenir de modèle, les techniques mises en œ uvre sont appelées techniques
externes. Parmi celles-ci, on trouve les techniques de reconnaissance des formes, ainsi que les
techniques de l'
intelligence artificielle (systèmes experts et techniques neuromimétiques).
Nous nous sommes intéressés au diagnostic des systèmes pour lesquels on ne dispose pas de
modèle. Dans ce cas, la seule connaissance du système repose alors sur l'
expertise humaine
confortée par un solide retour d'
expériences. Une des tâches principales est alors la
catégorisation des informations issues du système à surveiller, c'
est-à-dire l'
affectation de la
catégorie de défauts à ces informations. Si les techniques de reconnaissance des formes sont
adaptées à ce genre de problème, dans de nombreux cas, cette catégorisation présente de
nombreuses difficultés. Ces difficultés peuvent être dues de la grande ressemblance des

113
informations de classes différentes d'
une part, et, d'
autre part, elles peuvent reposer sur la
grande disparité de ces informations au sein d'
une même classe. Durant les dernières
décennies, des études ont montré que lorsqu'
une approche de diagnostic par reconnaissance
des formes est adoptée, les réseaux de neurones artificiels sont des outils performants pour
réaliser cette catégorisation. Nos efforts se sont donc focalisés sur la mise en œ uvre de
techniques neuronales.

Le premier chapitre a été consacré au diagnostic par des techniques basées sur les
réseaux de neurones artificiels. Nous avons présenté trois modèles neuronaux1 fréquemment
utilisés pour le problème du diagnostic : le réseau à rétropropagation du gradient (ou
BackPropagation), le réseau Learning Vector Quantization et le réseau Radial Basis Function.
Puis, nous avons proposé et présenté la mise en œ uvre d'
une strucutre neuronale hybride pour
le diagnostic des systèmes complexes tels que ceux que nous avons étudiés dans cette thèse.
Cette structure comprend trois niveaux de traitement : tout d'
abord une phase de prétraitement
des informations qui permet d'
extraire les informations pertinentes des données brutes et d'
en
faciliter le traitement par les structures neuronales suivantes. Puis, un ensemble d’ agents
neuronaux, pouvant être d'
un même type (architecture homogène) ou de types différents
(architecture hétérogène), permet la réalisation d'
une classification préliminaire des
informations prétraitées. Enfin, le dernier niveau de traitement est constitué d'
un module de
décision qui fournira un élément de diagnostic. La réalisation de celui-ci peut faire appel à
diverses techniques, telles que des opérations de seuillage, des réseaux de neurones artificiels,
ou des systèmes experts, par exemple.

Dans un deuxième chapitre, nous avons présenté les résultats obtenus par la mise en
œ uvre des réseaux LVQ et RBF pour deux domaines, l'
un biomédical, et l'
autre, industriel. Le
volet biomédical concerne l'
aide au diagnostic de pathologies auditives en utilisant des
signaux caractéristiques : les Potentiels Evoqués Auditifs (PEA). Pour réaliser l'
outil d'
aide au
diagnostic, nous disposions ici d'
une base de données mise à notre disposition par un centre
médical, le CREFON2. Le volet industriel aborde le problème du diagnostic de défaillances

1
Il est important de noter que ces modèles ne doivent pas être considérés comme des solutions concurrentes,
mais comme des systèmes ayant des caractéristiques différentes.
2
Centre de Recherche et d'Exploration Fonctionnelle Oto-Neurologique

114
un moteur asynchrone. La base de données a été réalisée au sein du laboratoire CERTES3 et
d'
nous nous sommes focalisés sur la signature vibratoire donnée par l'
accélération du moteur.
L'
étude a concerné la catégorisation de signaux PEM dans le cas biomédical et
vibratoires dans le cas industriel. Nous nous sommes focalisés sur la mise en œ uvre des
réseaux LVQ et RBF et la recherche des structures adéquates pour le traitement de ces
informations en faisant varier un paramètre caractéristique pour chacun des réseaux : le
nombre de neurones cachés pour le réseau LVQ et la valeur d'
un paramètre caractéristique du
rayon de la zone d'
influence (sc) pour le réseau RBF. Concernant l'
application biomédicale,
les résultats obtenus ont été assez insuffisants puisqu'
on atteint des taux de classification
correcte de 56,2% pour un réseau LVQ comprenant 12 ou 20 neurones cachés et 59,1% pour
un réseau RBF où le paramètre sc vaut 7,5. Ces résultats ont été cependant meilleurs que ceux
obtenus dans le cadre de la mise en œ uvre d'
une approche conventionnelle (modélisation
autorégressive) puisque, dans ce cas, seuls 37% des vecteurs de notre base de données étaient
correctement classés. Concernant l'
application industrielle, plusieurs bases de données ont été
construites pour la mise en œ uvre de ces techniques neuronales simples. Les différences entre
les trois premières bases utilisées concernaient l'
origine des signaux des bases d'
apprentissage
et de généralisation (origine prise au moment du "Top Tour" ou non). La quatrième base
employée devait permettre la détection de l'
apparition d'
un défaut progressif apparaissant sur
un des organes du moteur asynchrone (roulement à billes). Concernant la première base de
données, les signaux des bases d'
apprentissage et de généralisation étaient calés sur le Top
Tour. On a alors obtenu d'
excellents résultats, avec des taux de classification correcte de
95,4% pour un réseau LVQ comprenant 9 neurones cachés et de 100% pour un réseau RBF
où le paramètre sc est compris entre 5 et 7. Nous avons décidé d'
étendre notre étude en
construisant une deuxième base de données pour laquelle l'
origine des signaux de la base de
généralisation n'
était pas forcément en phase avec le Top Tour. Dans ce cas, compte tenu des
résultats précédents, seul le réseau RBF a été mis en oeuvre. Les résultats obtenus étaient
alors assez insuffisants puisqu'
on a atteint un taux de classification correcte de 63,1% pour un
réseau RBF où le paramètre sc valait 21. La troisième base de données comprenait quant à
elle, des signaux dont l'
origine ne dépendait pas de l'
information délivrée par le Top Tour, et
ce, tant pour la base d'
apprentissage que pour la base de généralisation. On a alors obtenu des
taux de classification correcte de 65,7% pour un réseau LVQ comprenant 9 neurones cachés
et de 86,3% pour un réseau RBF où le paramètre sc est égal à 2. Si le réseau LVQ n'
a pas

3
Centre d’ Etudes et de Recherche en Thermique, Environnement et Systèmes

115
permis d'
obtenir des résultats satisfaisants, la mise en œ uvre d'
un réseau RBF pour la
classification de ces signaux a semblé adaptée.
Compte tenu de ces résultats prometteurs, nous avons décidé de détecter l'
apparition
progressive d'
un défaut de roulement sur la machine tournante. Les résultats ont alors été très
insuffisants: le réseau LVQ n'
est pas parvenu à détecter ce défaut, même quand celui-ci est
installé sur la machine. Le même constat a pu être fait pour le réseau RBF.
Les résultats obtenus ont montré que globalement, des structures neuronales simples
ne sont pas suffisantes pour réaliser un outil d'
aide au diagnostic fiable [DUJA 01b], nous
nous sommes alors tournés vers la structure plus complexe, présentée au chapitre I.

Le chapitre III a été consacré à la mise en œ uvre de la structure neuronale hybride


proposée et à son application aux deux problématiques précédentes. Concernant le volet
biomédical, si plusieurs variantes ont été mises en œ uvre, leur principe reste le même :
plusieurs informations sont présentées à la structure : le PEM, le seuil auditif et la perte
auditive dans certains cas. Après prétraitement (normalisation+troncature), le PEM est
présenté aux agents neuronaux (RBF et/ou LVQ) dont le rôle sera de réaliser une première
classification. Les résultats obtenus sont ensuite traités par le module de décision. Différents
modules de décision ont été mis en œ uvre, comportant tous une étape finale de seuillage. Leur
différence repose sur l'
implication ou non d'
un réseau de neurones et de la prise en compte, ou
non de l'
information liée à la perte auditive. Lorsque le module de décision fait intervenir un
réseau de neurones, nous avons choisi d'
utiliser les réseaux LVQ et BP, qui, de par leur nature
peuvent jouer le rôle de décideur. Les résultats que nous avons alors obtenus sont meilleurs
par rapport aux structures simples, puisque les taux de classification correcte varient de 77,5%
pour la structure hybride RBF/Seuillage à 84,5%pour la structure RBF/BP+Seuillage avec
prise en compte de la perte auditive.
De la même manière, concernant le volet industriel, le principe des structures hybrides
mises en œ uvre est le même Dans tous les cas, le module de décision mis en œ uvre est un
réseau de neurones artificiels. Les réseaux LVQ et BP comme précédemment, ont joué le rôle
des décideurs. Si les résultats obtenus grâce à la structure RBF/LVQ ne présentent pas
d'
amélioration significative dans le cas des bases de données 2 et 3 par rapport aux résultats
obtenus par le RBF seul, la mise en œ uvre du réseau BP comme module de décision a permis
d'
améliorer de façon notable les résultats (81,1% des signaux de la base de données 2 sont
correctement reconnus, alors que seuls 63,1% l'
étaient par le RBF seul, et 98,5% des signaux
de la base de données 3 le sont, alors que seuls 86,3% l'
étaient par le RBF seul). En revanche,

116
dans le cadre plus complexe de la détection de défaut progressif, la structure hybride ne
permet pas d'
améliorer les résultats obtenus par un réseau RBF utilisé seul.

Cette structure neuronale hybride est adaptée aux problèmes d'


aide au diagnostic,
qu'
ils soit biomedical ou industriel. Nous avons pu aussi remarquer que plusieurs structures
pouvaient être pertinentes pour l'
aide au diagnostic. Dans le cas de l'
application biomédicale,
par exemple, la préférence d'
une structure par rapport à une autre n'
est pas simple à obtenir. Il
faut savoir s'
il est primordial d'
obtenir un taux de classification optimal – dans ce cas, le choix
se porterait sur la architecture hybride RBF/BP+Seuillage - ou si on préfère avoir une
reconnaissance correcte et "équilibrée" pour chacune des classes – dans ce cas, le choix se
porterait sur l'
architecture hybride RBF+LVQ/BP+Seuillage. On pourrait alors imaginer
l'
ajout d'
un indice de confiance sur le résultat qui pourrait alors permettre au médecin de
savoir quel degré de crédibilité accorder à la réponse fournie par le système et, ainsi de
trancher. Cet indice de confiance aurait aussi tout à fait sa place dans un système d'
aide au
diagnostic industriel. A plus long terme, concernant l'
étude biomédicale, il sera intéressant de
poursuivre l'
approche basée sur l'
analyse de le traitement d'
images, amorcée il y a peu.
Enfin, dans le cadre de la problématique industrielle, et compte tenu des faibles
performances obtenues pour la détection préventive de défaut, plusieurs perspectives sont
envisageables. La mise en œ uvre d'
une structure hybride mettant en jeu un ensemble d'
agents
neuronaux où chacun serait spécialisé dans la reconnaissance d'
une catégorie de
fonctionnement est une piste à explorer. Cette structure a été présentée au chapitre III. De
plus, et compte tenu des remarques précédentes, on peut aussi penser que l'
utilisation d'
une
seule signature pour caractériser le fonctionnement d'
une machine tournante ne soit pas
suffisante. On peut alors imaginer d'
adjoindre à cette information d'
autres signatures, comme
le courant d'
alimentation, pour améliorer les résultats. Rappelons aussi que les signatures
utilisées dans ce cas n'
avaient pas subi de prétraitement visant à extraire des caractéristiques
pertinentes de ces signaux. Utiliser une autre représentation de ces signatures, obtenue, par
exemple, grâce à la transformée en ondelettes, est aussi une perspective à ne pas ignorer.

117
"It is not absolutely necessary to believe that neural network model have anything to
do with the nervous system, but it helps. Because, if they do, we are able to use a large body
of ideas, experiments, and facts from cognitive science and neuroscience to design, construct
and test networks. Otherwise, we would have to suggest functions and mechanism for
intelligent behaviour without any examples of successful operation."1 [ANDE 95]
Le cerveau humain possède une fantastique puissance de traitement de l'
information si
l'
on considère ses capacités à prendre en charge certaines tâches nécessaires pour obtenir un
comportement intelligent. A la base de ce formidable outil, on trouve les neurones. Ce sont les
éléments fonctionnels de base des systèmes nerveux. S'
il existe une grande variété de
neurones (entre 100 et 1 000 pour le cerveau humain) et s'
ils différent beaucoup d'
une espèce
animale à l'
autre, ils possèdent néanmoins le même comportement global.

• Les neurones
L'
accomplissement de tâches par le cerveau est lié à l'
activité électrochimique des
cellules nerveuses. Un neurone est une cellule assurant cinq fonctions spécialisées :

1
"Il n'
est pas absolument nécessaire de croire que les réseaux de neurones artificiels ont un rapport avec le
système nerveux, mais cela aide. Dans ce cas, nous sommes capables d' utiliser beaucoup d'
idées, d'expériences et
de concepts des sciences cognitives et des neurosciences pour modéliser, construire et tester des réseaux. Dans le
cas contraire, il nous faut inventer des fonctions et des mécanismes de comportement intelligent sans aucun
exemple."

124
• recevoir des signaux en provenance des neurones voisins,
• intégrer ces signaux,
• engendrer un influx nerveux,
• le conduire,
• le transmettre à un autre neurone capable de le recevoir.
Il est constitué principalement de trois parties qui, vis-à-vis des transferts
d'
information, ont un rôle fonctionnel bien précis :
• un réseau d'
entrée, les dendrites, qui capte les signaux des autres neurones
ou de l'
extérieur dans le cas des neurones sensoriels,
• un élément de traitement de l'
information, le corps cellulaire, ou soma,
• un réseau de sortie, l'
axone qui achemine l'
impulsion nerveuse vers les
autres neurones.

La connexion des ramifications d'


un axone aux dendrites ou au soma d'
un autre
neurone est appelée synapse. L'
arborisation dendritique des cellules nerveuses, comme la
ramification des axones, varie beaucoup suivant le type de cellule. La longueur des axones
chez l'
être humain peut ainsi aller de quelques dixièmes de millimètre jusqu'
à plus d'
un mètre.
Pour simplifier, nous considérerons que le signal support de l'
information nerveuse est
de nature électrique : l'
influx nerveux est une impulsion électrique et les signaux dendritiques
et somatiques sont des variations de potentiel électrique. Au niveau de la synapse, c'
est-à-dire,
entre deux cellules nerveuses, la transmission se fait le plus souvent par l'
intermédiaire d'
un
médiateur chimique.
Selon les neurobiologistes, le principe de fonctionnement classique simplifié est le
suivant : le soma recueille l'
ensemble des informations collectées par les dendrites, en effectue
une sommation et compare le résultat obtenu à un seuil. Si ce potentiel somatique dépasse ce
seuil, il y a émission d'
un potentiel d'
action ou spike. Ce signal, très bref (1 ms), est alors
transmis sans atténuation le long de l'
axone et réparti sur les synapses des neurones cibles.
L'
information mémorisée est contenue dans les liens synaptiques.
Chaque neurone comporte donc sa propre unité de décision et le seul lien qui unit les
neurones entre eux sert à transmettre des informations. Contrairement à un ensemble
d'
ordinateurs connectés en réseau, il n'
existe aucun signal de synchronisation ou de contrôle.

125
Figure A1. 1 - Neurone Biologique

• Les réseaux de neurones biologiques


Afin d'
avoir une idée de la complexité du système nerveux, il faut savoir qu'
on estime
à environ 100 à 1 000 milliards le nombre de neurones du système nerveux humain et qu'
on
compte en moyenne 1 000 à 100 000 synapses par neurone.
La notion de réseaux de neurones s'
applique aux réseaux dans lesquels les neurones
sont considérés comme les nœ uds d'
un graphe et les synapses comme les arrêtes de celui-ci.
Un réseau de neurones peut se représenter sous la forme d'
une "boîte noire" munie d'
entrées et
de sorties. Le rôle de cette boîte noire est de percevoir, de réagir et de se souvenir.
L'
entrée de ce réseau est constituée d'
un ensemble de capteurs sensoriels spécialisés
qui réagissent aux stimuli du monde extérieur (image, son, odeur...). La mission de ces
récepteurs est de prévenir le cerveau de toute modification survenue dans son environnement
et d'
enrichir le contenu cérébral, d'
une part en informations à mémoriser, d'
autre part, en
stimulant l'
organisation des structures et des connexions nerveuses. En sortie du réseau, on
trouve d'
autres cellules spécialisées, les motoneurones, qui permettent de commander des
contractions musculaires2.
A l'
intérieur de cette boîte noire, les schémas de connexions du système nerveux sont
très variables d'
une région à l'
autre du cerveau. Et même si ces architectures sont assez bien
connues, parfois depuis fort longtemps, leurs propriétés fonctionnelles demeurent encore
souvent difficiles à comprendre. La théorie de la localisation cérébrale des fonctions mentales

2
A l’ exception des systèmes endocriniens et exocriniens.

126
date du début du XIXème siècle, mais des études plus récentes ont montré que ces
découpages n'
étaient pas aussi nets que l'
on pensait. Les travaux de Cajal [CAJA 52] ont
permis de montrer que le cortex est organisé en couches. De plus, de nombreuses observations
prouvent que les cellules sont organisées en unités fonctionnelles et anatomiques, appelées
colonnes corticales en raison du caractère ascendant et descendant de la transmission des
signaux à l'
intérieur de ces cellules.
Si les systèmes nerveux simples tels que l'
arc réflexe monosynaptique dans lequel
seules trois cellules interviennent sont bien connus, il subsiste bien des questions concernant
les systèmes plus complexes dans lesquels plusieurs capteurs sensoriels interviennent. Le fait
de reconnaître une personne que l'
on ne connaît pas bien n'
est pas lié uniquement à une de ses
caractéristiques (visage, voix, façon de marcher...). Il existe une coopération complexe entre
les cellules fonctionnelles. Par exemple, après un accident vasculaire cérébral, qui entraîne
souvent une hémiplégie, une hémiparésie ou une aphasie, on a pu observer une récupération
partielle ou totale grâce à une réorganisation opérée au sein du cortex cérébral.

• La plasticité neuronale
La plasticité neuronale, propriété particulièrement remarquable du système nerveux,
recouvre la faculté d'
évolution des cellules nerveuses et de leurs interconnexions. Les notions
d'
apprentissage et de mémoire sont étroitement liées à cette propriété.
Si le système nerveux d'
un nouveau-né est caractérisé par une architecture complexe
due à un "précâblage" redondant, un enfant de quatre ans possède déjà un système mature. En
effet, les circuits neuronaux se spécialisent pendant cette période par sélection, élimination ou
renforcement des connexions, grâce aux stimuli extérieurs. L'
apprentissage, ou adaptation des
réseaux neuronaux à court terme, consiste en une modification des liens synaptiques. Un bon
exemple de cette plasticité neuronale est celui évoqué plus haut concernant les accidents
vasculaires cérébraux. Des études récentes utilisant la tomographie par émission de photons
par exemple ont permis de mettre en évidence une récupération importante, parfois même
totale des fonctions perdues, suite à une lésion partielle du cerveau, soit par restauration des
circuits endommagés, soit par transfert de la fonction de la région lésée sur une région voisine
saine.
Pour comprendre ce phénomène d'
apprentissage, de nombreuses études ont été
réalisées sur l'
Aplysia Californica, un mollusque marin dont le système nerveux ne comporte
qu'
environ 20 000 cellules nerveuses de très grosse taille (elles atteignent 1 mm de diamètre).
Par exemple, on provoque une habituation des ouïes au toucher. C'
est un réflexe

127
monosynaptique. Si ce stimulus est suffisamment répété, il se produit un phénomène
d'
habituation, c'
est-à-dire que la réponse diminue et reste affaiblie durant un certain temps.
L'
effet physiologique associé à ce phénomène est une décroissance de l'
émission
présynaptique du neurotransmetteur aux synapses. Alors, l'
arrivée d'
un potentiel d'
action
provoque une dépolarisation moindre et l'
efficacité synaptique diminue. On peut, de façon
analogue, provoquer un accroissement de l'
efficacité synaptique.

C'
est à Hebb qu'
on doit, en 1949, le premier énoncé d'
une règle qualitative régissant la
plasticité synaptique : "When an axon of cell A is near enough to excite cell B and repeatedly
or persistently takes part in firing it, some growth process or metabolic change takes place in
s efficiency, as one of the cells firing B, is increased."3 [HEBB
one or both cells such that A'
49].

• Le neurone formel

C'
est en 1943 que McCulloch & Pitts ont modélisé une cellule nerveuse par un
automate à seuil, appelé neurone formel. Un neurone formel est une modélisation très
simplifiée du neurone biologique. Il en reprend les caractéristiques de fonctionnement
principales. Sa fonction est d'
intégrer les entrées et d'
en calculer une transformation non-
linéaire. La modélisation d'
un tel neurone est représentée figure A1.2.

3
"Quand une cellule A excite par son axone une cellule B et que, de manière répétée et persistante, elle participe
à la genèse d'une impulsion dans B, un processus de croissance ou un changement métabolique a lieu dans l' une
ou dans les deux cellules, de telle sorte que l'
efficacité de A à déclencher une impulsion dans B est, parmi les
autres cellules qui ont cet effet, accrue."

128
Synapse
Corps cellulaire

Axone
xi wij xj
Dendrites oj = wij . xi x j = ϕ (o j )
i

Neurone j

Figure A1. 2 - Schéma fonctionnel d'un neurone

(oi)
(oi)

oi
oi
0 si o i ≤ θ
Linéaire : ϕ(oi)= oi seuil : ϕ ( oi ) =
1 si o i ≥ θ

(oi) (oi)
1
1

1 2
oi oi
semi-linéaire : sigmoïde :

0 si oi < θ1 oi − θ
exp
oi − θ1 T
ϕ( oi ) = si θ1 ≤ oi ≤ θ 2 ϕ(oi ) =
θ 2 − θ1 oi − θ
1 + exp
1 si oi > θ2 T

Figure A1.1 - Les fonctions d'activation usuelles.

129
Le potentiel oj de sortie du neurone j, auquel sont connectés les neurones i en entrée,
se calcule à l'
aide de la relation suivante :

oj = wij .xi (Eq. A1.1)


i

dans laquelle xi représente l'


état du neurone i et wij, le poids de la synapse reliant le neurone i
au neurone j. La sortie, ou état, du neurone j est alors :

x j = ϕ (o j ) (Eq. A1.2)

où ϕ est la fonction d'


activation du neurone. Les fonctions d'
activation généralement utilisées
sont les fonctions linéaires, les fonctions seuils, les fonctions semi-linéaires et les sigmoïdes
(tangentielles et exponentielles) et sont représentées figure A1.3.

• Les réseaux de neurones artificiels et leur mise en oeuvre

Par analogie avec le système nerveux, un réseau de neurones artificiels est équivalent à
un graphe dont les nœ uds sont des neurones et dont les arêtes orientées et pondérées sont les
connexions (ou synapses). La mise en œ uvre d’ un tel réseau peut être comparée à la formation
d’ un étudiant. En effet, un étudiant qui assiste à un cours apprend, grâce à un professeur, les
notions essentielles dans des matières précises. Il est entraîné grâce à des exemples
caractéristiques et évalué sur des choses connues. Quand il entre dans la vie active, il doit
généraliser les connaissances acquises de façon à résoudre les problèmes réels qui lui sont
posés. De la même manière, la mise en œ uvre d’ un réseau de neurones artificiels passe par les
mêmes étapes.

La phase d’ apprentissage consiste à la modification des paramètres du réseau afin de


faire converger le comportement du réseau vers un comportement de référence. L’ algorithme
d’ apprentissage dépend du modèle du réseau utilisé. Pour cette phase d'
apprentissage, il est
nécessaire d'
employer un corpus de données, appelé base d'
apprentissage, la validation de cet
apprentissage est faite sur un autre ensemble de données, la base de test.
L'
ensemble formé par la base d'
apprentissage, la base de test et, éventuellement de
leurs sorties correspondantes, est appelée base de données du système neuronal. Le choix de
la base de données, ainsi que le choix de la représentation des données associées constituent
des éléments essentiels dans la réussite d'
une application à base de réseaux de neurones.

130
Le réseau, ainsi entraîné, peut alors être utilisé comme outil pour effectuer une tâche
précise qui lui a été apprise. Il est alors capable de répondre très rapidement ce qui rend leur
utilisation possible pour des traitements en temps réel.

131
Les travaux présentés dans cette annexe concernent l'
estimation quantitative de
paramètres d'
un système à surveiller. Le problème sur lequel se sont focalisés nos efforts
concerne l'
estimation du taux de vide dans un écoulement diphasique [DUJA 01a]. Il ne s'
agit
que d'
une étude de faisabilité et la structure neuronale hybride présentée précédemment n'
a
pas été mise en œ uvre. Les résultats obtenus pour un système expérimental sont présentés ici.

La présence d'
impuretés (gaz, corps étranger) dans un liquide peut avoir des
répercussions sur le bon fonctionnement d'
un système. Le phénomène complexe des
écoulements diphasiques (mélange de deux substances dans deux phases thermodynamiques
différentes), est étudié depuis 1910 par de nombreux travaux de recherche. Les problèmes liés
à ce phénomène se rencontrent dans de nombreux processus industriels. Un exemple
fréquemment observé dans l'
industrie est celui des écoulements à bulles, où l'
une des
substances est présente sous forme liquide et l'
autre sous forme gazeuse. Parmi les industries
concernées par ce problème, on peut ainsi citer les industries chimiques, métallurgique,
pétrolières (production et transport), nucléaires…
Le problème principal, encore à l'
étude aujourd'
hui, est la mesure du taux de vide,
rapport entre volume de gaz et volume de liquide, dans un contexte dynamique. En effet, si la
mesure du volume de liquide est en général aisée, celle du volume de gaz présent dans le
liquide est plus délicate et constitue encore aujourd’ hui un problème ouvert. C’ est pourquoi,

133
dans un écoulement à bulles, l’ intérêt principal réside dans les bulles et il semble donc
judicieux de s’ intéresser aux caractéristiques de celles-ci (taille, vitesse… ).
De nombreuses études ont été menées pour tenter de résoudre ce problème [LEUT 98],
et de nombreuses techniques ont été proposées parmi lesquelles : la photographie, le laser
[DURS 75], des techniques mettant en œ uvre des capteurs capacitifs… Cependant, les
limitations de ces méthodes sont grandes et sont dues, d'
une part, à la nécessité de connaître
un modèle très fin de l'
écoulement à bulles (qui est un problème très difficile et encore non
résolu à ce jour), et d'
autre part, aux difficultés liées aux conditions expérimentales et de
mesure. Quelques auteurs proposent aussi des techniques ultrasonores [BONN 87][LEMO
98].
Compte tenu des difficultés d'
une telle mesure (taux de vide) – notamment à cause du
contexte dynamique dans lequel elle intervient –, nous pensons qu'
il sera nécessaire d'
associer
les mesures obtenues par plusieurs capteurs différents afin de parvenir à une estimation de ce
taux de vide. La technique à développer doit être non invasive et non destructive, car elle doit
pouvoir s'
adapter, par exemple, sur des tuyauteries existantes, comme par exemple des
pipelines. Nous avons choisi de travailler dans un premier temps avec des techniques
ultrasonores. Nous nous sommes alors focalisés sur la mesure fournie par un capteur
ultrasonore, dans un contexte statique. Dans un premier temps, nous nous sommes intéressés à
la classification des signaux fournis par ce capteur, afin d’ obtenir une information qualitative.
Puis, nous nous sommes penchés sur l'
estimation du taux de vide présent entre les deux
capteurs ultrasonores. La partie suivante concerne le dispositif mis en œ uvre pour l'
acquisition
des signaux et la construction des bases de données pour les deux problématiques soulevées.
Puis, nous présentons les résultats obtenus lors de la mise en œ uvre des techniques neuronales
simples (cf. Chapitre I&II)

Les ultrasons sont des ondes acoustiques dont la fréquence varie de 20khz à 200Mhz.
Ces ondes ne peuvent se propager que dans un milieu matériel et leur propagation dépend du
milieu dans lequel elles se propagent. L'
intensité de ces ondes a aussi son importance,
puisque, dans le cas d'
ultrasons dit de puissance, des bulles dites de cavitations peuvent
apparaître.

134
L'
analyse par ultrasons repose sur l'
analyse des échos observés après émission d'
un
faisceau d'
ondes ultrasonores. Un capteur envoie un train d'
ondes ultrasonores qui se
propagent dans le milieu à contrôler où elles font l'
objet de phénomènes de diffraction et de
réflexion. L'
analyse de l'
écho obtenu au moyen, soit d'
un autre capteur placé en regard de
l'
émetteur, soit par l'
émetteur lui-même qui peut recevoir l'
onde réfléchie, peut alors permettre
de détecter un défaut.
Cette méthode de contrôle non destructif et non invasif est en général utilisée pour la
détection de fissure dans différents matériaux. Dans ce cas, une analyse spectrale des échos
peut être suffisante. En revanche, dans le cas de la détection d'
impuretés dans un liquide, une
analyse classique des signaux ne permet pas de conclure.

Le dispositif expérimental, représenté figure A2.1 nous a permis de construire une


base de données. Le protocole d'
acquisition des signaux, est le suivant : on dispose d'
un
récipient rempli d'
eau, dans lequel on crée artificiellement un flot de bulles d'
air, symbolisant
les impuretés. Les bulles d'
air sont générées en continu au moyen d'
une pompe. Un robinet
permet de régler le débit et ainsi le volume d'
air présent entre les deux capteurs à un moment
précis.

Ondes émises

Emetteur
Ultrasonore

Valve
Pompe à air

Figure A2.1 - Dispositif expérimental

On dispose de deux capteurs à ultrasons, un émetteur et un récepteur, qui sont


placés face à face de part et d'
autre du récipient. Ceux-ci sont directement au contact de

135
l'
eau, ceci afin de s'
affranchir de la propagation de l'
onde ultrasonore à travers le
plastique. Les capteurs sont pilotés par un logiciel qui gère à la fois l'
émission et la
réception des ondes. Celles-ci se font en continu ce qui permet la visualisation en temps
réel de l'
évolution des signaux en fonction de la quantité d'
air émise par la pompe.
L'
acquisition, quant à elle, se fait au moment choisi par l'
expérimentateur.
Le mode expérimental permettant de faire varier le débit de la pompe, nous
avons, dans un premier temps, choisi de définir trois classes de signaux, en fonction du
volume d'
air émis. Nous avons alors procédé à l'
acquisition de 61 signaux répartis de la
manière suivante :
• 20 signaux pour la classe 1, correspondant à de l'
eau seule,
• 20 signaux pour la classe 2, correspondant à un faible débit d'
air,
• 21 signaux pour la classe 3, correspondant à un fort débit d'
air.
Un exemple de signal correspondant à chacune des classes est présenté figure A2.2.
Amplitude

Numéro de composante

Figure A2.2 - Signaux ultrasonores


--- Classe 1
-+- Classe 2
-*- Classe 3

La base d'
apprentissage, que nous avons constituée pour la mise en œ uvre des
structures neuronales, comprend 14 signaux, dont quatre correspondant à la classe 1,
cinq, à la classe 2 et cinq, à la classe 3. Pour la phase de généralisation, nous avons utilisé
la base de données globale, qui comprend les vecteurs de la base d’ apprentissage, mais
aussi les vecteurs non appris.

136
Cette première base de données nous permet d’ obtenir des renseignements
qualitatifs concernant la quantité d’ air présent dans l’ eau. Le but de cette première étude
est la classification des signaux ultrasonores relevés suivant 3 catégories. Il est cependant
nécessaire, dans certains cas, d'
avoir une estimation quantitative de ce taux de vide. Pour
évaluer la faisabilité d'
une telle estimation par l'
association du capteur ultrasonore et des
réseaux de neurones artificiels, nous avons donc mis en place une seconde
expérimentation afin de construire une seconde base de données. Le protocole
d'
acquisition des signaux diffère un peu du précédent. Comme précédemment, nous
disposons du même récipient et des deux capteurs ultrasonores placés en regard l'
un de
l'
autre. En revanche, nous ne générons plus de bulles. Le principe de cette
expérimentation consiste à accroître progressivement le niveau d’ eau entre les deux
capteurs, en partant d’ un niveau minimum jusqu’ au total recouvrement des capteurs.
Connaissant le diamètre de chacun des capteurs et le niveau d'
eau dans le récipient, nous
pouvons alors estimer le volume d'
eau – et donc, le volume d'
air – présent entre les deux
capteurs. Nous avons alors construit une seconde base de données de la manière suivante.
Nous avons procédé à l'
acquisition de 56 signaux ultrasonores correspondant à des
volumes d’ air compris entre 0 et 14,66cm3.
Afin d'
effectuer l'
étude de faisabilité d'
une telle estimation, nous avons construit à
partir de cette base de données, plusieurs bases d'
apprentissage comportant un nombre
variable d'
exemples. Cette étude est présentée dans le paragraphe suivant.

• ! "
L'
objet de cette étude concerne, dans un premier temps, la classification de signaux
ultrasonores permettant de déterminer, de façon qualitative, la quantité d'
air dans un récipient
rempli d'
eau. L'
objectif de cette étude est de parvenir à un outil permettant l'
estimation du
taux de vide dans un écoulement dynamique. Nous nous sommes ensuite penchés sur la
quantification de ce taux de vide. L'
objectif de cette étude est l’ estimation du volume d’ air
[AMAR 02].
Dans les deux cas, les composantes des vecteurs d'
entrées sont les échantillons des
signaux ultrasonores. Les signaux ultrasonores n’ ont ici subit aucun prétraitement avant leur
présentation aux différents réseaux neuronaux.

137
• # " $ %

Concernant le réseau LVQ, le nombre de neurones de la couche d'


entrée correspond au
nombre de composantes des vecteurs d'
entrée, soit 168. Le nombre de sortie correspond quant
à lui au nombre de classes que l'
on souhaite obtenir. On souhaite classer les vecteurs d'
entrée
dans 3 catégories, le réseau LVQ comprendra 3 neurones de sortie.
Le nombre de neurones dans la couche cachée est un des paramètres à ajuster pour ce
modèle. Ce choix est un problème délicat.
Nous avons mené une étude en faisant varier le nombre de neurones dans la couche
cachée du réseau LVQ de 2 à 100. Les résultats de l'
évolution du nombre d'
erreurs en phase
de généralisation en fonction du nombre de neurones sont représentés par la figure A2.3.
erreurs
Nombre d'

Nombre de neurones dans la couche cachée

Figure A2.3 - Evolution du nombre d'erreurs en fonction du nombre de neurones dans la couche cachée
du réseau LVQ pour la classification ultrasonores.

Nous pouvons remarquer qu'


au-delà de six neurones dans la couche cachée, le réseau
classe correctement 98 à 100% des signaux de la base de données selon la taille de la couche
cachée. Ceci peut s'
expliquer par le fait que le nombre de neurones dans la couche cachée d'
un
réseau LVQ peut être vu comme le nombre de sous-classes dénombré au sein de notre base de
données. Six neurones suffisent donc pour obtenir un excellent taux de classification. La
croissance du nombre de neurones ne perturbe donc pas le comportement du réseau. De plus,
lorsque le réseau se trompe, l'
erreur de classification est toujours commise sur le même
vecteur de la classe 2 que le réseau reconnaît comme un vecteur de la classe 1.

138
• &

• '

Tout comme le réseau LVQ, les nombres de neurones des couches d'
entrée et de sortie
sont déterminés par le problème à traiter. Ainsi, le réseau comprendra autant de neurones en
entrée que de composantes des vecteurs d'
entrée, soit 128.
Pour le nombre de neurones de sortie, on peut envisager le problème de deux manières
différentes, suivant la manière dont on code les classes (voir II.2.3.2.2.a.). Pour la
classification des signaux ultrasonores, la classe sera codée de la seconde manière et le réseau
RBF comprend donc 1 seul neurone de sortie.
Comme nous l'
avons déjà mentionné, contrairement au LVQ, le nombre de neurones
de la couche cachée du RBF est déterminé par apprentissage. Les neurones de la couche
cachée sont utilisés pour mémoriser un exemple et une fonction d’ activation. Chacun a une
activité locale dans l’ espace d’ entrée. Ainsi, les fonctions noyaux ne donnent des réponses
utiles que dans le cas d’ un domaine restreint, leur champ récepteur. Ce champ récepteur,
encore appelé zone d'
influence, est l'
un des paramètres caractéristiques du réseau RBF. Pour
le modèle que nous utilisons, le rayon de cette zone est fixe et nous pouvons le faire varier
grâce à un paramètre, noté sc.
Nous avons étudié, dans chacun des cas, l'
impact de la taille de la zone d'
influence des
neurones. Pour cela, nous avons fait varier le paramètre sc de 0,1 à 10 avec un pas de 0,01..
L'
apprentissage s'
arrête quand le nombre de neurones cachés atteint le nombre de vecteurs de
la base d'
apprentissage ou que l'
erreur commise atteint un seuil fixé par l'
utilisateur. Les
résultats obtenus en phase de généralisation sont présentés à la figure A2.4.
Pour le problème de classification des signaux ultrasonores; on peut remarquer un taux
de classification correct élevé de 98% pour un intervalle précis, à savoir [1,59 ; 1,64]. Cet
intervalle, valable pour les vecteurs de cette base d'
apprentissage, permet alors d'
optimiser
dans ces conditions la couverture de l'
espace des paramètres. Pour un rayon inférieur, le
nombre d'
erreurs diminue jusqu'
à atteindre le minimum. Puis, au-delà de cet intervalle, le
nombre d'
erreurs s'
accroît à nouveau et finit par rester stable. En effet, la taille de la zone
d'
influence intervient directement sur la cartographie que réalise le réseau RBF au cours de
son apprentissage. Un rayon d'
influence trop faible peut alors conduire à une cartographie trop
lacunaire, tandis qu'
un rayon trop élevé risque de provoquer des recouvrements de zones de
classification. Si on analyse les résultats obtenus, on peut remarquer que, pour l'
intervalle

139
optimal du rayon, l'
erreur commise est toujours la même. Le réseau ne parvient pas à
déterminer la classe d'
un vecteur de la classe 3. Le résultat fourni alors correspond à une
classe non définie. Cependant, cet excellent taux de classification ne doit pas occulter le fait
que les résultats obtenus ne concernent qu'
une étude assez éloignée de la réalité.
Les résultats obtenus ne sont valables que pour les bases d'
apprentissage définies. Ils
montrent cependant la pertinence de ce paramètre dans la construction d'
un réseau adéquat. Il
est important de rappeler que les critères d'
arrêt d'
apprentissage utilisés, mentionnés ci dessus,
restent restrictifs du fait que le rayon d'
influence a été supposé identique pour tous les
neurones de la couche cachée.

RBF

35
30
Nombre d'erreurs

25
20
15
10
5
0
0 1 2 3 4 5 6 7 8 9 10
Rayon zone d'influence

Figure A2.4 - Evolution de l'erreur commise en fonction du paramètre sc pour la classification des
signaux ultrasonores

• $

Nous nous sommes penchés sur la quantification du taux de vide à l'


aide d’ un réseau
RBF. L'
objectif de cette étude est l’ estimation du volume d’ air compris entre les deux
capteurs ultrasonores par ce RNA. Dans notre cas, les composantes des vecteurs d'
entrées sont
les échantillons des signaux ultrasonores. Le réseau fournit dans ce cas une seule
information : la valeur estimée du volume d’ air.
Le réseau utilisé comporte 168 neurones dans la couche d'
entrée, correspondant aux
168 composantes des vecteurs d'
entrée. La couche de sortie contient 1 neurone qui doit
prendre la valeur estimée par le RNA du volume d’ air.

140
La figure A2.5 (a) présente les résultats obtenus en phase de généralisation après
apprentissage par le RNA de 28 prototypes de la base de données, soit un vecteur sur deux.
Les deux courbes correspondant au volume d’ air attendu (croix) et au volume d’ air estimé par
le RNA (ligne) sont pratiquement confondues. On obtient donc, avec cette approche, une
bonne estimation du volume d’ air compris entre les deux capteurs même pour des valeurs non
apprises par le RNA.
Nous avons également procédé à la même expérimentation avec un nombre de
prototypes appris par le RNA plus faible, soit 9 vecteurs au lieu de 28. Les résultats obtenus
sont présentés figure A2.5 (b). Les valeurs d’ estimation fournies par le RNA restent
satisfaisantes, malgré le peu de prototypes appris.

(a)

(b)

Figure A2.5 - Estimation par le réseau RBF du volume d’air en phase de généralisation
(a) pour une base d'apprentissage comprenant 28 vecteurs
(b) pour une base d'apprentissage comprenant 9 vecteurs

141
Nous avons ensuite fait l'
expérimentation suivante : nous avons supprimé les deux
extrêmes de la base d'
apprentissage et nous avons alors obtenus les résultats présentés Figure
A2.6.
Les résultats obtenus sont nettement insuffisants. On remarque que les volumes non
compris dans l'
intervalle appris ne sont pas estimés correctement. Il sera donc nécessaire de
connaître l'
intervalle dans lequel se situera l'
ensemble des volumes à estimer.

Figure A2.6 - Estimation par le réseau RBF du volume d’air en phase de généralisation
(Extrêmes non appris)

Puis, nous nous sommes intéressés à l'


estimation du volume des bulles d'
air de notre
première expérimentation. Rappelons toutefois que nous n'
avons qu'
une connaissance
qualitative des "bulles", car il nous est impossible de mesurer avec précision le diamètre, et
donc, le volume, des bulles générées par la pompe à air. Cependant, compte tenu du mode
opératoire pour l'
acquisition des deux bases de données, on peut affirmer que le volume des
bulles sera compris entre 0 et 14,66cm3. Nous avons alors repris le réseau RBF présenté au
début de cette partie (réseau RBF comprenant 168 neurones d'
entrée et 1 neurone de sortie),
entraîné avec 28 prototypes de la seconde base de données. Les résultats alors obtenus sont
présentés figure A2.7. On peut remarquer que l'
estimation fournie par le réseau RBF est dans
l'
ensemble correcte, sauf pour certains signaux de la classe 1 (Eau seule). En effet, pour les

142
signaux de cette classe, le volume d'
air compris entre les deux capteurs est nul. Or, pour 5
air compris entre 4 et 6 cm3. Cette
signaux de cette classe, le réseau estime un volume d'
mauvaise estimation peut venir du fait que l'
acquisition des signaux de ces deux bases
d'
informations n'
a pas été faite le même jour et que, par conséquent, les conditions,
notamment de température, ne sont pas identiques. Nous avons donc ajouté à la base
d'
apprentissage précédente un signal de la classe 1, puisque, dans ce cas, nous connaissons le
volume d'
air correspondant à cette mesure. Les résultats obtenus sont présentés figure A2.8.

Figure A2.7 - Estimation du volume d'air pour les signaux de la première base de données

L'
estimation est alors beaucoup plus satisfaisante. On peut ainsi estimer que :
• Le volume d'
air compris entre les capteurs dans le cas de la classe 3 (fort
air de la pompe) est supérieur à 2 cm3.
débit d'
• Le volume d'
air compris entre les capteurs dans le cas de la classe 2 (faible
air de la pompe) est inférieur à 2 cm3.
débit d'
Même si nous n'
avons qu'
une connaissance quantitative du volume des bulles, et
même si le protocole expérimental d'
acquisition de nos bases de données est assez
rudimentaire et reste assez éloigné du problème réel, les résultats montrent cependant la
faisabilité d'
un outil d'
estimation du taux de vide à l'
aide de réseaux de neurones.

143
Figure A2.8 - Estimation du volume d'air (base d'apprentissage modifiée)

Compte tenu de ces résultats, l'


utilisation d'
autres capteurs pour des mesures en
dynamique et la mise en œ uvre de notre structure neuronale hybride dans cette configuration
plus complexe sont, à ce jour, à l'
étude.

144
On peut décomposer l'
appareil auditif en trois parties : l'
oreille externe, moyenne et
interne. La figure A3.1 est une vue d'
ensemble du système auditif à laquelle on pourra se
reporter tout au long de cette partie.

(© Informatique Graphics Corp. 1992)

Figure A3. 1 - Anatomie simplifiée d'une oreille

On appelle oreille externe, l'


ensemble constitué du pavillon et du conduit auditif
externe. Le conduit auditif externe est un conduit musculo-membraneux dans ses deux tiers
externe et osseux dans son tiers interne. Son rôle est de protéger le tympan des agressions
mécaniques et de modifier le champ sonore en augmentant la directivité des sons, en

146
association avec le rôle diffracteur de la tête. L'
oreille externe est responsable d'
un gain auditif
substantiel sur les hautes fréquences.

L'
oreille moyenne comprend le tympan et la chaîne ossiculaire – ou osselets (marteau,
enclume, étrier) – logés dans un espace osseux du rocher appelé caisse du tympan. C'
est un
espace rempli d'
air qui communique avec le pharynx par l'
intermédiaire de la trompe
d'
Eustache, un conduit musculo-membraneux. Le rôle de ce conduit est de maintenir
l'
équipression de part et d'
autre du tympan grâce à son ouverture régulière au cours des
mouvements de bâillement ou de déglutition. Il permet ainsi la vibration optimale de la chaîne
tympano-ossiculaire.
La membrane tympanique est une structure élastique, fibrillaire dans laquelle est
inclus le marteau par sa longue apophyse, encore appelée manche du marteau. La tête du
marteau est articulée avec l'
enclume. Il est suspendu dans l'
oreille moyenne par un puissant
ligament qui s'
insère sur sa courte apophyse, sa longue apophyse est, elle, en relation avec
l'
étrier. L'
étrier, quant à lui, est constitué de deux branches, et d'
une partie plate – ou platine –
qui repose dans la fenêtre ovale, par laquelle il est en contact avec l'
oreille interne.
Le développement fonctionnel de l'
oreille moyenne, qui a commencé chez les
amphibiens, a considérablement amélioré la transmission sonore en agissant comme un
adaptateur d'
impédance. Cet effet est accompli principalement à travers la grande différence
de surface entre le tympan (65 mm²) et la platine de l'
étrier (3,2 mm²) et, à moindre degré, à
travers l'
action de levier de la chaîne ossiculaire.
Les osselets sont maintenus en place par un système complexe de ligaments et de
muscles. Parmi ces derniers, les plus importants sont le muscle du marteau et le muscle de
l'
étrier – ou muscle stapédien – dont le rôle est de tendre la chaîne ossiculaire. Il est
notamment mis en jeu par voir réflexe, lors de fortes stimulations auditives. C'
est un réflexe
bilatéral, sous contrôle du nerf facial. Un de ses rôles serait de protéger l'
oreille interne des
sons de forte intensité en limitant la pénétration de la chaîne des osselets dans l'
oreille interne.
L'
onde sonore atteint le conduit auditif externe et met le tympan en vibration.
L'
énergie sonore est transférée à la chaîne ossiculaire dont les déplacements sont de l'
ordre de
quelques angströms, puis au liquide de l'
oreille interne par l'
intermédiaire de la platine de
l'
étrier.

147

L'
oreille interne est constituée d'
une partie responsable de l'
audition, la cochlée et
d'
une partie responsable de l'
équilibre, le vestibule.
La cochlée, plus familièrement appelée limaçon en raison de sa forme de tube enroulé
sur deux trous de demi de spire, est entouré d'
une capsule osseuse et remplie de liquide. Ce
tube est cloisonné par deux membranes constituant trois rampes, qu'
on distingue bien sur une
coupe transversale : les rampes vestibulaires, tympaniques et surtout cochléaire qui nous
intéresse particulièrement, car c'
est là que se situe l'
organe sensoriel de l'
audition : l'
organe de
Corti.
L'
organe de Corti est constitué d'
une architecture complexe de cellules sensorielles et
de cellules de soutien. On trouve deux types de cellules sensorielles : les cellules ciliées
internes (CCI), disposées sur une seule rangée, et les cellules ciliées externes (CCE),
disposées, elles, sur trois rangs.
Ces cellules ciliées ont la particularité de présenter à leur extrémité apicale des
expansions cytoplasmiques en doigts de gants appelées stéréocils. Il existe plusieurs rangées
de stéréocils par cellule, les plus courts étant disposés à l'
intérieur de la cochlée, les plus
longs, à l'
extérieur. Ces stéréocils sont rangés en ligne dans les CCI et le long d'
un W dans les
CCE.
Les CCE ont la propriété de se contracter en réponse à une stimulation sonore. Elles
ont avant tout une activité musculaire, les CCI étant, quant à elles, les véritables cellules
sensorielles qui transmettent l'
information sonore au nerf auditif. Lorsque l'
onde sonore est
transmise à l'
oreille interne, elle fait vibrer la membrane basilaire, sur laquelle repose l'
organe
de Corti. En se contractant, les CCE permettent une amplification très localisée de la vibration
de la membrane basilaire, ce qui permet de ne stimuler qu'
un nombre limité de CCI,
améliorant ainsi la sélection fréquentielle.
Quand il y a destruction de CCE, comme dans le cas d'
un traumatisme sonore, il faut
de fortes intensités sonores pour stimuler directement les CCI. Alors, de nombreuses CCI sont
stimulées, entraînant une perte de sélectivité fréquentielle. Les CCI ont un rôle de
transduction en transformant la stimulation vibratoire en influx nerveux destiné aux dendrites
des axones du nerf auditif qui font synapse au niveau du pôle inférieur de la cellule. Il s'
agit
d'
une innervation afférente.

148
Il existe, au niveau de la cochlée, une répartition fréquentielle tonotopique, les aigus
étant codés à la base et les graves à l'
apex, qui a fait comparer la cochlée à un clavier de
piano. On parle du clavier cochléaire.

L'
ensemble est 30 000 axones innervant l'
organe de Corti constitue le nerf auditif. Il
chemine dans le conduit auditif interne et rejoint le tronc cérébral.
Il existe, au niveau du nerf auditif, une organisation tonotopique, chaque fibre
répondant de manière préférentielle à une fréquence particulière, dite fréquence
caractéristique. Au niveau des fibres auditives, on observe une activité spontanée en dehors de
toute stimulation auditive. Pour une fibre donnée, le niveau d'
activité est assez stable, en
revanche, il varie beaucoup d'
une fibre à l'
autre.
Les neurones auditifs primaires répondent tous de manière univoque à la stimulation
sonore, en augmentant leur activité. Il existe une brusque augmentation des décharges au
début du stimulus, suivie d'
une diminution de l'
activité qui se stabilise en plateau durant la
deuxième partie de la stimulation.
Le premier relais des neurones du nerf auditif se situe au niveau des noyaux
cochléaires du bulbe qui contiennent les neurones auditifs secondaires. Il existe une grande
variété de types cellulaires dans les noyaux cochléaires, corrélée avec une grande variété de
types de réponses qui contraste avec l'
activité univoque des neurones primaires. Comme au
niveau du nerf auditif, on observe une organisation tonotopique au niveau des noyaux
cochléaires.
Puis, les relais des voies auditives se trouvent au niveau de la protubérance. Il s'
agit du
complexe olivaire supérieur. Au sein de ces noyaux, les différents neurones n'
ont pas tous les
mêmes caractéristiques physiologiques. Il s'
agit du niveau le plus bas du système auditif.
Le relais suivant est le colliculus inférieur. Quand le signal atteint ce relais, il a déjà
subi plusieurs modifications, non seulement dues aux transformations synaptiques survenues
entre la cochlée et le colliculus inférieur, mais aussi à la convergence des fibres provenant des
deux oreilles au niveau d'
un même neurone à des niveaux inférieurs. La mise en jeu des
excitations et des inhibitions devient de plus en plus complexe.
Le corps grenouillé médian est le dernier relais sous cortical. Il est composé de deux
parties : une partie principale et un noyau ventral. Les fibres en provenance du colliculus

149
inférieur se terminent essentiellement dans la partie principale. Enfin, les ondes auditives se
projettent sur le cortex auditif.

150
[ALPS 94] D.Alpsan, “Auditory Evoked Potential Classification by Unsupervised
Art 2-A and Supervised Fuzzy Artmap Networks”, IEEE International
Conference on Neural Networks (ICNN), Orlando, July, 1994.

[ALPS 95] Alpsan, D., Towsey, M., Özdamar, Ö., Tsoi, A., Ghista, D.N., "Efficacy
of modified back-propagation and optimization methods on a real-world
medical problem", Neural Networks, 8:945:962, 1995.

[AMAR 96] V Amarger., A. Bengharbi, K. Madani, "A New Approach to fault


diagnosis of Analog Circuit using Neural Networks Based Techniques",
IEEE European Test Workshop 96 Montpellier, 12-14 Juin, 1996.

[AMAR 02] V. Amarger, A-S Dujardin, K. Madani, "Vers un Capteur Ultrasonore


Intelligent Pour la Surveillance de Processus Industriels", 6ème Congrès
Français d’ Acoustique, Lille, France, 8-11 avril 2002

[ANDE 95] J.A. Andersen, "An Introduction to Neural Network", MIT Press,
Cambridge, 1995

[BARR 03] M. Barret, A-S. Dujardin, V. Amarger, K. Madani, J-F. Durastanti, "
"Mechanical faults recognition using wavelet transform and artificial
neural network techniques", CISIM'
03, 2003.

[BAZO 94] M. A. Bazoon, D.Stacey, C.Cui, “A Hierarchical Artificial Neural


Network System for the Classification of Cervical Cells”, IEEE
International Conference on Neural Networks, Orlando, July, 1994.

[BENG 97a] A. Bengharbi, "Contribution au test et diagnostic des circuits


analogiques par des approches basées sur des techniques neuronales",
PhD thesis report, University of Creteil - Paris XII, 1997.

[BENG 97b] A. Bengharbi, V. Amarger, K. Madani, “Multi-Fault Diagnosis of


Analog non Linear Circuits by Smart Classification Technique”, IEEE
European Test Workshop 97, Turin, Mai, 1997.

[BONN 87] J.C. Bonnet, L.L. Tavlarides, "Ultrasonic technique for dispersed-phase
holdup measurements", Ind. Eng. Chem. Res. Vol. 26, N°4,1987, pp 811-
815.

[BROO 88] D.S. Broomhead, D. Lowe, "Multivariable Functionnal Interpolation and


Adaptative Networks", Complex Systems, Vol. 2, pp 321-355, 1988.

118
[CAJA 52] R. Cajal, "Histologie du système nerveux de l’homme et des vertébrés",
Vol. 1 et 2, traduit de l’ espagnol par L. Azoulay, Madrid 1952

[CHAN 02] X. Chang, V. Cocquempot, C. Christophe, "Modélisation de la Machine


Asynchroneen Présence de Pannes Stator", Conférence Internationale
Francophone d'Automatique, pp 459-464, Nantes, 8-10 juillet 2002.

[CHEB 97] A. Chebira, K. Madani, G. Mercier, "Multi-Neural Networks Hardware


and Software Architecture : Application of Divide to Simplify Paradigm
DTS", IWANN' 97, Lanzarote, 1997.

[CHEN 99] K. Chen, L. Xu, H. Chi, "Improved Learning Algorithms for mixture of
experts in multiclass classification", Neural Networks 12, pp1229-1252,
1999.

[COMB 02] C. Combastel, S. Gentil, J-P. Rognon, "Génération de Résidus Adaptative


pour le Diagnostic de la Machine Asynchrone", Conférence
Internationale Francophone d' Automatique, pp 453-458, Nantes, 8-10
juillet 2002.

[DON 97] M. Don, A. Masuda, R. Nelson, D. Brackmann, "Sucessful detection of


small acoustic tunour using the stacked derived-banded auditory
brainstem response auditory", The American Journal of Otology, 18:608-
621, 1997.

[DUBU 90] Dubuisson, "Diagnostic et Reconnaissance des Formes", Hermès, Traité


des Nouvelles Technologies, Série Diagnostic et Maintenance, 1990

[DUJA 99a] A-S Dujardin, V. Amarger, K. Madani, O. Adam, J-F. Motsch. "Multi-
Neural Network approach for Classification of Brainstem Evoked
Response Auditory". Lecture Notes in Computer Science - Biological and
Artificial Computation : From Neuroscience to Technology, Edité par :
Jose Mira, Roberto M. Diaz et Joan Cabestany - Springer Verlag Berlin
Heidelberg 1999.

[DUJA 99b] A-S Dujardin-Bellanger, V. Amarger, K. Madani, O. Adam, J-F. Motsch,


"Une approche Multi-Neuronale pour la classification des Potentiels
Evoqués Auditifs". CNRIUT' 99, Modélisation et Simulation, ouvrage Ed.
par L'
Harmattan, 1999.

[DUJA 99c] A-S Dujardin, V Amarger, K Madani, "A Multi-Neural Networks


Approach for Biomedical Applications : Classification of Brainstem
Auditory Evoked Potentials", International Joint Conference on Neural
networks (IJCNN'99 Proceedings), Washington DC, USA, July 10-16,
1999.

119
[DUJA 01a] A-S Dujardin, V. Amarger, K. Madani, "Approches Neuronales pour
Diagnostic Industriel : Application à la Classification de Signaux
Ultrasonores", CNRIUT' 01, Roanne, ouvrage Ed. par les Publications de
l'
Université de Saint-Étienne, 2001

[DUJA 01b] A-S Dujardin, "Pertinence d'une approche hybride multi-neuronale dans
la résolution de problèmes liés au diagnostic industriel ou médical",
Valgo n°01-02 , octobre 2001, ISSN 1625-9661. (http://www.supelec-
rennes.fr/acth/valgo/Valgo_Numero-01-02.html)

[DURS 75] F. Durst, M. Zare, "Laser Doppler measurements in Two-Phase Flows",


Proc LDA Symp., 1975, Copenhagen, pp. 403-429.

[GROS 92] M. Grossman, "Détection automatique d’évolutions vibratoires de


machines tournantes", Progrès récents des méthodes de surveillance
acoustiques et vibratoires, Senlis, France, Octobre 1992

[HEBB 49] S. Hebb, "The Organization of Behaviour", Wiley and Sons, New York,
USA, 1949

[JODO 94] J.F. Jodouin, "Les réseaux neuromimétiques : Modèles et Applications",


Editions Hermès, Paris, 1994.

[JORD 95] M. I. Jordan, L. Xu, "Convergence Result for the EM Approach to


Mixtures of Experts Architectures", Neural Networks, Vol.8, n°9,
pp.1409-1431, 1995.

[KOHO 88] T. Kohonen, "Learning Vector Quantization", Neural Networks, vol.1,


suppl. 1, p. 303, 1988.

[KOHO 89] T. Kohonen, "Self Organising and Associative Memoy", 3rd ed., Springer-
Verlag, Germany, 1989.

[LEMO 98] H. Lemonnier, Ch. Boyer, "Phase fraction determination in three-phase


dispersed flows by ultrasonic methods", Third International Conference
on Multiphase Flow, ICMF’ 98, Lyon France, 8-12 Juin, 1998.

[LEUT 98] S. Leuthner, A. H. Manu, H. Auracher, "A high frequency impedance


probe for wave structure identification of falling films", Third
International Conference on Multiphase Flow, ICMF’ 98, Lyon France, 8-
12 Juin, 1998.

[MATL] Neural Networks ToolBox, http://www.Mathworks.com

[MOOD 89] J. Moody, C.J. Darken, "Fast Learning in networks of Locally Tuned
Processing Units", Neural Computation, Vol.1, pp. 281-294, 1989.

120
[MOTS 87] J.-F. Motsch, "La dynamique Temporelle du Tronc Cérébral : Recueil,
extraction et analyse optimale des Potentiels Evoqués Auditifs du Tronc
Cérébral", Thèse d' Etat de doctorat, Université de Créteil-Paris XII,
1987.

[MUST 92] M. T. Mustawi et al., "On the taining of Radial Basis Functions
Classifiers", Neural Networks, Vol. 5, pp.595-603, 1992.

[NIRA 88] M. Niranjan, F. Fallside, "Neural Networks and Radial Basis Function in
classifying-static speech pattern", Report CUED/FINFENG/TR22,
Cambridge University, England, 1988.

[POWE 85] M. J. D. Powell, "Radial Basis Function for Multi-Variable


Interpolation", IMA Conférence, Shrivenham, England, 1985.

[RUME 86] D.E. Rumelhart, G.E. Hinton, R.J. Williams, "Parallel Distributed
Processing", MIT Press, 1986.

[SCHW 02] F.Scwenker, C. Dietrich, H.A. Kestler, K. Riede, G. Palm, "Radial Basis
Function Neural Networks and Temporal Fusion for the Classification of
Bioacoustic Time Series", Neurocomputing, vol 51, pp 265-275, 2002

[SHOR 76] E. Shortliffe, "Computer-based medical consulation : MYCIN", Elsevier,


New-York, USA, 1976

[SRID 99] D.V. Sridhar, E.B. Bartlett, R.C. Seagrave, "An Information Theoretic
Approach for Combining Neural Network Process Model", Neural
Networks 12, pp 915-926, 1999.

[THOM 99] W.T. Thomson, "A Review of On-line Condition Monitoring Techniques
for Three-Phase squirrel-Cage Inductor Motors – Past, Present and
Future", IEEE SDEMPED' 99, Gijon, Spain, pp3-18, 1999.

[VENK 89] V. Venkatasubramanian, K. Chan, "A neural Network Methodology for


Process Fault Diagnosis", American Institute of Chemical Engineers
Journal, Vol. 35, n°12, pp1993-2002, 1989.

[VUCK 02] A. Vuckovic, V. Radivojevic, A. C. N. Chen and D. Popovic, "Automatic


recognition of alertness and drowsiness from EEG by an artificial neural
network", Medical Engineering & Physics, Volume 24, Issue 5, June
2002, Pages 349-360.

[YANG 03] D.M. Yang, A.F. Stronach, P. MacConnell, "The Application of Advances
Signal Processing Techniques to Induction Motor Bearing Condition
Diagnosis", Meccanica 38, pp297-308, Kluwer Academic Puvlishers.

121
[ZWIN 91] G. Zwingelstein, M.H. Masson, B. Dubuisson, M. Pavard, J. Mazaleyrat,
"The applications of neural netaworks for the predicitve maintenace of
nuclear plants", Proceedings of the 3rd Symposium on Expert System
Application te Power Systems, Tokyo, April 1992.

[ZWIN 92] G. Zwingelstein, "Quelles perspectives industrielles pour les réseaux de


neurones dans les centrales nucléaires", Séminaire Institute for
International Research, Paris, 1992

[ZWIN 95] G. Zwingelstein, "Diagnostic des Défaillances", Hermès, Traité des


Nouvelles Technologies, Série Diagnostic et Maintenance, 1995.

122
Le problème du diagnostic se rencontre dans de nombreux domaines, notamment
médical et industriel, et l’ homme y joue un rôle indispensable. La difficulté majeure liée à ce
problème repose sur la similitude des signatures qui permettent de faire un diagnostic. De
plus, on dispose souvent d’ une connaissance empirique du système, et donc, d’ un modèle
incomplet, nécessitant le recours à un expert. Nos efforts se sont concentrés sur des
techniques à base de réseaux de neurones artificiels (RNA) pour l' aide au diagnostic. En effet,
en ce qui concerne les tâches de reconnaissance, de classification et de décision, les
techniques proposées représentent un certain nombre d' avantages par rapport aux approches
conventionnelles grâce à leur capacité d' apprentissage et de généralisation. Constatant de plus
que les techniques neuronales simples ne permettent pas d’ obtenir de bons résultats, nous
proposons une structure neuronale hybride. Deux volets ont alors été considérés : l' un lié au
domaine biomédical et l' autre, concernant le domaine industriel.

: Aide au diagnostic, Réseaux de neurones artificiels, Catégorisation de


signatures, Technique neuronale hybride.

The problem of diagnosis occurs in many fields, especially medical and industrial,
where operator has a key role. The major difficulty bound to this problem lies on the
resemblance between the signatures which allow to make a diagnosis. Furthermore, we often
have an empirical knowledge of the system, and thus, an incomplete model, requiring the
appeal to an expert. Our efforts were focused on techniques based on neural techniques for
computer aided diagnosis. For the tasks of pattern recognition, classification and decision, the
proposed techniques indeed presents a number of advantages over classical models because of
their abilities of learning and generalization. Moreover, noticing that simple neural techniques
do not allow obtaining good results, we propose a neural hybrid structure. Two applications
have been considered: one linked to the biomedical field and the other concerning the
industrial domain.

Computer aided diagnosis, Artificial neural networks, Signatures’ classification,


Neural hybrid structure.

Vous aimerez peut-être aussi