Vous êtes sur la page 1sur 5

SETIT 2007

4th International Conference: Sciences of Electronic,


Technologies of Information and Telecommunications
March 25-29, 2007 – TUNISIA

Système multicapteur utilisant les réseaux de


neurones artificiels pour la surveillance des eaux
potables
Mohamed Bouamar, Mohamed Ladjal
LASS, Laboratoire d’Analyse des Signaux et Systèmes, Université de M’sila, Algérie
medbouamar@yahoo.fr
medladjal@yahoo.fr

Résumé : Le domaine de surveillance de l’eau potable acquiert depuis quelques temps une importance particulière.
Dans les usines de production et de distribution, on s’intéresse de plus en plus à la qualité de cette ressource vitale dans
le but d’une maîtrise des risques. Pour cela, plusieurs méthodes et techniques de surveillance ont été mises en œuvre.
On présente dans cet article une technique à base de réseaux de neurones artificiels (RNAs) implantée au niveau d’un
système multicapteur de surveillance. Il s’agit d’une méthode d’apprentissage statistique qui affiche des performances
d’entraînement et de généralisation optimales dans plusieurs domaines, entre autres le domaine de reconnaissance de
formes. Appliquée comme outil de classification, cette technique assure au sein du système un contrôle direct et quasi
permanent de la qualité de l’eau. Pour sa validation, une étude en simulation est effectuée sur le temps d’apprentissage,
le taux de reconnaissance, et la sensibilité au bruit. Dans le but de montrer son bon fonctionnement, une application est
présentée.
Mots clés : Système multicapteur, Surveillance des eaux potables, RNAs, Classification, Simulation.

techniques, on trouve les réseaux de neurones


artificiels (RNAs) qui se démarquent des autres outils
INTRODUCTION par leurs capacité et rapidité d’apprentissage.
Le domaine de surveillance de l’eau potable Présentant des performances dans plusieurs domaines,
présente des caractéristiques bien spécifiques qu’il est ils sont utilisés en reconnaissance de formes comme
indispensable d’en tenir compte dans la construction outil de classification ou de régression [TOR 97]
d’une démarche globale de prévention des risques. La [REY 02]. Le travail présenté dans cet article, utilise
qualité doit être garantie par une surveillance et un ces RNAs intégrés dans un système de surveillance
contrôle permanents à travers des mesures qualifiables dédié au contrôle de la qualité de l’eau potable. Le
et quantifiables dans le but de ne pas ralentir la problème posé est vu comme un problème de
production et d’en assurer un niveau de qualité élevé classification à deux classes (classe potable, classe
et uniforme [VAL 00] [SCH 00]. Le but de cette non potable). L’architecture du système à base d’une
maîtrise est de pallier sans aucun doute les approche multisensorielle, est présentée dans la
conséquences graves qui se concrétisent au niveau des figure 1. Les paramètres descripteurs de l’eau
risques encourus pour la santé publique. L’exigence [VAL 99] sont transformés en signaux électriques à
d’une réglementation très stricte des pouvoirs publics partir de capteurs physico-chimiques, pour être ensuite
est alors bien justifiée. transmis vers une unité de traitement qui assure
Durant ces dernières années, d’importants efforts l’acquisition et l’analyse. Le réseau RNA implanté, a
ont été déployés dans le développement de méthodes pour rôle d’effectuer une séparation des données en
de contrôle et de surveillance automatique dans ce deux classes bien distinctes. Un module
domaine. Les techniques de l’intelligence artificielle d’apprentissage supervisé par un expert humain
qui servent comme outil de base pour l’aide à la collecte de façon continue et permanente les
décision, présentent une réponse plus élaborée qui paramètres relatifs aux différents états de l’eau pour la
peut être obtenue soit à partir de données brutes mise en œuvre d’une base de connaissance.
venant directement des variables de surveillance, soit
à partir de données traitées venant des sorties de
traitements de bas niveau [ZEM 03]. Parmi ces

-1-
SETIT2007

Carte
PCI-ADC pH
biais

Décision Décision
Capteurs
C yd
pH, T°, C, .. Neurone
Opérateur de sortie
TU
Base de
données O2 Couches cachées
Eau
Neurones
d’entrée
Fig.1. Schéma fonctionnel du système multicapteur de
surveillance.
Fig.2. Perceptron multicouche, PMC.
Le système construit autour d’un PC et d’une carte
d’acquisition multivoie de dernière génération, est Les neurones de la couche cachée ont la capacité de
destiné pour acquérir plusieurs signaux en entrée. Il traiter l’information reçue. Chaque neurone effectue
s’agit de la carte d’acquisition PCI-ADC de chez deux opérations bien distinctes, à savoir une somme
« BleuChip Technology ». Elle dispose de 16 entrées pondérée de ses entrées, suivie d’une transformation
analogiques simples (asymétriques), ou 8 entrées par une fonction d’activation non linéaire, continue, et
différentielles, de résolution 12 bits ±5mV, et ±5V à complètement dérivable. Plusieurs fonctions de ce
gains programmables. Elle dispose de sorties type existent, notre choix est porté cependant sur la
analogiques et numériques permettant une éventuelle fonction sigmoïde bornée entre « -1 » et « +1 », dont
intégration dans une boucle de commande ou de son expression est : [YIN 04]
régulation.
e βx − e − βx
Notre objectif recherché se limite toutefois à la E ( x) = tanh( βx) = (1)
validation par simulation des RNAs dans ce domaine. e β x + e − βx
Une évaluation des performances en matière de temps Ce type de fonctions a la propriété d’être
d’apprentissage, de taux de reconnaissance et de différentiable ; les fonctions dérivées qui en résultent
sensibilité au bruit est effectuée. Les paramètres peuvent être exprimées facilement à l’aide de ces
descripteurs choisis dans l’analyse sont comme suit : mêmes fonctions, ce qui assure un gain en temps de
le pH, la température (T°), la conductivité (C), la calcul non négligeable. L’apprentissage supervisé par
turbidité (TU), et l’oxygène (O2) [VAL 99]. le réseau consiste à déterminer les poids qui
minimisent sur l’ensemble des données de la base
1. Les RNAs d’entraînement, les écarts entre les valeurs de la sortie
Le développement de systèmes de surveillance de désirée yr, et les valeurs de la sortie décidée yd. Le
type « machine environnement » représente souvent minimum du critère quadratique suivant est à trouver :
un problème complexe. Les modèles mathématiques 1 N
de tels systèmes qui sont non linéaires de nature, sont
quasiment impossibles à construire à cause de leurs
Cw =
N
∑(y
i =1
ri − y di ) 2 (2)

caractéristiques dynamiques et stochastiques. Le


problème exposé dans cet article est vu plutôt comme Avec N égal au nombre d’exemples de la base
un problème de reconnaissance de formes à base d’apprentissage.
d’une classification. Depuis quelque temps un certain Il y a ici un problème d’optimisation non linéaire
nombre de modèles basés sur les réseaux de neurones classique. La technique traditionnellement employée
artificiels ont été développés et appliqués dans le pour effectuer l’apprentissage supervisé est
domaine de l’eau. Quelques études récentes [HER 05], l’algorithme de rétro propagation de l’erreur
[YIN04], ont montré l'efficacité potentielle de cette [DAV 93]. Initialement, on utilisait la méthode
approche. Dans notre application, une classification de d’optimisation non linéaire du gradient [TOR 97]. Une
données non linéaire est opérée en utilisant le méthode connue pour avoir un comportement
perceptron multicouche avec au moins une seule oscillatoire proche de la solution. Actuellement les
couche cachée, (figure 2) [MAK 89], [CHE 90]. méthodes dites du 2ème ordre (basées sur une
approximation du Hessienne) sont plutôt préférées ;
elles fournissent toutefois de bien meilleurs résultats.
Parmi les plus connues, citons la méthode de
Levenberg-Marquardt utilisée dans notre application.

-2-
SETIT2007

2. Simulation
Le modèle RNA implanté dispose de cinq Architecture du Taux_rec (%)
Algorithme réseau
neurones en entrée correspondant aux capteurs (couches caches)
Min Max Moy
utilisés. Différentes architectures sont testées pour Scaled
conjugate 02 80.30 84.00 82.35
déterminer le nombre adéquat de couches et de gradient
neurones cachés. Pour cela les algorithmes Levenberg-
03 79.5 82.40 81.16
d’apprentissage (Scaled conjugate gradient et Marquardt
Levenberg-Marquardt) sont tous les deux utilisés. On
présente dans le tableau 1 les résultats correspondants Tableau 2. Résultats de généralisation
à une base de données de 500 vecteurs, réalisée selon
les normes de potabilité recommandées. Les Une bonne adéquation des deux réseaux testés est
paramètres tels que le nombre d’itérations (NI), le affichée. Un taux de reconnaissance plus de 80 % est
temps d’apprentissage (T_appr) et l’erreur réalisé avec une erreur inférieure à 10-9. Le minimum
d’entraînement (Er) sont indiqués pour différents de temps d’apprentissage et de nombre d’itérations,
types de réseaux testés. En matière de reconnaissance, ainsi qu’une meilleure précision, sont obtenus par
on peut d’ores et déjà supposer qu’un taux plus de l’algorithme de « Levenberg-Marquardt ». Toutefois,
75% est jugé satisfaisant [REY 02]. et afin de vérifier la capacité d’apprentissage de ces
deux réseaux, nous avons utilisé une base
d’entraînement de 1000 vecteurs. Le réseau à trois
Architecture du réseau couches cachées utilisant l’algorithme de
T_appr
Algorithme Nbre de NI Er « Levenberg-Marquardt » reste le mieux placé
Nbre de neurones en (s)
couches
couches cachées réalisant un taux de reconnaissance de 86.24 %. Cette
cachées

Scaled 01 10 50000 2091.2 10-6 performance est confirmée en phase de généralisation


conjugate 02 (6, 4) 50000 2032.5 5.10-10 sur une base de données réelle de 1000 vecteurs où un
gradient 03 (4, 3, 2) 50000 2069.6 1.25 10-6 taux de reconnaissance de 92.70 % est obtenu.
01 10 126 10 10-15
Levenberg-
02 (12, 8) 23 7.4 10-15 ƒ Sensibilité au bruit
Marquardt
03 (4, 3, 2) 23 7.6 5.97 10-17 L’utilisation de capteurs physiques comme source
d’information dans un système de contrôle et de
Tableau 1. Résultats d’apprentissage. surveillance, nécessite le plus souvent un soin
particulier des données manipulées. Ces transducteurs
sont souvent à l’origine de parasites et de bruits
Les résultats montrent qu’avec l’application de
intrinsèques ou provenant du milieu environnant. En
l’algorithme « Scaled conjugate gradient », le nombre
outre des techniques de mise en forme et de filtrage
d’itérations est relativement important (5.104), d’où un
utilisées, que se soit sur le plan analogique ou
temps d’apprentissage assez conséquent (30 à 45 min).
numérique, il reste néanmoins important de mesurer la
L’erreur d’entraînement reste relativement faible (d’un
robustesse de la méthode employée. Dans ce qui suit,
ordre inférieur à 10-9, pour le réseau à 2 couches).
nous allons vérifier la sensibilité du réseau RNA (03
Cependant l’utilisation de l’algorithme de
couches) retenu, aux bruits superposés aux données
« Levenberg-Marquardt » est plutôt préférable, car il
d’entrée. Une simulation est effectuée en ce sens, en
fournit de bien meilleurs résultats. Le nombre
introduisant artificiellement différents niveaux de bruit
d’itérations est plus faible (entre 20 et 130), soit un
blanc au niveau de ces mesures. Trois (03) vecteurs
temps d’apprentissage plus court (entre 7 et 10 sec).
descripteurs de test sont utilisés pour vérifier cette
Le réseau à trois couches cachées utilisant ce même
sensibilité. Appartenant à la classe non potable, ces
algorithme s’avère le mieux adapté. Il se caractérise
vecteurs sont situés par rapport au seuil comme suit :
par un temps d’apprentissage de 7.6 sec et une erreur
VS0, considéré comme le vecteur le plus proche, VS1
d’entraînement de 5.97 10-17. Pour procéder à la phase
distant de celui-ci d’une distance d dans le sens non
de généralisation, des bases de données aléatoires de
potable, et enfin VS2 situé plus loin encore à une
1000 vecteurs sont constituées. Une évaluation en
distance supérieure. Les positions de ces vecteurs par
matière de taux de reconnaissance (Taux_rec) pour les
rapport au seuil, sont montrées dans la figure 3. Une
deux réseaux cités est effectuée. Le tableau 2 montre
analyse statistique utilisant 4 niveaux de bruit à signal
les résultats obtenus.
différents (B/S= -20, -40, -60, et -80dB), est effectuée.
Pour chaque niveau, une cinquantaine de tests est
réalisée. Le tableau 3 montre les taux de
reconnaissance obtenus pour les différents vecteurs de
test.

-3-
SETIT2007

du réseau. Un taux de reconnaissance de 95.90 % est


obtenu pour cela, soit 4.10 % de fausses alarmes sur
l’ensemble des décisions réalisées. Ce faible taux de
Classe fausses alarmes obtenu est sans doute très
Seuil
potable encourageant dans ce type d’application. La sensibilité
du domaine et les dangers imprévus appellent pour
plus d’améliorations afin de minimiser davantage les
risques encourus. Faut-il souligner toutefois qu’en
VS0
matière de temps d’exécution, l’opération de décision
effectuée par le réseau ne dure que 16 µs. Un
Classe traitement dynamique du système multicapteur
VS 1,2 opérant sur plusieurs voies en entrée (supérieur à 5
Non potable
voies) reste parfaitement justifié.
2

Fig.3. Positions des vecteurs de test. 1

0
Sortie décidée

-1
Fausses alarmes
Taux de reconnaissance en fonction du A
Vecteurs -2
rapport B/S 0 50 100 150 200 250 300 350
de test
-80 dB -60dB -40dB -20dB
2
VS0 100 % 60 % 52 % 52 %
VS1 100 % 100 % 70 % 54 % 1
VS2 100 % 100 % 74 % 58 %
0
Sortie réelle

Tableau 3. Sensibilité du réseau RNA au bruit. -1


B
-2
0 50 100 150 200 250 300 350

3
On observe une nette dégradation du taux de 2.5
Sortie réelle
reconnaissance du réseau pour le vecteur VS0 quand ........... Sortie décidée
2
le rapport B/S augmente. Il y a d’ailleurs une nette
1.5
limitation d’immunité au bruit pour un rapport B/S
supérieur ou égal à -60 dB. Cependant, on remarque 1

que les vecteurs VS1 et VS2 ne subissent aucune 0.5

altération pour B/S inférieur ou égal à – 60 dB. La 0

dégradation de la décision n’est ressentie pour ces -0.5


deux vecteurs qu’à partir de -40 dB et plus. Il est clair -1
que le vecteur le plus loin (VS2) est le moins altéré. Fausses décisions
-1.5 C
On peut dire alors que le réseau RNA retenu pour cette
40 60 80 100 120 140 160 180 200
application, affiche une résistance acceptable pour des
bruits ayant un rapport B/S inférieur à - 20 dB.
Fig.4, Comparaison des courbes de potabilité
(A : RNA, B : réelle).
3. Application
Un exemple de simulation est illustré dans la
figure 4, où est supposé montrer un enregistrement
annuel correspondant à un suivi quotidien de la 4. Conclusion
potabilité d’un réservoir alimenté en eau. Dans la Les divers dispositifs et outils de surveillance
partie (A) de la figure, est représentée la fonction de dans le domaine de l’eau existants actuellement de par
décision du réseau (sortie décidée). La partie (B) le monde, sont réalisés dans le but d’assurer une
montre l’état réel de potabilité de cette eau, (potable = surveillance permanente et efficace. C’est dans l’esprit
1 et non potable = -1). En effet, si la valeur de la sortie et l’intérêt considérable que présente le contrôle de la
décidée est proche de 1, l’observation évaluée qualité de cette ressource dans les usines de
correspond à un état où l’eau est supposée comme production et de distribution, que nous avons tenté
potable. Si par contre cette valeur est proche de -1, un dans cet article d’exposer notre application. Le
état non potable est considéré. Dans la partie (C) de la système multicapteur proposé, appelé à assurer un
figure, un effet de zoom porté sur la sortie décidée contrôle dynamique et permanent, utilise la technique
pour montrer quelques erreurs de classification des réseaux de neurones artificiels en tant qu’outil de
apparues. Il y a 5.21 % de fausses alarmes sur classification de données. Ceux-ci (les RNAs) ne
l’ensemble des décisions réalisées, soit une erreur de disposent cependant pas de règles bien précises pour
moins de 2 fois/mois. Pour confirmer ce résultat, des fixer le nombre de neurones et de couches cachées. Un
vecteurs descripteurs au nombre de 1000 provenant problème de choix est posé et reste donc le principal
d’une base de données réelle sont présentés à l’entrée inconvénient. Par contre une assez nette amélioration

-4-
SETIT2007

du taux de reconnaissance est constatée quand on [SCH 00] W. Schon, K. Odeh, T. Denoeux, F. Fotoohi,
augmente la base d’apprentissage. Un enrichissement Maîtrise des risques dans le domaine de l’eau potable, In
continuel de celle-ci avec le temps est pratiquement Actes du 12ème Colloque National de Sûreté de
indispensable, car cela dépend de beaucoup de Fonctionnement, Laboratoire SIME Système Intelligents
paramètres aussi bien climatiques que géographiques. pour la Maîtrise de l’Eau, Montpellier, France, pages 695-
Il importe dans cette situation de déterminer la taille 701, March 2000.
du réseau qu’il faut, pour décrire au mieux les données
[TOR 97] Juan-manuel TORRES-MORENO, Apprentissage
acquises. Sur le plan de l’apprentissage, l’algorithme
et généralisation par des réseaux de neurones : Etude de
« Scaled conjugate gradient » nécessite plus
nouveaux algorithmes constructifs, Thèse de Doctorat,
d’itérations avec une erreur d’entraînement moins
Institut national polytechnique de Grenoble, France, 1997.
faible que celle obtenue avec l’algorithme de
« Levenberg-Marquardt ». Ceci représente un autre [VAL 00] N. Valentin, Construction d’un capteur logiciel
critère entrant dans le choix de l’architecture du réseau pour le contrôle automatique du procédés de coagulation en
et de son implantation. Il apparaît que sur le plan traitement d’eau potable, Thèse de doctorat, Laboratoire des
décisionnel, le réseau RNA choisi a présenté de bons Eaux, UTC, 2000.
résultats, avec des taux de reconnaissance allant
[VAL 99] N. Valentin, T. Denoeux, F. Fotoohi. A hybrid
jusqu’à plus de 90 % en généralisation. Le faible
neural network based system for optimization of coagulant
pourcentage de fausses alarmes justifie l’intérêt d’un
dosing in a water treatment plant. Proceedings of IJCNN'99,
tel emploi pour ce type d’application. Vis-à-vis du
Washington D.C, July 1999.
bruit, il a aussi présenté une robustesse relative. Le
temps de calcul imparti à la phase d’apprentissage est [YIN 04] Yin, Zhilin Li, Onyx WH Wai, Bruce King,
très court (quelques secondes), ce qui lui confère Integration of multi-source data for water quality
l’avantage d’une intégration dans un système de classification in the Pearl River estuary and its adjacent
surveillance dynamique. Les avantages restent coastal waters of Hong Kong, Continental Shelf Research
nombreux en tous cas, que se soit sur le plan de son 24, 1827–1843, 2004.
adaptation pour les problèmes de classification, ou sa
[ZEM 03] M. R. Zemouri, Contribution à la surveillance des
mise œuvre du point de vu algorithmique. Faut-il
systèmes de production à l’aide des réseaux de neurones
souligner que le principal souci reste l’obtention d’une
architecture optimale. Des améliorations peuvent dynamique, Application à la e-maintenece, Thèse de
doctorat, Université de Franche-Comté, 2003.
toujours être opérées à ce niveau en ajoutant de
nouveaux capteurs en entrée capables de fournir plus
d’informations. D’autres techniques d’apprentissage
statistiques telles que les machines à vecteurs de
support (SVMs) peuvent aussi être appliquées.

REFERENCES
[CHE 90] Chester D. L. Why two hidden layers are better
than one. In Proceedings of International Joint Conference
on Neural Networks, Vol. 1, pp. 265-268, Washington, DC,
1990.
[DAV 93] E. Davalo, P. Naïm, Des réseaux de neurones,
2ème édition, Edition EYROLLES, Paris, 1993.
[HER 05] H. Hernandez, Développement d'un capteur
logiciel pour la prédiction de la dose de coagulant dans une
station de traitement d'eau potable en vue de son diagnostic,
Rapport LAAS No05175, 6ème Congrès des Doctorats de
l'Ecole Doctorat Systèmes (EDSYS), Toulouse , France, 17-
20 Mai 2005.
[MAK 89] Makhoul J., El-Jaroudi A., et Schwartz R.
Formation of disconnected decision regions with a single
hidden layer. In Proceedings of the International Joint
Conference on Neural Networks, Vol. 1, pp. 455-460, 1989.
[REY 02] R. A. Reyna Rojas, Conception et intégration
VLSI d’un système de vision générique, Application à la
détection et la localisation d’objets à l’aide de support vector
machines, Thèse de doctorat, Laboratoire LAAS – CNRS,
N°02226, Toulouse, France, 2002.

-5-