Académique Documents
Professionnel Documents
Culture Documents
Alexander Vergaraa, ,1, Shankar Vembua,1, Tuba Ayhanb,2, Margaret A. Ryanc, Margie L. Homer c,
Ramón Huertaa
a BioCircuits Institute, Université de Californie, San Diego, La Jolla, CA 92093, ÉtatsUnis
b
Département d'ingénierie électronique et de communication, Université technique d'Istanbul, Maslak, TR34469 Istanbul, Turquie
c
Jet Propulsion Laboratory, California Institute of Technology, 4800 Oak Grove Drive, Pasadena, CA 91109, ÉtatsUnis
Historique des articles : La dérive des capteurs reste le problème le plus difficile en matière de détection chimique. Pour résoudre ce problème, nous
Reçu le 27 septembre 2011
avons collecté un vaste ensemble de données sur six composés organiques volatils différents sur une période de trois ans
Reçu sous forme révisée
dans des conditions de fonctionnement étroitement contrôlées à l'aide d'un réseau de 16 capteurs de gaz à oxyde métallique.
26 novembre 2011
Les enregistrements ont été réalisés à l’aide du même réseau de capteurs et d’un système de distribution de gaz robuste. Au
Accepté le 17 janvier 2012
Disponible en ligne le 1er mars 2012 meilleur de nos connaissances, il s'agit de l'un des ensembles de données les plus complets disponibles pour la conception
et le développement de méthodes de compensation de dérive, librement accessible en ligne. Nous avons introduit une
approche d'apprentissage automatique, à savoir un ensemble de classificateurs, pour résoudre un problème de discrimination
Mots clés:
Dérive du capteur de gaz sur des périodes prolongées avec des taux de précision élevés. Les expériences indiquent clairement la présence
Capteurs d'oxyde métallique d'une dérive dans les capteurs pendant une période de trois ans et que cela dégrade les performances des classificateurs.
Classification des séries chronologiques Notre méthode d'ensemble proposée basée sur des machines à vecteurs de support utilise une combinaison pondérée de
Méthodes d'ensemble classificateurs formés à différents moments. Comme l'illustrent nos résultats expérimentaux, l'ensemble de classificateurs est
Machines vectorielles de support capable de bien gérer la dérive du capteur et fonctionne mieux que les méthodes concurrentes de base.
© 2012 Elsevier BV Tous droits réservés.
09254005/$ – voir la préface © 2012 Elsevier BV Tous droits réservés. est ce que je:10.1016/
j.snb.2012.01.074
Machine Translated by Google
les trois aspects suivants ont été soulignés : (i) de tous les La méthode d’ensemble utilisée dans cet article complète, plutôt que
technologies de détection disponibles, capteurs de gaz à base d'oxyde métallique [12] est en concurrence avec les méthodes de correction des composants existantes
restent la meilleure option pour les applications à long terme en continu mentionné cidessus; puisque les méthodes de correction des composants sont
systèmes de surveillance; (ii) un gaz d'étalonnage est recommandé pour essentiellement une technique de prétraitement, on peut en effet utiliser l'ensemble
estimer la compensation de dérive du capteur, et (iii), le remplacement du capteur méthode sur les données prétraitées également. Dans le reste de ceci
est inévitable sur de longues périodes. article, nous décrivons d’abord la configuration expérimentale, l’ensemble de données et
Dans les applications pratiques, il est difficile de différencier empiriquement les méthodes d'extraction de caractéristiques considérées dans ce travail (Section
entre la dérive réelle et la dérive du second ordre, si possible. En conséquence, il est 2). Nous décrivons ensuite l’algorithme de compensation de dérive (Section
difficile de développer des méthodes pour corriger différentes sources. 3), suivie d'une description détaillée de nos résultats expérimentaux (Section 4). Et enfin,
de dérive car son origine ne peut être déterminée. Utiliser un nous présentons les commentaires concluants
Un système de distribution efficace permet aux capteurs chimiques de contourner le tirés des résultats présentés dans cet article (Section 5).
effet de dérive du second ordre, permettant de se concentrer exclusivement sur les capteurs
chimiques pour compenser la dérive réelle. Dans notre 2. Collecte de données
système de livraison de gaz particulier, nous pouvons contrôler le second ordre
la dérive également, afin que nous puissions nous attaquer exclusivement au véritable problème de dérive. Ainsi,
Nous appliquons notre méthode de compensation de dérive à une vaste gamme
dans la suite de ce document, nous utilisons le terme dérive pour désigner
ensemble de données3 enregistré par un réseau de capteurs de gaz à oxyde métallique. Dans ce
véritable dérive. Concernant la réduction réelle de la dérive, de nombreux efforts ont été
section, nous décrivons la configuration expérimentale, le protocole d'enregistrement et les
consacré à la recherche de matériaux de capteurs capables d'interagir de manière réversible
algorithmes de traitement du signal utilisés pour la fonctionnalité
avec le gaz afin que les molécules détectées se détachent du matériau du capteur dès que extraction.
le gaz a été purgé de la surface du capteur
[1315]. D'autres solutions basées sur une modification périodique de la température de
fonctionnement du capteur [16, 17] ont également été mises en œuvre dans 2.1. Le montage expérimental
dans la réponse du capteur est nécessaire pour contrecarrer efficacement la dérive. réseau de capteurs de gaz à semiconducteurs à oxyde métallique, fabriqué et
Toutefois, ce traitement général ne constitue qu'une facette de commercialisé par Figaro Inc. [12], pour nos expériences. Le
le problème ce qu'on appelle la dérive à court terme une étude approfondie de la conception personnalisée utilisée dans la technologie de détection comprend une ligne
la variabilité du capteur sur des périodes plus longues est également nécessaire. de chauffage électrique RuO2 (oxyde de ruthénium) à contrôle indépendant
Les solutions les plus couramment utilisées pour faire face à la dérive des capteurs et un film semiconducteur à oxyde métallique en tant que matériau de capteur imprimé
Au sein de la communauté de détection chimique, il existe des méthodes univariées et sur les électrodes de mesure (métal noble). Le capteur obtenu
l'élément est monté sur un substrat d'alumine puis connecté
multivariées, dans lesquelles la compensation de la dérive est effectuée soit sur
chaque capteur individuellement ou sur l'ensemble du réseau de capteurs [9,18]. Parmi par des fils conducteurs jusqu'aux broches du boîtier du capteur. Le tableau résultant,
les méthodes de compensation de dérive multivariées, les techniques de correction de rempli de capteurs (4 de chaque) étiquetés par le fabricant
composants non supervisées sont les plus populaires [4,19,20]. Ces comme TGS2600, TGS2602, TGS2610, TGS2620 est placé dans une chambre de test
les techniques reposent sur la recherche de transformations linéaires qui normalisent d'un volume de 60 ml, où les substances odorantes d'intérêt, sous forme gazeuse
les réponses du capteur dans le temps afin qu'un classificateur puisse être directement forme, doivent être injectés pour des essais. Pour générer l'ensemble de données requis,
appliqué aux données stationnaires résultantes. Par exemple, la méthode de correction nous connectons ladite chambre d'essai à un système à flux continu contrôlé par ordinateur,
˚
des composants présentée par Artusson et al. [4] s'applique qui offre une polyvalence pour le transport du
la transformation suivante vers la matrice de mesure/données composés chimiques d'intérêt aux concentrations souhaitées pour
X←X − (X · c)c, où c est le ou les vecteurs composants principaux du la chambre de détection avec une grande précision et de manière hautement reproductible
mesures calculées à l'aide d'un gaz de référence qui peut approximer la direction de dérive. tout en maintenant le débit total constant. En particulier,
Le principal inconvénient de ces techniques notre système utilise trois débits massiques numériques supervisés par ordinateur
est qu'ils supposent que la direction de la dérive est linéaire dans l'entité contrôleurs (MFC) (fournis par Bronkhorst HighTech BV [26]),
l'espace et, par conséquent, une transformation linéaire des données suffit chacun d'eux avec des niveaux de débit maximum différents (200, 100 et
pour le corriger. Bien qu'il soit tout à fait plausible que les versions kernelisées 20 ml/min, ±1 % de précision). De tels dispositifs se connectent à différentes bouteilles de
L'analyse des composantes, telle que l'analyse des composantes principales du noyau [21], gaz sous pression, qui contiennent, diluées dans de l'air sec, soit le
peut être appliquée pour tenir compte des nonlinéarités dans la dérive. gaz vecteur ou les analytes chimiques à mesurer. Maintenir
direction, ces techniques n’ont pas été beaucoup étudiées dans le le niveau d'humidité est constant à 10 % HR (mesuré à 25 ± 1 ◦C) pendant tout le processus
communauté de détection chimique. Aussi, à l'exception de la Réf. [20], de mesure, nous utilisons de l'air synthétique sec
ces techniques nécessitent un gaz de référence utilisé pour se rapprocher comme base pour toutes les mesures, fourni par Airgas Inc. [27].
la direction de dérive en supposant que le gaz de référence fournit la Ensuite, les analytes analysés (c'estàdire l'ammoniac, l'acétaldéhyde, l'acétone, l'éthylène,
direction de dérive dans tous les autres gaz. l'éthanol et le toluène) sont ajoutés à ce fond.
Dans cet article, nous adoptons une approche complètement différente pour résoudre dans un ordre aléatoire. Le débit total à travers la chambre de détection est
le problème mentionné, dans lequel nous ne faisons aucune des hypothèses mentionnées réglé à 200 ml/min et maintenu constant pendant toute la mesure
cidessus. Au lieu de cela, nous utilisons une machine supervisée processus. La réponse du réseau de capteurs de gaz a été mesurée lorsque
méthode d'apprentissage, à savoir un ensemble de classificateurs pour faire face à la température de fonctionnement des capteurs a été fixée à 400 ◦C, ce qui,
dérive du capteur. Au meilleur de nos connaissances, un tel apprentissage automatique selon la table de recherche déterministe unàun fournie
approche, qui détecte et gère automatiquement la dérive du capteur, par le fabricant [12], est obtenu via un chauffage intégré qui est
n'a jamais été appliqué dans la communauté de détection chimique auparavant, piloté par une source de tension continue externe réglée à 5 V. Enfin, pour assurer
bien qu'il ait été démontré qu'il donne des résultats prometteurs sur les problèmes liés aux Afin que des modèles de réponse reproductibles soient acquis lors de chaque mesure, les
concepts dérivés dans l'apprentissage automatique et l'exploration de données capteurs ont été préchauffés pendant plusieurs jours avant la mesure.
[2225]. Utiliser un ensemble de données complet d'un multicomposant le processus d’expérimentation démarre.
problème de classification des gaz enregistré à partir de capteurs de gaz à oxyde métallique
sur une période de 36 mois, nous étudions la faisabilité
de notre méthodologie d’ensemble de classificateurs pour atténuer la dérive
3 L'ensemble de données sera mis à disposition sur le référentiel UCI après acceptation du
effet dans les capteurs de gaz chimiques. Il est important de noter que le papier.
Machine Translated by Google
Fig. 1. Configuration expérimentale utilisée pour l'acquisition de données. Les réponses du capteur sont enregistrées en présence de l'analyte sous forme gazeuse diluée à différentes concentrations
dans l'air sec. Le système de mesure fonctionne dans un environnement entièrement informatisé avec une intervention humaine minimale, ce qui offre une polyvalence dans le transport des odeurs
d'intérêt (aux concentrations souhaitées) vers la chambre de détection avec une grande précision, tout en maintenant constant le débit total. Par conséquent, aucun changement dans le débit ou la
dynamique du débit n'est reflété dans la réponse du capteur (c'estàdire que seule la présence d'une substance odorante sera reflétée dans la réponse du capteur). De plus, étant donné que le système
fournit en permanence du gaz à la chambre de détection (soit de l'air propre et sec, soit un composant chimique), la quantité de molécules de gaz dans la chambre de détection est répartie de manière homogène.
La réponse du capteur est lue sous la forme de la résistance à travers la discriminer les six analytes différents quelle que soit leur concentration. L'identité
couche active de chaque capteur ; par conséquent, chaque mesure produit une de l'odeur et les valeurs de concentration en parties par million par volume
séquence de séries temporelles de 16 canaux. La carte d'acquisition de données (ppmv) sont répertoriées dans le tableau 1.
collecte les données des capteurs de gaz et contrôle le signal de tension Chacune des paires possibles de types de gaz et de concentrations a été
analogique vers chaque capteur chauffant. Cette tension est utilisée pour échantillonnée sans ordre particulier. L'ensemble de données résultant comprend
contrôler et faire varier la température de fonctionnement du capteur chauffant à 13 910 enregistrements (séquences de séries chronologiques) collectés sur une
l'aide d'un programme d'environnement LabVIEW [28] fait maison fonctionnant période de 36 mois. La répartition exacte du nombre de mesures par mois est
sur une plateforme PC. La configuration expérimentale est illustrée dans le indiquée dans le tableau 2. Notez que certains mois indiqués dans le tableau ne
schéma présenté sur la figure 1. contiennent aucune des mesures pour un ou plusieurs gaz ; d'autres analytes
gazeux et/ou mélanges complexes qui ne sont pas pris en compte dans cette
2.2. L'ensemble de données étude ont été collectés au cours de cette période spécifique en utilisant le même
réseau de capteurs et d'appareils expérimentaux, ce qui a augmenté la
Notre ensemble de données consiste en un problème de classification de complexité du problème en raison des interférences de ces analytes externes
six gaz/analytes dosés à différentes concentrations, dans lequel le but est de qui peuvent
Machine Translated by Google
Tableau 1
Analytes et concentrations dans l’ensemble de données.
Ammoniac 50, 60, 70, 75, 80, 90, 100, 110, 120, 125, 130, 140, 150, 160, 170, 175, 180, 190, 200, 210, 220, 225, 230, 240, 250, 260, 270, 275, 280, 290, 300, 350,
400, 450, 500, 600, 700, 750, 800, 900, 950, 1000
Acétaldéhyde 5, 10, 13, 20, 25, 30, 35, 40, 45, 50, 60, 70, 75, 80, 90, 100, 120, 125, 130, 140, 150, 160, 170, 175, 180 , 190, 200, 210, 220, 225, 230, 240, 250, 275, 300,
500
Acétone 12, 25, 38, 50, 60, 62, 70, 75, 80, 88, 90, 100, 110, 120, 125, 130, 140, 150, 170, 175, 180, 190, 200, 210, 220, 225, 230, 240, 250, 260, 270, 275, 280, 290,
300, 350, 400, 450, 500, 1000
Éthylène 10, 20, 25, 30, 35, 40, 50, 60, 70, 75, 90, 100, 110, 120, 125, 130, 140, 150, 160, 170, 175, 180, 190, 200, 210, 220, 225, 230, 240, 250, 275, 300
Éthanol 10, 20, 25, 30, 40, 50, 60, 70, 75, 80, 90, 100, 110, 120, 125, 130, 140, 150, 160, 170, 175, 180, 190, 200, 210, 220, 225, 230, 240, 250, 275, 500, 600
Toluène 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100
Tableau 2
Détails de l'ensemble de données. Chaque ligne correspond aux échantillons collectés sur une période d'un mois pour six gaz.
mois1 76 0 0 88 84 0 248
mois2 7 30 70 10 6 74 197
mois3 0 0 7 140 70 0 217
mois4 0 4 0 170 82 5 261
mois8 0 0 0 20 0 0 20
mois9 0 0 0 4 11 0 15
mois10 100 105 525 0 1 0 731
mois11 0 0 0 146 360 0 506
mois12 192 334 0 0 526
mois13 0 48 0 10 0 554
mois14 18 43 5 0 113
mois15 216 0 12 12 275 0 12 0 52 12 0 48
mois16 20 46 63 40 28 0 197
mois17 0 0 0 20 0 0 20
mois18 0 0 0 3 0 0 3
mois19 110 29 140 100 264 652
mois20 466 451 250 9 1625
mois21 0 0 630 662 649 458 3613
mois22 360 25 744 15 123 0 0 568 0 163
mois23 15 18 20 30 30 18 131
mois24 0 25 28 0 0 1 54
mois30 100 50 50 55 61 100 416
mois36 600 600 600 600 600 600 3600
potentiellement affecter la durée de vie du capteur. De plus, comme observé dans complète, divisée en 100 s pour la phase d'injection de gaz et au moins
Tableau 2, le dernier lot d'enregistrements, qui contient 3 600 mesures des mêmes 200 s pour la phase de récupération (nettoyage). À des fins de traitement,
analytes, a été volontairement collecté cinq nous avons considéré la réponse entière du capteur après avoir soustrait le
mois après la mise hors tension des capteurs. Cet écart de 5 mois référence de chaque enregistrement. La fréquence d'échantillonnage a été fixée à 100 Hz.
est extrêmement important pour cette étude, non seulement parce qu'il permet Enfin, le processus de mesure décrit ici a été reproduit
nous de valider notre méthode proposée sur l'ensemble annoté de mesures collectées pour les mesures ultérieures.
cinq mois plus tard, mais aussi parce que c'est pendant
cette période de temps pendant laquelle les capteurs ont été soumis à une grave
2.3. Traitement des données et extraction de fonctionnalités
contamination, car des interférences externes pouvaient facilement et de manière irréversible
s'attacher à la couche de détection en raison du manque de fonctionnement
Les capteurs de gaz à oxyde métallique Figaro sont connus pour avoir un lent
température.
réponse à un analyte chimique. Cette réponse, dans des conditions de fonctionnement
Pour générer l'ensemble de données, nous avons suivi une procédure de mesure
étroitement contrôlées (c'estàdire débit d'air constant et
composé des étapes suivantes. Premièrement, un flux constant de produits de qualité zéro
température de fonctionnement), implique généralement un changement doux et saturant
de l'air sec circulait à travers la chambre de détection tandis que le gaz
de manière monotone de la conductance/résistance tout au long de sa détection
le réseau de capteurs a été maintenu à une température de fonctionnement stable (400 ◦C).4
couche due aux réactions d’adsorption/désorption du produit chimique
Cette étape a été effectuée pour mesurer le capteur de référence en régime permanent
analyte présent à la surface microporeuse du capteur. Le
réponse (c'estàdire la réponse du capteur en présence d'aucun produit chimique)
la quantité et la vitesse de ces réactions dépendent de (i) l'identité de l'analyte, (ii) la
analytes). Ensuite, la concentration souhaitée de l'odorant a été
concentration de l'analyte, (iii) la couche active (c'estàdire le capteur
injecté par le système à flux continu dans la chambre de détection.
type), et (iv) la température de surface (c'estàdire, le fonctionnement des capteurs
Enfin, lors de la troisième étape (phase de nettoyage), la vapeur a été aspirée
température). Puisque les deux derniers facteurs sont fixes tout au long de la
loin du réseau de capteurs et la chambre de test a été nettoyée
toute la procédure de mesure de cette analyse, le capteuranalyte
à l'air sec avant la phase de concentration d'une nouvelle mesure.
le processus d’interaction identité/concentration devient le seul facteur
Le temps d'acquisition de ces mesures a pris au moins 300 s pour
qui, en tant que paire, façonne le profil de réponse et, ainsi, définit le
identité de l’analyte chimique d’intérêt [29]. En conséquence, les caractéristiques reflétant
l'ensemble de la dynamique de détection à la surface du capteur
sont d’un intérêt particulier dans notre analyse de compensation de dérive.
4 Nous n'avons pas accès à la température réelle de la surface de détection en raison de l'emballage,
L'extraction de caractéristiques joue un rôle important dans chaque application chimio
mais une table de consultation la reliant à la tension du chauffage peut être trouvée sur demande.
dans la Réf. [12]. sensorielle [30] ; il est défini comme une cartographie de transformation
Machine Translated by Google
(un)
6000
100 200 300 400 500 600 700 800 900 1 000 1 100
Caractéristiques prises en compte dans la partie Caractéristiques prises en compte dans la partie
croissante de la réponse du capteur décroissante de la réponse du capteur
(b) (e)
1 Valeurs maximales de l'ema
1
Valeurs minimales de l'ema
100,0=
mumixam
0 0
emaα max =0,001
100,0=nimαame
αame
min emaα=0,001
−1 −1
100 200 300 400 500 600 700 800 900 1 000 1 100
(c) 2 f) 2
1
mumixam
0
0
10,0=nimαame
10
α 0=
a,m e
min emaα=0,01
−1 −2
100 200 300 400 500 600 700 800 900 1 000 1 100
(d) 2 (g) 2
emaα max =0,1
1,0=
mumixam
0 0
αame
1,0=nimαame
min emaα=0,1
−2 −2
400 500 600 700 800 900 1 000 1 100 100 200 300
Temps (s)
Fig. 2. Panneau (a), réponse typique d'un capteur chimique à base d'oxyde métallique à 30 ppmv d'acétaldéhyde. La courbe montre les trois phases d'une mesure : mesure de base (effectuée avec de l'air
pur), mesure du gaz test (lorsque l'analyte chimique est injecté, sous forme gazeuse, dans la chambre de test) et phase de récupération (pendant laquelle le capteur est à nouveau exposé à l'air pur ; le
temps de récupération est généralement beaucoup plus long que la phase d'injection de gaz). Panneaux (b) – (d), moyenne mobile exponentielle de la partie croissante de la réponse du capteur (injection
de gaz) pour ˛= 0,1, ˛= 0,01 et ˛= 0,001. Les valeurs maximales des graphiques (c'estàdire max ema˛r[k]), représentent les caractéristiques extraites du
k
capteur chimique en réponse à l'analyte. Panneaux (e) – (g), moyenne mobile exponentielle de la partie décroissante de la réponse du capteur (phase de nettoyage) pour ˛= 0,1, ˛= 0,01 et ˛= 0,001. Les
valeurs minimales des graphiques (c'estàdire min ema˛r[k]) sont les caractéristiques que nous avons extraites pour représenter le signal du capteur pendant sa phase de nettoyage. Les fonctionnalités sont
k
marqué de cercles rouges dans l'intrigue. (Pour l'interprétation des références à la couleur dans la légende de cette figure, le lecteur est renvoyé à la version Web de l'article.)
la réponse du capteur à un espace de dimension inférieure préservant la D'autre part, nous extrayons également un ensemble de caractéristiques
partie la plus significative des informations contenues dans le signal du reflétant la dynamique du capteur de la partie transitoire croissante/
capteur d'origine. Dans ce travail, nous considérons deux types distincts de décroissante de la réponse du capteur pendant toute la procédure de mesure
caractéristiques qui exploitent l'ensemble des processus dynamiques se dans des conditions contrôlées. En particulier, nous utilisons la moyenne
produisant à la surface du capteur, y compris ceux qui reflètent son mobile exponentielle (ema˛), une transformation empruntée au domaine de
adsorption, sa désorption et les réponses à l'état stationnaire (ou final) de l'élément l'économétrie
du capteur. initialement introduite dans la communauté des capteurs
D’une part, nous utilisons la caractéristique à l’état d’équilibre, qui est la « chimiques dans [32] qui convertit les séries temporelles discrètes croissantes/
référence » pour l’extraction de caractéristiques chimiosensorielles [31]. Il décroissantes et saturantes r[·] collectée à partir du capteur chimique dans
est défini comme la différence entre le changement de résistance maximal et un scalaire réel f˛{r[·]}, en estimant la valeur maximale (ou minimale pour la
la ligne de base, partie décroissante de la réponse du capteur) de sa transformée moyenne
mobile exponentielle (ema˛), calculée par ,
r[k], (1)
R = maxk r[k] − mink y[k] = (1 − ˛)y[k − 1] + ˛(r[k] − r[k − 1]), (3)
et sa version normalisée exprimée par le rapport de la résistance maximale où k = 1, 2, . . ., T, y[0], sa condition initiale, mise à zéro (y[0] = 0), et le
et des valeurs de base, scalaire ˛ (˛ {0, 1}) étant un paramètre de lissage de l'opérateur qui définit à
la fois la qualité de la caractéristique f˛{r[·]} et le moment de son apparition le
maxkr[k] − minkr[k] long de la série temporelle.5 Dans ce travail, nous avons défini trois valeurs
||R|| = , (2)
vison[k] différentes pour ˛ (˛= 0,1, ˛= 0,01 et ˛= 0,001)
Tableau 3
respectivement. Soit L le nombre de classes. On peut estimer un ensemble
Caractéristiques extraites des données de séries chronologiques. L
de poids {ˇc 1,. . .,ˇc t} pour chaque classe c {1,. . ., 2
} ou c {1,
Caractéristiques à l'état stable Caractéristiques transitoires
. . ., L − 1} en résolvant (4). Alternativement, si nous voulons attribuer des poids
Portion montante Partie en décomposition
selon les performances de prédiction des classificateurs sur le plus
R. maximum min lot récent, nous pouvons simplement estimer un seul ensemble de poids {ˇ1, . . .,
ema˛=0,001(r[k]) ema˛=0,001(r[k])
k k
||R|| maximum min ˇt} en utilisant les précisions de prédiction du classificateur multiclasses sur chaque
ema˛=0,01(r[k]) ema˛=0,01(r[k])
k k lot. Dans ce cas, les prédictions sont faites selon un coefficient pondéré
maximum min
ema˛=0.1(r[k]) ema˛=0.1(r[k])
k k vote majoritaire, c'estàdire
Pour plusieurs classes, nous pouvons utiliser une stratégie un contre un ou un contre
Fig. 3. Performances des classificateurs lorsqu'ils sont formés les mois 1 et 2 et testés sur
tous [34] pour former un classificateur pour chaque paire de classes ou pour chaque classe.
mois 3 à 36.
Machine Translated by Google
Tableau 4
Détails de l'ensemble de données. Chaque ligne correspond aux mois qui ont été combinés pour former un
lot.
ID de lot ID de mois
Paramètre 1 Pour chaque mois, nous avons formé un classificateur multiclasses avec
données du mois précédent uniquement et je les ai testées sur le
mois en cours.
Cadre 2 Pour chaque mois, nous avons formé un ensemble de multiclasses
classificateurs en utilisant la méthode de l’algorithme 1. Fig. 4. Performances des classificateurs entraînés sur les lots 1 à 5 et testés sur des lots successifs.
Paramètre 3 Identique au paramètre 2 mais avec des poids uniformes sur les classificateurs lots. (Pour l'interprétation des références à la couleur dans cette légende de figure, le lecteur
individuels (de base). fait référence à la version Web de l'article.)
Paramètre 4 Identique au paramètre 1 mais avec les ensembles de tests modifiés à l'aide de
la méthode de correction des composants (PCA) [4].
Le SVM formé dans le cadre 1 constitue une base de référence solide car il voit
le lot d'exemples le plus récent qui n'est pas corrompu par des dérives
données du passé. Si nous devions former un SVM en utilisant l'intégralité des données
jusqu'à un instant t, les performances se dégraderaient encore davantage. Notez que
l'ensemble des classificateurs formés dans le cadre 3 avec
les poids uniformes utilisent essentiellement toutes les données du passé. Nous
voudrais souligner que notre configuration expérimentale est robuste dans
le sentiment que les méthodes de base sont solides. Une configuration expérimentale
similaire a été utilisée dans la réf.[36] qui fut l'une des premières méthodes pour
aborder la dérive des concepts dans la communauté de l’apprentissage automatique. Paramètre
4 est similaire à la configuration expérimentale décrite dans les réf. [19,20].
Afin de pouvoir former des classificateurs dans ces paramètres, nous
besoin d’un nombre suffisant d’exemples dans chaque classe et chaque mois.6 Nous
donc combiné les mesures de 36 mois pour former 10
lots de telle manière que le nombre de mesures soit aussi
uniformément répartie que possible. Des détails sur le nombre de mesures dans chaque
lot sont donnés dans le tableau 4. La figure 4 montre le
Fig. 5. Performances des classificateurs formés dans le cadre du paramètre 1 (•), du paramètre 2 (),
performances d'un SVM (ligne noire) entraîné sur le lot 1 et testé
Réglage 3 () et réglage 4 (+) décrits dans le texte. La ligne noire continue correspond au
sur les lots 2 à 10. Notez que cette courbe est estimée avec le même
paramètre dans lequel un classificateur a été formé avec le lot 1 et testé sur
Modèle SVM utilisé dans la figure 3 mais testé à la place sur les données des lots lots successifs. Le paramètre 2 correspond à notre méthode proposée (Algorithme 1).
de mois. (Pour l'interprétation des références à la couleur dans la légende de cette figure, le lecteur est
Encore une fois, nous voyons que les performances du classificateur sont fait référence à la version Web de l'article.)
se dégradant avec le temps à cause de la dérive. Nous avons constaté des comportements similaires lorsque
nous avons formé plusieurs SVM sur les lots 2 à 5 et les avons testés sur des lots
une enquête en cours, nous avons l'intention de déterminer quelle concentration
successifs. Ces résultats sont à nouveau présentés sur la figure 4. L'ensemble
Les niveaux doivent être utilisés pour calibrer le réseau de capteurs de gaz. Fait intéressant,
ensemble de résultats, c'estàdire la précision des classificateurs formés sur des lots
les classificateurs formés dans le cadre du paramètre 1 ont été capables de faire face à la dérive
1 à 9 et testé sur des lots successifs, est donné dans le tableau 5. Le premier
dans une certaine mesure et, comme mentionné cidessus, nous pensons qu'ils constituent
cinq lignes de ce tableau correspondent aux résultats tracés sur la figure 4.
une base de référence naturelle et solide pour tout apprentissage automatique corrigeant la dérive.
Ces classificateurs ont finalement été utilisés dans notre méthode d'ensemble
algorithme à comparer.
avec des poids appropriés. La figure 5 montre les performances des classificateurs avec
Comme le montre la figure 5, les ensembles de classificateurs ont pu mieux fonctionner
les paramètres 1, 2, 3 et 4 décrits cidessus. Comme prévu,
que ces classificateurs de base lorsqu'ils ont été testés sur la plupart des
classificateurs formés selon le paramètre 1, c'estàdire en utilisant le lot le plus récent
des lots avec des améliorations significatives de la précision sur plusieurs lots. A partir de
d'exemples, fonctionnent mieux que le classificateur formé avec des données
la figure indiquée, nous pouvons faire ce qui suit
à partir du lot 1 uniquement. Nous pensons à une baisse de précision lors des tests sur les
déclarations:
lots 5 et 6 en utilisant les classificateurs formés sur les lots 4.
et 5, respectivement, est un artefact sur l'ensemble de données. Nous soupçonnons que le
la concentration des gaz utilisés pour l’entraînement a un impact important sur • L'ensemble de classificateurs fonctionne mieux que le SVM formé dans
les performances des classificateurs au fil du temps. En conséquence, dans le cadre de Réglage 1 aux lots/points temporels t = 4, 5, 6, 9 et 10. La performance est comparable
aux instants t = 3 et t = 8. Notez qu'à
t = 2, nous n’avons pas d’ensemble et donc chaque paramètre est
6 Notez que cette exigence n'est pas nécessaire si nous formons les classificateurs de manière purement essentiellement le même. Le SVM du paramètre 1 fonctionne mieux que
mode en ligne [24,25], mais dans cet article, nous nous concentrons uniquement sur la formation par lots à l'aide de SVM. .
notre approche uniquement à t = 7 Comme mentionné cidessus, ce SVM formé
Machine Translated by Google
Tableau 5
Performances des classificateurs formés sur les lots 1 à 9 et testés sur les lots successifs.
2 3 4 5 6 7 8 9 dix
lot1 lot2 74.36 61.03 50,93 18.27 28.26 28.81 20.07 34.26 34.48
lot3 lot4 87,83 90,68 72.08 44.52 42.46 29.93 59.57 39,69
lot5 lot6 90.06 94,92 70,96 73,73 62,59 65,74 38,89
lot7 lot8 56,35 27,52 35,40 19,73 17,02 17h56
lot9 42,52 41,32 13,95 21,49 20.11
83,53 88,44 65,74 49,97
91,84 69,15 54.28
62,98 37,69
22.64
5. Conclusions
Sur une période de 3 ans, nous avons rassemblé une étude complète
ensemble de données utilisant un réseau de 16 capteurs de gaz à oxyde métallique pour analyser le
problème de dérive du capteur. Les données ont été collectées dans des conditions
étroitement contrôlées pour 6 gaz différents à plusieurs concentrations.
allant de 10 à 1000 ppmv. Au meilleur de nos connaissances, ceci
est l'un des ensembles de données les plus complets disponibles pour la conception
et le développement de méthodes de compensation de dérive, qui seront
disponible en ligne en complément de cet article, contribuant, espéronsle, aux améliorations
algorithmiques à l'avenir. Nous avons
ont signalé des avantages significatifs grâce aux techniques d'apprentissage automatique
basé sur des ensembles de classificateurs comme méthode de correction de dérive pour
applications chimiosensorielles. Comme nous l'avons démontré, la méthode proposée
parvient non seulement à bien atténuer l'effet de la dérive
dans les capteurs chimiques, mais surpasse également les méthodes concurrentes. Un
Une observation importante de notre analyse de dérive du capteur est que le
les compensations effectuées par la méthode proposée restent valables longtemps
Fig. 7. Performances du classificateur entraîné dans le cadre 4 avec correction des composants. Les
périodes. L'écart de 6 mois entre les enregistrements du
parcelles individuelles correspondent aux performances du classificateur formé
les 30 premiers mois et le dernier mois enregistré n'ont pas invalidé le
avec le lot 1 et testé sur des lots à des moments ultérieurs après application du
méthode de correction des composants pour chacun des six gaz de référence. compensation de dérive sur la même tâche, malgré le fait que le
Machine Translated by Google
les capteurs ont été exposés à un empoisonnement, car ils ont été éteints capteurs de gaz à microplaque chauffante : sélection et validation des fréquences de modulation
optimales, Sensors and Actuators B : Chemical 123 (2007) 1002–1016.
pendant cette période.
[18] J.E. Haugen, O. Tomic, K. Kvaal, Une méthode d'étalonnage pour gérer la dérive temporelle des capteurs
Enfin, le niveau de généralité atteint par la méthode proposée de lutte de gaz à l'état solide, Analytica Chimica Acta 407 (12) (2000) 2339.
contre la dérive est élevé du point de vue suivant. De par sa conception, la [19] R. GutierrezOsuna, Réduction de la dérive pour les réseaux de capteurs à oxyde métallique utilisant la
méthode de lutte contre la dérive utilisant des ensembles de classificateurs régression de corrélation canonique et les moindres carrés partiels, dans : Actes du 7e Symposium
international sur l'olfaction et le nez électronique, 2000.
fonctionne sur des échantillons collectés à la volée et en ligne, ce qui est [20] A. Ziyatdinov, S. Marco, A. Chaudry, K. Persaud, P. Caminal, A. Perera, Compensation de dérive des
important pour les opérations en temps réel. La technique ne fait aucune données du réseau de capteurs de gaz par analyse en composantes principales communes, Capteurs
hypothèse sur la nature de la dérive et elle est également indépendante du et actionneurs B : Chimique 146 ( 2) (2010) 460465.
[21] B. Schölkopf, AJ Smola, K.R. Müller, Analyse des composants non linéaires en tant que problème de
classificateur de base utilisé dans la tâche d'identification des gaz. En
valeurs propres du noyau, Neural Computation 10 (5) (1998) 12991319.
conséquence, cette solution a le potentiel d'être utile dans de nombreuses autres [22] H. Wang, W. Fan, PS Yu, J. Han, Mining conceptdrifting data streams using ensemble classifiers, dans :
applications où les données sont collectées sur une période de temps prolongée Actes de la neuvième conférence internationale ACM SIGKDD sur la découverte des connaissances et
l'exploration de données, 2003.
avec des distributions sousjacentes dérivantes et, plus important encore, elle
[23] JZ Kolter, MA Maloof, Majorité pondérée dynamique : Une nouvelle méthode d'ensemble pour suivre la
peut être facilement transposée dans des applications de détection de gaz plus dérive des concepts, dans : Actes de la Conférence internationale de l'IEEE sur l'exploration de données,
réalistes. tions, y compris, mais sans s'y limiter, l'identification et la localisation 2003.
[24] JZ Kolter, MA Maloof, Utiliser des ensembles d'experts additifs pour faire face à la dérive conceptuelle,
d'analytes chimiques dans des environnements complexes (par exemple, dans
dans : Actes de la vingtdeuxième Conférence internationale sur l'apprentissage automatique, 2005.
une soufflerie), la cartographie de la distribution des gaz et le suivi des panaches
de gaz à l'aide de platesformes robotiques. Nous avons considéré cette question [25] JZ Kolter, MA Maloof, Majorité pondérée dynamique : Une méthode d'ensemble pour les concepts
comme une position défendable ici que nous aborderons dans des études ultérieures. dérivants, Journal of Machine Learning Research 8 (décembre) (2007) 27552790.
[33] C. Cortes, V. Vapnik, Réseaux à vecteurs de support, Machine Learning 20 (3) (1995)
Les références 273297.
[34] R. Rifkin, A. Klautau, Pour la défense de la classification un contre tous, Journal of Machine Learning
[1] JW Gardner, PN Bartlett, Nez électroniques : principes et applications, Research 5 (2004) 101141.
Presse universitaire d'Oxford, New York, 1999. [35] C.C. Chang, C.J. Lin, LIBSVM : une bibliothèque pour les machines à vecteurs de support et les logiciels.
[2] KC Persaud, G. Dodd, Analyse des mécanismes de discrimination dans le système olfactif des Disponible sur http://www.csie.ntu.edu.tw/cjlin/libsvm, 2001.
mammifères à l'aide d'un nez modèle, Nature 299 (1982) 352355. [36] R. Klinkenberg, T. Joachims, Détecter la dérive des concepts avec des machines à vecteurs de support,
[3] M. Holmberg, F. Winquist, I. Lundstrom, F. Davide, C. DiNatale, A. D'Amico, Drift counteraction for an dans : Actes de la Conférence internationale sur l'apprentissage automatique, 2000.
electronic nose, Sensors and Actuators B: Chemical 36 (1–3) (1996 ) 528535.
[37] O. Chapelle, B. Schölkopf, A. Zien (Eds.), SemiSupervised Learning, MIT Press, Cambridge, MA, 2006.
˚
[4] T. Artusson, T. Eklöv, I. Lundström, P. Mårtensson, M. Sjöström, M. Holmberg, Correction de dérive pour
les capteurs de gaz utilisant des méthodes multivariées, Journal of Chemometrics 14 (5–6) (2000)
711723. Biographies
[5] W. Göpel, K.D. Schierbaum, Définitions et exemple typique, dans : Chemical and Biochemical Sensors,
Part I, VCH, Weinheim, 1992, pp.
[6] F. Davide, CD Natale, M. Holmberg, F. Winquist, Analyse fréquentielle de la dérive dans les capteurs Alexander Vergara (Ph.D., 2006 – Universitat Rovira i Virgili) est chercheur postdoctoral au BioCircuits Institute
chimiques, dans : dans : Actes de la 1ère Conférence italienne sur les capteurs et les microsystèmes, de l'UC San Diego. Ses travaux se concentrent principalement sur l'utilisation de méthodes dynamiques pour
1996, pp. l'optimisation de systèmes microsensoriels de gaz et sur la construction de véhicules autonomes capables de
[7] M. Zuppa, C. Distante, P. Siciliano, KC Persaud, Drift counteraction with multiple selforganising maps localiser les sources d'odeurs grâce à un processus ressemblant au traitement olfactif biologique. Ses domaines
for an electronic nose, Sensors and Actuators B: Chemical 98 (2–3) (2004) 305– 317. d'intérêt comprennent également le traitement du signal, la reconnaissance de formes, l'extraction de
caractéristiques, les réseaux de capteurs chimiques et l'olfaction mécanique.
[8] M. Holmberg, T. Artusson, Compensation de dérive, normes et méthodes d'étalonnage, Manuel des
machines d'olfaction artificielle, WILEYVCH Weinheim, Allemagne, 2003, pp.
Shankar Vembu (Ph.D., 2010 – Université de Bonn) est chercheur postdoctoral au BioCircuits Institute de l’UC
San Diego. Ses intérêts de recherche portent sur les algorithmes d’apprentissage automatique et leurs
[9] A. Hierlemann, R. GutierrezOsuna, Détection chimique d'ordre supérieur, ACS Chemical Reviews 108
applications.
(2008) 563613.
[10] A.C. Romain, J. Nicolas, Stabilité à long terme des capteurs de gaz à base d'oxyde métallique pour les Tuba Ayhan (MS, 2010 – Université technique d'Istanbul) est titulaire d'un doctorat. étudiant au Département
applications environnementales du nez électronique : un aperçu, Sensors and Actuators B : Chemical d'ingénierie électronique et des communications, Université technique d'Istanbul. Ses intérêts de recherche
146 (2) (2010) 502–506. portent sur les systèmes embarqués, les FPGA, les nez électroniques et l'olfaction des machines. Tuba a
[11] A.C. Romain, P. André, J. Nicolas, Trois ans d'expérimentation avec les mêmes réseaux de capteurs réalisé l'essentiel de son travail sur cet article lors d'une visite au BioCircuits Institute de l'UCSD.
d'oxyde d'étain pour l'identification de sources malodorantes dans l'environnement, Sensors and
Actuators B: Chemical 84 (2–3) (2002) 271–277 .
[12] Figaro USA, Inc., http://www.figarosensor.com/. Margaret A. Ryan (Ph.D., 1987 – Université du Massachusetts à Amherst) est chercheuse scientifique associée
[13] W. Göpel, Nouveaux matériaux et transducteurs pour capteurs chimiques, Capteurs et au Jet Propulsion Laboratory du California Institute of Technology. Avant de rejoindre le JPL en 1989, elle
Actionneurs B : produit chimique 18 (1–3) (1994) 1–21. était chercheuse au Centre National de la Recherche Scientifique de Bellevue, en France, et au Solar Energy
[14] N. Yamazoe, Nouvelles approches pour améliorer les capteurs de gaz à semiconducteurs, Sen Research Institute (maintenant National Renewable Energy Lab) à Golden, Colorado. Son travail dans les deux
sors et actionneurs B : produit chimique 5 (1–4) (1991) 7–19. endroits comprenait la modification d'électrodes d'oxyde métallique et de semiconducteurs pour la conversion
[15] K. Dobos, R. Strotman, G. Zimmer, Performance des mosfets à grille Pd sensibles aux gaz avec des d'énergie photoélectrochimique, le traitement photoélectrochimique des solides et la photochimie. Elle est
isolateurs de grille SiO2 et Si3N4 , Sensors and Actuators 4 (1983) 593598. arrivée au JPL en 1989 et a travaillé principalement dans les domaines de la détection chimique et de la
[16] M. Roth, R. Hartinger, R. Faul, HE Endres, Réduction de la dérive des capteurs de gaz à revêtement conversion de l'énergie thermique en énergie électrique. Elle est chercheuse principale dans le cadre du projet
organique par modulation de température, Sensors and Actuators B : Chemical 36 (1–3) (1996) 358– de développement de la technologie du nez électronique de la NASA. Son travail au JPL s'est concentré sur
362. deux principaux domaines de recherche : (a) le développement de capteurs chimiques
[17] A. Vergara, E. Llobet, J. Brezmes, P. Ivanov, C. Cane, I. Gracia, X. Vilanova, X. Correig, Analyse
quantitative de mélanges gazeux par modulation de température
Machine Translated by Google
et des dispositifs de surveillance de la qualité de l'air, notamment le JPL ENose, du carbure de silicium Ramón Huerta (Ph.D., 1994 – Universidad Autónoma de Madrid) est associé
capteurs d'hydrocarbures et capteurs colorimétriques pour l'ozone et d'autres oxydants, et (b) Chercheur scientifique au BioCircuits Institute, UC San Diego. Ses domaines d'expertise comprennent les
études sur les métaux et les alliages métalliques destinés à être utilisés dans les dispositifs de conversion systèmes dynamiques, l'intelligence artificielle et les neurosciences. Son travail
d'énergie à haute température, y compris le convertisseur thermiqueélectrique de métal alcalin (AMTEC) traite du développement d'algorithmes pour la discrimination et la quantification de séries temporelles
et les appareils thermoélectriques. Amy travaille maintenant au Département américain de multidimensionnelles complexes, de la construction de modèles pour comprendre les
Énergie. traitement de l'information dans le cerveau, détection chimique et olfaction mécanique
applications basées sur des technologies bioinspirées. Ramón est coauteur de plus de 80 articles dans des
Margie L. Homer (Ph.D., 1993 – Université de Californie à Los Angeles) est associée revues à comité de lecture à l'intersection de l'informatique, de la physique et
Chercheur scientifique au Jet Propulsion Laboratory, California Institute of Technology. La physicochimiste la biologie.
Margie Homer est la cochercheuse du nez électronique
projet au JPL. Ses intérêts de recherche portent sur les capteurs chimiques.
Machine Translated by Google