Vous êtes sur la page 1sur 5

SETIT 2009

th

5 International Conference: Sciences of Electronic,


Technologies of Information and Telecommunications
March 22-26, 2009 TUNISIA

Application des Systmes Immunitaires Artificiels


Pour la Classification Plantaire
Hiba KHELIL * et Abdelkader BENYETTOU*
*Laboratoire SIMPA -Dpartement dinformatique
Universit des sciences et technologie dOran, Mohammed BOUDIAF - USTOMB
ALGERIE
hibakhelil@yahoo.fr
benyettou@simpa-usto.net
Rsum: La classification est un problme qui survient dans plusieurs domaines dapplication, comme la classification
des emails, reconnaissance de la parole, reconnaissance des signatures, reconnaissance des visages pour ce but
plusieurs mthodes sont appliques de diffrentes approches. Dans cet article nous prsenterons le systme immunitaire
artificiel pour la classification plantaire, nous avons choisi les IRIS comme exemple dapplication de notre systme
immunitaire artificiel. Nous prsenterons au dpart une ide gnrale sur le mcanisme dimmunit naturelle, par la
suite nous donnerons les tapes dapprentissage des systmes immunitaires artificiels et en fin les diffrents rsultats
obtenu par lapplication de ces mthodes pour la classification des plantes IRIS.
Mots cls: Systme immunitaire artificiel (AIRS), antigne, anticorps, cellules B mmoire, IRIS.

la fin nous donnerons les rsultats de classification des


fleurs dIRIS ; des critiques et des conclusions seront
aprs possible pour prouver la validit et la diffrences
entre ces mthodes.

INTRODUCTION
La reconnaissance des formes est un domaine
assez vaste en intelligence artificielle, dont ont peut
trouver la reconnaissance des visages, les empreintes,
la parole, lcriture manuscrite le systme
immunitaire artificiel est une approche bio-inspire
assez rcente utilis pour diffrents problmatiques,
comme la reconnaissance des formes [Sec et all,
03][Lin et all, 05][Den et all, 05][Den, 06][Goo et all,
02] [Wat et all, 05 b], dtection dintrusions [Kim et
all, 01], robotique [Jun et all, 99], apprentissage
machine [Tim, 00]

1. Le systme immunitaire naturel


Le systme immunitaire biologique constitue une
arme contre les intrus qui pntrent le corps, pour cela
plusieurs cellules contribuent pour llimination de cet
intrus nomm antigne , ces cellules B et T
participent pour ce quont appelle la rponse
immunitaire biologique . Nous distinguons deux
types de rponse immunitaire naturelle, une inn
lmentaire et lente et lautre adaptative
secondaire, rapide et intelligente [Emi, 06].

Le prsent travail est une application du systme


immunitaire artificiel (AIRS) pour la classification
plantaire des IRIS. AIRS est une mthode propos par
A. Watkins en 2001 [Wat, 01] dans sa thse de Master
luniversit de Mississipi, lamlioration de cet
algorithme t en 2004 par A. Watkins, J., Timmis et
L. Boggess [Wat et all, 04] dont les auteurs optimisent
sur le temps dexcution et le nombre de cellules B
mmoires gnres. Cette mthode t dot par la
possibilit dapprentissage parallle prouv dans le
PHD de A. Watkins de luniversit de Kent en 2005
[Wat, 05].

2. Le systme immunitaire artificiel


Pour une bonne simulation du systme
immunitaire naturel, il est vident de bien comprendre
son fonctionnement naturel dabord, ce qui nest pas
simple, car cette simulation se base aussi sur des
concepts mathmatiques et bio-inspirs la fois.
Plusieurs tentatives ont vu leurs jours par leffort de
plusieurs chercheurs. Dans ce travail nous allons
prsenter quelques algorithmes dimmunit artificielle
pour la reconnaissance des formes et voir aussi la
simulation des facteurs principaux de la rponse
immunitaire (antignes, anticorps et cellules B).

Dans cet article nous donnerons une bref dfinition


sur le systme immunitaire naturel, en seconde partie
nous reprsenterons le systme immunitaire artificiel
par les diffrents algorithmes utiliss dans ce papier,
-1-

SETIT2009

mcmatch = argmaxmcMCag.c stimulation(ag, mc)

3. AIRS : le systme immunitaire artificiel


pour la reconnaissance des formes
Dans cette partie nous allons reprsenter un
algorithme dapprentissage du systme immunitaire
artificiel destin pour la reconnaissance des formes
(AIRS), cet algorithme est propos par A. Watkins
dans sa thse de Master de luniversit de Mississipi
en 2001, ce dernier a connu une volution par la
proposition de AIRS2 dans sa thse de PhD en 2005
luniversit de Kent [Goo et all, 02] [Wat, 01] [Wat et
all, 05 a]. Dans cette session nous allons prsenter les
algorithmes dapprentissages plus en dtail.

Une fois que la cellule m c m a tc h est slectionne, elle


sera utilise pour gnrer des nouveaux ARBs
(clonage), cet ensemble sera additionn a lensemble
total des ARBs gnr par lensemble des antignes
pralablement trait. Le nombre de clone pour cette
cellule sera calcul par la formule (3):

nombre _ clones = hyper _ clonal _ rate*clonal _ rate


* stimulation(mcmatch , agen_cours )

3.1. Les tapes dapprentissage AIRS

3.1.3. Etape

de comptition des ressources et


dveloppement des cellules mmoire
candidates

Cette partie est complmentaire de la prcdente,


car elle complte les informations des ARBs gnrs
en calculant leurs ressources selon (4) entre chaque
anticorps avec lantigne en cours de traitement ; ces
ressources sont mis jour durant lapprentissage et
chaque ARB nayant pas de ressources sera supprim
de lensemble des ARBs [Wat, 01].

3.1.1. Etape dinitialisation


Dans cette partie tout les donnes dapprentissage
(antignes) seront normalises et auront des valeurs
dans lintervalle [0, 1]. Un seuil daffinit est calcul
partir de cet ensemble dantigne, qui reprsente
laffinit moyenne entre tous les exemples
dapprentissage selon la formule (1) :

ressources = stimulation ( ag , anticorps )


* clonal _ rate

i =1 j = i + 1

affinit ( ag i , ag j )
n ( n 1)
2

(4)

Les tapes 4.1.2 et 4.1.3 seront excutes pour un


antigne donn jusqu ce que la condition
s i S e u il _ d ' a ffin it
soit vrifie, avec

seuil _ d ' affinit =

(3)

Par la suite, chaque ARB gnr par mcmatch est


mut selon lalgorithme de mutation dcrit dans la
thse de master de A. Watkins en 2001 [Wat, 01].

Dans cette partie nous allons reprsenter un


algorithme dapprentissage du systme immunitaire
artificiel destin pour la reconnaissance des formes
(AIRS), cet algorithme est propos par A. Watkins
dans sa thse de Master de luniversit de Mississipi
en 2001 [Wat, 01], ce dernier a connu une volution
par la proposition de AIRS2 dans sa thse de PhD en
2005 luniversit de Kent [Wat, 05]. Dans les
prochaines sessions nous allons prsenter les
algorithmes dapprentissage en dtail.

(2)

(1)

| A Bi |

j =1

a b j . s tim

Avec : gi et gj deux antignes. Affinit(gi,gj)


retourne la distance euclidienne normalise entre gi et
gj.

si =

La dernire tape dinitialisation consiste


initialiser lensemble des cellules mmoires
(anticorps) et la population des ARB (Artificial
Recognition Ball), partir de lensemble des antignes
par tirage alatoire des exemples.

Lorsque la condition darrt est valide, lensemble


dARBs obtenu sera prt pour introduire ltape
finale dapprentissage.

3.1.2. Etape

Cette tape consiste choisir partir des ARBs la


cellule candidate qui convient le plus lantigne en
terme de similarit, en tenant compte la cellule
mc
dj slectionne dans 4.1.2. La cellule
candidate sera additionne lensemble des cellules
mmoires seulement si elle retourne une valeur de
stimulation plus leve que la cellule m c m a t c h avec
lantigne en cours de traitement, sinon la cellule
m c m atch
sera retire de lensemble si sa stimulation entre
la cellule candidate dpasse pas un seuil [Wat, 01].

| A Bi |

3.1.4. Etape

, abj A Bi

dintroduction
mmoires

didentification des cellules B et


gnration des ARBs

Cette tape aura lieu pour chaque antigne de


lensemble dapprentissage. Une cellule mmoire est
slectionne de lensemble des cellules B est

(5)

des

cellules

m atch

nomme mc match , cette dernire ressemble1 le plus a


lantigne en cours de traitement (la plus grande
valeur de stimulation) selon la formule (2)

Dans cette partie nous avons reprsent


lalgorithme
dapprentissage
dun
systme
immunitaire artificiel destin pour la reconnaissance
des formes, autres modifications sont port sur cet
algorithme qui seront reprsent dans la prochaine

1 La ressemblance est calcule par la formule de


stimulation : stimulation(ag, mc) =1 affinit(ag, mc)
-2-

SETIT2009
session.

5. Notions gnrales sur les IRIS


IRIS est une plante vivace rhizomes ou bulbes
de la famille des Iridaces (dont fait galement partie
le crocus). Le genre IRIS contient 210 espces et
d'innombrables varits horticoles. On trouve souvent
dans les jardins des Iris germaniques. La prsente
base de donne utilise est cre par Fisher en 1988,
dont chaque fleur IRIS est reprsente sur le
quadruple :sepal length, sepal width, petal length,
petal width qui dsigne la longueur et la largeur des
ptales et spales.

3.2. AIRS2 : Lapprentissage dalgorithme AIRS


amlior
Cet algorithme ne diffre pas trop par rapport
loriginal, seulement au niveau de la mutation et la
comptition des ressources. Car dans la mutation les
auteurs A. Watkins, J., Timmis et L. Boggess
introduisent la notion de stimulation entre lanticorps
et lantigne dans la formule de mutation, de mme
pour la comptition des ressources qui prend en
compte seulement des anticorps de mme classe que
lantigne [Wat et all, 04] [Wat, 05].
3.3. Lapprentissage dalgorithme AIRS et AIRS2
par usage de facteur
Autres modifications sont port aussi sur AIRS et
AIRS2, ces modifications sont seulement dans la
dernire tape dapprentissage (introduction des
cellules mmoires) plus prcisment sur le critre
dintroduction de la cellule comme indiqu ci dessus :

Figure 1. Fleur IRIS

C a n d S tim S tim u la tio n ( a g , m c c a n d id a te )

6. Application et mise en uvre

M a tc h S tim S tim u la tio n ( a g , m c m a tc h )

Pour la mise en uvre de notre application nous


avons utilis la base de donne dIRIS cre par Fisher
en 1988, la distribution des donnes est prsente dans
la table 1:

C e llA ff a ffin ity ( m c c a n d id a te , m c m a tc h )


if ( C a n d S tim > M a tc h S tim )
if ( C e llA ff < A T

(6)

ATS )

M C M C m c m a tc h
M C M C m c c a n d id a te

Setosa
Versicolour
Virginica

Le code prsent dans (6) reprsente une partie de


la dernire tape dapprentissage dAIRS et AIRS2,
les modifications portes sur cette tape sont donnes
dans (7)
if (CellAff < AT

ATS

factor)

TABLE I.

Test
(bezdekIris)
30
30
30

Distribution des exemples dIRIS


(Apprentissage et Test)

Pour le droulement dapprentissage il est


obligatoire de fixer les paramtres dapprentissage
selon la table dessous :

(7)

Signification

Notant que facteur est calcul selon (8):


f a c te u r = A T S * d a m p e n e r
*
lo g ( n p )

Apprentissage
(IRIS)
50
50
50

Hyper
clonal
rate
Clonal
rate
Mutation
rate

(8)

Avec A T S et d a m p e n e r deux paramtres entre 0


et 1 et np est le nombre de classes. Cette modification
est surtout pour relaxer la suppression des cellules
mmoires, nous allons voir par la suite la diffrence
dvolution des cellules pour chaque mthode.

Type

Valeurs

Taux de clonage

Entier

30

Taux moyen de
clonage

Entier

20

Taux de mutation

Rel
[0,1]

0.25

TABLE II.

Paramtres dapprentissage

Lapprentissage est ralis en langage C++ sous


lenvironnement LINUX Mandriva 2006 dans une
machine dote dun processeur dune frquence de
1.7Ghz et dune mmoire volatile dun giga de
capacit. Prenant en compte les paramtres indiqus
dans la table 2, lapprentissage est droul sur 50
gnrations (itrations) pour tout lensemble
dapprentissage et les rsultats de classification
(KMeans) ainsi que lvolution des cellules B sont
donns dans la table et les figures suivantes:

4. La classification
A la fin de lapprentissage, les cellules B gnrs
seront prt pour la phase de classification, cette
dernire doit classer lantigne test dans sa classe
associ en utilisant le principe de KMeans entre
lantigne et lensemble des noyaux des cellules
mmoires de chaque classe.

-3-

SETIT2009

%Train

%Test

Nbr cellules

%Train

%Test

45
42

100
92

100
93.33

49
47

100
92

100
93.33

42

100
97.33

100
97.77

35

100
97.33

100
97.77

%Test

Nbr
cellules B

47

100

100

49

100

100

42

94

96.66

47

92

93.33

42

98

96.66

35

100

100

97.33

97.77

97.33

97.77

TABLE III.

Selon les figures lvolution des cellules B est


beaucoup plus stable dans b) et d) que dans a) et c),
malgr que le taux de reconnaissance global soit le
mme pour les quatre mthodes, ont peut dire que
AIRS2 et AIRS2 + facteur sont moins agressives dans
la gnration des cellules B mmoire. Concernant les
taux de classification est identiques pour chaque base
de donne, et cela revient ltape dinitialisation car
nous avons pris tout lensemble dapprentissage en
entier dans lensemble cellules B mmoire.
Dans toutes les expriences les paramtres
dapprentissage sont les mmes pour toutes les
expriences, de mme pour linitialisation des cellules
B mmoire t quitable pour chaque ensemble. La
mesure de distance utilise est la distance euclidienne
car elle est la mieux adapte pour des donnes type
rel.

AIRS2 + Fact.
%Test

%Train

Nbr
cellules B

AIRS + Fact

%Train

Setosa
Versicolour
Virginica

AIRS2

Nbr cellules

AIRS

Selon les rsultats de classification ainsi que


lvolution de cellules B, il est prfrable dutiliser
AIRS2 ou bien AIRS2 + facteur car elles minimisent
sur le temps dapprentissage, de plus lvolution des
cellules B est de plus en plus stable, c'est--dire quil
t possible de sarrter dans quelque gnrations.

7. Conclusion

Taux de classification

Dans cet article nous avons prsent la


classification des fleurs IRIS laide dapprentissage
immunitaire artificiel ; nous nous somme intress par
immuno-computing car cest une des plus rcente
mthode dapprentissage machine et nous avons
utilis dans cet article quatre versions dAIRS propos
par A. Watkins (2001-2005) dans le but de la
classification plantaire.
Pour les futurs travaux, nous avons pens de
donner plus dimportance aux valeurs des paramtres
et de proposer une nouvelle mthode de recherche des
paramtres optimums dans le but daugmenter la
performance de la classification immunitaire par usage
des algorithmes doptimisation.

REFERENCES
[Den, 06] Deneche A.: Approches bios inspirees pour la
reconnaissance de formes, These de Master
luniversit de Mentouri, Constantine, Algerie (2006)
[Den et all, 05] Deneche A., Meshoul S., Batouche M. : Une
approche hybride pour la reconnaissance des formes en
utilisant un systeme immunitaire artificiel. Graphic
computer science, Biskra, Algerie (2005)
[Emi, 06] Emilie P.: Organisation du system immunitaire
felin, Thse de PhD, Ecole Nationale, Lyon, France
(2006)
[Goo et all, 02] Goodman D., Boggess L., Watkins A.:
Artificial immune system classification of multiple class
problems, Intelligent Engineering Systems Through
Artificial Neural (2002)
[Jun et all, 99] Jun J. H., Lee D. W., Sim K. B.: Realization
of cooperative and swarm behavior in distributed
autonomous robotic systems using artificial immune

Figure 2. Evolution des cellules B dans a) AIRS,


b) AIRS2, c) AIRS + facteur, d) AIRS2 + facteur

-4-

SETIT2009
system. IEEE international conference of Man and
Cybernetics, vol. 6, pp. 614--619. New York (1999)
[Kim et all, 01] Kim J., Bently P.: Towards an artificial
immune system for network intrusion detection: an
investigation of clonal selection with a negative
selection operator. Congress on Evolutionary
Computation, vol. 2, pp. 1244--1252, Kor sud (2001)
[Lin et all, 05] Lingjun M., Peter V. D. P., Haiyang W., A:
Comprehensive benchmark of the artificial immune
recognition system (AIRS). Advanced data mining and
applications ADMA, vol. 3584, pp. 575--582, Chine
(2005)
[Sec et all, 03] Secker A., Freitas A., Timmis J.: AISEC: An
artificial immune system for e-mail classification. the
Congress on Evolutionary Computation, pp. 131--139,
Canberra. Australie (2003)
[Tim, 00] Timmis J.: Artificial immune systems: a novel
data analysis technique inspired by the immune network
theory, Thse de PhD Wales UK University (2000)
[Wat, 01] Watkins A.: AIRS: A resource limited artificial
immune classifier, Thse de Master luniversit de
Mississippi (2001)
[Wat et all, 04] Watkins A., Timmis J., Boggess L.: Artificial
immune recognition system (airs): an immune inspired
supervised learning algorithm, vol. 5, pp. 291--317,
Genetic Programming and Evolvable Machines (2004)
[Wat, 05] Watkins A.: Exploiting immunological metaphors
in the development of serial, parallel, and distributed
learning algorithms, Thse de PhD luniversit de Kent
(2005)
[Wat et all, 05a] Watkins A., Timmis J.: Artificial immune
recognition system (airs): revisions and refinements.
Premire confrence International en Artificial Immune
System ICARIS, pp. 173--181, Universit de Kent (2005)
[Wat et all, 05b] Watkins A., Boggess L.: A new classifier
based on resources limited artificial immune systems.
congress de Evolutionary Computation, IEEE World
Congress on Computational Intelligence held in
Honolulu, HI, USA, pp. 1546--1551, Universit de Kent
(2005)

-5-

Vous aimerez peut-être aussi