Académique Documents
Professionnel Documents
Culture Documents
These SMA
These SMA
rojet de pin d9tudes our l9otention du diplme de wster yption X sntelligene erti(ielle hme
Conception et ralisation d'une plateforme multi-agents pour l'extraction de connaissances dans des entrepts de donnes distribus.
Propos par : Prsent par :
wme rFhse.
Soutenu le 12/06/2011 Devant le jury compos de :
xfinme X HVSGPHII
S
6
1.1 Introduction . . . . . . . . . . . . . . . . . . . 1.2 Dnition . . . . . . . . . . . . . . . . . . . . 1.3 L'intelligence des agents . . . . . . . . . . . . 1.3.1 cognitif . . . . . . . . . . . . . . . . . . 1.3.2 ractif . . . . . . . . . . . . . . . . . . 1.4 L'interaction . . . . . . . . . . . . . . . . . . . 1.5 Communications et actes de langage . . . . . 1.5.1 actes de langages . . . . . . . . . . . . 1.5.2 Langages de communication des agents 1.6 Mthodologies . . . . . . . . . . . . . . . . . . 1.6.1 Dans quel cas utiliser l'agent . . . . . . 1.6.2 les mthodologies . . . . . . . . . . . . 1.7 FIPA . . . . . . . . . . . . . . . . . . . . . . . 1.8 Application . . . . . . . . . . . . . . . . . . . 1.9 conclusion . . . . . . . . . . . . . . . . . . . . 1.10 1.11 1.12 1.13
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
9 9 10 11 11 12 13 13 14 14 14 15 16 16 17
V W
Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . Dnition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . le processus du KDD . . . . . . . . . . . . . . . . . . . . . . . Taxonomie des mthodes de data mining . . . . . . . . . . . . 1.13.1 mthodes de dcouverte : . . . . . . . . . . . . . . . . . 1.13.2 mthodes de vrication . . . . . . . . . . . . . . . . . 1.13.3 supervis et non supervis . . . . . . . . . . . . . . . . 1.14 La place du data mining dans les systmes d'aide la dcision 1.15 Aspirations du domaine . . . . . . . . . . . . . . . . . . . . . 1.16 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
IV
18 18 19 20 20 21 22 22 23 23
le des mtires
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Le projet dcisionnel . . . . . . . . . . . . . . . . . . . . . . . 2.2.1 limites des systmes d'information oprationnelle(SIO) 2.2.2 Dnition . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Les entrept de donnes . . . . . . . . . . . . . . . . . . . . . 2.3.1 Dnition . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.2 Particularit des Entrepts de donnes . . . . . . . . . 2.3.3 Objectifs des Entrepts . . . . . . . . . . . . . . . . . . 2.3.4 Les composants d'un Entrept de donnes . . . . . . . 2.3.4.1 Les applications oprationnelles sources . . . 2.3.4.2 Prparation des donnes . . . . . . . . . . . . 2.3.4.3 Prsentation des donnes . . . . . . . . . . . 2.3.4.4 Outil d'accs aux donnes . . . . . . . . . . . 2.3.5 la modlisation dimensionnel . . . . . . . . . . . . . . . 2.3.5.1 Table de faits . . . . . . . . . . . . . . . . . . 2.3.5.2 Table de dimension . . . . . . . . . . . . . . . 2.3.5.3 snowaking . . . . . . . . . . . . . . . . . . . 2.3.5.4 Matrice en bus et les dimensions conformes . 2.4 OLAP et AdHoc Querry . . . . . . . . . . . . . . . . . . . . . 2.4.1 OLAP . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.1.1 Composant . . . . . . . . . . . . . . . . . . . 2.4.2 requte Ad Hoc . . . . . . . . . . . . . . . . . . . . . . 2.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
PS
25 26 26 27 27 27 27 28 28 28 29 29 30 30 30 30 32 32 32 32 33 33 34
II tude de l'existant
35
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1 Introduction . . . . . . . . . . . . . . . . . . 3.2 Agent Mining . . . . . . . . . . . . . . . . . 3.2.1 facteur de l'mergence . . . . . . . . 3.2.1.1 Facteurs li aux agents . . . 3.2.1.2 Facteurs lis au data minig 3.2.2 Framework pour agent mining . . . . 3.2.3 Cycle de vie et Process . . . . . . . . 3.3 Application . . . . . . . . . . . . . . . . . . 3.4 plateforme et architecture existante . . . . . 3.4.1 IRF Architecture . . . . . . . . . . . 3.4.1.1 Agent Academy . . . . . . . 3.4.1.2 l'architecture externe d'IRF
QU
37 37 37 38 38 39 39 40 40 40 41 42
le des mtires
3.4.1.3 l'architecture interne d'IRF Critique . . . . . . . . . . . . . . . . Papyrus . . . . . . . . . . . . . . . . 3.4.3.1 Architecture : . . . . . . . . 3.4.3.2 Critique . . . . . . . . . . . 3.5 Conclusion . . . . . . . . . . . . . . . . . . . 3.4.2 3.4.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
iii
42 42 44 44 45 45
46
4.1 Introduction . . . . . . . . . . . . . 4.2 Le scnario . . . . . . . . . . . . . 4.3 Architecture . . . . . . . . . . . . . 4.3.1 GRC . . . . . . . . . . . . . 4.3.2 Le modle . . . . . . . . . . 4.4 Architecture du systme dcisionnel 4.4.1 Dnition . . . . . . . . . . 4.4.2 La requte . . . . . . . . . . 4.5 Technique de Data Mining . . . . . 4.5.1 C4.5 . . . . . . . . . . . . . 4.5.2 Les Paramtre : . . . . . . . 4.6 Conclusion . . . . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
RV RW
49 49 50 50 51 55 55 55 57 57 58 58
5.1 Introduction . . . . . . . . . . . . . . . . 5.2 Origines . . . . . . . . . . . . . . . . . . 5.3 Prsentation des tapes de la conception 5.3.1 Diagramme des cas d'utilisation : 5.3.2 Identication des types d'Agents : 5.3.3 Identication des responsabilits : 5.3.4 Identication des Accointances : . 5.3.5 Ranement des Agents : . . . . . 5.3.6 Le dploiement des Agents : . . . 5.3.7 rvaluation des agents : . . . . . 5.4 Interaction des agents . . . . . . . . . . . 5.5 notre architecture . . . . . . . . . . . . . 5.5.1 Diagramme des cas d'utilisation : 5.5.2 Identication des types d'agents . 5.5.3 Identication des responsabilit .
SW
59 59 60 60 61 61 61 62 62 62 62 64 64 64 65
iv
5.5.4 Identication des Aquintance : 5.5.5 Ranement des Agents : . . . 5.5.6 Le dploiement des Agents : . 5.6 Interaction et Format de message . . 5.6.1 Interaction . . . . . . . . . . . 5.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
le des mtires
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 66 68 69 69 69
6.1 Introduction . . . . . . . . . . . . . . . 6.2 Format de messages . . . . . . . . . . . 6.3 Agent Miner . . . . . . . . . . . . . . . 6.3.1 Construction du modle . . . . 6.3.2 Modication des modles . . . . 6.4 Agent Agrgateur . . . . . . . . . . . . 6.4.1 Cration d'un modle gnrique 6.4.2 Transformation de modle . . . 6.5 Agent User . . . . . . . . . . . . . . . 6.5.1 Assimilation . . . . . . . . . . . 6.5.2 Ores . . . . . . . . . . . . . . 6.6 Conclusion . . . . . . . . . . . . . . . .
UH
70 71 72 72 73 74 74 75 76 76 76 77
gonlusion
IV Ralisation et mise en oeuvre
UV
79
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.1 Introduction . . . . . . . . . 7.2 Benchmark . . . . . . . . . 7.2.1 TPC-DS . . . . . . . 7.2.1.1 Modle . . 7.2.2 Motivation . . . . . . 7.3 Exprimentation . . . . . . 7.4 Jade . . . . . . . . . . . . . 7.4.1 Motivation . . . . . . 7.5 Jess . . . . . . . . . . . . . 7.5.1 Intgration avec Jade 7.5.2 Motivation . . . . . . 7.6 SQL Server . . . . . . . . . 7.6.1 Les outils . . . . . . 7.6.2 Data Mining . . . . . 7.7 Notre Application . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
VI
81 81 81 82 83 84 85 85 86 86 86 87 87 87 87
le des mtires
7.8 Exprimentation . . . . . . . . . . . . . . . . . . . . . . . . . 7.9 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
v
88 89
WH WI
3.1 Possibilit d'intgration et d'interaction . . . . . . . . . . . . . 3.2 Architecture d'Agent Academy . . . . . . . . . . . . . . . . . 3.3 L'architecture IRF . . . . . . . . . . . . . . . . . . . . . . . . 4.1 Notre modle de donnes . . . . . . . . . . . . . . . . . . . . . 4.2 Notre modle de donnes . . . . . . . . . . . . . . . . . . . . . 5.1 5.2 5.3 5.4 5.5 Cheminement des tapes de notre Conception Diagrammes de cas d'utilisation . . . . . . . . Diagramme Type d'agents . . . . . . . . . . . Nouveaux Diagramme agent . . . . . . . . . . Nouveaux diagramme des agents . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.1 Exemple format PMML . . . . . . . . . . . . . . . . . . . . . 6.2 L'arbre de dcision . . . . . . . . . . . . . . . . . . . . . . . . 6.3 L'arbre de dcision . . . . . . . . . . . . . . . . . . . . . . . . 7.1 7.2 7.3 7.4 7.5 7.6 7.7 7.8 Membre du TPC . . . . . . . . . . . Tables du modle . . . . . . . . . . . Statistiques des tables . . . . . . . . Un chantillon des modles existants GUI de JADE . . . . . . . . . . . . . Jade et Jess . . . . . . . . . . . . . . Notre application . . . . . . . . . . . Notre application . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.1 Table des responsabilit . . . . . . . . . . . . . . . . . . . . . 5.2 Table des responsabilit aprs ranement . . . . . . . . . . . 5.3 Table des Interaction . . . . . . . . . . . . . . . . . . . . . . . 6.1 Rcapitulatif pour 6.2 Rcapitulatif pour 6.3 Rcapitulatif pour
ew . . . . . . . . . . . . . . . . . . . . . . ee . . . . . . . . . . . . . . . . . . . . . . e . . . . . . . . . . . . . . . . . . . . . .
Ddicaces
je ddie ce travail a toute ma famille et aux deux femmes qui ont fait de moi ce que je suis je taime maman. M BENABADJI qui restera toujours dans nos coeurs AITAKLI Soane.
je ddie ce travail a ma famille et mes amis qui ont su se montrer patients prsents et surtout souriants (smile). AITCHEIKH LYES.
Remerciements
En prsentant ce travail nous tenons exprimer notre grande gratitude notre promotrice Mme Habiba DRIAS, pour avoir accepter de nous encadrer tout au long de ce travail, pour sa disponibilit, son amabilit, ses conseils et suggestions et pour toute laide morale et matrielle quelle na cessai de nous prodiguer. Nous tenons remercier M NECIR pour lhonneur quil nous fait de prsiderai notre jury de soutenance. Nous tenons galement remercier Mme TAMEN et M AMANI pour avoir bien voulu accepter dexaminer et de juger notre modeste travail. Que tout enseignant nous ayant fait bncier de son savoir, trouve ici lexpression de notre profonde gratitude. A toute personne ayant contribu, de prs ou de loin, ce travail, nous disons merci. A toute personne nous ayant une fois fait rire, nous disons merci. Au hasard qui nous a runi, un grand merci.
Introduction
Nous sommes l're de l'information, l'information a remplac l'argent dans le capital des socits, les dcideurs doivent prendre des dcisions rapidement et ecacement pour pouvoir survivre dans la jungle qu'est le monde du buisness,ces dcisions peuvent propulser l'entreprise au devant de la scne comme elles peuvent la rduire nant.Les entrepreneurs ont remarqu que l'exprience de l'entreprise pouvait aider prendre ces dcisions vu que les situations sont parfois rcurrentes, ce qui les a pouss essayer de capitaliser leurs expriences : ceci a donn naissance aux entrepts de donnes. Stocker c'est bien mais fallait il encore trouver le moyen de les exploiter d'une manire ecace d'autant plus que ces donnes taient de l'ordre du traoctet, ceci a donn naissance au data mining pour l'entreprise comme outil d'aide la dcision, le data minig remplissait bien sa tache il classiait,trouvait des relations enfouies et aidait prendre la bonne dcision au bon moment. Cela dit avec le temps plusieurs obstacles commenaient apparaitre l'abondance des donnes obligeaient les socits distribuer leur donnes, c'est alors que s'est pos le problme de la propagation de la connaissance acquise . Ces obstacles annoncent l'entr d'une autre technologie qu'est les agents,ils ont pour mission de rendre le data mining plus exible, capable de s'adapter aux environnements distribus et d'utiliser les interactions de ses agents pour propager cette connaissance. Une chose reste voir c'est comment ces deux technologies vont pouvoir interagir pour crer une synergie capable de nous orir le systme dont rve tout preneurs de dcisions,un systme performant able et capable de s'adapter toutes les situations. C'est ce systme que nous allons essayer de prsenter tout au long de ce projet . Notre travail sera divis en quatre parties : Nous dbuterons par prsenter les dirents ingrdients dont on aura besoin tout au long du projet. Nous tudierons tout ce qui a tait fait en rapport notre problmatique . Nous prsenterons notre solution . Nous ferons un tour rapide sur les applications ainsi que le benchmark utilis pour montrer l'ecacit de notre systme
Chapitre 1
Systme multi-agent
1.1 Introduction
Les systmes multi-agents sont un nouveau paradigme pour la conception et la ralisation de solutions informatiques. Ce paradigme a t conu et mis en oeuvre pour relever les ds qui se posent l're de l'informatique moderne.Ce qui le distingue des autres modles, tel que l'orient objet, c'est la capacit de chacun de ses composants agir sur le monde qui l'entoure et cela de manire totalement indpendante . Les systmes multi-agents comprennent des ides et techniques venant de plusieurs disciplines : calcul distribu, intelligence articielle, sociologie, psychologie, philosophie... Le foisonnement et l'interaction entre ces multiples sciences a donn naissance cette discipline avec des contours assez dicile dlimiter,d'o la cration de la FIPA 1 . Nous introduirons cette organisation qui a pour but de standardiser les dirents concepts lier aux agents ;cela dit, nous dbuterons ce chapitre par une dnition des agents, puis nous passerons aux dirents types qui coexistent dans cette discipline et leur particularit la plus intressante savoir l'interaction et la communication .
1.2 Dnition
La meilleure manire de dbuter cette partie aurait t de donner une dnition formelle des agents et des systmes multi-agents. Malheureusement il n'y a pas de dnition universellement reconnue, de ce qu' un agent est cens tre ou faire, par contre, il y a un consensus gnral sur le fait que l'autonomie est un concept fondamental des agents . Dans ce qui suit nous dressons une vue d'ensemble sur les direntes dnitions que nous pouvons rencontrer dans la littrature : Un agent est une entit qui peroit son environnement et agit sur celui-ci" (Russell 2 , 1997) Un agent est un systme informatique, situ dans un environnement, qui agit d'une faon autonome pour atteindre les objectifs pour lesquels il a t
1. Foundation for Intelligent Physical Agents. 2. Professeur a l'universit de Berceley Auteur du :"Articial Intelligence : A Modern Approach" .
IH
conu (Wooldrige et Jennings 3 , 1995). Les agents intelligents sont des entits logiciels qui ralisent des oprations la place d'un utilisateur ou d'un autre programme, avec une sorte d'indpendance ou d'autonomie. Pour faire cela, ils utilisent une sorte de connaissance ou de reprsentation des buts ou des dsirs de l'utilisateur." (L'agent selon IBM) ; Un agent est une entit qui fonctionne continuellement et de manire autonome dans un environnement ou d'autres processus se droulent et d'autres agents existent." (Shoham 4 , 1993) ; Un agent est une entit autonome, relle ou abstraite, qui est capable d'agir sur elle-mme et sur son environnement, qui dans un univers multiagents, peut communiquer avec d'autres agents dont le comportement est la consquence de ses observations, de ses connaissances et des interactions avec les autres agents (Ferber 5 , 1995). En partant de ces dnitions mises par des professionnelles du domaine , on peut identier les caractristiques suivantes pour la notion d'agent : situ :l'agent est capable d'agir et de ragir sur son environnement partir des entres qu'il reoit de ce dernier. utonome : l'agent est capable d'agir sans l'intervention d'un tiers (humain ou agent) et contrle ses propres actions ainsi que son tat interne. proEtif : l'agent doit adopter un comportement pro-actif et opportuniste, tout en tant capable de prendre l'initiative au bon moment. ple de rpondre temps :l'agent doit tre capable de percevoir son environnement et d'laborer une rponse dans le temps requis ; soil : l'agent doit tre capable d'interagir avec d'autres agents (logiciels ou humains) an d'accomplir des taches ou aider ces agents accomplir les leurs.
II
L'approche traditionnelle pour construire des systmes articiellement intelligents, connue comme L'IA Symbolique,suggre que les comportements intelligents peuvent tre gnrs dans un systme en donnant ce dernier une reprsentation symbolique de son environnement, du comportement dsir et d'une manipulation de cette reprsentation [Wooldridge 09]. Les agents cognitifs s'inscrivent dans cette approche. Ils sont caractriss par une reprsentation des connaissances sous forme symbolique et par des notion mentale (telles que la connaissance, les croyances ...). L'agent utilisera cette reprsentation symbolique qui est un ensemble de formules logiques, pour faire un travail de dduction[Wooldridge 09]. En terme de fonctionnalit ce type d'agent une reprsentation symbolique et partielle de son environnement et des buts spciques. Ils sont capables de planier leur comportement, mmoriser leurs actions passes, communiquer par envoi de messages, ngocier, etc.
1.3.2 ractif
L'approche traditionnelle, pour construire des agents, fait face certaines limitations tel que la faiblesse du langage de reprsentation de notre logique. Cela ne permettra pas de construire des agents qui pourrait rpondre toutes les attentes de leur concepteur notamment dans des environnement contrainte de temps. Une nouvelle approche a vu le jour au milieux des annes 1980. Elle se caractrise par un rejet de l'IA symbolique[Wooldridge 09]. Cette approche est bas sur trois ides principales : Le rejet de la reprsentation symbolique et de la prise de dcision base sur la manipulation de cette reprsentation. L'intelligence n'est pas incorpor mais est le produit de l'interaction que les agents maintiennent avec leur environnement. Le comportement intelligence jaillit de l'interaction de comportement tout fait simple.[Wooldridge 09] Ce type d'agent est gnralement quali de pas intelligents , il n'a donc pas de capacit mental. Ses capacits rpondent uniquement au mode stimulus/action qui peut tre considr comme une forme de communication. Un systme multi-agents ractif est gnralement compos d'un grand nombre d'agents. l'intelligence merge de l'interaction de ces agents entre eux ,on dit que leur intelligence est distribue.
IP
1.4 L'interaction
Jusqu'ici nous avons mis l'accent sur les direntes faons de voir et de concevoir un agent isol mais une de leur proprit incontournable est leur capacit interagir en groupe ou avec le monde extrieur(l'environnement). Cette interaction est dnie comme toute action qui se droule dans le systme d'agents et qui a pour eet de modier le comportement d'un autre agent[Bellifemine 07]. En gnral, les interactions sont mises en oeuvre soit par un transfert d'information entre les agents ou entre l'agent et l'environnement, soit par sa perception La gure ci dessous [Wooldridge 09] montre une structure gnrique des diffrentes interaction que l'on peut rencontrer dans un systme multi-agent.
IQ
IR
pse a cre un standard de langage de communication agent egv @egent gommunition vngugeA : elle dnit une vingtaine de
La performative (tel que "inform")pour instruire sur le contenu du message. Elle ne contraint pas l'utilisation d'un certain langage dans le contenu et ressemble au @uwvA dans sa syntaxe.
1.6 Mthodologies
Le paradigme agent suit dans son volution celui de la yy. L'agent est dans une priode faste o il doit mettre en oeuvre des mthodologies pour son expansion d'un paradigme exprimental vers une technologie plus pratique. Qui dit pratique dit mis en oeuvre d'application industrielle, cela induit un processus de conception d'agents ecace et rentable. Dans ce qui suit nous verrons les dirents cas d'utilisation du paradigme d'agent ainsi que les direntes mthodologies les plus utilises pour concevoir ces systme base d'agents. Mais tout d'abord, nous devons identier les dirents cas et scnarios dans lesquels une solution base d'agents est la plus adquate. Ceci est le prambule pour chaque situation o une solution base d'agent est envisag :
IS
:dans ce genre d'environnement les agents sont les plus appropris car capable de dcision exible et autonome les gents sont une mtphore nturelle :plusieurs environnement sont de nature organisationnel avec des interaction qui ressemblent celles des humains (le commerce et les environnements comptitifs). Ces derniers sont diciles voir impossible mettre en oeuvre avec les paradigmes existants . l distriution des donnes :dans le domaine informatique la centralisation d'une solution est tout simplement inimaginable. Le paradigme agent est tout a fait convenable pour les problme a caractre distribu. les systmes onventionnels :la plupart des systmes informatiques tournent grce des solutions dont la technologie est obsolte, il est donc dicile de mettre en oeuvre une solution base d'agent dans un tel environnement.
the eess methodology @uinny et lA X qui a t dvelopp par l'Australian AI Institute. Il est l'un des premiers qui a mis en oeuvre le paradigme royneEdesireEintention. Il a t utilis dans la conception de
logiciel pour la gestion du trac arien.[Sellers 05] cette mthodologie permet, partir de simples spcications, de crer un modle de grande precision. Ce dernier sera directement utilis lors de l'implmentation ;[Sellers 05]
qi @ooldridge et lA X
tde methodology X cette approche combine deux approches dite op hown ET hown op
Nous dtaillerons cette dernire un peu loin[Sellers 05].
IT
1.7 FIPA
Une collaboration internationale, constitu d'organisations universitaires et industrielles sous l'gide de la FIPA (Foundation for Intelligent Physical Agents), a permis de spcier des standards dans la technologie agent qui vise favoriser l'interoprabilit des applications, des services et des quipements informatiques bass sur le paradigme agent. Parmi les standards qu'elle a dnit, nous trouvons les protocoles d'interactions suivants : pseEequest X c'est le protocole de base de touts les protocoles, il permet a un agent de faire une demande a un autre agent[Bellifemine 07]. pseEgontrt xet X Permet l'initiateur d'envoyer un appel d'ore un ensemble d'agents. Seuls ceux qui respectent certaines conditions pourront soumettre leur ore. L'initiateur pourra choisir un ou plusieurs agents selon ses besoins[Bellifemine 07]. pseEusrier X L'initiateur devra envoyer un message pour pouvoir s'inscrire dans une sorte de mailing liste. Chaque fois que l'agent cible aura rempli certaines conditions, il enverra un message tous les agents qui se sont inscrit dans la mailing liste[Bellifemine 07]. Elle a dnit des standards pour les comportements qui ont la responsabilit de grer les direntes taches des agents ynehot fehviour X les taches qui sont grer par ce comportement ne seront excut qu'une seul fois . iker fehvuour X les taches qui sont grer par ce comportement seront excut a des intervalles de temps dnie. gyli fehvuour X les taches qui sont grer par ce comportement seront sans interruption et de faon rcurrente.
1.8 Application
La technologie des agents est en train de s'implanter dans divers domaines o les systmes conventionnels ont montr leurs limites ou dans lesquelles les agents ont montr une ecacit sans prcdent. Souvent, ce sont des domaines assez critiques ou ouverts avec une complexit norme. Nous pouvons citer certains exemples : les gents et les rseux de pteur Xce sont des micro-capteurs capables de rcolter et de transmettre des donnes environnementales d'une manire autonome. Cela convient tout fait aux systmes multi-agent qui voluent bien dans un environnement distribu
IFWF onlusion
IU
l'information. Des sources de donnes presque innies sont notre disposition et les agents sont tout fait adquats pour les exploiter et grer cette information. La technologie agent est la plus adquate pour cette mthode car l'information est distribue et parpille (Internet) l'intrt pour la gestion la gestion du workow ne cessent d'augmenter dans l'informatique moderne,automatiser le process d'un business est devenue ncessaire, Un systme multi-agent nomm ADEPT a tait conue pour le workow, il modlise une socit d'change et de ngociation
1.9 conclusion
Ce chapitre n'tait qu'une bauche d'ides et de principes concernant la technologie des agents. Nous avons tudi d'abord les agents en tant qu'entits et vu qu'il n'existait pas d'agent isol. Ainsi nous avons vu les systmes multi-agent et leurs proprits qui est l'interaction. Nous avons omis de mentionner les technologies existantes pour les systme multi-agents car chacune a une vision bien particulire des dirents concepts prsents plus hauts. Les SMA ont atteint une certaine maturit qui leur permet de combiner leur comptence avec d'autres technologies comme nous l'avons signal. Particulirement les agent cognitif utilisent la dduction pour faire face aux obstacles. Une autre possibilit est l'utilisation de l'induction qui est reprsent par la discipline prsent dans le chapitre suivant le Data Mining
1.11 Dnition
"Le Knowledge Discovery in Databases (KDD) est l'analyse exploratoire et la modlisation de larges entrepts de donnes.Le KDD est le processus d'identication de modle qui soit valide,indit,utile et comprhensif et cela partir de large et complexe sources de donnes[Witten 05] ; Le data mining est le coeur de ce processus et cela par l'utilisation des dirents algorithmes qui explorent les ensembles de donnes et qui construisent les dirents modles, qui sont ensuite utiliss pour l'assimilation de phnomnes mergents ainsi qu' son analyse et sa prdiction[Maimon 10] De ces dnitions assez austre nous pouvons dduire plusieurs points assez intressants et qui nous aiderons poser les bases de cette technologie : le KDD et le data mining sont complmentaires, ils ont un but commun :transformer les donnes en connaissances le KDD est un ensemble d'tapes qui pour but la construction de modles qui nous aiderons mieux comprendre nos donnes .
IW
le data mining est l'une de ces tapes, il a un rle crucial car c'est grce ses algorithmes que l'on peut construit ces fameux modles.
PH
donnes, traiter les champs de donnes manquantes, tenir compte des informations sur les squences temporel et les changements connus rduire et projeter les donnes X Trouver des outils utiles pour reprsenter les donnes, en fonction de l'objectif de la tache et ce an de rduire leur taille et en avoir une meilleure apprciation. identi(er une mthode de dt mining X Faire correspondre les objectifs du processus KDD une mthode de datamining particulire et qui serait la plus apte nous donner des rsultats optimaux, par exemple : classication, rgression, clustering, etc. hoix d9un lgorithme de dtmining X Choix de la ou des mthodes utiliser pour la recherche de modle dans les donnes parmi les algorithmes les plus connus et ayant dj fait leur preuves. ppliquer le dtmining X Appliquer la techniques ainsi que l'algorithme choisi dans l'tape prcdente sur notre base de test vluer les rsultts du dtmining X Interprter les modles explors selon le rsultat obtenus tout en possdant toujours la possibilit de revenir aux tapes 1-7 pour plus d'itration. onsolider les onnissnes douvertes X Intgrer ces connaissances dans un autre systme pour des actions supplmentaires, ou simplement le documenter et le rapporter aux parties intresses.
PI
PP
PQ
1.15 Aspirations du domaine etive dt mining X Les nouvelles informations qui rsulteront partir du KDD seront automatiquement appliques aux systmes. ves mtElgorithme X Des algorithmes qui pourront nous informer sur la
ou les techniques les plus adquates utiliser pour un ensemble de donnes en particulier. xonomie pour les neufs tpes X Nous avons vu tout l'heure la taxonomie des techniques de data mining. Une telle taxonomie pour chacune des neuf tapes serait un bon en avant dans la rsolution de la complexit de cette dernire. ve dt mining distriu X on ne peut imaginer une gigantesque source de donnes qui serait centralise le data mining dans un environnement dcentralise est une ncessit. grtristique du prolme X tude au pralable de l'utilit de l'utilisation d'une technique de data mining.
1.16 Conclusion
Nous avons essay dans ce qui a prcd, de donner une vue d'ensemble sur le processus d'extraction de connaissances tout en dnissant son outil le plus crucial le data mining. Nous avons prfr ne pas inclure des interactions avec des d'autres disciplines qui auraient un lien avec notre problmatique car elles seront traites dans les prochains chapitres. Nous avons aussi vu l'architecture trois tiers du systme dcisionnel. Nous allons dans le chapitre suivant d-
PR
cortiquer ce systme pour mieux comprendre l'utilit de l'application du Data Mining sur les plateformes prcdemment mentionnes.
Chapitre 2
PT
sants ainsi qu'une vue d'ensemble sur les direntes faon de modliser et de l'exploiter .
PU
donnes, le SI n'est donc pas en mesure de fournir une aide aux stratgies d'adaptation cet environnement les donne du SI ont une forme ge et sont exclusivement destines tre traites par des procdures prdtermines.
2.2.2 Dnition
Un systme d'information dcisionnel est,par essence et par dnition,un outil destin recueillir, organiser, mettre en forme et diuser des donnes de manire en faire des informations.Sa conception repose avant tout sur des modles de donnes[Rabah 09] Un systme dcisionnel est un systme d'information ddi aux applications dcisionnelles,il regroupe un ensemble d'information et d'outil mis la disposition des dcideurs pour supporter de manire ecace la prise de dcision[Gouarne 98]. Elle se distingue par des caractristiques qui sont Un systme d'information dcisionnel qui est la fois spar du point de vue conception et applications et dpendant pour son alimentation . L'information dcisionnelle est indpendante des structures et des procdures courantes de la production (elle est oriente sujet ). L'information dcisionnelle est chronologique, elle est utilise des buts d'analyse de phnomne voluant dans le temps,ce facteur est essentiel mais contribue la complexit du systme.
yrient sujet X
PV
sntgres X elle se propose de rsoudre le problme d'htrognit des donnes (logiciel et matriel). honnes histories X un rfrentiel temps doit tre attribu aux donnes pour donner un sens leur utilisation dans l'entrept. honnes non voltile X les donnes ne peuvent tre mise a jour la seul
opration permise est l'ajout .
v9entrept de donnes doit prsenter l9informtion de l9orgnistion de mnire ohrente : les donnes doivent tre crdibles, elle ne seront publies qu'aprs avoir vri leur qualit. v9entrept de donnes doit tre dptle et rsistnt ux hnE gement X les changements dans une entreprise sont invitables et cela se
rpercute sur l'entrept ,les changements eectus ne doivent pas porter atteinte la validit des donnes dj stockes .
l9entrept doit tre le sole sur lequel repose l9mliortion des prises de dision X C'est l'un des objectifs les plus critiques des entrepts,il
PW
QH
PFQFSFI le de fits
Chaque table de fait contient des mesures en relation avec le Buisness Process comme la prise de commande ou la gestion du stock ,chaque enregistrement dans cette table reprsente une mesure ,ces mesures quantie la magnitude de ce Process, de ce fait ces mesures sont quasi exclusivement numrique comme le prix de la commande ou la quantit restante dans un stock,et ils sont pour la plupart additive car les traitements se font au niveaux de ces quantit mesurable en leur appliquant des oprations ensembliste ,par exemple acher les gains engrang en un an en auditionnant les direntes prix des commandes sur une anne ve grin X Une notion importante plus le grain est petit plus on peut adresser des requte plus exible il reprsente la precision de nos donnes ou l'chelle ,si nous sommes dans un contexte temporelle le grain peut tre prsent comme le mois ou le jour le grain dans une table de fait doit tre le mme.
PFQFSFP le de dimension
Les tables de dimension sont les points d'entres dans la table de faits.Des attributs de dimension nombreux permettent de varier les possibilits d'ana-
QI
lyse ,Les dimensions tablissent l'interface Homme/Modle[Kimball 02]. les dimensions sont les fondations du modle dimensionnel ils dcrivent l'objet du Business comme les employ les client ,ces tables sont des description textuelle de ce Process,la puissances et la lisibilit de l'entrept de donnes est proportionnelle la qualit des attributs de ces dimensions ,car ils sont le points d'entre dans la table de fait ou sont gard les mesures intressantes . les relation qui vont lier la table des faits et la table de dimension et une relation de type <un a plusieurs> ,un enregistrement dans la table des fait aura un enregistrement dans la table des dimension et un enregistrement dans la table des dimension aura plusieurs enregistrements dans la table des fait ce qui nous garantit la non redondance des donnes Ci dessous la gure montre
QP
PFQFSFQ snow)king
Le snowaking se rsume attacher des tables aux, tables de dimension ce qui donne un modle en forme de ocon de neige. Ce genre de modle met en avant l'ecacit et la rapidit pour trouver des donnes en tentant parfois de renormaliser les tables dimensionnelles,la gure ci dessous est un exemple d'un modle en ocon de neige.
PFRFIFI gomposnt
L'architecture OLAP consiste en trois services : fses de donnes X cette base de donnes doit supporter les donnes agrges ou rsumes qui peuvent provenir d'un entrept ou d'un march de donnes. Elle doit possder une structure multidimensionnelle erveur yve X Elle gre la structure multidimensionnelle dans le SGBD et l'accs aux donnes de la part des usagers wodle lient XPermet aux usagers de manipuler et d'explorer les donnes,ache les donnes sous forme graphique ou de tableaux.
QR
2.5 Conclusion
Nous avons essay dans cette partie de donner une vue d'ensemble sur la technologie des entrepts de donnes. Nous avons intentionnellement nglig le cot accs de donnes ainsi que l'interaction avec le data mining en ne donnant que de simple dnition car nous y reviendrons plus longuement dans un chapitre ou nous donnerons les avantages et les inconvnient de chaque approche
Chapitre 3
3.1 Introduction
L'intgration et l'hybridation des technologies avances est un processus qui s'inscrit tout naturellement dans le dveloppement de l'informatique moderne. Le rsultat de ces hybridations peut mtaphoriquement tre reprsent par cette somme 2+2=5. Les avantages de chaque hybridation peuvent tre vue de direntes faons ,selon qu'on se place du cot des agents ou du data mining. Le data mining amliore les capacits du systme base d'agents ,il augmente son intelligence et sa capacit s'adapter des situations nouvelles, le data mining gagne en vitesse et en distributivit. Nous dresserons dans ce qui suit une vue d'ensemble sur les facteurs qui ont pouss l'mergence de cette branche ainsi que les ds et objectifs que les deux technologies veulent atteindre avec cette intgration.
QV
QW
L'egent wining en tant que discipline mergente,tudie les direntes mthodologies,principes,techniques et applications de cette synergie[Cao 07]. L'interaction et l'intgration du data mining dans les agents se fait sur diffrentes couches comme nous pouvons le voir dans la Figure,que ce soit au niveau des donnes,des capacits d'apprentissages et de l'aspect organisationnel. Ceci requiert une tude pousse des aspects des deux disciplines pour trouver un framework assez consistant qui puisse orir une synergie parfaite entre les deux technologies.
gouhes essoures X L'intgration et l'interaction peut s'eectuer au niveau des donnes. gouhes gonnissnes X L'intgration et l'interaction peut s'eectuer au niveau de la connaissances qu'elle soit humaine ou extraite. gouhes epprentissge X L'intgration et l'interaction peut s'eectuer au
niveau des mthodes d'apprentissages,des capacits d'apprentissages et des perspectives lier la performances de ce dernier. gouhes erformne X L'intgration et l'interaction peut s'eectuer pour l'amlioration de l'une ou de l'autre des technologies.
tant donn que l'egent wining se compose de deux technologies qui ont volu dans des domaines dirents leur cycle de vie est en toute logique dirents ; si les systmes base d'agents sont utiliss exclusivement pour supporter les
RH
algorithmes de data mining alors le cycle de vie suivra celui de ce dernier savoir : Extraction , Transformation , Chargements ... D'autre part si les algorithmes de data mining sont implants sur les agents pour les rendre plus performant,alors le cycle de vie sera celui de la conception d'un logiciel savoir analyse ,conception ... Jusqu' maintenant il n'y a pas de cycle de vie gnrique qui engloberai les deux voies, cela dpend grandement de la solution prsenter et de l'importance de chacune des deux technologies dans cette dernire. D l'importance que prend cette discipline, il serait plus intressant de mettre en oeuvre un cycle de vie qui serait propre elle .
3.3 Application
L'interaction des 2 technologies ouvre des perspective normes dans les applications auxquelles elle peut tre conduite que ce soit dans les domaines du data mining ou des agents. On trouve dans la littrature plusieurs domaines : erti(il nd eletroni mrkets, qestion de l reltion lient, ixE trtion et tritement des donnes distriu, iEommere, fusiness intelligene . Dans ce qui suit nous allons voir l'application de l'egent wiE ning pour l'extraction de connaissances. Ces deux plateformes ont mis en oeuvre leur propre framework pour mettre en oeuvre la synergie des systme multi-agent et du data mining pour bncier au maximum de cette complmentarit .
L'sntelligent eomendtion prmework est comme son nom l'indique un framework pour la construction de systmes de recommandation partir d'i (Entreprise Roussources Planning),des progiciel pour les systme d'information , l'aide de systmes multi agents utilisant des algorithmes de data mining. Ce systme a pour but d'extraire des rgles partir des donnes contenues dans l' i et de les injecter vers d'autre agents qui joueront le rle d'agents de recommandation. Ce systme a t conu spcialement pour
RI
le wrket eomndtion, ce qui veut dire qu'il gre des recommandations et des prols d'usagers et d'inventaires. Avant d'entrer dans les dtails de l'architecture de ce framework nous devons tout d'abord faire une brve introduction de la plateforme sur laquelle se base IRF Architecture.
RP
3.4.2 Critique
Ce framework a t conu exclusivement pour le systme de recommandation, en dehors de ce domaine il est inutilisable . Les ERP sont par essence des systmes distribus nanmoins il n'y a pas dans
RQ
RR
simplement inutilisable.
3.4.3 Papyrus
Papyrus est un systme base de couches contenant dirents outils logiciels ainsi que des outils rseaux pour rsoudre le problme du data mining distribu. Contrairement ses prdcesseurs, il est orient peer to peer,en d'autre termes les agents sont plus libres d'eectuer leur travail avec une abilit et une ecacit maximum[Grossman 99]. Cette architecture est tout fait adquate pour le Data Mining Distribu (DMD)et elle a d'ailleurs t conue pour pour eectuer de l'extraction de connaissances sur des zones distribues.
QFRFQFI erhiteture X
Papyrus se compose de quatre couches : l ouhe dt wrehouse X la couche la plus basse de l'architecture contient comme son nom l'indique les entrepts de donnes desquelles seront extraites les donnes d'apprentissages l ouhe dt mining XCette couche a pour but la construction de modle de donnes en appliquant des techniques de data mining sur les ensembles de donnes extraites partir des entrepts de donnes . l ouhe du modle prditive XCette couche va grer les connaissances extraites en transformant les modle de donnes en format XML (PMML) . l ouhe egent X s'occupe du transport de ces modles entre les dirents noeuds. Les concepteurs de cette approche ont mis sur pied un langage xml appel DDML (Data Discovery Markup Language) qui dcrit les direntes requtes et les meta-donnes qui accompagnent l'utilisation du data mining distribu. Les agents se transmettent les chiers PMML ET DDML . Plusieurs stratgies peuvent tre mises en oeuvre en ce qui concerne les donnes que les agents se transmettent : dpler les donnes X cette approche permet de transmettre les donnes. Ceci requiert un trs grand dbit, mais en contre partie cela permet une plus grande precision lors de la construction du modle agrg dpler les modles douverts X une autre approche serait d'appliquer la technique de data mining localement et de transmettre les donnes sous un format XML. Ceci requiert une bande passante moindre avec une certaine perte de precision lors de l'agrgation. dpler les rsultts X cette stratgie est la moins couteuse mais ne permet pas de faire l'agrgation entre plusieurs sources.
RS
Ce framework a nglig totalement l'aspect extraction de donnes et n'a fait que survoler le fait d'appliquer une technique de data mining. Inexistence d'une mthodologie capable d'accompagner la construction du systme multi agents. L'tat interne de l'agent a t tout simplement ignor(Comportement,Interaction ...).
3.5 Conclusion
Les plateformes existantes servirons de base notre propre modle. Nous essayerons de reproduire les avantages de chaque mthode en vitant leurs inconvnients tout en essayant de suivre les aspirations de cette nouvelle discipline qu'est l'egent wining et la synergie de ces composants .
Introduction
Aprs une courte introduction des dirents ingrdients et techniques que nous allons dployer, pour mettre en oeuvre notre solution,nous allons nous atteler dans cette partie prsenter notre modlisation. Elle aura pour but d'automatiser l'extraction des connaissances partir d' entrept de donnes distribues ,de propager ces connaissances et modles de donnes et de faciliter leur accs pour les utilisateurs. Quand nous parlons de connaissance, il est bien sur question de construction de modle de donnes cens nous montrer et nous rvler des relations enfouies dans les donnes et ou de prdire le comportement d'une entit . Comme abord dans la partie "Etude de l'existant" il n'y a pas de mthodologie qui puisse nous accompagner tout au long de la construction d'un systme multi-agents, tout en ayant la capacit d'utiliser les techniques de data mining. Nous avons vainement essayer d'adapter les frameworks existants notre problmatique, coups de modications et de changements assez critique, malgr cela ils n'arrivaient pas couvrir tous les aspects de notre problmatique. Aprs avoir pris conscience de cette donne, nous nous somme mis concevoir un framework en nous inspirant des travaux dj existants(certains sont cits dans la section "Agent Mining") en vitant de reproduire leur lacunes et de le concevoir de faon gnrique de telle faon pouvoir s'adapter toutes les situations qui requinqueraient l'utilisation des direntes technologies. Nous avons donc d mettre en place une nouvelle architecture qui puisse supporter les direntes contraintes lies notre problme et en rgle gnrale tout systme qui aurait pour ambition l'extraction de rgles et leur propagation pour une utilisation eective et simple , nous allons dcrire notre architecture en la ciblant sur un cas bien prcis pour montrer l'ecacit et sa exibilit. Nous allons d'abord dcrire le scnario sur lequel nous allons appliquer notre systme , cela fera oce de notre premier chapitre puis nous passerons notre systme multi-agents en cernant les dirents rles et nalement nous consacrerons un chapitre pour dcrire la constituante de chaque agent et de son comportement.
Buisness Modle
4.1 Introduction
Les nouvelles technologies sont omniprsentes dans notre socit. Tous les magasins et grandes surfaces l'incorporent dans leur stratgie an d'attirer et dliser leurs clients pour faire plus de prots. Toutes ces entreprises proposent aux clients des cartes d'abonnements, qui ne sont ni plus ni moins que des prols que ces dernires gardent pour mieux connaitre le client ,car plus on connait le client plus on saura quoi lui vendre. L'exemple le plus connu est celui de wall mart : ds que vous poser un pied dans cette chaine de grande surface,wall mart sait ce que vous voulez acheter . Nous allons donc simuler une grande surface qui a des succursales gographiquement spares. Elle utilise une technologie d'entrept de donnes qui historise direntes informations auxquels nous nous intresserons. Le modle de donnes est inspir d'un benchmark nomm TPC-DS et des ouvrages de Ralph Kimball qui modlise une grande surface de distribution de produit en tout genre, donc contient toutes les informations (tables) dont nous aurons besoin pour notre cas. Nous ne prsenterons pas ce benchmark dans ce chapitre mais dans le chapitre ralisation, cependant l'architecture des donnes est typique pour un systme de gestion des relations clients et donc elle sera dissque. Nous dbuterons notre chapitre par prsenter le scnario dans lequel nous voulons appliquer notre systme ,nous passerons ensuite vers la description de l'architecture de nos donnes historises dans l'entrept de donne,nous parlerons ensuite de l'architecture 3-tiers utilis pour analyser . Nous tayerons tout ce que nous dirons par des exemples et des gures explicatives.
Chapitre 4
4.2 Le scnario
Le data mining peut tre appliqu divers applications dans le monde rel et particulirement dans le monde du business. Nous pouvons cerner une dizaine de cas tels que : htetion d9nomlie X Les entreprises utilisent le data mining pour vrier si une donne est valide ou pas comme par exemple est ce que le code de la
SH
reommndtion X
carte de crdit est entr par une personne autoris ou pas . qestion du risque XLe data mining peut tre utilis pour dterminer le risque qu'on peut avoir par exemple pour l'octroie d'un prt . Mais la principale utilisation du data mining est bien sur les systmes de
Quelle type de produit ou d'ores devez vous prsenter un client. C'est une question que tout les grants de magasins se posent.Gnrer des recommandations est trs important dans le domaine de la distribution,les clients qui reoivent les recommandations(en d'autre termes les bons produits au bon moment) seront plus rentables (car ils seront plus apte consommer encore plus) et plus dle (car ils se sentiront plus l'aise ) . Ce que nous voulons modliser est un systme de recommandations, qui pourra selon le prol d'un utilisateur, recommander des produits avec un label satisfait ou rembours pour dliser les clients. Mais de l'autre cot cela gnre des pertes si on tombe sur des clients qui demanderont tre rembours sans aucune raison li leurs satisfaction au produit. La solution : selon le prol de l'utilisateur qui se trouve tre dans une carte de dlit ou dans son compte (si les achats se font sur internet), il recevra des ores personnalises. Nous restons toujours dans notre logique de pousser le consommateur acheter plus de produit et lui rserver des traitements personnaliss pour qu'ils se sentent plus l'aise et donc deviennent dle sans pour autant engranger de pertes.
4.3 Architecture
Dans cette section nous tenterons de prsenter l'architecture typique d'un processus qui a pour but d'englober le retour des produits qui fait partie de la gestion de la relation clients. Nous dbuterons par une dnition du GRC puis de l'tude de l'architecture
4.3.1 GRC
Tous les secteurs se rallient la gestion des relations clients,passant d'une orientation produit une orientation client [Kimball 02] L'ide, toujours la mme, est d' essayer de mieux cerner les clients pour tablir une relation durable avec lui ; cela concerne ventes,livraison ou service aprs vente.Essayer d'orir un traitement personnalis chaque client est le mot d'ordre de ce systme.
RFQF erhiteture
SI
SP
Colonne c-Salutation c-Nom c-Prenom c-Naissance-Jour c-Naissance-Mois c-naissance-Anne m-Naissance-Pays c-ID c-Ad-Mail m-Pays m-Dernire-Visite Type char(3) char(20) char(20) int int int char(10) int char(30) char(10) date Nulle X X X X X X X X X
RFQF erhiteture
Colonne d-Nom-Jour d-Num-JS d-Num-JM d-Num-JAE d-AE d-AC d-Seq-Semaine d-Seq-Tri d-Num-Tri d-Ind-Fri Type Entier Entier Entier Decimal Decimal Decimal Decimal Decimal Decimal Decimal Nulle X X X X X X X X X X
SQ
Explication la dnomination du jour l'ordre du jour par rapport au dbut de la semaine l'ordre du jour par rapport au dbut du mois Numro de jour a partir de la premire anne d'exercice Anne de puis le dbut de l'exercice L'anne d'aprs le calendrier numro de semaine depuis le dbut de l'exercice numro du trimestre depuis le dbut de l'exercice le numro de trimestre depuis le dbut de l'anne est ce un jour fri
wgsins Dhte
Nous n'avons pas inclus les cls primaires et trangres car cela ne ferait que compliquer les tables et le modle.
SR
Colonne m-Magasin-date-ouverture m-Magasin-Nom m-Rue-Nom m-Rue-Numero m-Ville m-Region m-Pays m-Zip-Code m-Manager m-Taxe-Pource m-Decalage-horaire
Type Entier Decimal Decimal Decimal Decimal Decimal Decimal Decimal Decimal Decimal Decimal
Nulle X X X X X X X
Explication Date d'ouverture du magasin non du magasin Nom de la rue Numro de la rue Nom de la ville Nom de la rgion Nom du pays Le code Zip Le nom du manager du magasin de la charge Pourcentage de la taxe appliqu Decalage horaire
Nulle X X X X X
Explication la quantit retourne Le montant des produit retourn la taxe sur les produit retourn Les frais qui ont accompagn le retour du produit Montant qui as tait rembours La perte Net Amortissage de la charge
SS
4.4.2 La requte
Nous utiliserons le langages SQL pour modliser une requtes qui pourra nous permettre de rcolter les donnes ncessaires a notre processus de data mining ,cette requtes nous aidera a retrouver des donnes qui pour-
ST
ront nous informer sur les client qui ont une fcheuse tendance a demander remboursement par rapport aux produit elle s'exprime sous la forme suivantes with client-total-retour as (select sr-client-sk as ctr-client-sk //sr-client-sk est la cl primaire de la table client ,sr-magasin-sk as ctr-magasin-sk //sr-magasin-sk est la cl primaire de la table magasin ,sum(sr-retour-amt) as ctr-total-retour //sr-retour-amt le montant qui a tait rendu from Retour-Magasin group by sr-client-sk ,sr-magasin-sk) select <Les paramtres de l'algorithme de data mining> // les paramtre que nous allons utiliser pour le DM from client-total-retour ctr1 //la table que nous avons construit plus haut ,magasin ,client where ctr1.ctr-total-retour > (select avg(ctr-total-retour)2 // calcul la moyenne des retour from client-total-retour ctr2 // et slectionne ceux qui sont suprieur de deux fois where ctr1.ctr-magasin-sk = ctr2.ctr-magasin-sk) // la moyenne and s-magasin-sk = ctr1.ctr-magasin-sk and ctr1.ctr-client-sk = c-client-sk order by c-client-id Cette requte utilise l'oprateur ith qui cre si on puis dire une table contenant le prix de touts les produits que le client a rendu en utilisant l'oprateur qroup y sur client,le calcule la somme est eectu par la fonction sum. Nous utiliserons la table de fait ou se trouve le prix des produits rendus. puis nous utilisons le rsultat de la requte avec ith pour calculer la moyenne du prix des objet rendu (par utilisateur et par magasins), et nous slectionnons ceux qui ont un montant deux fois plus lev que la normal,avec cette ligne : where trIFtrEtotlEretour b @selet vg@trEtotlEretourAP . On fait une jointures entre trois tables : Client et magasins qui fournissent dirents attributs a utiliser avec nos algorithmes de data mining. la table construites tout a l'heure avec l'oprateur ith pour retrouver les
SU
bon clients,nous leur rajoutant une colonne ype lient qui aura pour valeur wuvis,et d'un autre cot nous slectionnant les client, qui au contraire, ont un montant d'objet rendu infrieur au double de la moyenne,nous leur donnant un label fon,en faisant cela nous venons de construire notre ensemble d'apprentissage . ce que nous essayerons d'apprendre est donc le concept de bon client (dans le sens de notre systme de recommandation), nous avons juger que les information sur le client lui mmes peuvent tre rvlatrice, l'environnement ou il fait ses achats a savoir le magasin est important,les objet rendu ne sont pas important car notre systme de recommandation ne visera pas a fournir des promotion sur des objets spcique mais a dtecter les mauvais clients.
4.5.1 C4.5
Les systmes qui font de la classications sont les plus rpondues dans le paysage du data mining appliqu,ils prennent en compte des instances et doivent les aecter a des classes prdnies,le C4.5 est UN descendant de L'ID3 et de CART qui ont largement tait utilis [XindongWu 07], tout comme touts les arbres de dcision il utilises l'approche diviser pour mieux rgner et apporte plusieurs amlioration tel que : une rapidit et un taux d'apprentissage lev Une plus grande exibilit. les tests sont bien plus ecaces la reprsentation de la connaissances acquise est sous la forme de rgle Les arbres de dcision et plus particulirement le C4.5 a tait lu comme la
SV
meilleur techniques de data mining par le Top dix des algorithmes de data mining [Maimon 10] plusieurs raisons li a notre problme nous ont pouss a choisir cette voie : les arbres de dcision en sortie gnre un modle qui est comprhensible par l'tre humain et donc sujet a modication ce qui sera notre cas . les sorties de cet arbre de dcision seront de la forme de rgle par exemple : i oueaR i grurntari i itessewxaIPH
evy inginaoiture
4.6 Conclusion
Aprs avoir dcrit notre problmatique dans ce chapitre, nous passerons en revue dans les chapitres suivants notre conception et les direntes approches que nous avons mis en place pour rsoudre cette problmatique .La exibilit et la tolrance aux pannes serons prises en compte,il faut garder a l'esprit que ce scnario est juste un exemple pour montrer de faon simple l'ecacit de notre solution
Chapitre 5
5.2 Origines
Comme nous l'avons signal dans les paragraphes prcdents,le choix d'une mthodologie est crucial l'accomplissement d'une conception saine. Nanmoins il y a une abondance de ces mthodologies. Nous en dnombrons une dizaine dans l'ouvrage rfrence de Brian Henderson-Sellers sur les mthodologies orient agent ,aprs une lecture des direntes mthodologies
TH
orient agents,notre choix s'est port sur la jdeEmthodologie. Direntes raisons (en rapport direct ou non avec notre problmatique)nous ont pouss faire ce choix, nous proposerons certaines d'entre elles dans ce qui suit : -elle n'est pas une extension d'un quelconque modle objet mais conue exclusivement pour le paradigme agent. -la dnition des rles des agent s'eectue aprs l'identication du types des agents ce qui est une approche plus souhaitable (et qu'on retrouve rarement dans les autres mthodologies). -elle supporte les environnements distribu . -la jade mthodologie est assez li a la plateforme jade ce qui nous permet d'exploiter au maximum tout les outils que nous ores cette dernire . -utilisation d'une approche (dite top-down et inversement) ce qui garantit que les systmes usuelle seront pris en compte. -elle suit les spcications de la FIPA ce qui nous permet une conception en adquation avec les normes tablie.
TI
autres systmes,ce diagramme est le meilleur moyen de modliser et de mettre en vidence les pr-requis et les objectifs d'un systmes (la technologie implment dans le systme n'inue pas sur ce diagramme)
TP
lui faire part d'vnement spcique. Cette tape aura pour eet la mise a jour de la table des responsabilit et du diagramme agent ce qui inclut une remise en question prliminaire des dirents diagramme pour dtecter toute incohrence lier aux types d'agents et leur responsabilit.
TQ
pseEii gyxegExi
Toutes ces tapes sont a caractre itratif,il faut rpter les tapes dcrit ci dessus jusqu' avoir cerner touts les objectifs,et aecter les direntes responsabilit sur la multitude d'agents,les dirents schma seront la pour nous aider a mieux visualiser notre conception et a l'aner.
TR
TS
-Un type d'agent pour chaque ressources donc comme nous pouvons le voir sur la gure ci dessous nous aurons un "Agent Miner" et un agents qui servira comme interface entre notre entrept de donnes notre Systme multi-agent et et cela va de mme pour "l'Agent User" selon l'approche transducteur que nous avons vu un peu plus haut,et donc si nous voulons interagir avec notre entrept de donnes nous passerons par l'agents de type "Agent entrept de donnes" et pour interagir avec l'utilisateur a sera l'autre type.
TT
TU
Taches 1-Rcuperer des donnes a partir du data warehouse Agent Miner(AM) 2-Traiter les donnes 3-Construire des modle 4-Rcuprer des modle a partir de "Agent Miner" Agent Agrgation(AA) 5-Construire modle uni a partir de ces modles 6-Rcuperer des modle a partir de "Agent Agrgation" Agent User(AU) 7-Rcuperer des modle a partir de "Agent Miner" 8-Proposer des ores aux clients
TV
Nous allons ici situer le champ d'action de chaque agent cela peut nous tre d'une grande utilit dans les tapes a venir "AM"prendra place auprs des serveurs qui sauvegarde les donnes ainsi il pourra traiter localement les donnes et diminuer de la charge du rseaux de par son emplacement on comprend aisment qu'il y'aura autant d'agent de ce type que de source de donnes car il ne faut pas oublier que cette architecture est distribu . "AU"seront localiser au sein des machine des utilisateur naux(dans les grandes surfaces) "AA"ce type d'agents pourrait ventuellement prendre place aux cot du serveur ou de l'utilisateurs mais la machine qui implmentera cet agent aura beaucoup d'opration d'entr sortie a grer donc son usage auprs des machine utilisateurs et dconseill et la mettre du cot serveur alourdira ses capacit car cet agent devra construire d'autre modle donc si le choix est oert implmenter ce genre d'agents sur des machine intermdiaire avec une bonne puissance de calcul et qui a bonne bande passante
TW
Lorsque Priodiquement Modle construit AA indisponible
5.7 Conclusion
Nous avons essay d'introduire la premire partie de notre mthodologie qui s'est inspire de la tde wthodologie nous avons grce elle cern les rles et les principales responsabilits de chaque type d'agent. La prochaine tape est de prsenter la constituante interne de chaque agent ainsi que les dirents comportement qui devront gr ces taches.
Chapitre 6
UI
UP
UQ
UR
Comportement Type Condition Construire le modle Ticker Behaviour chaque priode de temps Transformer le modle Cyclic Behaviour lorsque une demande arrive de
Dans la section prcdente nous avons dit que L'ew devra construire des modles de donnes grce aux arbres de dcision et sous forme de wwv ,ee les rcupra grce la responsabilit numro six que nous avons dcrit dans la table ,cette responsabilit utilise un protocole d'interaction FIPARequest,ce dernier doit tre excut intervalle rgulier pour pouvoir suivre la production de modles dans ew et donc utilisera le iker fehviour ; lorsque l'agent rcuprera ces modles sous forme de chier wwv il devra les agrger et pour cela nous utilisons la technique dcrite dans [Pichuka 07] et dans [Aoun-Allah 07] cette technique est dcrite ci dessous : Sur chaque serveur local faire (a)construire le modle : Ri ={rik | k [1..n] } avec n le nombre de rgles et R le modle (b)calculer pour chaque modle le coecient de condence crik sur le site central (a) Crer R= i=1..nd Ri avec nd le nombre d'entrept de donnes jusqu' l'tape il n'y'a pas de problme on construit des modles puis pour chaque rgle on assigne un coecient qui va tre calcul selon une equation que nous montrerons plus tard puis nous arrivons la l'tape d'unication de modle,c'est la o nous introduirons la notion de conit,lorsque deux rgles dcrivent le mme objet comme par exemple :
US
Comportement Type Condition Rcuprer et transformer les modles Ticker Behaviour chaque priode de temps
on dit dans ce cas que nous avons un conit et pour le rsoudre nous allons utiliser le coecient que nous avons calcul tout l'heure ,nous additionnerons les coecients de toutes les rgles qui ressemblent r1 puis ceux de r2 nous ferons la moyenne pour chacune d'elle : le coecient le plus bas l'emportera . le point central de la gestion de conit est bien sur le coecient de chaque rgles que nous devons calculer ,nous avons modi ce coecient pour l'adapter notre problmatique ; tr aBin@nDnEr D A cette valeur reprsente le plus petit taux d'erreurs dans le pire cas dans 1- fin reprsente la loi binomiale cette loi provient fin@nDkDcd A qui est la probabilit que le classieur produisent k erreurs parmi n instances avec un taux d'erreurs vritable avec n le nombre d'instances K le taux d'erreurs minimums cd la vritable erreur du classicateur nous ajoutons tr une autre information ,c'est l'anciennet de l'information :plus la rgle est ancienne moins elle est crdible donc nous ajoutons cette contrainte comme suit ;
cr tr
sp gontrya4e4 nd egebQH rix ypeafon glient sp gontrya4e4 nd egebQH rix ypeawuvis glient
pour les autres rgles nous aurons tout simplement les mettre ensemble vu qu'ils ne comportent pas de conit
UT
Comportement Obtenir modle de ee Obtenir modle de ew Fournir Ore
6.5.1 Assimilation
L'agent devra assimiler les connaissances qui lui parviendront et cela partir de deux sources ee et lew. notre agent recevra cette connaissance sous format tiwv qu'il s'injectera,ce processus continuera indniment et est actionn par l'arriv d'un message lee :le comportement qui l'implmentera sera de type gyli feE hviour. Au mme moment un autre comportement sera la pour prvenir toute panne ou problme li l'ee, ce comportement sera de type iker fehviour, si ce comportement se rveille et il n'y a pas eu de mise jour des rgles alors il lancera une interaction de type gontrt xet vers les ews pour obtenir des modles, le critre de choix de l'agent qui fournira le modle est la vitesse de rponse ,car opter pour l'interrogation des ew n'est qu'une solution secondaire recalculer l'erreur de chacune serait une perte de temps
6.5.2 Ores
Comme nous l'avons dit tout l'heure cet agent est dot d'une interface graphique, il attendra qu'un utilisateur entre sa carte ou son login et mot de passe pour se mettre en marche, il assimilera des informations sur l'utilisateur puis il les soumettra aux rgles que l'agent a assimil tout l'heure et c'est la
TFTF gonlusion
UU
que l'agent devra dcider : si il doit lui proposer l'ore ou pas . Cette tache sera implmente dans un comportement de type Cyclique qui sera bloqu et attendra que l'utilisateur entre des informations pour qu'il se rveille et soumet le prol de ce dernier ses rgles.
6.6 Conclusion
Ceci est la dernire tape de notre conception, nous avons dcri l'tat interne de chaque agents : nous avons dcri les dirents comportements que les agents devrons dployer pour remplir leurs taches. Les dirents comportements qui auront grer les direntes interactions.
Conclusion
Ce que nous venons de prsenter est une suite d'tapes pour concevoir un systme multi-agents capable de faire de l'extraction de connaissances,nous l'avons appliqu a un systme de recommandation et nous avons vu de quelle faon nous avons remplies touts les objectives,nanmoins ces tapes peuvent tre facilement port a touts les systmes qui aspirent a voluer dans les conditions suivantes : Le systme volue dans un systme distribu une large quantit de donnes pour extraction de connaissances propagation de ces connaissances . L'utilisation des format en XML dmultiplie les possibilit de propagation de l'information ,tout les systme (agent ou non) peuvent prtendre a acquierire de la connaissances rien qu'en interagissant .
Chapitre 7
7.2 Benchmark
Le Transaction Process Council (TPC) est une organisation but non lucratif, fond en 1988, elle dnit des benchmarks pour les bases de donnes et les systmes dcisionnels, l'un de ses atouts est sa totale neutralit envers les fournisseurs des technologies ,elle compte parmi ses membres la majeur partie des plus grands fournisseurs de service de traitement de donnes ,ce qui lui donne une trs grandes crdibilit .
7.2.1 TPC-DS
le TPC Benchmark DS (TPC-Decison Support) est un benchmark qui modlise plusieurs aspects -d'ordre gnral- de l'application des systme d'aide la dcision en entreprise, incluant la maintenance des donnes et la gnration de requtes . s Le Benchmark propose une valuation de la performance,et modlise les processus d'aide la dcision suivant : Gnration et examen de larges quantits de donnes . Proposer des solutions de rels problmes d'entreprises . Excution de plusieurs sortes de requtes de direntes complexits (ad-hoc,
VP
UFPFIFI wodle
le TPC-DS modlise le systme d'aide la dcision d'une chaine de grande surface qui distribue dirents produits(lectro-mnagers ,nourriture... ), le modle prend en compte la distributivit de ces grandes surfaces,il modlis les ventes par magasin, internet et catalogues,que a soit pour le rachat ou le retour. Les tables de fait sont au nombre de sept : le modle contient deux tables de fait pour chacun des trois rseaux de distribution : Une table pour les ventes. Une table pour les retours. Il contient une table de fait pour modliser l'inventaire . Il fournit aussi des tables dimensionnelles qui sont au nombre de 17 qui sont utilises par les tables de faits . Dans ce qui suit quelques statistiques sur les direntes tables qui existent : Comme nous pouvons le voir sur la gure un extrait du modle on voit que le modle choisi est le modle en ocon de neige qui utilise des tables conformes que nous avons vu dans notre partie tat de l'art(plus communment appel
UFPF fenhmrk
VQ
7.2.2 Motivation
On peut trouver les raisons d'utiliser TPC-DS comme benchmark au lieux des autres existants dans l'article [Poess 05] nanmoins nous pouvons citer quelques raisons : Il modlise un vritable processus d'entreprise. Il est caractris par une exibilit qui nous permet d'exploiter ses donnes grce des requtes de data mining. Il respecte les spcications de modlisation des entrepts de donnes. Il est reconnu par la plus grande partie des entreprises activant dans le traitement et le stockage de donnes.
VR
7.3 Exprimentation
Nous avons gnrer trois chantillon de donnes 1,10,20 GO nous pouvons remarquer que le temps de gnration et d'intgration dans le moteur de basses de donnes augmente exponentiellement. Les donnes qui sont gnr sont synthtiques ce qui veut dire elle ne s'inspire pas de la ralit mais suit une loi bien dnie (Normal,Poisson...) ceci optimise la gnration des donnes.
UFRF tde
VS
7.4 Jade
Jade(Java Agent Developpement Framework)est une plateforme dvelopp par eleom stli en 2003,entirement conu en java, elle simplie l'implmentation des systmes multi-agents ,grce son interface graphique elle simplie le dboguage et le dploiement et cela en quelques clics, elle peut intgrer des bibliothques provenants de vepce qui la rend encore plus exible . La dnition d'un agent dans tehi est aussi simple que la dnition d'une classe,elle inclut plusieurs bibliothques qui reprsentent les interactions et les comportements ce qui facilite normment le travail du dveloppeur qui n'aura qu' personnaliser ces classes.
7.4.1 Motivation
Il respecte les spcications de la FIPA . Interoprabilit avec plusieurs autres composants . Sa conception en java lui permet d'tre multi-plateforme . Outil open source ce qui garantit une maintenance continue de la plateforme .
VT
7.5 Jess
Jess est un moteur d'infrence pour la plateforme java dveloppe par nE di xtionl vortories,il utilise un langage fonctionnel pour spcier la logique, il sut d'utiliser des rgles en utilisant l'un des deux formats suivant : ve lngge de rgle pormt wv @tiwvA on devine aisment que le deuxime format est le plus convenable pour notre application pour des raisons cites dans la partie conception
7.5.2 Motivation
L'utilisation de tess comme moteur d'infrence procure plusieurs avantages : Une compatibilit entre jade et tess criture des rgles en format XML
UFTF v erver
VU
ont commenc tre intgr, Microsoft a tenu le cap, et maintenant dans sa dernire version toute une suite d'outil d'aide la dcision est notre disposition .
7.6 SQL Server wirosoft v erver est un systme de gestion de base de donnes (abrg en SGBD ou SGBDR pour Systme de gestion de base de donnes relationnelles ) dvelopp et commercialis par la socit wirosoft . Depuis la version v erver PHHH, des outils pour l'aide la dcision
notre solution : un moteur relationnel pour grer et stocker les tables dimensionnelles de l'entrepts de donnes. Un service d'intgration pour pouvoir construire le systme ig(Extraction, Transformation, Chargement) . Ore des services de data Mining pour extraire des modles. des environnements pour le BI accompagne v erver qui augmente la productivit et l'ecacit des utilisateurs ;
dcision, les taches de data mining se feront par l'intermdiaire de ce langage qui est suppos faciliter et optimiser les taches d'aide la dcision. Les arbres de dcision se voit aussi optimis, l'algorithme est toujours le mme gRFS mais wirosoft utilise une architecture qui permet de booster la tache des arbres de dcision sur les tables relationnelles on peut trouver plus d'informations dans [Poess 05].
wirosoft est parmi les premiers qui ont utilis hw qui est un langage qui s'approche de v, il permet de spcier des requtes pour l'aide la
VV
7.8 Exprimentation
Dans cette section nous allons prsenter quelques exprimentations que nous avons eectu, les donnes qui sont gnres le sont sur une seule machine,ce qui laisse imaginer les potentialits lorsque plusieurs sont mises en parallles,mais d'abord nous allons jeter un coup d'oeil l'arbre qui a t gnr par Microsoft Decision Tree (MDT) Bien sur les donnes sur lesquelles a t gnr cet arbre de dcision sont
UFWF gonlusion
Taille donnes(Go) 1 10 20 Taille PMML(Ko) 2 3 2.5
VW
Dur moyenne pour DM (secondes) 33 67 125
7.9 Conclusion
Les exprimentations prouvent que notre architecture est tout fait crdible et applicable dans le monde rel,vu la taille des chiers changs travers le rseau elle ne ncessite pas une grande bande passante. On peut remarquer que notre systme utilise plusieurs plateforme,langage et format .Cela est une consquence -en grande partie- la nouveaut du domaine auquel nous nous sommes attaqus, cela a gnr plusieurs dicults et parfois des incompatibilits ce qui nous pousse une rexion :pourquoi ne pas dvelopper un outil spciquement conu pour l'extraction de la connaissance travers des agents,ce qui fera partie de nos perspectives.
Conclusion et Perspective
Nous avons essay tout au long de ce projet de prsenter une nouvelle approche pour exploiter les entrepts de donnes distribues et ainsi orir un service performant et able pour des systmes qui auraient pour vocation d'exploiter ces donnes grce des outils d'aide la dcisions tel que le data Mining ,les agents ont montr une fois encore leurs utilits dans des environnements distribus et surtout dans des environnements incertains(possibilit de panne) La symbiose de ces deux disciplines a donn naissances L'Agent Mining, une branche trs prometteuse nous avons vu dans notre cas comment elle a contribu rendre notre systme ecace mais ses applications sont indnombrables et cela s'explique par leurs complmentarits tant au niveau de l'intelligence des agents que de l'optimisation du data mining. L'agent Mining se heurte un problme majeur auquel nous avons du faire face, l'inexistence d'une methodologie ou d'un framework capable de nous accompagner lors de la conception d'un systme utilisant cette branche, notre travail d'une manire indirecte s'inscrit dans ce sillage, nous pouvons extrapoler partir de notre travail un framework assez exible pour l'achvement d'un tel systme tout en exploitant au maximum les capacits de chacun de ses deux constituants. Malgr que notre systme ait atteint tous les objectifs de dpart il peut tre amlior et cela sur deux plan : Notre systme peut tre bas sur les i au lieux des entrepts de donnes, les i sont des pro logiciel qui peuvent contenir des entrepts de donnes mais contiennent aussi des informations non historises ce qui peut donner une plus grande exibilit et plus de possibilit notre systme. Un autre point trs important est l'apprentissage : l'entrept de donnes n'est pas la seul source de donnes accessible a l'agent, il y'a un proverbe qui dit que la connaissance de soi est la sagesse, appliquer cela aux agents serait d'apprendre de ses propres comportements et de ses propres erreurs ce qui lui confrerait une plus grande autonomie et une ecacit dcuple.
Bibliographie
[A. Mitkas 04] Andreas A. Mitkas, L. Symeonidis, Dionisis Kehagias & Ioannis N. Athanasiadis. Application of Data Mining and Intelligent Agent Technologies to Concurrent Engineering. IJAM, 2004. Michael Wooldridge, An introduction to multiagent systems. Chichester : Wiley and Sons, 2009. Fabio Luigi Bellifemine, Developing multi-agent systems with jade. Chichester : Wiley and Sons, 2007. Brian Henderson-Sellers, Paolo Giorgini, Agent-oriented methodologies. Hershey : IDEA GROUP, 2005. Andreas L. Symeonidis, Pericles A. Mitkas, Agent intelligent through data mining. New York : Springer, 2005. Longbing Cao, Data mining and multiagent integration. New York : Springer, 2007. Mohamed Aoun-Allah & Guy Mineau. Distributed Data Mining : Why Do More Than Aggregating Models. IJCAI, 2007. Oded Maimon, Lior Rokach, Data mining and knowledge discovery handbook. New York : Springer, 2010. Ian H.Witten, Eibe Frank, Data mining : Practical machine learning tools and techniques. San Francisco : ELSEVIER, 2005. Jamie MacLennan, ZhaoHui Tang, Data mining with microsoft sql server 2008. Danvers : Wiley Publishing, 2009. Ralph Kimball, The data warehouse toolkit. New York : Wiley Publishing, 2002. Jean-Marie Gouarne, Le projet dcisionnel. Paris : Eyerolles, 1998. Joy Mundy, Warren Thornthwaite, Ralph Kimball, The microsoft data warehouse toolkit : With sql server 2005 and the microsoft business intelligence toolset. Indiana : Wiley Publishing, 2006. R. L. Grossman, S. Bailey, A. Ramu, B. Malhi & A. Turinsky H. Sivakumar. Papyrus : A System for Data Mining over Local and Wide Area Clusters and Super-Clusters. IEEE Press, 1999.
[Wooldridge 09] [Bellifemine 07] [Sellers 05] [Symeonidis 05] [Cao 07] [Aoun-Allah 07] [Maimon 10] [Witten 05] [MacLennan 09] [Kimball 02] [Gouarne 98] [Mundy 06]
[Grossman 99]
WP
[Pichuka 07]
filiogrphie
Chaithanya Pichuka, Raju S. Bapi, Chakravarthy Bhagvati, Arun K. Pujari & B. L. Deekshatulu. A Tighter Error Bound for Decision Tree Learning Using PAC Learnability. IJCAI, 2007. [Poess 05] Meikel Poess, Raghunath Othayoth Nambiar & David Walrath. Why You Should Run TPC-DS :A Workload Analysis. 32nd International Conference on Very Large Data Bases (VLDB), 2005. [Rabah 09] Bouabdallah Rabah & Merrad Khaled. Conception et ralisation d'un outil d'aide a l'administration des entrepts de donnes relationnels. Master's thesis, Universit des sciences et technologies Houari Boumedienne, 2009. [XindongWu 07] XindongWu, Vipin Kumar, J. Ross Quinlan, Joydeep Ghosh, Qiang Yang, Hiroshi Motoda, Georey J. McLachlan, Angus Ng, Bing Liu, Philip S. Yu, Zhi-Hua Zhou, Michael Steinbach, David J. Hand & Dan Steinberg. Top 10 algorithms in data mining. Verlag London, 2007.
Abstract :
Notre travail a pour but de concevoir un systme multi-agents capable d'extraire de la connaissances a partir d'entrept de donnes distribu et cela en utilisant des techniques de data mining,cette connaissance devra pouvoir etre propag et assimiler d'une faon automatique sans l'intervention d'un tiers .
Keywords :