Vous êtes sur la page 1sur 9

PROPOSITION DE THESE : C ONCEPTION DE PLATEFORME E-COMMERCE PAR MODLISATION DE LCHANGE CONVERSATIONNEL ENTRE UN INTERNAUTE

ET DES AGENTS ARTIFICIELS

RAMSESDEUX SAS Laboratoire LACL (universit Paris 12) Mots clefs : conversation automatique, agents conversationnels, page WEB, raisonnement tape, traitement automatique du langage, langage homme/machine, surveillance du logiciel, agent mobile, optimisation de ressources de calcul, configuration dune communaut dagents, Cloud computing.

1. Objectif finalis de la thse

Concevoir une nouvelle plateforme de commerce lectronique fonctionnant non plus comme un ensemble doffres en ligne parmi lesquelles linternaute est appel choisir, mais comme un systme qui partant dune demande de linternaute naviguant dans un site web, se verra offrir exactement ce quil cherche grce des changes avec des assistants de vente qui travaillent en parallle qualifier la demande et trouvent ce que cherche linternaute grce leur capacit dductive. La plateforme logicielle serait administre grce une interface de configuration dune communaut dagents, qui dporterait sur des serveurs distants des traitements de surveillance traditionnellement localiss sur le poste administrateur. Partant dune modlisation du langage homme/machine par lincorporation dun raisonnement tapes et des outils danalyse automatique des textes, il sagit de construire une plateforme qui dans le contexte de la page WEB, ralise des changes conversationnels avec linternaute. Cette nouvelle application pourra bnficier des connaissances acquises grce lEcoute Clients, une plateforme dite Customer feedback , de retour dexprience client et daide en ligne, dveloppe par la socit RAMSESDEUX qui permet loprateur dun site WEB de savoir ce que pensent les internautes de son site, grce aux perceptions et aux commentaires quils dposent dans les pages WEB et de les aider en ligne en fonction de leurs demandes.

2. Objectifs Scientifiques de la thse 2.1. Production scientifique


Production de connaissances sur la gestion automatique dune conversation entre un internaute et un site WEB comme outil de conversion.

Incorporation de raisonnement tape dans la conversation. Elaboration dindicateurs de performances de systmes mixtes combinant des technologies de traitement automatique de langage avec des technologies dagents artificiels assurant les changes conversationnels. La problmatique est lamlioration des performances des systmes dchange conversationnels. La production de connaissances portera sur les systmes de dialogue homme/machine utilisant le Chat et proposant des solutions au caractre stochastique des interactions avec les humains. Les systmes incorporant le raisonnement par tapes dans la modlisation du langage seront recherchs et compars. Une architecture de la plateforme logicielle dportant sur des serveurs distants les traitements de surveillance traditionnellement localiss sur le poste administrateur, pour offrir la configuration de la communaut des agents sera propose. Objectif principal La recherche dfinira la problmatique prcisment, partir dun tat des lieux des systmes de traitements automatiques du langage utilisant des techniques danalyse morphologique, syntaxique et smantique incorpors dans des systmes de gestion de la conversation. On cherchera comparer les performances de chaque systme identifi. La mise au point dun modle sous-tendu par l'aspect Stochastique et Markovien de langage humain, la ralisation dun prototype et les tests constituent lobjectif principal de la thse. A partir des spcifications du modle, ralisation dun prototype et tests 1. Test de Turing 2. Loebner Prize 3. Tests IRC Le prototype utilisera les donnes mtier de la socit RAMSES comme exemple du modle. Enfin, la gnralisation du modle sera recherche pour le rendre utilisable dans dautres mtiers comme la banque (conclusion dun prt bancaire en ligne) ou lassurance (conclusion dun contrat dassurance)

3. Contexte et positionnement du projet

3.1. Modlisation
La problmatique des interactions homme/machine dcoule de la manire dont ceux-ci communiquent entre eux. De tout temps, l'tre humain communique prioritairement par la parole. Aujourd'hui, on est souvent contraint d'utiliser des dispositifs excluant la voix pour changer de l'information il s'agit pour l'essentiel du clavier, de la souris, des boutons, des crans tactiles, etc. Ceci est d au fait que la reconnaissance

vocale sur des phrases longues et courantes est encore une tche non automatise de nos jours. Le traitement numrique actuel associ une telle tche reste prohibitive en termes de cout de calcul et occasionne des gnes intolrables pour la navigation. Actuellement le chat, interaction homme/machine via le clavier, est la solution idale, conomique et raisonnable pour un dialogue homme/machine en temps rel. De nombreux projets existent dont Eliza fut le premier prototype simulant un psychothrapeute conu en 1966 MIT par Joseph Weizenbaum. Eliza fut simplement implment l'aide des techniques dites de "pattern matching". Plus rcemment Microsoft et AOL ont acquis SmarterChild conu par Active Buddy aujourd'hui connue sous le nom de Colloquis une compagnie spcialise dans les systmes "Automated Service Agents". Colloquis fut rachet par Microsoft en 2006. Actuellement Smarter Child renomm par Microsoft "I'm Initiative" a t arrt en 2008. La cause essentielle tant un manque d'innovations, en particulier lincorporation de raisonnement dans la conversation et l'incapacit du modle de ragir des situations stochastiques rgies par le hasard. Un chercheur franais, Philippe Lemoisson propose un apport innovant dans le domaine de la modlisation du langage homme/machine par lincorporation dun raisonnement tapes pour prendre en compte le caractre stochastique du langage humain. Lobjectif est de mettre disposition de chacun une intelligence artificielle ddie au dialogue homme/machine afin de librer l'homme pour d'autres tches dites plus valorisantes.

3.2. Architecture
La recherche se situe dans le monde du logiciel et plus particulirement dans les applications WEB. Une application Web est utilise les internautes via le rseau pour rendre un service demand. Son domaine dutilisation est par construction borne dans une fentre de trafic rseau convenu. Dans ce contexte lobservation de la charge montante dune application, la dtection quun temps dutilisation est hors des bornes habituelles, etc. sont cruciales pour poursuivre lexploitation dans des conditions normales ou proches. La surveillance logicielle revt une part importante du contrle de lexploitation mais son impact ne se limite pas lexploitation dune configuration statique de ressources. En effet, lallocation de nouvelles ressources doit pouvoir tre prise en compte comme un vnement nouveau au cours de lexploitation. Cela signifie dfinir de nouvelles actions adaptatives telles que la migration dune application sur une nouvelle ressource de calcul ou lquipement de cette nouvelle ressource pour les besoin de surveillance. A linverse, la libration de ressource est aussi prendre en compte.

3.3. Etat de l'art


L'essentiel des progrs depuis les vingt dernires annes concerne l'implmentation algorithmique et non l'algorithme lui mme. La technologie beaucoup progresse ce qui a permis de traiter des masses de donnes beaucoup plus importantes ne un temps record.

Ainsi cette avance a vu le dveloppement de diffrents langages spcialiss pour la conversation homme/machine comme par exemple un langage appel AIML i.e. "Artificial Intelligence Mark up Language", dialecte XML, qui a t dvelopp par Richard Wallace entre 1995 et 2002. Il est noter que le systme reste essentiellement bas sur le "pattern matching" aucun raisonnement n'est intgr cette formalisation du langage. MyCyberTwin une compagnie australienne ainsi que Jabberwacky de British programmer Rollo Carpenter utilisent d'autres techniques dites "Strong AI". Malheureusement la plus part des rsultats sont assez limits et plutt insatisfaisants. Lapproche plus fructueuse retenue par Virtuoz et dautres dveloppeurs dagents conversationnels, situe lchange entre linternaute et les agents artificiels dans le contexte de la page Web ; cest ainsi que les agents dvelopps par cette socit sappuient sur des dictionnaires et des systmes dchanges en rpondant des questions poses par les internautes. Ces agents sont toutefois dpourvus dintelligence dductive. Philippe Lemoisson propose dans le Brevet (INPI Mars 2009) un procd de conversation automatique entre un agent humain et des agents artificiels. Plus particulirement, linvention porte sur un systme multi-agents MSA ( Multi Agent System en anglais), lagent humain et les agents artificiels communiquant entre eux par lintermdiaire dun rseau. Cette invention propose une rponse au caractre stochastique de la conversation homme/machine en incorporant un raisonnement tapes aux conversations avec linternaute. Par rapport lapproche Virtuoz, celle-ci ajoute des raisonnements diffrentis des agents artificiels tout en se situant dans le mme contexte de la page WEB.

3.4. Positionnement Technique


Implmentation relle dautomatisation dchanges conversationnels comportant diffrentes logiques et diffrentes priorits entre un internaute et des agents artificiels ; La recherche porte plus prcisment sur une encapsulation de composants smantiques par les composants de la technologie dchange conversationnel propose par la socit RAMSES (technologie MEC).

3.4.1 Composants smantiques


Les composants smantiques pourront tre apports par la socit Lingway ; LINGWAY est un diteur de logiciels qui se positionne sur le march des moteurs de recherche spcialiss (ou Verticaux ), forte valeur ajoute linguistique. Il est un acteur reconnu pour la qualit de son expertise en traitement automatique des langues et notamment en smantique. Lingway a dvelopp des dictionnaires dj trs complets (plusieurs dizaines de milliers de mots simples, connects des centaines de milliers de sens, et autant de termes composs), adapts chaque domaine dapplication. Ils sont complts par de puissants outils danalyse des textes et de gestion des dictionnaires.

3.4.2 Technologie MEC


Le prototype pourra faire la dmonstration de la pertinence de la technologie de gestion automatique dune conversation entre un terminal utilisateur (linternaute) et un serveur (LEcoute Clients) sur lequel sont programms une pluralit dagents artificiels, chaque agent artificiel tant associ un calcul. Cette technologie (ci aprs dsigne par technologie MEC pour Moteur dEchange Conversationnel) permet le pilotage de la conversation. Cette technologie se caractrise par une expertise complexe, implmente par fragments (les composants) de faon totalement compositionnelle : le programmeur na pas se soucier de connecter entre eux les composants ; il doit juste dcrire leur dclencheur, les questions et les assertions quils mettent. Une assertion ou une question peuvent jouer le rle de dclencheur. Assertions et questions sont exprimes laide dun langage extensible ayant la puissance des graphes conceptuels toils. La conversation entre composants est automatiquement contrle par le moteur conversationnel. Un mme composant peut travailler en parallle sur un nombre quelconque de contextes ; Les composants peuvent encapsuler des raisonnements complexes impliquant des tapes et des calculs, alors que les systmes experts classiques oprent des chanages sur des simples rgles si alors

3.4.3 Agent Mobile


La technologie Agent Mobile est un moyen par lequel un code non prsent sur une ressource peut le devenir sans y avoir t pralablement install. De nombreux travaux ont montr lintrt de cette technologie pour diminuer le trafic rseau au profit de traitement locaux aux ressources. Ainsi, la surveillance de logiciel nest plus simplement une activit distante o les donnes de surveillance sont mises depuis des points de mesure destination du centre de contrle. Cest une opration qui seffectue par vague dont la premire correspond une collecte, la seconde une adaptation. Les agents mobiles offrent laptitude de pouvoir migrer dune ressource de calcul une autre afin dy effectuer un traitement tel que lexcution dun script local ou encore un traitement de filtrage sur des donnes locales. Cette approche est particulirement adapte dans le cadre de la surveillance o la quantit de donnes est souvent importante et rpartie sur tous les sites observs. Dans le cas de perte de ressource (panne matrielle), le travail en cours est alors propag sur un site disponible pour une reprise de lexcution. Regroups en espace ou communaut dagents mobiles, un ensemble dagents est ddi une activit importante ce qui permet de grer de faon spare les contrles. Les changes sont ainsi tanches et il ny a pas dimpact entre deux communauts.

3.4.4 Administration de plate forme logicielle


Fournir un point dadministration distant correspond fournir une interface de configuration dune communaut dagents, celle-ci est trop technique pour tre visible ladministrateur de la surveillance logicielle. Aussi, une approche serait dadopter une dmarche de type Cloud computing cest--dire de dportation sur des serveurs distants des traitements de surveillance traditionnellement localiss sur le poste administrateur. Lide est de considrer le Software as a service (SaaS) autrement de masquer le

logiciel, o le fournisseur Cloud maintient : les applications mtier de surveillance ainsi que toutes les applications Web, les bases de donnes, le matriel serveur, le stockage, et autres qui doivent tre surveill.

3.4.5 Dbouchs conomiques possibles


La gestion automatique dune conversation entre un internaute et un site WEB est un outil de conversion. Lorientation mtier des agents artificiels convient particulirement bien aux oprateurs de services. Lapplication mtier retenue relve des tudes - marketing sur le WEB. Cest la ralisation et laffichage dun tableau de bord de pilotage dun site WEB, construit partir de lanalyse des avis des internautes. Dautres applications mtier, la banque, lassurance, les tlcommunications, qui sur le web, ralisent des devis ncessitant des questions/rponses et des calculs complexes, sont directement viss. Cest un immense march trs demandeur dinnovations dans la manire de faire du e-commerce.

4. Programme dtaill 4.1. Phase 1 acquisition de connaissances


Dure : 6 mois Un cycle de recherche appliqu dbute par une tape dacquisition de connaissances qui constitue un premier socle non seulement de connaissance technique mais aussi dapprentissage de la recherche. En effet, les sources dinformations sont aujourdhui plus importantes que jamais et la gestion des projets ne permet pas de se disperser aux grs des lectures. Aussi, il est crucial de commencer par ltude des technologies matrises au sein du groupe de travail systme mobile communiquant de lquipe spcification et vrification de systme . Plus particulirement les travaux raliss par Mamoun Bernichi au cours de sa thse intitul Surveillance logicielle base dune communaut dagents mobiles . Enfin la validation de cette premire phase de travail est aussi un moyen de sensibiliser le doctorant et lui permettre de se placer par rapport aux attentes de lquipe projet. La ralisation dun prototype de monitoring de la charge dun serveur http en nombre de requte par unit de temps, constitue une premire approche de la recherche applique que nous comptons mener.

4.2. Phase 2 Prototype de plateforme


Lexpertise de RAMSES est retenue ici pour constituer un exemple dexpertise mtier entrant dans le projet de recherche propos ici. L'avance attendue est la modlisation du langage humain permettant de prendre en compte le Caractre alatoire de l'interaction interaction issue d'un dialogue homme/machine. LEcoute Clients est le service de fidlisation interactif de la socit RAMSES. Le service permet de faire des tudes de satisfaction par l'analyse des avis (perceptions et commentaires) associs au comportement de l'internaute et de dvelopper la relation consommateur en rpondant aux questions contenues

dans les avis.

4.2.1 Expertise RAMSES


Les tudes ralises par RAMSES se matrialisent par laffichage dun tableau de bord de pilotage du site WEB, dans une interface en ligne, destin loprateur du site. Le tableau de bord de lEcoute Clients comporte des tableaux, graphiques et indicateurs ; il permet de comparer entre elles diffrentes priodes, tablir des tendances, afficher des mesures de satisfaction, de limage perue du site etc.. Pour tablir ses rapports dtude, le service met en uvre une mthodologie dinterprtation des avis qui fait appel une technique de codage et des calculs pour faire merger les plans de codes. Le "base knowledge" du modle est celui fourni par le systme de lEcoute Clients de Ramses.

4.2.2 Conception du modle


L'objectif principal est la mise au point du modle conversationnel partir de linvention, constituant une approche du caractre imprvisible du langage humain et capable de suivre des trajectoires caractrises par des sauts de contexte. Un modle paramtrique sera dtermin. Codage de lapplication. Il s'ensuivra la phase de rglage des paramtres sur des bases de donnes typiques existantes.

4.2.3 Tests et Implmentation


Les tests dureront au moins six mois et seront automatises. Des statistiques seront recueillies et analyses afin de servir de feedback l'amlioration du modle. Limplmentation se fera maximum. Dure : 12 mois cot serveur afin de s'assurer d'une portabilit

4.3. Phase 3 : Gnralisation de la plateforme mtiers cibles

sur les

Dans les domaines comme ceux de la banque, de lassurance et dautres services complexes, les devis et propositions adresss en ligne sont limits par labsence dchange conversationnel. Seuls des formulaires permettent actuellement lacquisition des donnes. En introduisant lchange conversationnel, nous permettons une nouvelle forme dacquisition des donnes plus souple, qui permettra des agents artificiels de

dduire loffre et de proposer exactement ce que demande linternaute.

4.3.1 Conception du modle


Reprise de la phase de rglage des paramtres sur des bases de donnes typiques existantes dans les mtiers considrs. Codage de lapplication

4.3.2 Tests et Implmentation


Les tests dureront au moins trois mois et seront automatises. Des statistiques seront recueillies et analyses afin de servir de feedback l'amlioration du modle. Limplmentation se fera maximum. Dure : 10 mois ct serveur afin de s'assurer d'une portabilit

4.4. Phase 4 Rdaction de la thse


Dure : 8 mois

5. Rfrences
[Lemoisson, 2006] Collaborative theory construction: towards a conversational abstractmachine LEMOISSON P. Thesis memoir. Universit Montpellier II Sciences et Techniques du Languedoc - (2006-12-15), Jean Sallantin (Dir.), Stefano A. Cerri (coDir.) http://www.lirmm.fr/~moisson/These/TheseLemoissonVersionFinale.pdf [Searle, 1969] J.R. Searle, Speech acts, Cambridge University Press, 1969. [Singh, 1998] M.P. Singh, Agent communication languages: rethinking the principles, IEEE, Computer, Volume 31, Issue 12, Dec 1998 Page(s):40 47 [Velthuijsen, 1992] H. Velthuijsen, The Nature and Applicability of the Blackboard Architecture, PTT Research, 1992. http://ia.ucpel.tche.br/~lpalazzo/Aulas/SWEB/files/sw/ebook-totw.pdf http://homepages.inf.ed.ac.uk/olemon/lecture1.pdf http://www.interweave-consulting.com/b/Chapter-12.pdf
[A] Bernichi, M. & Mourlin, F. "Mobile agent communication scheme (an evolving canvas)" International Conference on Systems and Networks Communications, IEEE Computer Society Press (10 pages), Tahiti, French Polynesia, October 2006 Bernichi, M. & Mourlin, F. "Software management based on mobile agents" Second International Conference on Systems and Networks Communications, IEEE Computer Society Press (6 pages), Cap Esterel, France, Aout 2007 Dumont, C. & Mourlin, F.

[B]

[C]

"A Mobile Computing Architecture for Numerical Simulation" International Conference on Mobile Ubiquitous Computing, Systems, Services and Technologies, UBICOMM 2007, November 4-9, 2007 - Papeete, French Polynesia (Tahiti) IOS Press (6 pages). [D] Bernichi, M. & Mourlin, F. "Network Management with mobile agent toolkit" NCM2008: 4th International Conference on Networked Computing and Advanced Information Management, September 2-4, 2008, Gyeongju, Korea (IEEE CS) KNC Editor (6 pages) Dumont, C. & Mourlin, F. "Space based architecture for numerical solving" ISE2008: 5th International Conference on Innovation in Software Engineering, 10-12 December 2008 - Vienna, Austria (IEEE CS 6 pages) Mekki, R. & Mourlin, F. "Mobile agent as interoperable mobile service for monitoring " Second International Conference on Systems and Networks Communications, IEEE Computer Society Press, Porto, Portugal, September 2009

[E]

[F]