Vous êtes sur la page 1sur 40

Master 2 Recherche Informatique Parcours Intelligence Artificielle et Aide `a la D´ecision Rapport de Stage Co-adaptation Homme-Machine

Carlos Alberto G´omez Hern´andez

Laboratoire d’InfoRmatique en Images et Syst`emes d’Information LIRIS UMR 5205 CNRS/INSA de Lyon, Bˆatiment Blaise Pascal 20 avenue Albert Einstein 69621 Villeurbanne CEDEX carlos-alberto.gomez-hernandez@insa-lyon.fr

R´esum´e Ce travail s’int´eresse a` la notion de co-adaptation homme- machine et a` la mise en pratique sur un exemple concret des concepts associ´es. Plus particuli`erement, nous faisons l’hypoth`ese que l’interaction entre un humain et une machine peut d´eboucher sur une succession de phases de stabilit´e co-construites, ´etant des signes d’une co-adaptation. Cette interaction est per¸cue par l’humain comme une exp´erience satisfai- sante que l’on pourra ´eventuellement qualifier d’esth´etique ou d’amusan- te. Dans un premier temps nous pr´esentons les concepts th´eoriques au- tour de cette approche ; nous d´eveloppons ensuite une preuve de concept sous forme d’un jeu vid´eo sur ordinateur afin d’impl´ementer les ca- ract´eristiques des syst`emes co-adaptatifs et valider l’hypoth`ese ´emise. Des r´esultats pr´eliminaires quantitatifs et qualitatifs soulignent la com- plexit´e de cette notion et ouvrent de nombreuses perspectives.

Mots-cl´es : IHM, Co-adaptation, M´etastabilit´e, Interfaces adaptatives

Abstract. This work focuses on the notion of human-machine co-adapta- tion and on the implementation of a concrete example of the related con- cepts. Particularly, we assume that the interaction between a human and a machine may lead to a succession of phases of co-constructed stabil- ity, being co-adaptation signs. This interaction is perceived by humans as a satisfying experience that we can eventually describe as aesthetic or entertaining. Firstly, we present the theoretical concepts of this ap- proach, and then we develop a proof of concept in the form of a computer video game to implement the characteristics of co-adaptive systems and validate the hypothesis made. Quantitative and qualitative preliminary results underline the complexity of the concept and opens up many per- spectives.

Keywords: HCI, Co-adaptation, Metastability, Adaptive Interfaces

2

Co-adaptation Homme-Machine

1

Introduction

1.1 Contexte et cadre du projet de recherche

Les interfaces homme-machine servent de pont entre l’homme et la machine (ou ordinateur) permettant des ´echanges d’informations. A l’origine, la concep- tion des interfaces mettait l’accent sur des aspects purement fonctionnels et techniques, exception faite de quelques aspects ergonomiques. En effet, c’´etait `a l’humain de s’adapter aux m´ecanismes et aux services offerts par l’interface. Plus tard, les concepteurs des interfaces ont remarqu´e l’importance de consid´erer non seulement les exigences fonctionnelles mais aussi les aspects humains car ils jouent un rˆole primordial pour un fonctionnement efficace des syst`emes informa- tiques [1]. Avec l’avancement de la technologie, les applications et les services propos´es par les interfaces sont devenus personnalis´es grˆace `a l’int´egration de m´ecanismes d’adaptation qui permettaient de rendre l’exp´erience d’interaction plus appro- pri´ee et satisfaisante pour les utilisateurs. En effet, on parle de plus en plus d’exp´erience utilisateur ; c’est-`a-dire qu’on consid`ere non seulement l’utilit´e et l’utilisabilit´e d’un syst`eme mais aussi les ´emotions que g´en`ere l’utilisation du syst`eme chez l’utilisateur. Parall`element, les humains ont acquis une meilleure maˆıtrise des applications technologiques et par cons´equent, ils ont adapt´e les dispositifs `a leurs propres usages. De nombreux travaux ont ´et´e men´es pour ´etudier l’adaptation d’un point de vue machine ou d’une appropriation d’un point de vue utilisateur. N´eanmoins, l’´etude de l’adaptation en temps r´eel en- tre les deux parties -humain et syst`eme informatique- comme une seule entit´e avec des propri´et´es particuli`eres reste inexplor´ee. Une des possibles causes de ce manque pourrait ˆetre la grande complexit´e de chaque ´el´ement participant dans ce couplage. L’humain en tant que syst`eme biologique et la machine en tant que syst`eme artificiel, les deux acteurs sont des syst`emes tr`es dynamiques et com- plexes, ce qui rend difficile d’´etudier l’harmonisation de l’interaction entre les deux. Le travail pr´esent´e dans ce rapport de stage se situe dans le cadre d’un pro- jet pluridisciplinaire r´eunissant des chercheurs des domaines de la psychologie, neurosciences, apprentissage statistique, intelligence artificielle, ing´enierie des connaissances et interaction homme - machine. L’objectif est de mettre en syn- ergie de fa¸con originale l’expertise des diff´erents domaines pour ´elaborer une r´eflexion globale sur les briques conceptuelles qui feront les interfaces homme - machine de demain : les syst`emes co-adaptatifs. L’´equipe de travail est compos´ee par des chercheurs issus de plusieurs laboratoires fran¸cais, notamment le Labo- ratoire d’InfoRmatique en Image et Syst`emes d’information (LIRIS), le Centre de Recherche en Neurosciences de Lyon, le Laboratoire des sciences techniques de l’information, de la communication et de la connaissance `a Brest, et le Lab- oratoire Informatique de Nantes Atlantique. Les th´ematiques trait´ees dans ce projet telles que la pluridisciplinarit´e, le cou- plage des syst`emes dynamiques, l’incertitude, la prise de risques, et la m´etastabili- t´e, s’inscrivent dans les objectifs de recherche appuy´es par l’Institut Rhˆone-Alpin

Co-adaptation Homme-Machine

3

des Syst`emes Complexes (IXXI) qui finance notre travail. L’IXXI favorise la recherche interdisciplinaire autours de la mod´elisation des syst`emes complexes et intervient essentiellement `a trois niveaux : l’organisation d’´ev´enements per- mettant aux chercheurs de se rencontrer, le lancement d’appels `a projets leur permettant d’amorcer des recherches communes, et l’h´ebergement de projets scientifiques pluridisciplinaires dans ses murs.

1.2 Objectif et probl´ematique de recherche

L’objectif de ce projet de stage est d’abord la r´ealisation d’une premi`ere ´etude sur l’approche de la co-adaptation homme-machine en d´efinissant les con- cepts th´eoriques de base et les caract´eristiques de ce type de syst`emes. En- suite, la mise en œuvre de `a cette approche `a partir d’une preuve de concept de taille modeste permettant d’impl´ementer les d´efinitions propos´ees. Finalement, une exp´erimentation men´ee aupr`es d’utilisateurs permettant d’observer, voire de mesurer la co-adaptation et de savoir si celle-ci est v´ecue comme une exp´erience satisfaisante pour les utilisateurs. La co-adaptation est d´efinie comme l’approche qui consid`ere la relation en- tre l’homme et la machine comme un couple indissoci´e avec des caract´eristiques particuli`eres et dans lequel il est constat´e un enchaˆınement de diff´erents ´etats stables pendant l’interaction des acteurs. Cette approche sort du cadre tradi- tionnel o`u l’un des acteurs en interaction (l’homme ou la machine) s’adapte `a l’autre. L’enjeu est d’arriver `a ´elaborer un syst`eme r´eel capable de montrer la dynamique de la co-adaptation.

2 Etat de l’art

2.1 L’adaptation en Interaction Homme-Machine

L’adaptation est un sujet largement ´etudi´e dans le domaine de l’Interaction Homme-Machine (IHM) dans les deux sens : l’appropriation des syst`emes par l’humain, et l’adaptation des syst`emes `a l’humain. Dans le premier, les utilisa- teurs d´eveloppent des usages particuliers qui n’´etaient pas pr´evus par le con- cepteur de l’interface de telle sorte qu’ils adaptent eux-mˆemes des outils `a leur contexte d’activit´e c’est ce qu’on appelle l’appropriation [2]. Dans le deuxi`eme, ce sont les interfaces qui s’adaptent `a l’utilisateur avec lequel elles interagissent. Cette adaptation est caract´eris´ee par deux propri´et´es : l’adaptabilit´e qui d´enote la capacit´e d’une interface `a ˆetre modifi´e par un utilisateur, et l’adaptativit´e qui r´ef`ere `a la capacit´e `a s’adapter sans l’intervention explicite de l’utilisateur [3]. L’adaptation est souvent abord´ee du point de vue de la plasticit´e des IHM qui d´esigne `a la capacit´e d’une interface `a s’adapter `a son contexte d’usage [3]. Ce contexte d’usage comprend principalement trois composants : la plate- forme, l’environnement, et l’utilisateur. L’adaptation `a la plateforme se situe au niveau des ressources mat´erielles et logicielles servant `a l’interaction. Ainsi, les caract´eristiques particuli`eres du dispositif utilis´e pour l’interaction telles que

4

Co-adaptation Homme-Machine

la taille de l’´ecran et la capacit´e de calcul sont des ´el´ements pris en compte dans ce type d’adaptation. L’environnement correspond aux conditions suscep- tibles d’influencer l’interaction entre l’humain et la machine telles que la lumi- nosit´e ou le bruit. Finalement, l’adaptation `a l’utilisateur peut se faire selon diff´erents degr´es de mod´elisation (adaptation au profil, aux interactions ou en- core `a l’activit´e de haut niveau de l’utilisateur) [4]. Si l’adaptation `a la plate- forme est largement explor´ee dans diff´erents travaux en IHM, l’adaptation `a l’utilisateur reste encore tr`es peu d´evelopp´ee. G´en´eralement, l’utilisateur est mod´elis´e par un profil prenant en compte ses capacit´es physiques et cognitives, ses int´erˆets, ses pr´ef´erences, ses connaissances, ses habitudes, ou encore ses ´etats psychologiques [5].

2.2 Les effets de l’adaptation

L’adaptation peut avoir un effet, `a diff´erents niveaux de complexit´e, sur la dis- tribution de l’IHM, sur les styles ou paradigmes d’interaction, et sur les tˆaches. La redistribution et le remodelage sont des m´ecanismes utilis´es par les inter- faces pour adapter les ´el´ements visuels aux diff´erentes ressources d’interaction. Le remodelage transforme l’interface sans changer l’´etat de distribution sur les ressources d’interaction : par exemple, le remplacement d’une image par un texte [6]. Inversement, la redistribution modifie l’´etat de distribution de l’interface et peut requ´erir un remodelage pour s’accommoder des ressources de la plateforme cible. Le deuxi`eme type d’adaptation correspond aux effets sur les modalit´es d’interaction. L’interaction entre une interface et un humain peut se d´erouler par diff´erentes modalit´es en fonction du mat´eriel sur lequel le syst`eme est d´eploy´e. Par exemple, l’utilisateur peut interagir avec l’interface `a partir du clavier, de la souris, de la voix, de la fixation du regard, entre autres. L’interface peut impl´ementer des m´ecanismes d’adaptation permettant d’identifier la meilleure proposition par rapport au comportement ou aux usages de l’utilisateur courant. Le troisi`eme effet sur l’adaptation, et qui reste encore peu explor´e par la commu- naut´e IHM, est celui qui concerne les tˆaches de l’utilisateur. G´en´eralement, un utilisateur manipule un syst`eme interactif avec un (des) objectif(s) ou une (des) tˆache(s) pr´ed´efinis. A un niveau plus complexe, le syst`eme pourrait s’adapter `a des tˆaches nouvelles, ´emergeant lors de l’utilisation du syst`eme. De cette mani`ere l’utilisateur d´ecouvrirait de nouveaux objectifs `a accomplir ou de nou- velles tˆaches `a r´ealiser. C’est ce niveau de complexit´e qui nous int´eresse dans la co-adaptation Homme-Machine.

2.3 Exemples d’adaptation `a l’utilisateur

Afin d’impl´ementer les m´ecanismes d’adaptation d´ecrits auparavant, les in- terfaces emploient diff´erentes sources d’acquisition de l’information concernant l’utilisateur. L’adaptation plus basique est celle des syst`emes qui pr´evoient a priori des m´ecanismes d’adaptation bas´es sur un ensemble de param`etres constituant le profil de l’utilisateur. Ainsi, il existe des interfaces qui adaptent les ´el´ements

Co-adaptation Homme-Machine

5

visuels en fonction de la langue maternelle de l’utilisateur, de son ˆage, de sa localisation. Ces informations de base sont inclues dans des profils statiques des usagers. D’un autre cˆot´e, il y a des interfaces qui utilisent les actions r´ealis´ees par l’utilisateur pour s’adapter en proposant des nouvelles fonctionnalit´es. Krzysztof et al. [7] ont conduit une ´etude de l’adaptation d’une barre d’outils sur le logiciel Microsoft Word. Le logiciel changeait l’emplacement des boutons en fonction des patrons d’usage de l’humain. Les sources d’adaptation ne sont pas exclusives entre elles et les interfaces peuvent employer une combinaison de plusieurs sources pour impl´ementer les m´ecanismes d’adaptation. Dans le cadre des Environnements Informatiques pour l’Apprentissage Humain, Butoianu et al. [8] ont d´evelopp´e Ariadne Finder, un outil pour la recherche et la recommandation personnalis´ees d’objets p´edagogiques. Le syst`eme emploi d’un cˆot´e le profil des utilisateurs pour filtrer les r´esultats de la recherche en fonction de la langue et du format de fichier pr´ef´er´e, et d’un autre cˆot´e un serveur de traces qui enregistre les fichiers consult´es par l’utilisateur pour lui proposer des fichiers associ´es. Finalement, il y a des interfaces o`u l’adaptation se r´ealise en fonction des ´etats physiologiques de l’utilisateur lors de l’interaction. Les ´etats physiologiques correspondent `a la condition du corps humain tels que la charge de travail, l’engagement, la frustration, l’amusement, la relaxation, etc. Ces ´etats sont capt´es par des manifestations physiques du corps tels que les signaux ´electriques du cerveau, la transpiration, ou le rythme cardiaque. Ces manifestations physiques sont mesur´ees `a l’aide de diverses techniques d’analyse comme l’Electroenc´ephalo- graphie ou l’Imagerie Spectroscopique Proche Infrarouge (fNIRS) [9] pour le cerveau, la r´eponse galvanique (GSR) pour la transpiration de la peau. L’´etat physiologique est finalement interpr´et´e grˆace `a des algorithmes de classifica- tion non supervis´es sur ces donn´ees. Mohammad Rezazadeh et al. [10] ont d´evelopp´e une interface homme-machine ayant comme but le contrˆole d’une proth`ese virtuelle de l’avant bras pendant une p´eriode de temps prolong´e. L’inter- face mesure la bande alpha des signaux EEG de l’humain, et utilise un algorithme afin de s’adapter `a la charge de travail de l’utilisateur. C’est surtout dans le domaine des jeux affectifs que des techniques de mesure des ´etats physiologiques sont employ´ees pour r´eguler le comportement du jeu. Gilleade et al. [11] distinguent entre deux approches de conception des jeux affectifs : biofeedback et affective feedback. Dans le premier, l’on trouve tout simplement le remplacement des manipulations conventionnelles par d’autres types tels que les signaux EEG, o`u l’utilisateur peut contrˆoler le jeu `a partir de ses propres r´eactions. Dans le deuxi`eme, la machine est un participant intelligent actif dans le cycle de biofeedback, c’est-`a-dire, le jouer et le jeu sont affect´es par les actions de l’autre. Des jeux affectifs ont ´et´e d´evelopp´es en prenant comme mesure le rythme cardiaque [11], ou le niveau de relaxation `a partir de l’activit´e ´electrodermale du joueur [12]. Grˆace aux signaux per¸cus, le jeu r´epond d’une fa¸con distincte, typiquement une augmentation ou diminution des niveaux de difficult´e pr´e´etablis. Mˆeme si le concept de feedback affectif est l’approche qui

6

Co-adaptation Homme-Machine

consid`ere la r´egulation de l’humain et du jeu vid´eo en mˆeme temps pendant l’interaction, le concepteur du jeu d´efini a priori le rang des adaptations possi- bles en fonction des variations des ´etats de l’utilisateur. Ceci implique que tout est d´efini d`es le d´epart et il n’est pas possible de faire ´evoluer les m´ecanismes d’adaptation permettant de changer la fa¸con d’interagir.

2.4 Vers une adaptation dynamique et ´emergente

L’enjeu de notre travail est donc d’´elaborer un syst`eme coupl´e homme-machine permettant la convergence vers une stabilit´e exprim´ee `a partir de la satisfac- tion de l’humain. Ce syst`eme devrait int´egrer l’adaptation en temps r´eel non seulement de la part de l’humain mais aussi de la machine, en permettant une certaine incertitude qui puisse mener `a des objectifs ou tˆaches ´emergentes. Les m´ecanismes d’adaptation devraient ´evoluer eux mˆeme en fonction des retours per¸cus par le syst`eme. Ainsi, l’effet d’une interaction ´evoluera en fonction de ce que l’utilisateur aura pu faire comme retour au syst`eme. Cette ´evolution du

syst`eme est sp´ecifique `a chaque utilisateur et permet d’aller vers des syst`emes plus cognitifs que r´eactifs.

A notre connaissance, il n’y a pas de travaux qui proposent une adapta-

tion dynamique d’un syst`eme interactif selon les concepts que nous proposons. C’est surtout dans le domaine artistique que l’on trouve des travaux les plus proches des objectifs que nous tentons d’atteindre, o`u plusieurs travaux portent sur l’´emergence d’interactions entre l’homme et la machine. Il est g´en´eralement donn´e `a l’utilisateur la possibilit´e, par ses propres interactions, de modifier l’œuvre en fonction des m´ecanismes pr´evus par l’artiste. Une fois que l’utilisateur s’est appropri´e de ce m´ecanisme, il peut cr´eer sa propre œuvre. Dans le cadre du projet A-life [13], le concept d’esth´etisme ´emergent est introduit comme le plaisir d’une interaction ´emergente entre des agents humains et virtuels et il est montr´e `a travers d’Alexitimia. Alexitimia est un robot immobile sans forme coh´erente qui attire la curiosit´e des humains qui l’approchent et le touchent mˆeme s’ils n’ont aucune information explicite sur la fa¸con d’interagir avec le robot. Quand le contact est r´ealis´e, Alexitimia transpire ce qui manifeste le passage d’un objet inanim´e `a un ˆetre vivant du fait de l’interaction de l’humain avec lui. N´eanmoins,

on qualifiera le syst`eme de r´eactif car l’effet associ´e `a une action de l’utilisateur sera toujours la mˆeme.

La collaboration en temps r´eel entre un humain et un syst`eme interactif, ainsi

que l’´emergence sont des caract´eristiques du syst`eme hpDJ. Il s’agit d’un DJ au- tomatique d´evelopp´e par Dave et al.[14] o`u des pistes de musique sont s´equenc´ees et mix´ees par le syst`eme dans un bar en collaboration avec le public. Les hu- mains qualifient la musique compos´ee et l’objectif du syst`eme est maximiser la satisfaction du public grˆace `a l’impl´ementation d’un algorithme g´en´etique. La musique compos´ee et jou´ee par hpDJ est vue comme une propri´et´e ´emergente de l’interaction dynamique entre le syst`eme et le public. En mˆeme temps, le pub- lic est vu comme une collaboration collective pour composer la musique jou´ee. Cependant, dans cette dynamique l’on peut remarquer que l’humain et la ma- chine jouent des rˆoles diff´erents. Les deux acteurs ne se trouvent pas en ´egalit´e

Co-adaptation Homme-Machine

7

d’importance car l’humain joue un rˆole d’´evaluateur avec une participation min- imale. Si nous sortons du domaine des arts interactifs, un syst`eme avec les car- act´eristiques que nous proposons apportera des outils au domaine des sciences cognitives pour mieux comprendre la dynamique de la cognition. Les domaines d’application concern´es par ces syst`emes sont notamment la sant´e (r´e´education apr`es un accident vasculaire c´er´ebral), ou encore l’enseignement (l’adaptation des repr´esentations mais surtout leur ´evolution en fonction d’un ´el`eve).

3 La co-adaptation : concepts th´eoriques

La co-adaptation homme-machine est l’approche qui consid`ere l’humain et la machine comme un couple indissoci´e au sein duquel s’instaure une dynamique entre le syst`eme informatique proposant une interaction `a un utilisateur et la mani`ere dont cet utilisateur interagit avec ce syst`eme. Dans cette approche, la machine prend en entr´ee les actions de l’utilisateur au travers des diff´erents m´ecanismes tels que la manipulation clavier ou souris, les fixations du regard, ou l’activit´e c´er´ebrale, et propose une modification des ´el´ements de perception pour l’humain qui `a son tour pourra agir. La mani`ere dont r´eagit le syst`eme co- adaptatif est bas´ee sur un ensemble de param`etres qui correspondent aux sorties d’un algorithme d’apprentissage fonctionnant en permanence, dont les entr´ees sont des ´el´ements de la situation pr´esente et pass´ee -l’action de l’utilisateur en regard des ´el´ements perceptifs propos´es notamment-. La machine ´evolue donc en permanence dans son fonctionnement, ainsi que l’utilisateur, qui d´eveloppe une mani`ere d’interagir avec elle. Nous faisons l’hypoth`ese que la dynamique d’interaction peut conduire `a des formes de stabilit´e entre la mani`ere dont fonctionne la machine –l’ensemble de param`etres- et la mani`ere dont l’utilisateur agit avec elle, qui correspond `a un fonctionnement satisfaisant, `a des ´echelles temporelles vari´ees. A noter que le concept de stabilit´e varie en fonction de l’objectif `a atteindre dans le syst`eme co-adaptatif, et peut ˆetre mesur´e `a l’aide de plusieurs indicateurs. La succession de diff´erents ´etats constat´es stables correspond `a la notion de m´etastabilit´e, d´efinie comme l’enchainement des diff´erents ´etats stables provoqu´es de fa¸con indiff´erente soit par la variation de l’environnement informatique d’interaction, soit par un des acteurs. Evidemment si on consid`ere le syst`eme faisant partie de la dynamique de la co-adaptation d’une fa¸con ind´ependante, celui-ci demeure encore un syst`eme avec des m´ecanismes d’adaptation cod´es pr´ealablement. Donc, notre proposition ne visualise pas l’individu et la machine comme des entit´es ind´ependantes, mais comme un couple indissoci´e avec des propri´et´es particuli`eres, o`u l’un s’adapte `a la proposition d’interaction de l’autre.

3.1 Caract´eristiques des syst`emes co-adaptatifs

Les caract´eristiques des syst`emes co-adaptatifs que nous identifions sont les suivantes :

8

Co-adaptation Homme-Machine

Satisfaction de l’utilisateur Les syst`emes co-adaptatifs doivent mesurer le degr´e de satisfaction de l’humain afin de mieux s’adapter `a ses attentes. Cette satisfaction peut ˆetre mesur´ee d’une fa¸con implicite par des indicateurs internes au syst`eme informatique, ou d’une fa¸con explicite grˆace au retour direct de l’humain. Les indicateurs peuvent ˆetre des donn´ees r´ecolt´ees et enregistr´ees au- tomatiquement exprimant d’une fa¸con quantitative les d´etails de l’interaction entre les acteurs du syst`eme. Par exemple, le temps ´ecoul´e d’interaction en- tre l’utilisateur et l’interface pourrait ˆetre un indicateur donnant des pistes de stabilit´e. Le retour direct de l’humain peut se r´ealiser directement en utilisant l’interface de communication ou bien, d’une fa¸con indirecte externe pendant l’interaction, ou `a la fin de celle-ci en utilisant d’autres moyens de support tels que les questionnaires de satisfaction. La combinaison des deux m´ecanismes pour mesurer la satisfaction est un moyen de d´ecouvrir s’il existe en r´ealit´e un senti- ment positif de cˆot´e de l’humain lorsqu’il interagit avec la machine.

Apprentissage en temps r´eel L’apprentissage automatique est le domaine de recherche interdisciplinaire consacr´e `a l’´etude formelle des m´ethodes automa- tisables qui permettent `a une machine (au sens large) d’´evoluer grˆace `a un pro- cessus d’apprentissage, et ainsi de remplir des tˆaches qu’il est difficile ou impos- sible de remplir par des moyens algorithmiques plus classiques [15]. L’approche de la co-adaptation homme-machine n´ecessite l’impl´ementation d’algorithmes d’apprentissage en temps r´eel qui puissent converger d’une fa¸con rapide car l’adaptation se r´ealise entre deux entit´es dynamiques. L’on peut mentionner trois types d’apprentissage pouvant ˆetre employ´es par les syst`emes co-adaptatifs

:

Apprentissage par renforcement : dans l’apprentissage par renforcement la machine interagit avec son environnement en produisant des actions. Ces actions ont un effet sur l’´etat de l’environnement ; en fonction de ces effets la machine peut recevoir des r´ecompenses ou sanctions. L’objectif de la ma- chine est donc, d’apprendre `a agir d’une mani`ere qui maximise les futures r´ecompenses qu’il re¸coit (ou minimise les sanctions) au cours de sa vie [15].

Apprentissage non-supervis´e : la machine re¸coit simplement des entr´ees mais elle n’obtient en information ni sorties cibles, ni r´ecompense de son environ- nement [15].

Inf´erence bay´esienne : permet d’utiliser les probabilit´es des ´ev`enements et

leurs relations pour inf´erer les causes ou les effets. Dans ce type d’apprentissage l’on peut trouver le Bayesian updating qui met `a jour des tables de proba- bilit´es lorsque de nouvelles donn´ees arrivent[15]. L’algorithme d’apprentissage impl´ement´e a la responsabilit´e d’interpr´eter les ac- tions de l’humain comme des entr´ees pour ensuite les analyser et proposer des ´el´ements d’interaction en accord avec la satisfaction de l’humain.

1.

2.

3.

M´etastabilit´e La constatation de l’atteinte de plusieurs ´etats stables pendant l’interaction entre les acteurs du syst`eme co-adaptatif est une caract´eristique primordiale pour consid´erer qu’il existe une co-adaptation.

Co-adaptation Homme-Machine

9

Incertitude Le caract`ere complexe et dynamique des acteurs du syst`eme co- adaptatif impose une incertitude dans la mesure o`u le concepteur de la machine peut d´efinir des r`egles de comportement, mais une fois que les entit´es commen- cent `a interagir on ne connaˆıt pas avec exactitude ce qui pourrait se passer ´eventuellement. Cette incertitude rend possible l’´emergence de nouvelles situ- ations qui n’´etaient pas pr´evues et auxquels les acteurs doivent s’adapter. Ces interactions ´emergentes sont r´esultat de la mani`ere dont l’humain r´eagit face aux ´el´ements propos´es par la machine.

Contextes vari´es d’interaction L’adaptation entre les acteurs du syst`eme peut se r´ealiser dans plusieurs cadres d’interaction. D’un cˆot´e, l’humain peut collaborer avec la machine pour atteindre des objectifs en commun. D’un autre cˆot´e, ils peuvent avoir le mˆeme objectif mais o`u l’un doit empˆecher l’autre `a r´eussir. Quel que soit le contexte (coop´eration, comp´etition, etc.) ils doivent arriver `a travailler ensemble.

4 La co-adapation : mise en pratique des concepts

4.1 Motivation

La notion de co-adaptation est une notion complexe, qui reste pour l’instant th´eorique. Il est tr`es difficile de trouver des exemples concrets de syst`emes co- adaptatifs. Comme le d´emontre l’´etat de l’art, ce sont les domaines de l’art et du jeu vid´eo qui abordent des notions se rapprochant le plus de celles de la co-adaptation. Apr`es un consensus entre les diff´erents chercheurs participants dans le projet, nous avons d´ecid´e d’impl´ementer les concepts th´eoriques de la co-adaptation dans un prototype fonctionnel sous forme de jeu vid´eo sur ordi- nateur pouvant int´egrer les caract´eristiques des syst`emes co-adaptatifs d´ecrites auparavant. Cette preuve de concept repr´esente un premier essai pour introduire la co-adaptation dans un contexte de collaboration entre un humain et un joueur virtuel. La nature des jeux vid´eo permet d’impl´ementer les caract´eristiques des syst`emes co-adaptatifs de fa¸con ad´equate.

Satisfaction : L’objectif principal d’un jeu vid´eo est de divertir l’humain, ce qui peut ˆetre mesur´e grˆace `a plusieurs indicateurs. La mesure de la satisfaction est exprim´ee ici en termes d’amusement et/ou de sentiment de maˆıtriser le jeu.

M´etastabilit´e : Pendant le d´eroulement d’un jeu vid´eo, un changement de conditions concernant l’environnement du jeu, le niveau de difficult´e, ou les actions `a r´ealiser par le joueur est mis en place `a des ´echelles temporelles vari´ees en fonction de la nature et complexit´e du jeu. Cette variation d’´el´ements peut aboutir `a la constatation d’un enchainement de plusieurs ´etats de stabilit´e. Nous pouvons reconnaˆıtre un ´etat stable lorsque la maˆıtrise du joueur reste `a un niveau constant jusqu’au moment o`u les changements d´ecrits auparavant alt`erent le jeu et la maˆıtrise du joueur est affect´ee.

10

Co-adaptation Homme-Machine

Apprentissage en temps r´eel : En fonction du degr´e de complexit´e du jeu vid´eo, il peut utiliser des r`egles de comportement statiques ou bien impl´ementer des algorithmes d’apprentissage en ligne permettant de le doter d’une meilleure finesse et pr´ecision prenant en compte en temps r´eel les actions de l’humain. Incertitude: En fonction de la quantit´e des variables participant dans un jeu, il peut y exister une infinit´e de possibles actions `a r´ealiser ou de valeurs `a prendre par les param`etres du jeu, ce qui pourrait mener `a une incertitude pendant son d´eroulement. Des objectifs peuvent ˆetre d´efinis au d´ebut par le concepteur du jeu mais ceci n’empˆeche pas l’apparition de nouveaux objectifs au cours du temps qui n’´etaient pas pr´evus par l’humain ou de nouvelles strat´egies `a mettre en place pour r´eussir dans l’objectif du jeu. La motivation de la conception d’un jeu est de prouver la co-adaptation grˆace `a la validation exp´erimentale des hypoth`eses suivantes :

1.

Un jeu avec les caract´eristiques des syst`emes co-adaptatifs satisfait les joueurs humains.

2.

Une m´etastabilit´e est constat´ee, produite par la variation de l’environnement du jeu et les actions des joueurs.

4.2

Description g´en´erale du jeu

Rolling Ball est un jeu compos´e d’un plateau avec des diamants distribu´es sur la surface, et par une boule roulant sur le plateau. Le plateau du jeu est contrˆol´e par les deux participants : le joueur humain et le joueur virtuel. Ils doivent collaborer afin de faire bouger le plateau pour r´ecup´erer avec la boule tous les diamants en ´evitant que celle-ci tombe sur les bords (voir Fig. 1). Le jeu a une dynamique multi-session car une fois que les joueurs r´ecup`erent la totalit´e des diamants ou que la boule tombe du plateau, une nouvelle session de jeu commence, et ainsi de suite. La particularit´e est que chaque jouer contrˆole seulement un axe d’inclinaison du plateau ; l’horizontale contrˆol´ee par le joueur humain et le verticale par le joueur virtuel. Cette contrainte impos´ee `a chacun des participants permet d’´evaluer la co-adaptation entre l’humain et le jeu dans un contexte de collaboration. La figure 2 montre d’une fa¸con abstraite les deux acteurs du jeu en interac- tion. D’une part l’humain et d’une autre part la machine (le jeu) compos´e par deux agents. L’interaction directe se situe entre l’humain et l’agent virtuel, tandis que l’agent superviseur n’est pas perceptible par l’humain malgr´e sa pr´esence `a tout moment. Nous avons d´ecid´e d’impl´ementer la co-adaptation dans le cadre de plusieurs sessions de jeu. L’agent virtuel est le compagnon de l’humain charg´e de collaborer avec lui pendant chaque session de jeu pour atteindre l’objectif grˆace `a l’impl´ementation des r`egles d’adaptation `a partir des cas. L’agent su- perviseur est charg´e d’analyser le d´eroulement de l’interaction pour modifier la dynamique du jeu de fa¸con ad´equate `a la satisfaction de l’humain grˆace `a un algorithme d’apprentissage inter-sessions. Ainsi, entre deux sessions de jeu, il est capable d’agir sur l’environnement physique et aussi sur le comportement

Co-adaptation Homme-Machine

11

Co-adaptation Homme-Machine 11 Fig. 1. Repr´esentation simplifi´ee du jeu de l’agent virtuel. Ces changements

Fig. 1. Repr´esentation simplifi´ee du jeu

de l’agent virtuel. Ces changements permettent de varier non seulement les con- ditions du jeu mais aussi les strat´egies `a mettre en place par l’humain et par l’agent virtuel. L’environnement du jeu est compos´e principalement par des pro- pri´et´es physiques du micro monde telles que la gravit´e, l’´echelle de temps ; de la boule telles que la friction et le rebond ; des ´el´ements du plateau comme les dia- mants `a r´ecolter. La mod´elisation en environnement et agents devrait permettre d’introduire une incertitude qui complexifierait le jeu et permettrait l’´emergence de certains objectifs.

le jeu et permettrait l’´emergence de certains objectifs. Fig. 2. Repr´esentation abstraite du jeu 4.3

Fig. 2. Repr´esentation abstraite du jeu

4.3 Caract´erisation du jeu en termes de co-adaptation

Le jeu permet de mettre en œuvre les caract´eristiques des syst`emes co- adaptatifs, de fa¸con plus ou moins d´evelopp´ee. La mesure de satisfaction de l’humain lors de l’interaction repr´esente une information primordiale pour l’agent superviseur pour qu’il puisse r´egler les param`etres du jeu de telle sorte que la satisfaction de l’humain soit maximis´ee. La satisfaction est consid´er´ee comme le fait d’avoir une bonne

12

Co-adaptation Homme-Machine

performance (la session de jeu r´eussie en peu de temps) et une bonne maˆıtrise du jeu (un bon contrˆole des ´el´ements du jeu, notamment le plateau et la boule).

La m´etastabilit´e peut ˆetre constat´ee pendant le d´eroulement du jeu si on observe que l’humain et le joueur virtuel r´eussissent `a collaborer ainsi que des oscillations de comportements stables. Nous consid´erons un ´etat comme stable lorsque l’humain maˆıtrise les ´el´ements propos´es par le jeu (comportement de l’agent coupl´e avec l’environnement physique) et se sent satisfait du d´eroulement du jeu.

L’apprentissage en ligne est ´egalement prioritaire pour l’agent superviseur afin de calculer les param`etres `a impl´ementer entre deux sessions de jeu. Cet algorithme prend en entr´ee l’activit´e de l’humain ainsi que les r´esultats de la session de jeu et rend en sortie la configuration de param`etres ad´equate pour maximiser la satisfaction de l’humain. Il est impl´ement´e par un r´eseau bay´esien.

L’incertitude est une caract´eristique pr´esente li´ee `a l’existence d’une in- finit´e de combinaisons possibles des param`etres du jeu. Par exemple, la boule peut suivre une infinit´e de trajectoires et des comportements en fonction de ses caract´eristiques physiques. La pr´ediction de l’intention de l’humain par l’agent virtuel pour viser le prochain diamant `a r´ecup´erer repr´esente ´egalement une incertitude. N´eanmoins, il serait plus int´eressant de permettre l’´emergence de nouveaux objectifs.

4.4 Description d´etaill´ee du jeu

Le jeu a ´et´e d´evelopp´e `a l’aide du moteur de jeu Unity3D version 4.1 car il met `a disposition les ´el´ements dont nous avions besoin pour d´evelopper un jeu

avec toutes les caract´eristiques que l’on souhaitait mettre en place. Le comporte- ment donn´e aux objets du jeu sont programm´es par des scripts cod´es en langage

C Sharp. La figure 3 illustre l’architecture technique des diff´erents composants.

En haut, on peut voir le flux des donn´ees depuis l’entr´ee au syst`eme jusqu’`a leur visualisation. Les donn´ees d’entr´ee peuvent ˆetre issues de l’humain ou directe- ment du syst`eme. Le traitement se r´ealise grˆace `a la logique programm´ee dans les scripts. Les sorties d´efinissent les propri´et´es physiques du jeu ainsi que le mouve- ment des objets –la boule et le plateau-. Les param`etres de friction et rebond de

la boule, la quantit´e et configuration des diamants constituent l’environnement

physique d’une session de jeu –intra partie- `a r´egler par l’agent superviseur et que l’humain ne peut pas modifier. La modification de ces param`etres aura un effet sur le comportement de la boule ou les ´el´ements du monde. Le joueur humain in- teragit avec les touches -fl`eche droite- et -fl`eche gauche- du clavier pour contrˆoler l’inclinaison horizontale du plateau. L’agent virtuel utilise toutes les informations

concernant le d´eplacement de la boule et les positions des diamants, ainsi que le comportement du joueur humain pour appliquer aussi une inclinaison verticale au plateau. Finalement, entre deux sessions de jeu –inter session- l’agent super- viseur analyse le comportement du joueur, le comportement de l’agent virtuel,

Co-adaptation Homme-Machine

13

et l’historique du jeu, et grˆace `a un algorithme d’apprentissage en ligne modifie les param`etres et le comportement de l’agent virtuel.

les param`etres et le comportement de l’agent virtuel. Fig. 3. Architecture logicielle 4.5 M´ecanismes

Fig. 3. Architecture logicielle

4.5 M´ecanismes d’adaptation Intra-session

Lors d’une session de jeu, l’agent virtuel et l’humain doivent coop´erer pour gagner la partie. Par cons´equent, il est n´ecessaire que l’agent virtuel soit capable d’assurer deux objectifs en parall`ele : ´eviter que la boule tombe du plateau (en contrˆolant les bords inf´erieur et sup´erieur), ainsi que collaborer avec l’utilisateur pour r´ecup´erer les diamants. La figure 4 montre les m´ecanismes mis en place par l’agent virtuel pour assurer ces deux objectifs.

Mod´elisation du comportement de l’agent virtuel Grˆace au fait que l’agent virtuel surveille en temps r´eel 1 le d´eplacement de la boule, en situation de danger il favorise l’objectif -´eviter que la boule tombe- quand celle-ci s’approche trop pr`es des bords du plateau par rapport `a l’objectif -r´ecup´erer les diamants- (voir formule 1). Il est pr´ef´erable de sauver la boule, puis une fois qu’elle se stabilise, r´ecup´erer le diamant. Inversement, si la boule n’est pas en danger, l’agent virtuel donne priorit´e `a l’objectif -r´ecup´erer les diamants-.

1. 60 frames par second

14

Co-adaptation Homme-Machine

(1)

b,l ± β

indique la distance entre

la boule et le limite du plateau, D b,d indique la distance entre la boule et le diamant, t repr´esente le temps de chaque cycle de calcul en seconds, α et β sont des co´efficients d’importance entre 0 et 1, et ± indique la direction de l’inclinaison du plateau. Le premier terme repr´esente l’inclinaison appliqu´ee au plateau pour sauver la boule et le deuxi`eme terme repr´esente l’inclinaison pour r´ecup´erer le diamant. Le r´esultat de ce calcul est l’angle d’inclinaison par seconde `a appliquer au plateau.

±α

→− V

b

→− D

→− V

b,d t

b

→− D

o`u V b corresponde `a la vitesse de la boule, D

b,l

corresponde `a la vitesse de la boule, → − D b,l Fig. 4. Chaˆıne de traitement

Fig. 4. Chaˆıne de traitement du point de vue de l’agent virtuel pour satisfaire les deux objectifs

M´ecanisme d’adaptation de l’agent virtuel Afin d’assurer une collab- oration entre le joueur virtuel et l’humain, il est important que les deux ac- teurs puissent se mettre d’accord sur le choix du diamant `a r´ecup´erer. Une fois que la partie de jeu commence, le seul moyen pour l’agent virtuel de connaˆıtre l’intention de choix du diamant de la part de l’humain en temps r´eel correspond `a la direction horizontale vers laquelle celui-ci d´ecide d’incliner le plateau pour diriger la boule. Cette information, combin´ee avec le d´eplacement de la boule, permet `a l’agent virtuel d’´evaluer en parall`ele les diff´erentes strat´egies de choix du diamant et d’appliquer ensuite la plus ad´equate (voir Fig. 4). On consid`ere trois strat´egies de choix des diamants :

Co-adaptation Homme-Machine

15

S´electionner le diamant le plus proche. Dans les cas o`u la boule se d´eplace avec une vitesse normale.

S´electionner le diamant plac´e dans la mˆeme direction que la boule. Dans le cas o`u la boule se d´eplace avec une grande vitesse il est pr´ef´erable de favoriser le diamant plac´e dans la mˆeme direction que la boule, mˆeme s’il y en a un autre plus proche mais avec un angle de s´eparation consid´erable.

S´electionner le diamant qui repr´esente moins de risque vis `a vis de l’objectif -´eviter que la boule tombe-. Dans le cas o`u il y a des diamants plac´es sur les bords du plateau, il est pr´ef´erable de r´ecup´erer le diamant plus facile ; c’est-`a-dire, celui qui se trouve le plus au centre du plateau.

Chaˆıne d’interaction entre les deux acteurs La figure 5 illustre l’interaction entre les deux acteurs pendant une session du jeu. Au d´ebut de la session (1) un des joueurs (dans ce cas l’humain) propose (de fa¸con implicite) d’aller vers un diamant en inclinant le plateau `a droite ou `a gauche (il adopte le rˆole de leader, car c’est lui qui d´efini la direction `a explorer) et l’autre joueur (dans ce cas l’agent virtuel) (2) ´evalue cette information ainsi que le reste du tableau (les positions des diamants, le d´eplacement de la boule) pour appliquer une strat´egie de choix d’un diamant et incliner le plateau sur son axe pour r´ecup´erer le diamant (il adopte le rˆole de suiveur, car il est restreint `a chercher dans la direction impos´e par l’humain). On voit bien que d’une certaine mani`ere les deux acteurs r´eussissent `a s’accorder sur un objectif en commun (3), et ils continuent `a manipuler l’inclinaison du plateau chacun sur leur axe (4) pour r´ecup´erer le diamant (5). Mˆeme s’ils ´echouent dans la r´ecup´eration du diamant, le cycle se r´ep`ete, la machine comme l’humain pouvant maintenant adopter le rˆole de leader et proposer une autre direction `a explorer. N´eanmoins, il est possible par exemple que l’humain d´ecide d’aller vers la droite mˆeme s’il n’existe pas des diamants vers cette direction. Sachant qu’il n’a pas d’objets `a explorer de ce cˆot´e du plateau, l’agent d´ecide alors de proposer lui-mˆeme un diamant situ´e dans une autre direction en manipulant l’inclinaison verticale. Dans le cas id´eal, l’humain pourrait se rendre compte de l’intention de la machine pour s’adapter `a cette proposition de choix du diamant. A noter que l’on parle toujours des propositions car d’une part les intentions ne sont pas clairement exprim´ees et d’autre part aucun des joueurs ne peut diriger la boule vers le diamant d’une fa¸con ind´ependante ; il est n´ecessaire que l’autre acteur accepte le mouvement. De cette fa¸con, les deux acteurs se mettent d’accord et s’adaptent l’un `a l’autre pour r´eussir dans le jeu.

4.6 M´ecanismes d’adaptation Inter-session

Les m´ecanismes d´ecrits dans la section pr´ec´edente sont impl´ement´es de fa¸con locale, c’est-`a-dire, dans une session de jeu. Cependant, le passage d’une session de jeu `a une autre apporte de nouvelles informations concernant le d´eroulement du jeu. Donc, il est n´ecessaire d’int´egrer une adaptation qui puisse consid´erer ces donn´ees observ´ees, ainsi que tous les ´el´ements utilis´es dans la session de jeu

16

Co-adaptation Homme-Machine

16 Co-adaptation Homme-Machine Fig. 5. Cycle d’interaction entre les deux acteurs pour se mettre d’accord sur

Fig. 5. Cycle d’interaction entre les deux acteurs pour se mettre d’accord sur le diamant a` r´ecup´erer

pr´ec´edente pour configurer la suivante en prenant en compte la satisfaction de l’humain. C’est le rˆole de l’agent superviseur.

Choix de l’algorithme d’apprentissage : le r´eseau bay´esien Comme d´efini pr´ec´edemment, un syst`eme co-adaptatif n´ecessite des algorithmes d’apprentissage en ligne pour interpr´eter les actions de l’humain. Apr`es une r´eflexion sur plusieurs algorithmes d’apprentissage existants, nous avons d´ecid´e d’utiliser l’inf´erence bay´esienne car le fait de d´eduire des ´ev´enements `a partir d’autres d´ej`a ´evalu´es ou observ´es semblait pertinent pour notre objectif de trouver la configuration ad´equate des param`etres `a impl´ementer. Un r´eseau bay´esien est d´efini par un graphe orient´e sans circuit (form´es par des nœuds et des arcs), un espace probabilis´e fini et un ensemble de variables al´eatoires associ´ees aux nœuds du graphe. Son utilisation essentielle est de cal- culer des probabilit´es conditionnelles d’´ev´enements reli´es les uns aux autres par des relations de cause `a effet (inf´erence). Une variable al´eatoire permet de car- act´eriser des ´ev´enements par une simple valeur [16]. Le fondement math´ematique des r´eseaux bay´esiens est le th´eor`eme de Bayes pr´esent´e dans la formule suivante

:

P(A | B) = P(B | A)P(A)

P(B)

A et B correspondent `a deux ´ev´enements. Le terme P(A) est la probabilit´e a priori ou marginale de A car elle pr´ec`ede toute information sur B. De mˆeme, le terme P(B) est appel´e la probabilit´e marginale ou a priori de B. P(A| B) est la probabilit´e a posteriori de A sachant B (A d´epend directement de B ). P(B |A)

Co-adaptation Homme-Machine

17

repr´esente la probabilit´e de l’´ev´enement B sachant l’´ev´enement A. Ainsi, ce th´eor`eme permet d’inverser la direction d’un ´enonc´e probabiliste. La d´emarche `a suivre pour construire le r´eseau bay´esien est la suivante :

1. D´efinir le graphe du mod`ele qui corresponde `a la structure du r´eseau : les vari- ables al´eatoires et les relations de d´ependance entre les variables al´eatoires.

2. D´efinir les param`etres du r´eseau : les tables des probabilit´es de chaque vari- able, conditionnellement `a ses causes.

D´efinition du graphe du mod`ele Pour construire le mod`ele du r´eseau bay´esien nous nous sommes inspir´es du travail de Synnaeve [17] dans le cadre des jeux vid´eo multi-joueurs. Dans ce type de jeux il est n´ecessaire de choisir des strat´egies `a suivre, des tactiques `a utiliser, et des actions `a r´ealiser. La strat´egie correspond `a ce qui sera r´ealis´e en long terme, la tactique r´epond aux questions o`u, com- ment, et quand agir, et l’action inclut des m´ecanismes imm´ediats `a mettre en place. Selon la complexit´e du jeu, un grand nombre de variables doit ˆetre con- sid´er´ees pour prendre la meilleure d´ecision. Ce fait implique une grande quantit´e de donn´ees qu’il est n´ecessaire d’´evaluer pour optimiser le processus de prise de d´ecision. Synnaeve propose une approche de prise de d´ecisions strat´egiques en temps r´eel `a partir d’une hi´erarchie en niveaux d’abstraction. L’avantage d’utiliser cette structure hi´erarchique est l’´etablissement d’une continuit´e verti- cale et horizontale permettant de mieux explorer l’espace de recherche. Il existe une continuit´e verticale si un choix dans le domaine d’un niveau sup´erieur im- plique une r´eduction du domaine du niveau inf´erieur. Ceci permet d’explorer l’espace d’´etats d’une fa¸con efficace, en filtrant des consid´erations inutiles par rapport au niveau de d´ecision sup´erieur. De la mˆeme fa¸con, pour un niveau d’abstraction donn´e il existe une continuit´e horizontale si la prise d’une d´ecision implique un fort conditionnement dans la d´ecision suivante du mˆeme niveau, s’il existe des d´ependances entre des variables du mˆeme niveau. Nous avons d´efini le r´eseau bay´esien comme le montre la figure 6. Les nœuds du graphe repr´esentent les variables al´eatoires et les arcs correspondent aux d´ependances conditionnelles ´etablies. On peut distinguer trois niveaux d’abstrac- tion pour la prise de d´ecision : le niveau strat´egique d´enote la d´ecision g´en´erale `a prendre (entre une session et une autre), le niveau tactique sp´ecifie sur quelle partie du jeu il faut agir, et finalement le niveau action repr´esente la fa¸con dont on changera les conditions du jeu. Etant donn´e que la tˆache de l’agent superviseur est de trouver la config- uration de la session de jeu suivante en fonction des donn´ees observ´ees de la session pr´ec´edente, le mod`ele a ´et´e con¸cu afin de repr´esenter la dynamique de cette temporalit´e. La partie gauche du r´eseau poss`ede les ´el´ements de la session de jeu courante et la partie droite repr´esente la session suivante. A noter que la strat´egie(t+1) est influenc´ee par la strat´egie et par les donn´ees observ´ees de la session pr´ec´edente (t). Les variables al´eatoires du niveau tactique et du niveau action sont influenc´es seulement par celles de la session pr´ec´edente et non pas par les donn´ees observ´ees. Dans le mod`ele propos´e par Synaevve, il utilise ´egalement les observations pour conditionner les variables al´eatoires de tous les niveaux.

18

Co-adaptation Homme-Machine

18 Co-adaptation Homme-Machine Fig. 6. R´eseau bay´esien. N´eanmoins, on a d´ecid´e de conditionner les

Fig. 6. R´eseau bay´esien.

N´eanmoins, on a d´ecid´e de conditionner les observations seulement au niveau strat´egique afin de ne pas exploser la complexit´e du mod`ele. L’espace probabiliste du mod`ele d´efini est d´ecrit ci-apr`es :

S t,t+1 Strategie´ , la variable du niveau strat´egique qui peut prendre les valeurs suivants : Simplifier pour ´eviter que le joueur arrˆete de jouer ou qu’il soit frustr´e quand il a des difficult´es `a maˆıtriser le jeu ; Complexifier pour rendre la session de jeu plus int´eressant pour les joueurs qui maˆıtrise le jeu et ainsi ´eviter qu’ils se lassent ; Explorer pour diversifier les valeurs des param`etres du jeu et de cette mani`ere ajouter de l’incertitude au jeu. T t,t+1 P hysique, Structure, Comportement, les variables du niveau tac- tique qui sp´ecifient la mani`ere dont il faudra agir. Chacune des variables peut prendre les valeurs : Tr`es facile, Facile, Difficile, Tr`es difficile. La variable Physique d´enote les propri´et´es de la boule, la variable Structure inclut les ´el´ements sur le plateau du jeu, et la variable Comportement exprime la fa¸con dont l’agent virtuel agira dans la session du jeu. A t,t+1 F riction, Rebond, Diamants, Conf iguration, Raisonnement, Mouvement, les variables du niveau action qui repr´esentent les param`etres de bas niveau `a configurer selon le d´eroulement du jeu. Chacune des variables peut prendre des valeurs particuli`eres d´efinis ci-apr`es :

La variable Friction peut prendre les valeurs Petite, Moyenne, Grande. Il est plus difficile `a contrˆoler la boule quand la friction est petite car la boule atteint plus de vitesse et glisse au lieu de rouler.

Co-adaptation Homme-Machine

19

La variable Rebond peut ´egalement prendre les valeurs Petit, Moyen, Grand. Inversement `a la friction, quand la propri´et´e de rebond de la boule a une grande valeur, la boule est plus difficile `a contrˆoler. Les valeurs de la variable Diamants vont de 0 `a 7, chaque valeur repr´esentant une quantit´e binaire de diamants. (Par exemple, la valeur 0 peut valoir 1 ou 2 diamants, etc´et´era). La variable Configuration exprime l’emplacement des diamants sur le plateau. Elle peut prendre les valeurs Centr´e pour placer les diamants au centre du plateau, Tout pour les placer dans la totalit´e de la surface, et Bords pour les mettre seulement aux extr´emit´es du plateau. La variable Raisonnement d´enote la fa¸con dont l’agent virtuel r´ealisera le choix du diamant `a r´ecup´erer. Elle peut prendre les valeurs Intelligent pour que l’agent virtuel impl´emente les strat´egies de r´ecolte d´ecrites auparavant, ou Al´eatoire que comme le nom l’indique il vise un diamant al´eatoire ce qui rend plus difficile la collaboration entre l’humain et l’agent virtuel. La variable Mouvement d´efinit la force des mouvements de l’agent virtuel lorsqu’il incline le plateau. Elle peut prendre les valeurs Calme, Normal, Brusque. O 1:n t T emps, Resultat,´ DiamantsRec, Activite,´ ChangDir, l’ensemble des variables observ´ees qui repr´esentent `a la fois des indicateurs de satisfaction de l’humain, elles sont d´ecrites ci-apr`es:

La variable Temps repr´esente le temps moyen par diamant r´ecup´er´e. Il peut prendre les valeurs Petit, Moyen, Grand. La variable R´esultat est binaire car elle indique si la session du jeu a ´et´e r´eussie ou perdue. La variable Diamants Rec exprime la quantit´e de diamants r´ecup´er´es par rapport `a ceux qui avaient disponibles sur le plateau. Elle peut prendre les valeurs Peu, Moyen, Beaucoup. La variable Activit´e indique la participation active de l’humain dans le jeu. Elle repr´esente le nombre de fois que les touches du clavier contrˆol´ees par l’humain ont ´et´e appuy´ees. Les valeurs possibles sont Petite, Moyenne, Grande. La variable Chang Dir repr´esente le nombre de fois que la boule a chang´e de direction pendant la session de jeu. Elle exprime d’une certaine mani`ere l’habilit´e des joueurs `a contrˆoler le parcours de la boule et peut prendre les valeurs Peu, Moyenne, Beaucoup. Afin de r´eduire la complexit´e de calcul, nous avons d´ecid´e de regrouper ces variables al´eatoires observ´ees dans deux variables interm´ediaires : la variable Performance qui regroupe les variables Temps et R´esultat, et la variable Maˆıtrise qui regroupe les variables Diamants Rec, Activit´e, et Chang Dir. Les variables Performance et Maˆıtrise peuvent prendre les valeurs Bon, Moyenne, Mauvais. Finalement, l’espace probabiliste est repr´esent´e dans la formule suivante :

P S t+1,t , T t+1,t , A t+1,t , O t

1:n = P S t · P T t · P A t · P O t

1:n

·P S t+1 | S t , O 1:n t · P T t+1 | S t+1 , T t · P A t+1 | T t+1 , A t

P S t+1 | S t , O 1:n t se lit comme la distribution de probabilit´e de la strat´egie au temps t+1 est d´etermin´ee par la strat´egie au temps t, et les observations au

20

Co-adaptation Homme-Machine

temps t.

P T t+1 | S t+1 , T t se lit comme la distribution de probabilit´e de la tactique au temps t+1 est d´etermin´ee par la strat´egie au temps t+1, et la tactique au temps

t.

P A t+1 | T t+1 , A t se lit comme la distribution de probabilit´e de l’action au temps t+1 est d´etermin´ee par la tactique au temps t+1, et l’action au temps t.

D´efinition des param`etres du mod`ele Les tables de probabilit´es et prob- abilit´es conditionnelles peuvent ˆetre inf´er´ees `a partir des donn´ees quand elles sont disponibles. Il suffit d’appliquer des algorithmes pour apprendre les prob- abilit´es d’une fa¸con automatique. Dans notre cas, de telles donn´ees ne sont pas disponibles. Par cons´equent, nous avons d´efini les tables de probabilit´es nous- mˆemes en tant qu’experts `a partir d’une analyse m´eticuleuse ´etant donn´e que nous connaissons d´ej`a les relations entre les variables du mod`ele. Les tables de probabilit´es sont pr´esent´ees dans l’annexe de ce rapport (cf. Annexe C).

Impl´ementation du r´eseau bay´esian dans le jeu Une fois le mod`ele et les tables de probabilit´es d´efinis, nous avons impl´ement´e le mod`ele th´eorique du r´eseau bay´esien dans le jeu. Pour l’impl´ementation de notre solution, il ´etait fondamental de compter sur des librairies pour les r´eseaux bay´esiens. Etant donn´e que le jeu a ´et´e d´evelopp´e dans le moteur Unity 4 en langage C Sharp, il fallait trouver un outil qui pourrait `a la fois mettre `a disposition des librairies permettant d’impl´ementer toutes les fonctionnalit´es des r´eseaux bay´esiens d’une fa¸con directe et en mˆeme temps interfacer avec le moteur de jeu. Apr`es une ´evaluation de diff´erents outils, nous avons d´ecid´e d’utiliser le frame- work Infer.NET 2.3 d´evelopp´e par le groupe Machine Learning and Perception de Microsoft Research Cambridge[18]. Infer.NET est un framework pour l’ex´ecution d’inf´erences bay´esiennes dans les mod`eles graphiques. Il peut ´egalement ˆetre utilis´e pour la programmation probabiliste. Infer.NET aide `a r´esoudre plusieurs types de probl`emes d’apprentissage automatique ; il a ´et´e utilis´e dans une grande vari´et´e de domaines, y compris la recherche d’information, la bioinformatique, l’´epid´emiologie, la vision, entre autres. L’impl´ementation du r´eseau bay´esien dans le jeu s’int`egre dans le cycle des sessions de jeu (voir Fig. 7). Quand le jeu d´emarre il n’existe pas encore de donn´ees `a analyser. Donc, l’agent superviseur initialise les param`etres en d´efini- ssant une strat´egie. Cette d´ecision a une influence sur le niveau tactique selon les tables de probabilit´es d´efinies pour chaque variable, et le niveau action est influenc´e par les actions du niveau tactique. A partir de l’algorithme d’inf´erence Expectation Propagation, l’agent superviseur g´en`ere les valeurs des param`etres du niveau action qui seront impl´ement´es dans la premi`ere session. Lorsque la session se termine (que si l’objectif ait ´et´e atteint ou non) les donn´ees concernant le d´eroulement du jeu deviennent les entr´ees du r´eseau bay´esien et sont prises en compte pour prendre la d´ecision strat´egique de la session suivante. Donc, pour prendre la d´ecision sur la prochaine strat´egie `a mettre en place, on doit

Co-adaptation Homme-Machine

21

consid´erer les donn´ees observ´ees ainsi que la d´ecision strat´egique de la session de jeu pr´ec´edente. Le mˆeme cycle se r´ep`ete pour les sessions de jeu suivantes.

cycle se r´ep`ete pour les sessions de jeu suivantes. Fig. 7. D´eroulement du jeu 5 Plan

Fig. 7. D´eroulement du jeu

5 Plan exp´erimental

5.1 Description de l’exp´erience

Afin de tester la notion de co-adaptation en pratique, il ´etait n´ecessaire de r´ealiser une exp´erimentation aupr`es des joueurs humains. Nous avons d´efini trois questions de recherche `a valider par cette exp´erimentation :

1. Est-ce que les sujets exp´erimentent une satisfaction en jouant le jeu co- adaptatif ?

2. Est-ce qu’il est possible de constater une m´eta-stabilit´e?

Dix sujets, 7 hommes et 3 femmes entre 20 et 26 ans ont particip´e `a l’exp´erience. Ils avaient de diverses habitudes de jeux allant de joueurs occasionnels `a des joueurs exp´eriment´es. Au d´ebut de l’exp´erience il ´etait expliqu´e la m´ecanique du jeu : l’objectif, et les possibles mouvements que le joueur pouvait r´ealiser. Nous avons d´ecid´e de ne pas sp´ecifier que le joueur virtuel allait travailler en collab- oration avec l’humain afin de mesurer le ressenti et la perception de l’humain par rapport au contexte d’interaction. Nous avons ´etabli un minimum de 13 parties de jeu obligatoires ; au del`a de cette quantit´e les sujets pouvaient contin- uer `a jouer autant de sessions suppl´ementaires qu’ils le souhaitaient. Ceci nous permettait de mesurer l’engagement et amusement de l’humain face au jeu. La

22

Co-adaptation Homme-Machine

quantit´e de 13 sessions comme minimum a ´et´e d´efinie sur l’hypoth`ese qu’au bout d’environ 10 sessions les participants arriveraient `a collaborer d’une fa¸con stable. D’une part les humains r´eussiraient `a maˆıtriser la physique du jeu, et `a comprendre comment collaborer avec le joueur virtuel. D’autre part, `a partir de l’inf´erence bay´esienne la machine arriverait `a proposer les bons param`etres du jeu par rapport `a la satisfaction de l’humain. Entre deux sessions de jeu, trois questions ont ´et´e pos´ees au joueur :

1. Avez-vous eu l’impression d’ˆetre performant au cours de cette partie?

2. Avez-vous eu l’impression de maˆıtriser le jeu?

3. Est-ce que le jeu a ´et´e trop facile, facile, difficile, trop difficile ?

La question 1 et 2 avaient comme possibles r´eponses l’´echelle suivante : non, plutˆot non, oui, plutˆot oui (inspir´ees de l’´echelle de Likert). La premi`ere ques- tion ´etait destin´ee `a comparer le ressenti de la performance de l’humain avec la variables observ´ee calcul´ee Performance. De mˆeme, la deuxi`eme question ´etait destin´ee `a comparer le ressenti de la maˆıtrise du jeu de l’humain avec la variable observ´ee calcul´ee Maˆıtrise. Finalement, la troisi`eme question permet de com- parer le ressenti de la difficult´e par rapport `a la variable al´eatoire strat´egie pour valider le fonctionnement du r´eseau bay´esien impl´ement´e. A la fin du jeu, un fichier ´etait enregistr´e automatiquement avec les donn´ees concernant le d´eroulement du jeu. Finalement, chaque joueur devait r´epondre un questionnaire (cf. Annexe B) permettant de r´ecolter des informations qualitatives afin de mieux connaˆıtre l’appr´eciation du jeu par l’humain. Les r´eponses donn´ees par les joueurs devraient potentiellement exprimer le degr´e de satisfaction de l’humain, et sa perception par rapport au couplage et la co-adaptation entre les deux joueurs.

5.2 Analyse des r´esultats

Nous avons utilis´e les r´eponses des questionnaires et les donn´ees des fichiers log pour v´erifier les questions de recherche d´efinies. Le tableau 1 montre les r´esultats les plus int´eressants qualitatifs du questionnaire qualitatifr´epondu par les participants `a la fin de l’exp´erience. Pour l’analyse des r´eponses, nous avons utilis´e la m´ediane et une ´echelle de 0 = Non, 1 = Plutˆot non, 2= Plutˆot oui, 3= Oui. Ainsi, nous pouvons constater qu’en g´en´eral:

1. Les participants ont ´et´e plutˆot satisfaits car ils ont trouv´e le jeu plutˆot amusant (question 3, m´ediane de 2), et non frustrant (question 4, m´ediane de 1). Nous consid´erons que les r´eponses de ces deux questions expriment d’une mani`ere claire la satisfaction, ´etant donn´e que la difficult´e est per¸cue de diff´erentes mani`eres en fonction de l’individu. De plus, en analysant les donn´ees du fichier log, parmi les dix sujets, sept ont jou´e des sessions suppl´ementaires : trois sujets ont jou´e quatorze parties, un sujet quinze, deux sujets seize, et finalement un sujet a jou´e vingt sessions. Ainsi, nous pouvons r´epondre positivement `a la question Est-ce que les sujets exp´erimentent une satisfaction en jouant le jeu co-adaptatif ?

Co-adaptation Homme-Machine

23

2. Les participants ont ressenti une co-adaptation car les questions concernant l’adaptation dans les deux sens (questions 6 et 7), la collaboration (question 9 et 12), et le progr`es en tant que co-´equipiers (question 11) ont une m´ediane de 2.

3. Les m´ecanismes de choix de diamants utilis´es par l’agent virtuel ´etaient pertinents, puisque les participants consid`erent qu’il agit d’une fa¸con plutˆot intelligente (question 5).

4. Les participants n’ont pas ressenti une variation de l’environnement physique du jeu (comportement de la boule et du plateau) exception faite des dia- mants, ce qui remet en question la pertinence des param`etres physiques du jeu.

Table 1. M´edianes des r´eponses du questionnaire

Sujet

Q1

Q2

Q3

Q4

Q5

Q6

Q7

Q8

Q9

Q10

Q11

Q12

Q13

1

2

1

2

2

2

2

0

1

1

1

1

2

2

2

0

2

2

1

2

3

2

0

2

0

2

1

3

3

0

2

3

0

1

1

0

0

1

2

0

1

0

4

2

1

2

1

1

2

0

2

0

0

3

2

2

5

1

1

2

1

3

2

2

3

2

0

2

2

3

6

0

3

2

0

2

2

2

1

2

0

2

2

1

7

0

2

3

0

2

2

2

2

3

0

2

1

0

8

0

3

2

0

2

3

2

2

2

1

2

2

0

9

0

3

2

1

2

3

3

1

3

0

2

2

1

10

1

2

3

3

2

3

2

0

1

2

2

1

3

M´ediane

0

2

2

1

2

2

2

1

2

0

2

2

1.5

Question 2. Est-ce qu’il est possible de constater une m´eta-stabilit´e ? Etant donn´e que la m´etastabilit´e peut ˆetre constat´ee `a partir d’un enchaine- ment d’´etats stables, nous avons consid´er´e qu’un indicateur important de sta- bilit´e est la progression des joueurs mesur´ee `a partir de la quantit´e de temps moyen par diamant r´ecup´er´e. Le temps moyen permet de r´efleter la co-adapation dans la mesure ou les 2 doivent coop´erer pour r´ecup´erer le diamant. Le temps moyen permet egalement d’avoir un indice sur la difficult´e ou non de se mettre d’accord. Le graphe de la figure 8 montre pour un individu le temps moyen par diamant r´ecup´er´e tout au long de l’exp´erience. Nous pouvons observer que les joueurs commencent avec un temps moyen ´elev´e. Cependant, de la session 2 `a la session 5 une certaine stabilit´e est montr´ee car ils d´epensent en moyenne 4,2774 seconds (´ecart type : 0.59). Puis, de la session 7 `a la 11 ils reprennent un bon temps moyen de 4.26 seconds (´ecart type : 1.16) jusqu’`a la partie 12 o`u ils re- montent le temps. Nous faisons l’hypoth`ese que si le temps total de jeu ´etait plus long, nous pourrions constater plusieurs ´etats stables o`u le passage d’un `a un autre se fait par le changement des param`etres du jeu. Le mˆeme comportement apparaˆıt dans 7 des 10 sujets.

24

Co-adaptation Homme-Machine

24 Co-adaptation Homme-Machine Fig. 8. M´etastabilit´e constat´ee face a` la progression du sujet 9 6 Discussion

Fig. 8. M´etastabilit´e constat´ee face a` la progression du sujet 9

6 Discussion et Perspectives

Dans ce travail, nous avons introduit d’abord les concepts th´eoriques de l’approche de la co-adaptation homme-machine. Nous avons ´egalement d´evelopp´e une preuve de concept pour impl´ementer les caract´eristiques des syst`emes co- adaptatifs. Finalement, une exp´erimentation a ´et´e men´ee pour essayer de valider quelques caract´eristiques de l’approche de la co-adaptation. N´eanmoins, nous consid´erons que les r´esultats issus de l’exp´erimentation ne sont pas suffisants - surtout en termes quantitatifs- pour valider l’approche de la co-adaptation. Donc, il est n´ecessaire de prendre du recul pour d´eterminer si la raison de ce manque de r´esultats convaincants se situe au niveau th´eorique concernant la mani`ere de penser la co-adaptation, ou au niveau technique concernant la conception et l’impl´ementation du syst`eme, ou la d´emarche exp´erimentale. Nous sommes conscients que l’approche de la co-adaptation est un sujet com- plexe qui rend difficile la mise en œuvre des concepts th´eoriques dans une appli- cation r´eelle. La fronti`ere entre une adaptation classique et une co-adaptation est souvent difficile `a constater ; elle n’est pas ´evidente `a premi`ere vue. Donc, il est n´ecessaire d’approfondir le cadre th´eorique pour faire ´evoluer les d´efinitions avec une int´egration plus importante des disciplines connexes telles que les neu- rosciences et la psychologie ´enactive. Du cˆot´e pratique, la conception d’un jeu simple avec des moyens d’interaction limit´es restreint la mise en œuvre de la co-adaptation compar´ee avec une appli- cation plus complexe. Cependant, il est vrai qu’une telle application demande un temps plus long de conception et d´eveloppement. Dans le mˆeme cadre de notre jeu co-adaptatif, nous pourrions consid´erer d’un cˆot´e, faire ´evoluer l’agent virtuel pour qu’il inclue un mod`ele de l’humain bas´e sur les concepts de la th´eorie de l’esprit, pour lui doter d’une plus grande intelligence. De cette mani`ere l’adaptation intra-session se ferait avec des mod`eles plus pr´ecis. D’un autre cˆote, le r´eseau bay´esien utilis´e pour l’apprentissage inter session peut ˆetre ´egalement raffin´e. Dans le mod`ele que nous avons d´efini, les variables observ´ees influen-

Co-adaptation Homme-Machine

25

cent seulement la prise de d´ecision du niveau strat´egique. Cependant, le mod`ele propos´e par Synaevve [19] utilise ´egalement les observations pour conditionner les variables al´eatoires du niveau tactique, et du niveau action pour optimiser la prise de d´ecisions strat´egiques. En plus, nous avons regroup´e les variables observ´ees en deux variables interm´ediaires -Performance et Maˆıtrise- ce que fa- cilite l’impl´ementation mais parall`element diminue la pr´ecision. Le fait d’avoir discr´etis´e certaines variables permet de r´eduire la complexit´e mais fait perdre en finesse d’adaptation. Finalement, la possibilit´e de changer d’un contexte col- laboratif `a un comp´etitif rendrait possible l’´emergence de nouveaux objectifs et permettrait de mieux observer la m´etastabilit´e. Les donn´ees r´ecolt´ees des exp´eriences d´ej`a r´ealis´ees combin´ees avec d’autres `a venir, permettraient l’impl´ementation d’un apprentissage de param`etres afin d’employer des tables de probabilit´es plus pr´ecises. L’exp´erimentation men´ee n’est pas exhaustive -et par cons´equence l’analyse derri`ere- dans la mesure o`u la quantit´e de participants n’est pas suffisante pour montrer des r´esultats repr´esentatifs et valider les questions de recherche que nous avons pos´ees. Tout de mˆeme, les r´esultats pr´eliminaires obtenus apr`es l’exp´erimentation men´ee, bien qu’ils ne soient pas tr`es repr´esentatifs, permettent de pousser la r´eflexion concer- nant les syst`emes co-adaptatifs. Par exemple, nous n’avons pas mis l’accent sur le temps d’interaction dans les syst`emes co-adaptatifs. Grˆace `a cette premi`ere preuve de concept, nous pouvons int´egrer la caract´eristique d’interaction pro- long´ee car ceci permettrai id´ealement de mieux constater une m´etastabilit´e.

References

1. B´alint, Lajos, ”Adaptive human-computer interfaces for man-machine interaction in computer-integrated systems”, Computer Integrated Manufacturing Systems, 1995, Elsevier.

2. Millerand, Florence, ”La dimension cognitive de lappropriation des artefacts com- municationnels”, Internet: nouvel espace citoyen. Paris: L’Harmattan, p. 181–203,

2002.

3. Thevenin, David and Coutaz, Jo¨elle, ”Plasticity of user interfaces: Framework and research agenda”, Proceedings of INTERACT, p. 110–117, 1999.

4. Calvary, Ga¨elle and Serna, Audrey and Coutaz, Jo¨elle and Scapin, Dominique and Pontico, Florence and Winckler, Marco, ”Envisioning Advanced User Interfaces for E-Government Applications: A Case Study”, Practical Studies in E-Government, p. 205–228, 2011, Springer.

5. Simonin, J´erˆome and Carbonell, No¨elle, ”Interfaces adaptatives Adaptation dynamique\a l’utilisateur courant”, arXiv preprint arXiv:0708.3742, 2007.

6. Balme, Lionel and Demeure, Alexandre and Barralon, Nicolas and Coutaz, Jo¨elle and Calvary, Gaelle, ”Cameleon-rt: A software architecture reference model for distributed, migratable, and plastic user interfaces” ,Ambient intelligence,

2004Springer.

7. Gajos, Krzysztof Z and Czerwinski, Mary and Tan, Desney S and Weld, Daniel S, ”Exploring the design space for adaptive graphical user interfaces”, Proceedings of the working conference on Advanced visual interfaces, p. 201–208, 2006, ACM.

26

Co-adaptation Homme-Machine

8. Butoianu, Valentin and Catteau, Olivier and Vidal, Philippe and Broisin, Julien, ”Un Syst`eme a` Base de Traces pour la Recherche Personnalis´ee dObjets P´edagogiques: le cas dAriadne Finder”, Atelier” Personnalisation de l’apprentissage:

quelles approches pour quels besoins?”, 2011.

9. Solovey, Erin Treacy and Girouard, Audrey and Chauncey, Krysta and Hirshfield, Leanne M and Sassaroli, Angelo and Zheng, Feng and Fantini, Sergio and Jacob, Robert JK, ”Using fNIRS brain sensing in realistic HCI settings: experiments and guidelines”, Proceedings of the 22nd annual ACM symposium on User interface software and technology”, p. 157–166, 2009, ACM.

10. Mohammad Rezazadeh, I and Firoozabadi, Mohammad and Hu, Huosheng and Hashemi Golpayegani, M, ”Co-Adaptive and Affective Human-Machine Interface for Improving Training Performances of Virtual Myoelectric Forearm Prosthesis”, 2012, IEEE.

11. Gilleade, Kiel and Dix, Alan and Allanson, Jen, ”Affective videogames and modes of affective gaming: assist me, challenge me, emote me”, 2005.

12. Bersak, Daniel and McDarby, Gary and Augenblick, Ned and McDarby, Phil and McDonnell, Daragh and McDonald, Brian and Karkun, Rahul, ”Intelligent biofeed- back using an immersive competitive environment”, Paper at the Designing Ubiq- uitous Computing Games Workshop at UbiComp, 2001.

13. Baljko, Melanie and Tenhaaf, Nell, ”The aesthetics of emergence: Co-constructed interactions”, ACM Transactions on Computer-Human Interaction (TOCHI), 2008, ACM.

14. Cliff, Dave, ”hpDJ: An automated DJ with floorshow feedback” Consuming Music Together, p. 241–264, 2006, Springer.

15. Bersak, Daniel and McDarby, Gary and Augenblick, Ned and McDarby, Phil and McDonnell, Daragh and McDonald, Brian and Karkun, Rahul, ”Unsupervised learn- ing”, Advanced Lectures on Machine Learning, p. 72–112, 2004, Springer.

16. Na¨ım, Patrick and Wuillemin, Pierre-Henri and Leray, Philippe and Pourret, Olivier and Becker, Anna, ”R´eseaux bay´esiens”, 2011, Eyrolles.

17. LUX, M Augustin, ”Bayesian Programming and Learn-ing for Multi-Player Video Games”, 2006, Coll`ege de France.

18. T. Minka, J. Winn, J. Guiver, and D. Knowles, Infer.NET 2.5, Microsoft Research Cambridge, 2012. http://research.microsoft.com/infernet

Co-adaptation Homme-Machine

27

7

Annexes

A

Rolling ball

Homme-Machine 27 7 Annexes A Rolling ball Fig. 9. Capture d’´ecran de Rolling Ball. B Questionnaire

Fig. 9. Capture d’´ecran de Rolling Ball.

B Questionnaire

28

Co-adaptation Homme-Machine

28 Co-adaptation Homme-Machine Fig. 10. Questionnaire appliqu´e a` la fin du jeu. C Tables de probabilit´es

Fig. 10. Questionnaire appliqu´e a` la fin du jeu.

C Tables de probabilit´es des variables du niveau

Strat´egique(t)

Strat´egie (t)

Simplifier

1

Complexifier

0

Explorer

0

D Tables de probabilit´es des variables du niveau Tactique

(t)

Co-adaptation Homme-Machine

29

 

Physique Boule (t)

Strat´egie (t)

Simplifier

Complexifier

Explorer

Tr`es facile

0

0

0

Facile

1

1

1

Difficile

0

0

0

Tr`es difficile

0

0

0

 

Structure Plateau (t)

Strat´egie (t)

Simplifier

Complexifier

Explorer

Tr`es facile

0

0

0

Facile

1

1

1

Difficile

0

0

0

Tr`es difficile

0

0

0

 

Comportement Agent (t)

Strat´egie (t)

Simplifier

Complexifier

Explorer

Tr`es facile

0

0

0

Facile

1

1

1

Difficile

0

0

0

Tr`es difficile

0

0

0

E Tables de probabilit´es des variables du niveau Action

(t)

   

Friction(t)

 

Physique Boule (t)

Tr`es facile

Facile

Difficile

Tr`es difficile

Petite

0

0

0.6

1

Moyenne

0

0.4

0.4

0

Grande

1

0.6

0

0

   

Rebond(t)

 

Physique Boule (t)

Tr`es facile

Facile

Difficile

Tr`es difficile

Petite

1

0.6

0

0

Moyenne

0

0.4

0.4

0

Grande

0

0

0.6

1

30

Co-adaptation Homme-Machine

   

Diamants(t)

 

Structure Plateau (t)

Tr`es facile

Facile

Difficile

Tr`es difficile

Peu

1

0.8

0

0

Normal

0

0.2

0

0

Beaucoup

0

0

0.6

0

Tous

0

0

0.4

1

   

Configuration(t)

Structure Plateau (t)

Tr`es facile

Facile

Difficile

Tr`es difficile

Centre

1

0. 6

0

0

Tous

0

0.4

0.4

0

Bords

0

0

0.2

0.4

   

Raisonnement(t)

Comportement (t)

Tr`es facile

Facile

Difficile

Tr`es difficile

Intelligent

1

1

0.8

0.6

Al´eatoire

0

0

0.2

0.4

   

Mouvement(t)

 

Comportement (t)

Tr`es facile

Facile

Difficile

Tr`es difficile

Calme

1

0. 6

0

0

Normal

0

0.4

0.4

0

Brusque

0

0

0.6

1

F Tables de probabilit´es des variables du niveau Strat´egique (t+1)

Co-adaptation Homme-Machine

31

 

Strat´egie (t+1)

 

Strat´egie

 

Simplifier

 

Performance

 

Bon

Maˆıtrise

Bonne

Moyenne

Mauvaise

Simplifier

 

0.1

 

0.2

 

0.3

Complexifier

 

0.9

 

0.8

 

0.7

Explorer

 

0

 

0

 

0

 

Strat´egie (t+1)

 

Strat´egie

 

Simplifier

 

Performance

 

Moyenne

 

Maˆıtrise

Bonne

Moyenne

Mauvaise

Simplifier

 

0.3

 

0.4

 

0.5

Complexifier

 

0.7

 

0.6

 

0.5

Explorer

 

0

 

0

 

0

 

Strat´egie (t+1)

 

Strat´egie

 

Simplifier

 

Performance

 

Mauvaise

 

Maˆıtrise

Bonne

Moyenne

Mauvaise

Simplifier

 

0.8

 

0.9

 

0.95

Complexifier

 

0.2

 

0.1

 

0.05

Explorer

 

0

 

0

 

0

Strat´egie (t+1)

   

Strat´egie

 

Complexifier

Performance

 

Bonne

Maˆıtrise

Bonne

Moyenne

Bonne

Simplifier

0.1

0.2

0.6

Complexifier

0.8

0.7

0.4

Explorer

0.1

0.1

0

 

Strat´egie (t+1)

   

Strat´egie

   

Complexifier

 

Performance

   

Moyenne

   

Maˆıtrise

 

Bonne

 

Moyenne

 

Grande

 

Simplifier

 

0.3

 

0.4

 

0.7

 

Complexifier

 

0.65

 

0.6

 

0.3

 

Explorer

 

0.05

 

0.1

 

0

 
 

Strat´egie (t+1)

   

Strat´egie

   

Complexifier

 

Performance

   

Grande

   

Maˆıtrise

 

Bonne

 

Moyenne

 

Grande

 

Simplifier

 

0.7

 

0.8

 

0.9

 

Complexifier

 

0.3

 

0.2

 

0.1

 

Explorer

 

0

 

0

 

0

 

32

Co-adaptation Homme-Machine

Strat´egie (t+1)

 

Strat´egie

 

Explorer

Performance

 

Bonne

Maˆıtrise

Bonne

Moyenne

Grande

Simplifier

0.2

0.35

0.4

Complexifier

0.6

0.55

0.4

Explorer

0.2

0.1

0.2

Strat´egie (t+1)

 

Strat´egie

 

Explorer

Performance

 

Moyenne

Maˆıtrise

Bonne

Moyenne

Grande

Simplifier

0.35

0.3

0.4

Complexifier

0.55

0.5

0.4

Explorer

0.1

0.2

0.2

Strat´egie (t+1)

 

Strat´egie

 

Explorer

Performance

 

Mauvaise

Maˆıtrise

Bonne

Moyenne

Grande

Simplifier

0.7

0.75

0.8

Complexifier

0.3

0.25

0.2

Explorer

0

0

0

Co-adaptation Homme-Machine

33

G Tables de probabilit´es des variables du niveau Tactique

(t+1)

 

Physique Boule(t+1)

Strat´egie (t+1)

 

Simplifier(t)

 

Physique Boule (t)

Tr`es facile

Facile

Difficile

Tr`es difficile

Tr`es facile

0.95

0. 8

0.1

0.05

Facile

0.05

0.2

0.8

0.15

Difficile

0

0

0.1

0.7

Tr`es difficile

0

0

0

0.1

 

Physique Boule(t+1)

Strat´egie (t+1)

 

Complexifier(t)

 

Physique Boule (t)

Tr`es facile

Facile

Difficile

Tr`es difficile

Tr`es facile

0.3

0

0

0

Facile

0.7

0.3

0

0

Difficile

0

0.7

0.2

0.05

Tr`es difficile

0

0

0.8

0.95

 

Physique Boule(t+1)

Strat´egie (t+1)

 

Explorer(t)

 

Physique Boule (t)

Tr`es facile

Facile

Difficile

Tr`es difficile

Tr`es facile

0.25

0.25

0.25

0.25

Facile

0.25

0.25

0.25

0.25

Difficile

0.25

0.25

0.25

0.25

Tr`es difficile

0.25

0.25

0.25

0.25

 

Structure Plateau(t+1)

Strat´egie(t+1)

 

Simplifier(t)

 

Structure Plateau (t)

Tr`es facile

Facile

Difficile

Tr`es difficile

Tr`es facile

0.95

0. 8

0.1

0.05

Facile

0.05

0.2

0.8

0.15

Difficile

0

0

0.1

0.7

Tr`es difficile

0

0

0

0.1

34

Co-adaptation Homme-Machine

 

Structure Plateau(t+1)

Strat´egie (t+1)

 

Complexifier(t)

 

Structure Plateau (t)

Tr`es facile

Facile

Difficile

Tr`es difficile

Tr`es facile

0.3

0

0

0

Facile

0.7

0.3

0

0

Difficile

0

0.7

0.2

0.05

Tr`es difficile

0

0

0.8

0.95

 

Structure Plateau(t+1)

Strat´egie (t+1)

 

Explorer(t)

 

Structure Plateau (t)

Tr`es facile

Facile

Difficile

Tr`es difficile

Tr`es facile

0.25

0.25

0.25

0.25

Facile

0.25

0.25

0.25

0.25

Difficile

0.25

0.25

0.25

0.25

Tr`es difficile

0.25

0.25

0.25

0.25

 

Comportement Agent(t+1)

Strat´egie (t+1)

 

Simplifier(t)

 

Comportement Agent (t)

Tr`es facile

Facile

Difficile

Tr`es difficile

Tr`es facile

0.95

0. 8

0.1

0.05

Facile

0.05

0.2

0.8

0.15

Difficile

0

0

0.1

0.7

Tr`es difficile

0

0

0

0.1

 

Comportement Agent(t+1)

Strat´egie (t+1)

 

Complexifier(t)

 

Comportement Agent (t)

Tr`es facile

Facile

Difficile

Tr`es difficile

Tr`es facile

0.3

0

0

0

Facile

0.7

0.3

0

0

Difficile

0

0.7

0.2

0.05

Tr`es difficile

0

0

0.8

0.95

 

Comportement Agent(t+1)

Strat´egie (t+1)

 

Explorer(t)

 

Comportement Agent (t)

Tr`es facile

Facile

Difficile

Tr`es difficile

Tr`es facile

0.25

0.25

0.25

0.25

Facile

0.25

0.25

0.25

0.25

Difficile

0.25

0.25

0.25

0.25

Tr`es difficile

0.25

0.25

0.25

0.25

H Tables de probabilit´es des variables du niveau Action

(t+1)

Co-adaptation Homme-Machine

35

 

Friction(t+1)

Physique Boule (t+1)

 

Tr`es facile

Friction(t)

Petite

Moyenne

Grande

Petite

0

0

0

Moyenne

0.3

0.2

0

Grande

0.7

0.8

1

 

Friction(t+1)

Physique Boule (t+1)

 

Facile

Friction(t)

Petite

Moyenne

Grande

Petite

0

0

0

Moyenne

0.4

0.3

0.2

Grande

0.6

0.7

0.8

 

Friction(t+1)

Physique Boule (t+1)

 

Difficile

Friction(t)

Petite

Moyenne

Grande

Petite

0.8

0.7

0.4

Moyenne

0.2

0.3

0.6

Grande

0

0

0

 

Friction(t+1)

Physique Boule (t+1)

 

Tr`es difficile

Friction(t)

Petite

Moyenne

Grande

Petite

1

0.8

0.7

Moyenne

0

0.2

0.3

Grande

0

0

0

 

Rebond (t+1)

Physique Boule (t+1)

Tr`es facile

Rebond(t)

Petit

Moyen

Grand

Petit

1

0.8

0.7

Moyen

0

0.2

0.3

Grand

0

0

0

 

Rebond (t+1)

Physique Boule (t+1)

 

Facile

Rebond(t)

Petit

Moyen

Grand

Petit

0.8

0.7

0.6

Moyen

0.2

0.3

0.4

Grand

0

0

0

 

Rebond (t+1)

Physique Boule (t+1)

 

Difficile

Rebond(t)

Petit

Moyen

Grand

Petit

0

0

0

Moyen

0.6

0.3

0.2

Grand

0.4

0.7

0.8

36

Co-adaptation Homme-Machine

 

Rebond (t+1)

Physique Boule (t+1)

Tr`es difficile

Rebond(t)

Petit

Moyen

Grand

Petit

0

0

0

Moyen

0.3

0.2

0

Grand

0.7

0.8

1

   

Diamants (t+1)

 

Structure Plateau (t+1)

 

Tr`es facile

 

Diamants

1-2

3-4

 

5-6

7-8

9-10

11-12

13-14

 

15

1-2

0.7

0.5

0.55

0.4

0.25

 

0.1

 

0

 

0

3-4

0.2

0.3

0.45

0.5

0.45

 

0.2

 

0.1

 

0

5-6

0.1

0.2

 

0.1

0.1

 

0.2

 

0.4

 

0.2

0.1

7-8

0

0

 

0

 

0

 

0.1

 

0.2

 

0.4

0.2

9-10

0

0

 

0

 

0

 

0

 

0.1

 

0.2

0.4

11-12

0

0

 

0

 

0

 

0

 

0

 

0.1

0.2

13-14

0

0

 

0

 

0

 

0

 

0

 

0

0.1

15

0

0

 

0

 

0

 

0

 

0

 

0

 

0

   

Diamants (t+1)

 

Structure Plateau (t+1)

 

Facile

 

Diamants

1-2

3-4

5-6

7-8

9-10

11-12

13-14

 

15

1-2

0.2

0.1

0.1

0.1

0.1

 

0

 

0

 

0

3-4

0.6

0.2

0.3

0.35

0.2

0.05

 

0

 

0

5-6

0.2

0.6

0.5

0.35

0.3

 

0.2

0.05

 

0

7-8

0

0.1

0.1

0.2

0.4

 

0.3

 

0.2

0.05

9-10

0

0

0

 

0

 

0

 

0.4

 

0.3

0.2

11-12

0

0

0

 

0

 

0

0.05

 

0.4

0.3

13-14

0

0

0

 

0

 

0

 

0

0.05

0.4

15

0

0

0

 

0

 

0

 

0

 

0

0.05

   

Diamants (t+1)

 

Structure Plateau (t+1)

 

Difficile

 

Diamants

1-2

3-4

5-6

 

7-8

9-10

11-12

13-14

15

1-2

0.05

0

0

 

0

0

0

0

0

3-4

0.4

0.05

0

 

0

0

0

0

0

5-6

0.3

0.4

0.05

0

0