Vous êtes sur la page 1sur 20

Modles de tche

Introduction : tche, activit.


Analyse de tches, modle de tche, activit sont des termes issus de lergonomie
qui se sont propags dans de nombreux domaines, du gnie logiciel, de lintelligence
artificielle, de la robotique, pour aboutir au domaine du dialogue homme machine
[Pierrel, 87]. Si dans leurs utilisations ces termes ne recouvrent pas toujours exactement
les mmes notions, lobjectif de base est cependant danalyser, de reprsenter et de
contrler la suite des actes dun utilisateur. Cette suite dactes, rellement effectue par
lutilisateur pour rsoudre un problme, sera appele activit. Elle nest de fait connue et
explicable qua posteriori, une fois le but atteint et vis--vis de lobjectif rellement vis.
Par convention nous distinguons :
un acte, il est produit par un utilisateur. Il a pour effet de modifier le monde ou de
changer un tat mental,
une action, elle est produite par la machine. Elle se dcompose en oprations
lmentaires relativement au programme implment. Il est vident que les actions
dfinies en machine conditionnent les actes permis lutilisateur et leur donnent
leur granularit.
La planification cognitive
Les recherches sur la planification ont t nourries par la psychologie cognitive et
lintelligence artificielle, les deux disciplines sinfluenant dailleurs trs fortement. Pour
lhumain, il y a plusieurs faons de planifier son action pour rsoudre un problme [Hoc,
89] :
de manire ascendante,
de manire descendante.
(a) la planification ascendante part de lanalyse dtaille de la situation et tente
dvoquer des plans dj connus en les adaptant cette situation. Lvocation des plans
peut se faire partir dindices ou par analogie. Dans ABSTRIPS [Sacerdoti, 74] le robot
apprend hirarchiser les dtails des situations releves au cours de son dplacement.
Ces dtails serviront plus tard dindices de dclenchement du plan lorsquune situation
identique se re-prsente. Dans la 2me mthode, lanalogie est suggre par une mise
en relation de SRT (Systmes de Reprsentation des Traitements) dans des situations
diffrentes.
(b) La planification descendante dtaille un plan pour lappliquer une situation donne,
connaissant le but atteindre. Ladaptation du plan la situation peut se faire en
particularisant certaines variables du plan. On distingue plusieurs variantes

par dcomposition du but et hirarchisation en sous buts ( chaque sous but est
associ un plan de rsolution),
en particularisant un but gnral un but spcifique,
en traitant les interfrences entre buts lorsquils ne peuvent tre dcomposs
indpendamment.
La planification chez lhumain dpend de la nature du problme rsoudre. On distingue
trois grands types de problmes :
les problmes de transformation dtats : chaque fois quun problme peut se
dcrire comme une succession dtats dtermins parcourir,
les problmes dinduction de structures : se ramnent une recherche de
relations dans un ensemble (par ex. complter les termes dune srie connaissant
les premiers lments),
les problmes de conception : dans ce type de problme le but est imprcis voire
compltement indfini ou dfini par un ensemble de contraintes (par ex. en
conception architecturale, obtenir une pice lumineuse et agrable).
Les stratgies de recherche ou de dveloppement du plan dpendent de ces grands
types de problmes. On distingue :
la stratgie essais-erreurs qui consiste explorer le graphe dtats au moyen
dheuristiques ou avec des techniques doptimisation, pour trouver le chemin (si
possible le meilleur) qui permet datteindre le but,
la stratgie fins-moyens avec laquelle on value chaque pas, lcart entre la
situation courante et ltat but pour dterminer les oprateurs mettre en uvre
pour rduire cet cart (cest le GPS, General Problem Solver de Newell [Newell,
1959]),
la stratgie de test dhypothse (GRI, General Rule Inducer de Simon et Lea
[Simon, 1974]) dans laquelle des schmas dhypothses sont tests, dans lordre
du gnral au particulier, selon une organisation en espaces dexemples, cest-dire par focalisation puis par balayage (autrement dit en largeur dabord puis en
profondeur),
la stratgie opportuniste, qui consiste tenter des actions selon la situation de
manire se rapprocher de situations connues, si possible en se ramenant un
problme de transformation dtats. pour lesquelles on dispose dj de solutions.
En IA, la reprsentation des plans se fait laide darbres et/ou ou de graphes, de
schma [Bobrow et Norman, 1975] ou de frame [Minsky, 1975], ou enfin laide de
scripts [Shank et Abelson, 1977]. Il existe une abondante littrature en IA sur la
planification. Hayes-Roth dfinit lensemble des lments ncessaires la planification
que nous retiendrons en termes de synthse :
(1) les units dexcution (procdures, agents) et les units de dcision
(focalisation, contrle),
(2) les abstractions de plan (intention, but, schmas, objets, stratgies, tactiques),

(3) lunit de mta-planification (type de problme, contraintes sur le plan,


heuristiques, critres dvaluation des hypothses),
(4) les units de raffinement (dmarche globale, but final, macro-instructions,
actions),
(5) les connaissances du domaine.
La planification dans le dialogue
Le problme en DHM est idalement de prdire les actes ou au moins de les situer dans
un cadre rfrentiel prcis pour orienter le dialogue, voire le planifier. Pour cela on parle,
peut-tre abusivement, de modle de tche (il serait peut-tre mieux de parler de modle
dactivit sachant dautre part que ce modle dpend de lutilisateur), pour reprsenter
lensemble des connaissances ncessaires la planification des actions de la machine.
Une tche se dfinit comme la ralisation dun but dans un contexte et selon une
procdure dont la reprsentation et la prcision varient en fonction des objectifs dirigeant
lanalyse. Cest en effet du ressort de lanalyste de dire ce quil entend par tche.
Souvent il adopte un point de vue fonctionnaliste : cest une reprsentation plus ou moins
abstraite des actes potentiels dun utilisateur. Le degr de granularit des actes est trs
variable, leur dcomposition ou leur structuration est souvent arbitraire. La complexit
des tches dpend bien sr des domaines dapplication : elle va de la routine (contrle
de processus) linnovation (problmes de conception) en passant par tous les stades
de complexit intermdiaires. Dans le premier cas on conoit bien quelle soit fortement
structure et que lactivit soit planifiable a priori, dans lautre elle ne lest pas du fait de
limprvisibilit mme des processus de cration. Il est alors tentant pour le concepteur
du dialogue de reprsenter des formes de comportements types pour canaliser et
interprter lactivit de lutilisateur. Remarquons cependant que dans de nombreuses
situations lutilisateur ne suivra pas ncessairement lordonnancement prvu dans le
modle de tche mme pour des tches risque et/ou trs contraintes [Visser, 93].
En fait, ce modle nest donc utile la machine que pour tenter de se reprsenter le
sens des actions dun utilisateur typique et planifier son propre comportement.
Lintrt de la notion de tches en DHM est double : pour lanalyse et pour la
modlisation. Pour lanalyse cet intrt rside dans la conception et lvaluation des
systmes informatiques et de leurs interfaces. Lintrt de modliser la tche est lui aussi
double. Il est de servir de cadre la conduite du dialogue (perspective inter-actionnelle)
et daider la rsolution des problmes de rfrence (en replaant les noncs dans un
cadre pragmatique). Au niveau reprsentationnel en effet, il apparat que le modle de
tche peut servir de support lexpression et la reprsentation de la dynamique de
linteraction, comme base du modle de dialogue. En particulier, le modle de tche est
un support intressant pour la reprsentation et la mise en uvre des contraintes du
dialogue issues du squencement entre tches et des conditions dactivation des tches,
ainsi que pour la gestion du partage des tches entre le systme et loprateur.
Pour le DHM nous pouvons retenir que :
(a) la tche est une reprsentation abstraite des oprations logiquement possibles
pour atteindre un objectif,

(b) lactivit est la squence dactes rellement effectus dans le contexte dune
tche donne,
(c) lacte est effectu par lutilisateur en vue de produire un effet dans le monde
rfrentiel de la machine en rponse (ou pour provoquer) des actions de la
machine.
Enfin rappelons les prsupposs noncs dans le chapitre
"Apprentissage, langue et dialogue : que retenir ?" qui visent :

1,

paragraphe

rendre la machine apte acqurir de nouvelles actions (ou scnarios),


permettre une grande varit d'activits diffrentes pour une mme tche (pour
respecter le principe d'ergonomie).
En pratique, on distingue deux types de modles de tche : les modles explicites et les
modles implicites. Nous examinons ci-aprs leurs capacits respectives satisfaire les
contraintes ci-dessus, puis nous proposons un modle possible.

Les modles de tche explicites


Un modle de tche explicite, appel aussi plan hirarchique, dcrit de manire explicite
la succession des actions (en termes deffets, de conditions, dordonnancement)
conduisant un but donn. Ce modle convient bien aux tches dites de routine, car les
tches tant dfinies une fois pour toutes, le systme peut parfaitement contrler le
droulement dun plan.
Classiquement les tches sont hirarchises en plans et/ou sous plans ou sous tches,
scnarios, etc., jusquaux scripts qui instancient les actions lmentaires. Le script tant
une structure rattache un plus haut niveau un scnario et ainsi de suite jusqu la
racine de la structure qui est la tche. On peut ainsi obtenir une certaine rcursivit des
reprsentations. Le nombre de niveaux de dcomposition peut tre trs variable dune
application une autre. Pour Valot [Valot et al., 91], les scripts sont des schmas dont
les attributs dcrivent lensemble des informations ncessaires lexcution dune tche
lmentaire (ouvrir un fichier, dplacer un objet). Les scnarios sont dfinis comme
des squences probables de scripts. Ils sont dcrits laide de scores que lon attribue
aux diffrentes successions possibles de scripts au cours du dialogue. De la mme
faon, les plans et/ou les sous plans sont dfinis en termes de probabilits attaches aux
diverses squences de scnarios. Plusieurs formes de reprsentation sont possibles :
arbre ET/OU, rseau ATN, rseau de Ptri, CLG [Moran, 81], GOMS [Card, 83], TAG
[Payne, 86], MAD [Pierret-Golbreich, 89], ETAG [Tauber, 90], TKS [Johnson, 91], UAN
[Hartson, 92], etc. A ces formes sont associes des mthodes de parcours qui
conditionnent le processus de planification.
Le mode de reprsentation le plus habituel est statique : il dcrit la combinatoire des
actions quil est thoriquement possible denchaner pour excuter une tche avec
succs. Du ct formel, on utilise les notations suivantes pour crire les relations entre
actions :

Succession fortuite dans le temps de deux actions


ai > aj (se lit aj suit fortuitement ai), par exemple : planter > pleuvoir,
Succession finalise de deux actions (l'une est le but de l'autre),
ai >> aj (se lit Aj est la raison de ai), par ex. : planter >> rcolter,
Succession motive ou entrane par la situation,
aj ai (se lit aj accompli pour raliser ai), par ex. : (faire un trou) (planter),
cette relation se lit aussi comme : aj drive de ai si ai est de plus haut niveau,
Causalit (provoqu par les lois du monde ou par volont),
ai aj (se lit ai est cause de aj), par ex. : faner tomber)
Voici par exemple un modle de tche explicite (fig. 1) reprsent par un graphe ET/OU :

Reprsentation statique

Tche

Plan(1)

Plan(2)

Scn(1,1) Scn(1,2) etc.

Script(1,1,1) etc. Script(1,2,1) etc.


a(1) a(2) a(3) ..............................

Plan(3)

etc.

Scn(2,1)

Script(2,1,1) etc.
temps
a(n) : suite d'actions effectues

Fig. 1 : Dcomposition arborescente de tches par arbre ET/OU. Cette reprsentation se lit : pour faire la
tche il faut excuter le Plan(1) ET le Plan(2), OU excuter le plan(3). De mme au niveau infrieur, pour
excuter le Plan(1) il faut excuter les scnarios Scn(1,1) ET Scn(1,2), et ainsi de suite.

Cette reprsentation dfinit une action lmentaire a(n) comme une structure spcialise
instancie () partir dun script et effectue linstant n. Cette action normalement
applique avec succs la situation (n-1), la fait passer ltat (n) (la relation se lit
cause-de), ce qui se formalise par :
a(n) : a(n) , a(n) (n)
Chaque action est active par un ou plusieurs actes de lutilisateur (verbal, gestuel, etc.).
Il existe une pragmatique P qui associe chaque action a une suite dactes {} de
communication qui dclenche a :
a : {} a

Tous les actes ne sont pas oprants vis--vis dune action il peut y avoir par exemple
des actes mta-discursifs. Ils sont tels que : : , o est une action nulle qui par
dfinition appartient = { a }
Lensemble des actes de lutilisateur est thoriquement illimit. On dfinit sur
lensemble des actes la relation dordre partiel de squentialit () qui confre toute
sous squence dactes, une structure de demi-treillis infrieur. Cette relation () permet
de dfinir un ordonnancement des actes et donc, corrlativement, des actions
dclenches. Dans lexemple de la fig. 2 nous avons :
{1} a(1) (1) avec a(1) 6 s5
{2 3} a(2) (2) avec a(2) 5 s4
s5 ET s4 S2
{5}
{4 6} a(3) (3) avec a(3) 3
{7}a(4) (4) avec a(4) 2 s2
3 ET s2 S1
S2 ET S1 P1
Si (4) est la situation correspondant au but quil fallait atteindre, alors ce but est non
seulement atteint mais il est satisfait. En consquence on saperoit que le locuteur a
droul le plan P1 pour latteindre.

Actes (verbaux et gestuels)


5
3
Actes en
intention

a(1)

a(2)

(0)

(1)

(2)

temps

a(3)

a(4)
(3)

(4)
But atteint
P1 ralis
But satisfait

Actions et situations
1

S1
Intention en
action

s2

P1

s4 3

S2
s5
Plans

Scnarios

2
4

Scripts

Fig. 2 : dans cet exemple le plan est ralis par instanciation des scripts 6, 5, 3, 2, cest--dire aprs
excution des actions {1} a(1), {2 3} a (2), {5} , {4 6} a (3), {7} a (4)

Ces modles classiques peuvent tre dcors dattributs rfrenant des tches, des
sous tches ou des actions lmentaires, ce qui fournit les moyens lexcution de
reconnatre les tches faites par loprateur. Dans cette approche cependant, une partie
des connaissances est laisse de ct, notamment les dpendances et les contraintes
entre les plans, les conditions portant sur le dclenchement ou lactivation des plans ;
ces contraintes sont soit mises en uvre au niveau des appels vers le noyau fonctionnel
(tests pour vrifier la validit dun appel), soit dilues dans les rgles de syntaxe : on en
peroit une manifestation de surface au niveau de la syntaxe dinteraction autorise mais
on a perdu laccs aux causes profondes. Pour lever ce type de limitation, les modles
fonctionnels [Foley, 88] prsentent des modles de tche deux niveaux de profondeur :
la surface de lactivit et lenchanement causal.
Nous ne dtaillerons pas davantage ce type de modle, lessentiel tant de comprendre
ses mcanismes pour le problme de lapprentissage qui nous motive. Nous voyons que
un modle explicite nous ne pouvons intervenir que sur le niveau pragmatique, cest-dire en termes formels, sur lapplication P qui associe p() (lensemble des parties de
lensemble des actes) A (lensemble fini des actions). Ce modle est donc insuffisant
pour notre propos puisque lensemble A ne peut voluer dans le temps.

Les modles de tche implicites


Un modle de tche implicite ne dcrit pas la succession des actions mais seulement le
but atteindre et des moyens (ou contraintes) pour latteindre (le cheminement nest pas
explicit). Ce modle convient aux tches dites innovantes ou de conception dans
lesquelles lespace de recherche nest pas compltement connu et o les connaissances
du domaine ne sont pas clairement exprimables.
Durant la dernire dcennie, diffrents mcanismes issus de lIA ont t proposs pour
simuler le comportement des concepteurs :
lexploration darbres de buts [Mahler, 85], [Mittal, 85],
la slection et lexpansion de plans de conception [Brown, 85],
la proposition et la rvision dhypothses fondes sur la satisfaction et la
propagation des contraintes [Marcus, 86],
la modification de solutions presque bonnes [Stallman, 77], [Howe, 88].
On distingue souvent trois grandes catgories de mthodes dinnovation :
les mthodes analogiques qui sappuient sur les ressemblances qui peuvent
exister entre le nouveau problme et dautres problmes connus lobjectif
consiste explorer les concepts qui sont en relation avec le concept de dpart ,
les mthodes antithtiques qui sappuient sur les oppositions qui peuvent exister
entre le nouveau problme et dautres problmes connus lobjectif consiste
explorer des concepts contraires au concept de dpart ,
les mthodes alatoires qui sappuient sur le hasard pour explorer des concepts
qui semblent sans aucun rapport avec le problme pos.
Cela conduit reprsenter le modle de tche par :
le but B atteindre,
des moyens ou des contraintes pour atteindre le but,
et des algorithmes de mutation de scripts prototypes permettant dajuster, de
modifier, de gnraliser ou de spcialiser des scripts ayant dj t utiliss dans
danciennes situations.
Nous allons tudier plus avant une reprsentation adquate pour nos objectifs partir de
ce deuxime modle de tche. Notons cependant que les deux types de reprsentation,
explicite et implicite, seront utiles pour modliser lapprentissage de la tche. Dans un
premier temps un modle implicite permet de prendre en compte de nouveaux plans, qui
ajouts un modle explicite incrmental permet de recomposer ou de contrler le
droulement de tches itratives.

Lapprentissage de la tche
Comme nous lavons annonc ci-dessus, si nous sommes intresss par la modlisation
du dialogue dans les situations de conception pour lesquelles il nest pas possible de
prvoir toutes les activits lavance, puisque par dfinition la conception est une activit
cratrice. Cependant on saperoit chez les architectes par exemple que lacte de
conception passe souvent par une rutilisation de plans architecturaux anciens,
simplement rorganiss. Dans ces conditions on a intrt apprendre un plan (pour faire
une tche ou rsoudre un problme) en le construisant pendant le droulement du
dialogue partir des buts poursuivis par larchitecte. Lapprentissage du plan permettra
ultrieurement de lassister de manire cooprative ou mme danticiper de manire
constructive. Au-del de ce simple exemple notons galement limportance de
lapprentissage par laction en psychologie du comportement [Piaget 64].
Les problmes soulevs propos de lapprentissage de la tche sont :
lacquisition dun nouveau plan daction, pertinent pour la tche en question,
sa caractrisation par rapport aux autres tches,
lassignation dun but dans le contexte du dialogue.
Puis, dans un deuxime temps, pour lassistance lutilisateur, les problmes sont :
la reconnaissance du but poursuivi partir des actions observes, pour infrer la
logique daction gnrale de lutilisateur et identifier son plan daction,
lactivation pertinente des stratgies dassistance lutilisateur dans le cours du
dialogue.
Lacquisition du plan peut tre ralise en utilisant des sous dialogues adapts [Caelen
95a]. Par exemple :
U : Dessine une maison
M : Quest-ce quune maison ? Montre-moi en la dessinant
U : "srie dactes pour faire le dessin" par exemple
(dessiner(carr) < dessiner(triangle)) dessiner(maison)
avec (activer(carr) < poser(carr)) dessiner(carr)
et ((slect(triangle) dupliquer(triangle)) < dplacer(triangle)) dessiner(triangle)
M : Il sagit bien dune maison nest-ce pas ?
U : Oui.
Dans cette courte squence dialogique mene avec une stratgie directive de la part de
la machine, les actions ont toutes rapport au mme but B = dessin(maison). La
confirmation permet de sassurer que le but est bien satisfait. Il y aurait de nombreuses
autres stratgies possibles, ceci nest quun exemple.
Au dpart, on suppose que lon dispose dactions lmentaires bien dfinies (que lon

trouve gnralement dans les diteurs graphiques). Puis, aprs que lutilisateur a pos
un but, il sagit pour la machine dobserver, dordonner et dassocier cette squence
dactions au but pos. Nous sommes donc ici dans un contexte matre apprenant o le
matre est lutilisateur et lapprenant est la machine.

pendant la phase dobservation la machine enregistre la srie dactes effectus


par lutilisateur, cest--dire son activit ;

partir de cet enregistrement, la machine tente de distinguer des relations entre


les actes, par exemple, la succession dans le temps ou la causalit ; pour tablir
un ordre partiel entre les actes ; et

dans la phase d'association, on attache le plan obtenu au but poursuivi par


lutilisateur.

A la fin de cette tape, la machine est capable de recommencer la tche partir dune
demande de lutilisateur. Mais lapprentissage ne sarrte pas ici. La nouvelle tche
apprise doit tre gnralise, spcialise ou intgre comme une sous tche une
tche plus complexe. Cette assimilation permet la formation dune abstraction lie au but
pos par lutilisateur. De cette faon, la connaissance acquise volue pour se rapprocher
du concept rel dtenu par lutilisateur.
Reprsentation du plan
Une difficult majeure est la manire de reprsenter les connaissances pour supporter
cet apprentissage, car on fait lhypothse que les connaissances acquises par la
machine sont incompltes et dynamiques et quelles doivent rendre explicites les
diffrents rapports entre les actions. La modlisation dun monde quintroduit le concept
daction exige la prise en compte de connaissances temporelles. Diverses approches ont
t proposes en Intelligence Artificielle (IA) pour tenter une modlisation des notions
temporelles comme lantriorit, le recouvrement, la simultanit entre actions, leur
causalit, etc. Diffrents travaux en raisonnement temporel ont t proposs, parmi
lesquels : le calcul situationnel de [McCarthy, 69], la logique temporelle de [MacDermott
82], le calcul dintervalles de [Allen 84] et la logique dintervalles de [Shoham 87].
Les ides ci-aprs sont bases sur le travail de Shoham qui dfinit dune manire
gnrale une proposition temporelle <i, p> laquelle associe une assertion logique p un
intervalle de temps i. La syntaxe et la smantique de cette logique sont dfinies dans
[Shoham 87] et [Dean, 90].
Pour parler de changements du monde, on utilise la notion dvnement, cest--dire, la
transition dune proposition dun tat un autre. En effet, considrons deux propositions
temporelles <(t1, t2), p> et <(t4, t5), p> telles que t2 prcde t4 (t2 t4) ; la transition de p
p qui se produit dans un instant t3 compris entre t2 et t4 est dtermine par un
vnement. La proposition temporelle <i, p> scrit HOLDS(i, p) et lintervalle i est le
couple ta\tb, o ta tb; mais pour souligner le rle dvnement dune expression
temporelle nous lcrirons OCCURS(i, p), lintervalle i o lvnement se produit est

linstant ta\tb, o ta = tb1. Par exemple :


OCCURS( t1, dessiner( triangle, x1, y1)) ET OCCURS( t2, dplacer( triangle, x2)) ET
OCCURS( t3, dessiner( carr, x3, y2)) ET OCCURS( t4, dplacer( carr, x4))

dcrit la squence dactions que lutilisateur a effectu pour dessiner une maison et dans
laquelle dessiner( triangle, x, y) reprsente laction de dessiner un triangle la position x
(o x est un vecteur) et de taille y. Chaque vnement correspond une action de base.
Chaque action de base est dfinie par une rgle la STRIPS qui permet de rcuprer
lensemble des propositions temporelles affectes par lexcution de laction. Par
exemple, la rgle simplifie suivante tablit les conditions et les effets pour laction
dplacer :
HOLDS( t0\t1, position( carr, x1 )) ET
OCCURS( t1, dplacer( carr, x2 )) ET HOLDS( t1\t2, position( carr, x2 ))

A partir de ces rgles, on introduit une relation de prcdence temporelle entre les
propositions. Par exemple, aprs la squence dactions pour dessiner la maison, on
rcupre les propositions suivantes :
HOLDS( t0\t1, dessin( triangle )) ET
HOLDS( t1\ta, dessin( triangle )) ET
HOLDS( t1\t2, position( triangle, x1 )) ET
HOLDS( t2\tb, position( triangle, x2 )) ET
HOLDS( t0\t3, dessin( carr )) ET
HOLDS( t3\tc, dessin( carr )) ET
HOLDS( t3\t4, position( carr, x3 )) ET
HOLDS( t4\td, position( carr, x4 ))

La figure 3, une adaptation dun time map [Dean 87], montre les propositions et leur
prcdence temporelle. Les lignes noires reprsentent les intervalles de temps et les
lignes pointilles la prcdence temporelle. Cette relation entre les propositions est
dduite dune part, par les rgles associes chaque action et dautre part, par les
dures de ralisation de la tche. Le premier cas est une relation forte qui oblige une
prcdence temporelle ncessaire. On nest pas capable de changer lordre
dexcution (avant de dplacer lobjet, il doit exister). Le deuxime cas entrane une
relation temporelle fortuite i. e. t2 t3 (le dessin du triangle avant le carr ne change rien
au rsultat final). Ces deux types de relation permettent de mieux apprhender la
combinaison temporelle des actions, et donc de mieux faire ressortir les paralllismes
possibles et les squencements obligatoires. De cette faon, on peut donc obtenir un
plan, non pas comme un ensemble de squences dactions, mais comme un ensemble

[Shoham 87] prsente une catgorisation des propositions temporelles. Par rapport celle-ci, une
proposition HOLDS(i, p) est quivalente une expression du type liquide et OCCURS(i, p) une
expression du type gestalt.

dactions partiellement contraintes dans le temps les unes par rapport aux autres et par
rapport certains faits.
La distinction entre ces deux types de relation nous permet de relier une srie dactions
qui sont dpendantes entre elles. Une action dpend dune autre si ses effets sont des
conditions par lexcution de lautre, cest--dire, sil existe une relation temporelle
ncessaire entre elles. On considre cette srie dactions comme une seule action. Cette
action compose est lie aux autres actions, aussi probablement composes, travers
une relation temporelle fortuite. Aprs avoir distingu les actions composes, on peut
appliquer des oprations de rduction dans chacune pour liminer les propositions
redondantes et simplifier le plan.
dessin(triangle)
dessin(triangle)
t1

to

t1
position(triangle, x1)
t1

ta
t2 position(triangle, x2)
t2

tb

dessin(carr)
to

dessin(carr)

t3
t3

tc

position(carr, x3)

t3

position(carr,x4)

t4
t4

td

Fig. 3. Les propositions et leur prcdence temporelle.

On peut rduire laction compose pour dessiner le carr au schma suivant (fig. 4) :
dessin(carr)
dessin(carr)
to

t3
t3

position(carr, x4)

t3

tc
td

Fig. 4 : Action compose aprs rduction.

cette rduction entrane llimination de laction dplacer et la modification de la cration

du carr directement la position x4.


Autre opration importante, que lon peut tenter aprs la sparation des actions
composes est la recherche de relations spatiales entre les objets sur lesquels elles sont
centres. Ltablissement des relations spatiales peut tre ralis travers les
dductions ralises par la machine et/ou travers laide directe de lutilisateur [Li 94].
Lobjet comme rsultat de linteraction
travers ce formalisme pour la reprsentation des connaissances, on est donc capable
de dcrire la squence dactions pour faire la tche mais aussi de produire des objets
comme rsultats de ces actions. Le but de lutilisateur est vu comme lensemble deffets
produits par la ralisation des actions. But et objet sont donc deux notions compltement
lies. Pour dcrire les objets, nous allons focaliser notre attention sur la squence
dactions observes et sur le rsultat des actions, dans le contexte du but atteindre.
Par exemple, les objets maison et lampe seront diffrents plus parce quils ont
t dessins avec des actions diffrentes que parce que leurs formes sont diffrentes.
Peut-tre que maison a t dessine en positionnant le triangle sur le rectangle alors
que lampe a t dessine en posant le triangle sur un cercle.
Le processus dassimilation ainsi que la reconnaissance des intentions prennent aussi
laction comme lment de base. Lutilisateur peut montrer deux squences diffrentes
pour faire la mme tche, mais le processus dassimilation nous permet, partir des
actions ralises, de former une abstraction plus gnrale. Ainsi, la connaissance de la
machine volue pour se rapprocher du concept exprim par lutilisateur. De la mme
faon, le processus de reconnaissance des intentions prend laction comme lment de
base. Cest partir des actions observes que la machine tente dinfrer le but de
lutilisateur. Nanmoins, comme nous lavons vu, il faut exprimer une squence dactions
par ses effets pendant la phase dordonnancement. Cette phase trouve, partir des
effets, des dpendances entre les actions et permet dliminer les actions redondantes
(cette phase complte la phase de rduction).
Lassimilation de la tche
Aprs avoir appris une tche, une autre considration importante est lassimilation de
celle-ci par rapport aux tches dj apprises. Le rsultat de cette assimilation est une
abstraction du plan pour atteindre le but poursuivi par lutilisateur. Depuis plusieurs
sessions de travail, la connaissance de la machine volue pour se rapprocher du
concept exemplifi par lutilisateur. Lapprentissage dans cette tape, est le
perfectionnement des connaissances, lamlioration des performances au cours de
lexprience. On part de lhypothse que les connaissances incorpores par le systme
sont incompltes et quelles voluent chaque fois que lutilisateur montre un nouvel
exemple dun mme concept.
Il y a diffrents paradigmes pour lapprentissage automatique [Carbonell, 89]. Les quatre
paradigmes dapprentissage principaux sont : linductif, lanalytique, le gntique et le
connexionniste. Bien que ces paradigmes aient le mme objectif, ils apprennent de faon
trs diffrente. Toutefois, tous les quatre voient le processus dapprentissage comme
une modification de la connaissance courante de lapprenant par interaction avec une

source dinformation extrieure. Dans notre cas, o lutilisateur tente de montrer son
savoir-faire la machine, et o la machine et lutilisateur doivent partager des ressources
et faire des raisonnements collectivement, les connaissances doivent tre codifies de
manire comprhensible par tous les deux [Carbonell, 83]. Les paradigmes gntique
et connexionniste ne reprsentent pas leurs connaissances de faon simple
interprter par lutilisateur. Il semble donc quil soit plus difficile de les utiliser ici.
Pour la formation dun concept, notre travail sappuie sur le paradigme inductif en
utilisant des stratgies dapprentissage de concepts par lexemple . Lide principale
est ladaptation de la description dune tche chaque fois que lutilisateur donne une
instance de cette tche. Ds que lon apprend une nouvelle tache, le concept cr est la
premire approximation de la description de celle-l. Lorsque lutilisateur prsente une
nouvelle instance de la tche, un processus de gnralisation adapte lapproximation
actuelle du concept pour inclure les caractristiques propres de linstance montre. Le
rsultat de la gnralisation, entre lapproximation courante et linstance actuelle, est une
nouvelle approximation plus complte. Cependant, ds la premire approximation, bien
quinexacte et/ou incomplte, on peut lutiliser pour reproduire la tche.
Dans notre cas, lapprentissage est caractris par :
a) La formation dun concept, il est (i) empirique au dpart, on ne connat rien sur
la tche , et il (ii) procde de faon incrmentale la description dune tche est
ajuste chaque occurrence dune nouvelle instance de cette tche.
b) Les tches sont classifies avec laide et sous le contrle de lutilisateur.
Lutilisateur guide la formation de nouveaux concepts, ainsi que laffinage de
concepts dj appris.
c) La description dune tche doit permettre sa reconnaissance ; dans une situation
ultrieure, on tente dinfrer la tche partir des actions observes.
Il y a diffrentes mthodes pour raliser des gnralisations. Des oprations comme la
restriction de conjonction ou le remplacement de constantes par des variables sont
utilises pour driver des gnralisations [Michalski 83].

Les processus de gnralisation ont t amplement explors, Plotkin a t le premier


analyser rigoureusement cette notion. La gnralisation la plus spcifique (base sur la
-subsumption) est la premire solution propose par Plotkin [Buntime, 96]. Lide est
de trouver entre deux termes la gnralisation minimale possible. Cest--dire, une
expression qui conserve le maximum de caractristiques communes aux expressions de
dpart.

La gnralisation la plus spcifique de deux termes T1 et T2, dnot g(T1, T2), est dfinie
de la manire suivante :
g(T1, T2) est une gnralisation de T1 et T2 sil existe deux substitutions 1 et 2
telles que :
g(T1, T2). 1 = T1 et g(T1, T2). 2 = T2
g(T1, T2) est plus spcifique que toute autre gnralisation selon lordre partiel sur
les termes :
T T, T est plus spcifique que T, si et ssi il existe une substitution telle que T.
=T
Pour faire le calcul de la gnralisation la plus spcifique de deux termes T1 et T2, on a :
si T1 = T2, alors g(T1, T2) = T1
si T1 = f(s1,s2 ... sn) et T2 = f(e1,e2 ... en),
alors
g(T1, T2) = f(g(s1, e1), g(s2, e2) ... g(sn, en))
si T1 et T2 sont diffrents (cest--dire des fonctions ou des variables diffrentes,
ou bien lun est une fonction et lautre une variable) alors g(T1, T2) est une variable
v, o la mme variable est partout utilise comme la gnralisation de ces deux
termes.
Par exemple :
T1 = dessiner( obj1, x1, y1 )
T2 = dessiner( obj2, x2, y1 )
g(T1, T2) = dessiner( X, Y, y1 )

Dans le cas le plus simple, la gnralisation la plus spcifique est exactement lopration
duale de lunification. Le rsultat du processus de gnralisation est une hirarchie qui
exprime la relation de gnralisation/spcialisation. Pour lexemple ci-dessus, on a la
hirarchie suivante :
dessiner(X, Y, y1)

1 = {(X, obj1), (Y, x1)}

2 = {(X, obj2), (Y, x2)}

dessiner(obj1, x1, y1)

dessiner(obj2, x2, y1)

Fig. 5 : Relation de gnralisation/spcialisation.

Les substitutions 1, 2 nous permettent de revenir aux instances du dpart. Cette


spcialisation du concept gnral est ncessaire pour reproduire la tche.
A partir de ces ides, on obtient une approximation du concept comme un ensemble
dactions qui dcrivent la tche. Cependant, il reste caractriser le concept, cest-dire, trouver des associations parmi les lments descriptifs du concept. La
caractrisation dun concept entrane donc la recherche des relations inhrentes entre
ses lments, partir des valeurs observes dans les exemples [Li, 94 ; Bratko, 91].
Dans notre cas, pour capturer ce type de relation, on utilise une proposition,
dnomme corrlation, qui regroupe les associations trouves.
Par exemple, lutilisateur dessine une maison, ce premier dessin devient la premire
approximation du concept de maison :

maison1 (avec fentre)


OCCURS( t1, dessiner( triangle1, x1, y1)) ET
OCCURS( t2, dessiner( rectangle1, x2, y2)) ET
OCCURS( t3, dplacer( rectangle1, x3)) ET
OCCURS( t4, dessiner( rectangle2, x4, y3)) ET
OCCURS( t5, changer_taille( rectangle2, y4)) ET
OCCURS( t6, dplacer( rectangle2, x5))

aprs la phase de rduction on obtient :


OCCURS( t1, dessiner( triangle1, x1, y1)) ET
OCCURS( t2, dessiner( rectangle1, x3, y2)) ET
OCCURS( t4, dessiner( rectangle2, x5, y4)) ET
HOLDS( t4\tb, corrlation( {x1, x3, x5}, {y1, y2, y4} )))

Supposons que lutilisateur montre un deuxime dessin de maison travers la


squence suivante :

maison2 (sans fentre )


OCCURS( t1, dessiner( triangle1, x4, y1)) ET
OCCURS( t2, dessiner( rectangle1, x3, y2)) ET
HOLDS( t2\tb, corrlation( {x4, x3}, {y1, y2} ))

Le rsultat de lassimilation de cette deuxime instance par rapport la premire


approximation sera le suivant :
concept maison = g(maison1,maison2)
OCCURS( t1, dessiner( triangle1, Xt, Yt)) ET
OCCURS( t2, dessiner( rectangle1, Xr, Yr)) ET

HOLDS( t2\tb, corrlation( {Xt, Xr}, {Yt, Yr} ))

La dernire proposition HOLDS( t2\tb, corrlation({Xt, Xr}, {Yt, Yr})), tente de capturer les
caractristiques inhrentes au concept maison qui sont satisfaites par les deux
instances, par exemple, le fait que le triangle est au-dessus du carr et solidaire par
rapport lui dans les dplacements.
Nous obtenons finalement une gnralisation du concept de maison associ aux
actions permettant de linstancier :
scnario
dessiner(maison)
maison

maison1
(sans fentre)

script
dessiner(rect)

script
dessiner(triangle)

maison2
(avec fentre)
scnario
dessiner(maison)
script
dessiner(rect)

script
dessiner(triangle)

riterer
dessiner(rect)
Lide de la gnralisation plus spcifique peut tre tendue pour prendre en compte des
connaissances darrire-plan et tenter dobtenir de meilleures conclusions, par exemple,
par subsumption gnralise [Buntime, 88]. Une autre possibilit est lutilisation des
ides proposes par la programmation logique inductive [Berdagano, 96].
Reconnaissance du but
La reconnaissance du but peut tre vue comme le problme inverse de lapprentissage :
les notions rsultantes de lapprentissage dirigent, pendant le droulement du dialogue,
la reconnaissance du but poursuivi par lutilisateur, cest--dire, qu partir des concepts
appris, on tente de retrouver le but de lutilisateur. Ainsi, la machine sera capable de
cooprer lorsquune situation, analogue une autre dj vcue, est rencontre. Dans ce
cas-l, aprs la confirmation de lutilisateur et ventuellement un sous dialogue de
particularisation de la tche, le plan pourra tre excut. De cette manire, en
sappuyant sur une stratgie dirige par les intentions, la machine tablit un dialogue qui
converge plus rapidement vers la ralisation de la tche.

La recherche du but utilise un processus de raisonnement pour dduire le but de


lutilisateur travers la succession dactions observes. Comme nous lavons voqu,
laction est llment principal, cest elle qui permet de caractriser un concept ou une
situation (le dessin dune maison et dune lampe sont diffrents par les actions ralises
et non pour ce que cela reprsente pour lutilisateur). La machine na videmment pas de
connaissances darrire-plan ici. Pour reconnatre le but de lutilisateur on doit enregistrer
et analyser les vnements observs, identifier les actions et ensuite vrifier si elles font
partie dun concept connu.
Le systme de reconnaissance tente donc dtablir un lien entre une squence
rpertorie et la squence dactions observes. Cette opration est ralise de manire
incrmentale. Au fur et mesure de loccurrence des vnements une description
volutive est construite. Lorsque cette description peut sapparier avec un sousensemble dactions dun concept connu, la machine a reconnu lintention de
lutilisateur. Cela peut ensuite tre mis profit dans le dialogue pour demander une
confirmation du concept ou donc continuer la tche aprs la validation de lutilisateur.
Dans le cas dambigut, cest--dire, quand le processus de reconnaissance obtient plus
dune hypothse, on attend jusqu' ce que la description courante soit suffisamment
complte pour tomber sur une seule possibilit. Par exemple, supposons deux concepts
connus, bateau et voiture qui prsentent tous deux, deux cercles (les hublots pour le
bateau et les roues pour la voiture) :

dessiner( triangle1, x1, y1)


dessiner( triangle2, x2, y2)
dessiner( cercle1, x3, y3)
dessiner( polygone1, x4, y4)
dessiner( cercle2, x5, y5)

dessiner( rectangle1, x1, y1)


dessiner( cercle1, x2, y2)
dessiner( cercle2, x3, y3)
dessiner( rectangle2, x4, y4)

Si lutilisateur commence dessiner les deux cercles, la description courante ne contient


que ces deux cercles : il y a ambigut, le processus de reconnaissance obtient deux
hypothses. On attend un nouvel vnement pour rsoudre lambigut, par exemple un
rectangle. Au moment o lutilisateur dessine un rectangle la machine comprend
lintention de dessiner une voiture ; elle est dans les conditions de dclencher un sous
dialogue pour continuer la tche : elle peut par exemple anticiper sur le dessin dune
voiture si on est dans une stratgie dassistance cooprative ou demander des
informations propos du concept.
Le processus de formation de la description courante est similaire la phase

dordonnancement pendant lapprentissage dune tche, mais il est plus complexe


puisquil doit prendre en compte sa nature incrmentale. A chaque fois que la machine
observe un vnement, celui-ci est intgr la description courante. On fait les
rductions appropries pour obtenir une description plus simple, dpouille des actions
intermdiaires redondantes. Cependant, lintgration dune nouvelle action observe
peut entraner llimination des conditions qui invalident des dductions pralables. Dans
notre exemple, aprs que lutilisateur a dessin deux cercles, le processus de
reconnaissance a tabli deux hypothses. Puis si lutilisateur dessine un troisime cercle,
la dduction doit tre annule puisquelle nest plus valide. Au mme temps, les
nouvelles conditions cres renvoient un autre ensemble dhypothses.
Enfin, une fois quil existe une hypothse valide, le processus de coopration doit dune
part, tablir les actions dj ralises et faire la planification du reste des actions pour
finir la tche ; et dautre part, demander les paramtres inconnus, pour particulariser la
tche en cours, partir dun sous dialogue de spcialisation.

Conclusion
Ce chapitre a prsent les deux grands types de modles de tche, explicites et
implicites. Les modles de tche implicites drivent dune planification hirarchique
tandis que les modles de tche implicites, autorisant la dynamicit, sont plus adapts
une planification de nature opportuniste (situated action).
Ce chapitre a galement abord quelques questions relatives lapprentissage dans un
modle de dialogue pour affronter des situations de conception innovantes. Lide
gnrale est de favoriser linteraction entre lhomme et la machine travers le dialogue
en langage naturel mais aussi de profiter du dialogue pour adapter la machine
lhomme. Lapprentissage est essentiel pour amliorer la communication ; si la machine
apprend faire une tche, acqurir de nouveaux concepts et agir de manire
opportune alors lutilisateur pourra lui confier des travaux de production assiste. La
machine sera capable de cooprer avec lui. En retour, lapprentissage permet de guider
le dialogue en utilisant une stratgie base sur des buts et qui est la base de toute
stratgie cooprative
Lapprentissage propos est bas sur un formalisme qui incorpore des aspects
fondamentaux pour reprsenter des actions. Il permet dexprimer des notions de
prcdence temporelle pour fixer un ordre et, de cette faon, faire ressortir les
paralllismes possibles et les squencements obligatoires entre les actions dun plan.
Lapprentissage est ralis en utilisant un processus de gnralisation. La machine
acquiert les connaissances pour faire une tche, et le processus de gnralisation fait
voluer ses connaissances chaque fois que lutilisateur montre une nouvelle instance
de la tche. Le rsultat est la constitution, pas pas, dune connaissance partage. La
stratgie de gnralisation expose, la gnralisation plus spcifique, a des limites
importantes, bien quelle puisse tre tendue pour prendre en compte des
connaissances darrire-plan : il est toujours possible de tomber sur des gnralisations
incorrectes. Une autre solution possible est lutilisation de la programmation logique
inductive qui propose des oprateurs inductifs linverser les rgles de dduction
comme lunification, la rsolution et limplication [Berdagano, 96].

Il est important de relever quun inconvnient de cette approche dapprentissage est sa


dpendance vis--vis de lutilisateur pour la formation de concepts. Lordre de
prsentation des exemples, le nombre dinstances et la classification dune tche sont
des aspects dterminants qui influent fortement sur les concepts appris et par
consquent, dans la reconnaissance des buts de lutilisateur.
Finalement, il est aussi important de rappeler que la reconnaissance des buts est un
passage oblig pour doter la machine de capacits qui lui permet de cordonner les
processus actionnels pendant le dialogue homme machine. A cet gard lapprentissage
apporte aussi des solutions ce problme.

Vous aimerez peut-être aussi