Académique Documents
Professionnel Documents
Culture Documents
par dcomposition du but et hirarchisation en sous buts ( chaque sous but est
associ un plan de rsolution),
en particularisant un but gnral un but spcifique,
en traitant les interfrences entre buts lorsquils ne peuvent tre dcomposs
indpendamment.
La planification chez lhumain dpend de la nature du problme rsoudre. On distingue
trois grands types de problmes :
les problmes de transformation dtats : chaque fois quun problme peut se
dcrire comme une succession dtats dtermins parcourir,
les problmes dinduction de structures : se ramnent une recherche de
relations dans un ensemble (par ex. complter les termes dune srie connaissant
les premiers lments),
les problmes de conception : dans ce type de problme le but est imprcis voire
compltement indfini ou dfini par un ensemble de contraintes (par ex. en
conception architecturale, obtenir une pice lumineuse et agrable).
Les stratgies de recherche ou de dveloppement du plan dpendent de ces grands
types de problmes. On distingue :
la stratgie essais-erreurs qui consiste explorer le graphe dtats au moyen
dheuristiques ou avec des techniques doptimisation, pour trouver le chemin (si
possible le meilleur) qui permet datteindre le but,
la stratgie fins-moyens avec laquelle on value chaque pas, lcart entre la
situation courante et ltat but pour dterminer les oprateurs mettre en uvre
pour rduire cet cart (cest le GPS, General Problem Solver de Newell [Newell,
1959]),
la stratgie de test dhypothse (GRI, General Rule Inducer de Simon et Lea
[Simon, 1974]) dans laquelle des schmas dhypothses sont tests, dans lordre
du gnral au particulier, selon une organisation en espaces dexemples, cest-dire par focalisation puis par balayage (autrement dit en largeur dabord puis en
profondeur),
la stratgie opportuniste, qui consiste tenter des actions selon la situation de
manire se rapprocher de situations connues, si possible en se ramenant un
problme de transformation dtats. pour lesquelles on dispose dj de solutions.
En IA, la reprsentation des plans se fait laide darbres et/ou ou de graphes, de
schma [Bobrow et Norman, 1975] ou de frame [Minsky, 1975], ou enfin laide de
scripts [Shank et Abelson, 1977]. Il existe une abondante littrature en IA sur la
planification. Hayes-Roth dfinit lensemble des lments ncessaires la planification
que nous retiendrons en termes de synthse :
(1) les units dexcution (procdures, agents) et les units de dcision
(focalisation, contrle),
(2) les abstractions de plan (intention, but, schmas, objets, stratgies, tactiques),
(b) lactivit est la squence dactes rellement effectus dans le contexte dune
tche donne,
(c) lacte est effectu par lutilisateur en vue de produire un effet dans le monde
rfrentiel de la machine en rponse (ou pour provoquer) des actions de la
machine.
Enfin rappelons les prsupposs noncs dans le chapitre
"Apprentissage, langue et dialogue : que retenir ?" qui visent :
1,
paragraphe
Reprsentation statique
Tche
Plan(1)
Plan(2)
Plan(3)
etc.
Scn(2,1)
Script(2,1,1) etc.
temps
a(n) : suite d'actions effectues
Fig. 1 : Dcomposition arborescente de tches par arbre ET/OU. Cette reprsentation se lit : pour faire la
tche il faut excuter le Plan(1) ET le Plan(2), OU excuter le plan(3). De mme au niveau infrieur, pour
excuter le Plan(1) il faut excuter les scnarios Scn(1,1) ET Scn(1,2), et ainsi de suite.
Cette reprsentation dfinit une action lmentaire a(n) comme une structure spcialise
instancie () partir dun script et effectue linstant n. Cette action normalement
applique avec succs la situation (n-1), la fait passer ltat (n) (la relation se lit
cause-de), ce qui se formalise par :
a(n) : a(n) , a(n) (n)
Chaque action est active par un ou plusieurs actes de lutilisateur (verbal, gestuel, etc.).
Il existe une pragmatique P qui associe chaque action a une suite dactes {} de
communication qui dclenche a :
a : {} a
Tous les actes ne sont pas oprants vis--vis dune action il peut y avoir par exemple
des actes mta-discursifs. Ils sont tels que : : , o est une action nulle qui par
dfinition appartient = { a }
Lensemble des actes de lutilisateur est thoriquement illimit. On dfinit sur
lensemble des actes la relation dordre partiel de squentialit () qui confre toute
sous squence dactes, une structure de demi-treillis infrieur. Cette relation () permet
de dfinir un ordonnancement des actes et donc, corrlativement, des actions
dclenches. Dans lexemple de la fig. 2 nous avons :
{1} a(1) (1) avec a(1) 6 s5
{2 3} a(2) (2) avec a(2) 5 s4
s5 ET s4 S2
{5}
{4 6} a(3) (3) avec a(3) 3
{7}a(4) (4) avec a(4) 2 s2
3 ET s2 S1
S2 ET S1 P1
Si (4) est la situation correspondant au but quil fallait atteindre, alors ce but est non
seulement atteint mais il est satisfait. En consquence on saperoit que le locuteur a
droul le plan P1 pour latteindre.
a(1)
a(2)
(0)
(1)
(2)
temps
a(3)
a(4)
(3)
(4)
But atteint
P1 ralis
But satisfait
Actions et situations
1
S1
Intention en
action
s2
P1
s4 3
S2
s5
Plans
Scnarios
2
4
Scripts
Fig. 2 : dans cet exemple le plan est ralis par instanciation des scripts 6, 5, 3, 2, cest--dire aprs
excution des actions {1} a(1), {2 3} a (2), {5} , {4 6} a (3), {7} a (4)
Ces modles classiques peuvent tre dcors dattributs rfrenant des tches, des
sous tches ou des actions lmentaires, ce qui fournit les moyens lexcution de
reconnatre les tches faites par loprateur. Dans cette approche cependant, une partie
des connaissances est laisse de ct, notamment les dpendances et les contraintes
entre les plans, les conditions portant sur le dclenchement ou lactivation des plans ;
ces contraintes sont soit mises en uvre au niveau des appels vers le noyau fonctionnel
(tests pour vrifier la validit dun appel), soit dilues dans les rgles de syntaxe : on en
peroit une manifestation de surface au niveau de la syntaxe dinteraction autorise mais
on a perdu laccs aux causes profondes. Pour lever ce type de limitation, les modles
fonctionnels [Foley, 88] prsentent des modles de tche deux niveaux de profondeur :
la surface de lactivit et lenchanement causal.
Nous ne dtaillerons pas davantage ce type de modle, lessentiel tant de comprendre
ses mcanismes pour le problme de lapprentissage qui nous motive. Nous voyons que
un modle explicite nous ne pouvons intervenir que sur le niveau pragmatique, cest-dire en termes formels, sur lapplication P qui associe p() (lensemble des parties de
lensemble des actes) A (lensemble fini des actions). Ce modle est donc insuffisant
pour notre propos puisque lensemble A ne peut voluer dans le temps.
Lapprentissage de la tche
Comme nous lavons annonc ci-dessus, si nous sommes intresss par la modlisation
du dialogue dans les situations de conception pour lesquelles il nest pas possible de
prvoir toutes les activits lavance, puisque par dfinition la conception est une activit
cratrice. Cependant on saperoit chez les architectes par exemple que lacte de
conception passe souvent par une rutilisation de plans architecturaux anciens,
simplement rorganiss. Dans ces conditions on a intrt apprendre un plan (pour faire
une tche ou rsoudre un problme) en le construisant pendant le droulement du
dialogue partir des buts poursuivis par larchitecte. Lapprentissage du plan permettra
ultrieurement de lassister de manire cooprative ou mme danticiper de manire
constructive. Au-del de ce simple exemple notons galement limportance de
lapprentissage par laction en psychologie du comportement [Piaget 64].
Les problmes soulevs propos de lapprentissage de la tche sont :
lacquisition dun nouveau plan daction, pertinent pour la tche en question,
sa caractrisation par rapport aux autres tches,
lassignation dun but dans le contexte du dialogue.
Puis, dans un deuxime temps, pour lassistance lutilisateur, les problmes sont :
la reconnaissance du but poursuivi partir des actions observes, pour infrer la
logique daction gnrale de lutilisateur et identifier son plan daction,
lactivation pertinente des stratgies dassistance lutilisateur dans le cours du
dialogue.
Lacquisition du plan peut tre ralise en utilisant des sous dialogues adapts [Caelen
95a]. Par exemple :
U : Dessine une maison
M : Quest-ce quune maison ? Montre-moi en la dessinant
U : "srie dactes pour faire le dessin" par exemple
(dessiner(carr) < dessiner(triangle)) dessiner(maison)
avec (activer(carr) < poser(carr)) dessiner(carr)
et ((slect(triangle) dupliquer(triangle)) < dplacer(triangle)) dessiner(triangle)
M : Il sagit bien dune maison nest-ce pas ?
U : Oui.
Dans cette courte squence dialogique mene avec une stratgie directive de la part de
la machine, les actions ont toutes rapport au mme but B = dessin(maison). La
confirmation permet de sassurer que le but est bien satisfait. Il y aurait de nombreuses
autres stratgies possibles, ceci nest quun exemple.
Au dpart, on suppose que lon dispose dactions lmentaires bien dfinies (que lon
trouve gnralement dans les diteurs graphiques). Puis, aprs que lutilisateur a pos
un but, il sagit pour la machine dobserver, dordonner et dassocier cette squence
dactions au but pos. Nous sommes donc ici dans un contexte matre apprenant o le
matre est lutilisateur et lapprenant est la machine.
A la fin de cette tape, la machine est capable de recommencer la tche partir dune
demande de lutilisateur. Mais lapprentissage ne sarrte pas ici. La nouvelle tche
apprise doit tre gnralise, spcialise ou intgre comme une sous tche une
tche plus complexe. Cette assimilation permet la formation dune abstraction lie au but
pos par lutilisateur. De cette faon, la connaissance acquise volue pour se rapprocher
du concept rel dtenu par lutilisateur.
Reprsentation du plan
Une difficult majeure est la manire de reprsenter les connaissances pour supporter
cet apprentissage, car on fait lhypothse que les connaissances acquises par la
machine sont incompltes et dynamiques et quelles doivent rendre explicites les
diffrents rapports entre les actions. La modlisation dun monde quintroduit le concept
daction exige la prise en compte de connaissances temporelles. Diverses approches ont
t proposes en Intelligence Artificielle (IA) pour tenter une modlisation des notions
temporelles comme lantriorit, le recouvrement, la simultanit entre actions, leur
causalit, etc. Diffrents travaux en raisonnement temporel ont t proposs, parmi
lesquels : le calcul situationnel de [McCarthy, 69], la logique temporelle de [MacDermott
82], le calcul dintervalles de [Allen 84] et la logique dintervalles de [Shoham 87].
Les ides ci-aprs sont bases sur le travail de Shoham qui dfinit dune manire
gnrale une proposition temporelle <i, p> laquelle associe une assertion logique p un
intervalle de temps i. La syntaxe et la smantique de cette logique sont dfinies dans
[Shoham 87] et [Dean, 90].
Pour parler de changements du monde, on utilise la notion dvnement, cest--dire, la
transition dune proposition dun tat un autre. En effet, considrons deux propositions
temporelles <(t1, t2), p> et <(t4, t5), p> telles que t2 prcde t4 (t2 t4) ; la transition de p
p qui se produit dans un instant t3 compris entre t2 et t4 est dtermine par un
vnement. La proposition temporelle <i, p> scrit HOLDS(i, p) et lintervalle i est le
couple ta\tb, o ta tb; mais pour souligner le rle dvnement dune expression
temporelle nous lcrirons OCCURS(i, p), lintervalle i o lvnement se produit est
dcrit la squence dactions que lutilisateur a effectu pour dessiner une maison et dans
laquelle dessiner( triangle, x, y) reprsente laction de dessiner un triangle la position x
(o x est un vecteur) et de taille y. Chaque vnement correspond une action de base.
Chaque action de base est dfinie par une rgle la STRIPS qui permet de rcuprer
lensemble des propositions temporelles affectes par lexcution de laction. Par
exemple, la rgle simplifie suivante tablit les conditions et les effets pour laction
dplacer :
HOLDS( t0\t1, position( carr, x1 )) ET
OCCURS( t1, dplacer( carr, x2 )) ET HOLDS( t1\t2, position( carr, x2 ))
A partir de ces rgles, on introduit une relation de prcdence temporelle entre les
propositions. Par exemple, aprs la squence dactions pour dessiner la maison, on
rcupre les propositions suivantes :
HOLDS( t0\t1, dessin( triangle )) ET
HOLDS( t1\ta, dessin( triangle )) ET
HOLDS( t1\t2, position( triangle, x1 )) ET
HOLDS( t2\tb, position( triangle, x2 )) ET
HOLDS( t0\t3, dessin( carr )) ET
HOLDS( t3\tc, dessin( carr )) ET
HOLDS( t3\t4, position( carr, x3 )) ET
HOLDS( t4\td, position( carr, x4 ))
La figure 3, une adaptation dun time map [Dean 87], montre les propositions et leur
prcdence temporelle. Les lignes noires reprsentent les intervalles de temps et les
lignes pointilles la prcdence temporelle. Cette relation entre les propositions est
dduite dune part, par les rgles associes chaque action et dautre part, par les
dures de ralisation de la tche. Le premier cas est une relation forte qui oblige une
prcdence temporelle ncessaire. On nest pas capable de changer lordre
dexcution (avant de dplacer lobjet, il doit exister). Le deuxime cas entrane une
relation temporelle fortuite i. e. t2 t3 (le dessin du triangle avant le carr ne change rien
au rsultat final). Ces deux types de relation permettent de mieux apprhender la
combinaison temporelle des actions, et donc de mieux faire ressortir les paralllismes
possibles et les squencements obligatoires. De cette faon, on peut donc obtenir un
plan, non pas comme un ensemble de squences dactions, mais comme un ensemble
[Shoham 87] prsente une catgorisation des propositions temporelles. Par rapport celle-ci, une
proposition HOLDS(i, p) est quivalente une expression du type liquide et OCCURS(i, p) une
expression du type gestalt.
dactions partiellement contraintes dans le temps les unes par rapport aux autres et par
rapport certains faits.
La distinction entre ces deux types de relation nous permet de relier une srie dactions
qui sont dpendantes entre elles. Une action dpend dune autre si ses effets sont des
conditions par lexcution de lautre, cest--dire, sil existe une relation temporelle
ncessaire entre elles. On considre cette srie dactions comme une seule action. Cette
action compose est lie aux autres actions, aussi probablement composes, travers
une relation temporelle fortuite. Aprs avoir distingu les actions composes, on peut
appliquer des oprations de rduction dans chacune pour liminer les propositions
redondantes et simplifier le plan.
dessin(triangle)
dessin(triangle)
t1
to
t1
position(triangle, x1)
t1
ta
t2 position(triangle, x2)
t2
tb
dessin(carr)
to
dessin(carr)
t3
t3
tc
position(carr, x3)
t3
position(carr,x4)
t4
t4
td
On peut rduire laction compose pour dessiner le carr au schma suivant (fig. 4) :
dessin(carr)
dessin(carr)
to
t3
t3
position(carr, x4)
t3
tc
td
source dinformation extrieure. Dans notre cas, o lutilisateur tente de montrer son
savoir-faire la machine, et o la machine et lutilisateur doivent partager des ressources
et faire des raisonnements collectivement, les connaissances doivent tre codifies de
manire comprhensible par tous les deux [Carbonell, 83]. Les paradigmes gntique
et connexionniste ne reprsentent pas leurs connaissances de faon simple
interprter par lutilisateur. Il semble donc quil soit plus difficile de les utiliser ici.
Pour la formation dun concept, notre travail sappuie sur le paradigme inductif en
utilisant des stratgies dapprentissage de concepts par lexemple . Lide principale
est ladaptation de la description dune tche chaque fois que lutilisateur donne une
instance de cette tche. Ds que lon apprend une nouvelle tache, le concept cr est la
premire approximation de la description de celle-l. Lorsque lutilisateur prsente une
nouvelle instance de la tche, un processus de gnralisation adapte lapproximation
actuelle du concept pour inclure les caractristiques propres de linstance montre. Le
rsultat de la gnralisation, entre lapproximation courante et linstance actuelle, est une
nouvelle approximation plus complte. Cependant, ds la premire approximation, bien
quinexacte et/ou incomplte, on peut lutiliser pour reproduire la tche.
Dans notre cas, lapprentissage est caractris par :
a) La formation dun concept, il est (i) empirique au dpart, on ne connat rien sur
la tche , et il (ii) procde de faon incrmentale la description dune tche est
ajuste chaque occurrence dune nouvelle instance de cette tche.
b) Les tches sont classifies avec laide et sous le contrle de lutilisateur.
Lutilisateur guide la formation de nouveaux concepts, ainsi que laffinage de
concepts dj appris.
c) La description dune tche doit permettre sa reconnaissance ; dans une situation
ultrieure, on tente dinfrer la tche partir des actions observes.
Il y a diffrentes mthodes pour raliser des gnralisations. Des oprations comme la
restriction de conjonction ou le remplacement de constantes par des variables sont
utilises pour driver des gnralisations [Michalski 83].
La gnralisation la plus spcifique de deux termes T1 et T2, dnot g(T1, T2), est dfinie
de la manire suivante :
g(T1, T2) est une gnralisation de T1 et T2 sil existe deux substitutions 1 et 2
telles que :
g(T1, T2). 1 = T1 et g(T1, T2). 2 = T2
g(T1, T2) est plus spcifique que toute autre gnralisation selon lordre partiel sur
les termes :
T T, T est plus spcifique que T, si et ssi il existe une substitution telle que T.
=T
Pour faire le calcul de la gnralisation la plus spcifique de deux termes T1 et T2, on a :
si T1 = T2, alors g(T1, T2) = T1
si T1 = f(s1,s2 ... sn) et T2 = f(e1,e2 ... en),
alors
g(T1, T2) = f(g(s1, e1), g(s2, e2) ... g(sn, en))
si T1 et T2 sont diffrents (cest--dire des fonctions ou des variables diffrentes,
ou bien lun est une fonction et lautre une variable) alors g(T1, T2) est une variable
v, o la mme variable est partout utilise comme la gnralisation de ces deux
termes.
Par exemple :
T1 = dessiner( obj1, x1, y1 )
T2 = dessiner( obj2, x2, y1 )
g(T1, T2) = dessiner( X, Y, y1 )
Dans le cas le plus simple, la gnralisation la plus spcifique est exactement lopration
duale de lunification. Le rsultat du processus de gnralisation est une hirarchie qui
exprime la relation de gnralisation/spcialisation. Pour lexemple ci-dessus, on a la
hirarchie suivante :
dessiner(X, Y, y1)
La dernire proposition HOLDS( t2\tb, corrlation({Xt, Xr}, {Yt, Yr})), tente de capturer les
caractristiques inhrentes au concept maison qui sont satisfaites par les deux
instances, par exemple, le fait que le triangle est au-dessus du carr et solidaire par
rapport lui dans les dplacements.
Nous obtenons finalement une gnralisation du concept de maison associ aux
actions permettant de linstancier :
scnario
dessiner(maison)
maison
maison1
(sans fentre)
script
dessiner(rect)
script
dessiner(triangle)
maison2
(avec fentre)
scnario
dessiner(maison)
script
dessiner(rect)
script
dessiner(triangle)
riterer
dessiner(rect)
Lide de la gnralisation plus spcifique peut tre tendue pour prendre en compte des
connaissances darrire-plan et tenter dobtenir de meilleures conclusions, par exemple,
par subsumption gnralise [Buntime, 88]. Une autre possibilit est lutilisation des
ides proposes par la programmation logique inductive [Berdagano, 96].
Reconnaissance du but
La reconnaissance du but peut tre vue comme le problme inverse de lapprentissage :
les notions rsultantes de lapprentissage dirigent, pendant le droulement du dialogue,
la reconnaissance du but poursuivi par lutilisateur, cest--dire, qu partir des concepts
appris, on tente de retrouver le but de lutilisateur. Ainsi, la machine sera capable de
cooprer lorsquune situation, analogue une autre dj vcue, est rencontre. Dans ce
cas-l, aprs la confirmation de lutilisateur et ventuellement un sous dialogue de
particularisation de la tche, le plan pourra tre excut. De cette manire, en
sappuyant sur une stratgie dirige par les intentions, la machine tablit un dialogue qui
converge plus rapidement vers la ralisation de la tche.
Conclusion
Ce chapitre a prsent les deux grands types de modles de tche, explicites et
implicites. Les modles de tche implicites drivent dune planification hirarchique
tandis que les modles de tche implicites, autorisant la dynamicit, sont plus adapts
une planification de nature opportuniste (situated action).
Ce chapitre a galement abord quelques questions relatives lapprentissage dans un
modle de dialogue pour affronter des situations de conception innovantes. Lide
gnrale est de favoriser linteraction entre lhomme et la machine travers le dialogue
en langage naturel mais aussi de profiter du dialogue pour adapter la machine
lhomme. Lapprentissage est essentiel pour amliorer la communication ; si la machine
apprend faire une tche, acqurir de nouveaux concepts et agir de manire
opportune alors lutilisateur pourra lui confier des travaux de production assiste. La
machine sera capable de cooprer avec lui. En retour, lapprentissage permet de guider
le dialogue en utilisant une stratgie base sur des buts et qui est la base de toute
stratgie cooprative
Lapprentissage propos est bas sur un formalisme qui incorpore des aspects
fondamentaux pour reprsenter des actions. Il permet dexprimer des notions de
prcdence temporelle pour fixer un ordre et, de cette faon, faire ressortir les
paralllismes possibles et les squencements obligatoires entre les actions dun plan.
Lapprentissage est ralis en utilisant un processus de gnralisation. La machine
acquiert les connaissances pour faire une tche, et le processus de gnralisation fait
voluer ses connaissances chaque fois que lutilisateur montre une nouvelle instance
de la tche. Le rsultat est la constitution, pas pas, dune connaissance partage. La
stratgie de gnralisation expose, la gnralisation plus spcifique, a des limites
importantes, bien quelle puisse tre tendue pour prendre en compte des
connaissances darrire-plan : il est toujours possible de tomber sur des gnralisations
incorrectes. Une autre solution possible est lutilisation de la programmation logique
inductive qui propose des oprateurs inductifs linverser les rgles de dduction
comme lunification, la rsolution et limplication [Berdagano, 96].