Académique Documents
Professionnel Documents
Culture Documents
35
selain.kasereka@unikin.ac.cd
Agent: Caractéristiques
pro-actif
social
36
selain.kasereka@unikin.ac.cd
Réactif
Si l’environnement d’un programme est garanti fixe, le
programme n’a jamais besoin de s’inquiéter de son propre
échec – le programme s’exécute juste en aveugle.
Exemple de programme à environnement fixe : un compilateur
Le monde réel n’est pas comme ça : les choses changent,
l’information est incomplète. Beaucoup d’environnements
intéressants sont dynamiques.
Il est difficile de construire des programmes sur des domaines
dynamiques : le programme doit prendre en compte la possibilité
d’échec – se demander s’il vaut la peine d’être exécuté !
Un système réactif est un système qui maintient une interaction
continue avec son environnement et qui répond aux changements
qui y surviennent (à temps pour que la réponse soit utile).
37
selain.kasereka@unikin.ac.cd
Pro-actif
Réagir à un environnement est facile
( stimulus règle de réponse)
Mais nous voulons généralement que les agents
fassent des choses pour nous.
D’où une conduite dirigée par un but.
Pro-actif =
Capable de générer des buts;
Essayant d’atteindre les buts;
Pas seulement dirigé par les évènements;
Capable de reconnaître des opportunités et de prendre des
initiatives.
38
selain.kasereka@unikin.ac.cd
Social
Le monde réel est un environnement multi-agent : nous ne
pouvons pas essayer d’atteindre des buts sans prendre en
compte les autres.
Certains buts ne peuvent être atteints qu’en coopérant
avec les autres.
C’est la même chose pour beaucoup
d’environnements informatiques : Internet par ex.
La capacité sociale chez les agents est la capacité à interagir
avec d’autres agents (peut-être même des humains) par le biais
d’un langage de communication inter agents, mais aussi dans
certains cas de coopérer avec les autres. 39
selain.kasereka@unikin.ac.cd
Autres propriétés des agents
La mobilité : la capacité pour un agent de se déplacer
sur son environnement.
L'honnêteté : un agent ne communiquera pas volontairement de
fausses informations.
La bienveillance : les agents n’ont pas de buts conflictuels et
chaque agent essaiera toujours en conséquence de faire ce qu’on
lui demande.
La rationalité : un agent agira afin d’atteindre ses buts et n’agira
pas de manière à empêcher ses buts d’être atteints (du moins
dans la limite où ses croyances le lui permettent).
L’apprentissage / L'adaptation : les agents cherchent à 40
L’activité r d’un agent dans un environnement est une suite mêlée d’états
de l’environnement et d’actions:
41
selain.kasereka@unikin.ac.cd
Architecture Abstraite pour les Agents
Soit:
R l’ensemble de toutes les suites finies possibles d’activités
(sur E et Ac)
RAc le sous-ensemble de R dont les éléments se terminent
par une action
RE le sous-ensemble de R dont les éléments se terminent
par un état de l’environnement 42
selain.kasereka@unikin.ac.cd
La Fonction de Changement d’Etat
Une fonction de changement d’état représente le
comportement de l’environnement :
: RAc RE U
Notons que les environnements sont :
dépendants de l’historique
non-déterministes
Si (r)=, alors il n’y a pas d’état successeur possible pour
r. Dans ce cas, nous disons que le système a terminé son
activité.
Un environnement Env est un triplet Env =E,e0, où :
E est l’ensemble des états possibles de l’environnement
e0 E est l’état initial 43
selain.kasereka@unikin.ac.cd
Le Système mono-agent
Un système S est une paire contenant un agent et un
environnement
S AG * ENVT
selain.kasereka@unikin.ac.cd
Le Système mono-agent
46
selain.kasereka@unikin.ac.cd
Les Agents Purement Réactifs
Certains agents décident de leur action sans faire référence à
leur historique : ils basent leur prise de décision entièrement
sur le présent, sans référence du tout au passé
De tels agents sont dits purement réactifs :
47
selain.kasereka@unikin.ac.cd
Les Agents Purement Réactifs
Introduisons maintenant le système de perception
see action
Agent
Environnement
48
selain.kasereka@unikin.ac.cd
Les Agents Purement Réactifs
49
selain.kasereka@unikin.ac.cd
Boucle de Contrôle de l’Agent purement reactif
ALGORITHME :
action : Per* Ac
3. Revenir à 1 50
selain.kasereka@unikin.ac.cd
Les Agents avec Etat Interne
Agent
see action
next Etat
Environnement
51
selain.kasereka@unikin.ac.cd
Les Agents avec Etat Interne
Ces agents ont une structure de données interne typiquement
utilisée pour enregistrer des informations sur l’état de
l’environnement et l’historique.Soit I l’ensemble de tous les
états internes de l’agent.
selain.kasereka@unikin.ac.cd
Boucle de Contrôle de l’Agent avec état Interne
selain.kasereka@unikin.ac.cd
Fonctions d’utilité sur les Etats
selain.kasereka@unikin.ac.cd
Fonctions d’utilité sur les Etats
55
selain.kasereka@unikin.ac.cd
Fonctions d’utilité sur les activités
Une autre possibilité : assigner une utilité non pas à des états
individuels mais aux activités elles-mêmes
u : R
Une telle approche permet une vue à long terme.
selain.kasereka@unikin.ac.cd
Environnement: accessible et inaccessible
Dans un environnement accessible, l’agent peut obtenir des
informations complètes, exactes, en temps réel sur l’état de
cet environnement.
Les environnements les plus modérément complexes (incluant,
par exemple, le monde physique de tous les jours ou Internet)
sont inaccessibles.
Plus un environnement est accessible, plus il est simple de
construire des agents pour y opérer.
57
selain.kasereka@unikin.ac.cd
Environnement: déterministe ou non-déterministe
58
selain.kasereka@unikin.ac.cd
Environnement: Statique ou Dynamique
selain.kasereka@unikin.ac.cd
Environnement: Discret ou Continu
60
selain.kasereka@unikin.ac.cd
Environnement: Ouvert
Un environnement
inaccessible
non déterministe
dynamique
continu
selain.kasereka@unikin.ac.cd
Les Agents Planificateurs
selain.kasereka@unikin.ac.cd
Les Agents Planificateurs
Intention/
Tâche/ Etat de Actions
But l’environnement possibles
Planificateur
selain.kasereka@unikin.ac.cd
La Planification
le plan lui-même.
64
selain.kasereka@unikin.ac.cd
Exemple : Le Monde des Blocs
A
B C
selain.kasereka@unikin.ac.cd
Le Monde des Blocs
Représentation des prédicats du Monde des
Blocs :
On(x, y) : objet x sur objet y
OnTable(x) : objet x sur la table
Clear(x) : rien ne se trouve sur objet x
Holding(x) : le bras tient objet x
66
selain.kasereka@unikin.ac.cd
Le Monde des Blocs
Voici une représentation du Monde des Blocs
représenté ici :
[Clear(A)] induit
On(A, B) A
OnTable(B)
B C
OnTable(C)
[Clear(C)] induit ...
Rappelons l’hypothèse du monde fermé : tout ce qui
n’est pas déclaré est supposé faux 67
selain.kasereka@unikin.ac.cd
Le Monde des Blocs
B A C
68
selain.kasereka@unikin.ac.cd
Le Monde des Blocs
A
B
Exemple 1:
L’action stack se produit quand le bras du robot place
l’objet x qu’il tient sur l’objet y.
Stack(x, y)
pre Clear(y) Holding(x)
del Clear(y) Holding(x) 70
B 71
selain.kasereka@unikin.ac.cd