Vous êtes sur la page 1sur 64

Intelligence Artificielle Chapitre 2 : Rsolution des Problmes et Jeux

Pr. : Imade BENELALLAM e-mail : i.benelallam@insea.ac.ma Anne : 2011/2012


INSEA, Dpartement Informatique, Bureau Numro 3

Pr. Imade BENELALLAM

IA

Objectifs
Comment rsoudre un problme ?
Recherche des solutions. Recenser les tats dun systme donn et trouver parmi ces tats une ou plusieurs solutions.

Comment ?
Le passage dun tat un autre se fait par lapplication dune action donne. Dveloppement dun arbre de recherche + une stratgie de recherche.

Pr. Imade BENELALLAM

IA

Machine dterministe

LHumain rsout un problme, la machine excute la solution Machine/Systme algorithmique (non intelligent)
Systme d excution de la solution, Machine dterministe tats finis, A tout moment durant l excution, la prochaine instruction excuter est bien dtermine

Pr. Imade BENELALLAM

IA

Machine Non dterministe


LHumain dfinit le problme, la machine le rsoud.
Systme de rsolution (automatique) de Problmes La Machine/Systme est appel trouver lui-mme la solution un problme donn: Systme de rsolution (automatique) de problmes, Espace de recherche (espace d tats, de buts..) Stratgies de recherche; exploration de lespace Prise de dcision, devant diffrents choix

Pr. Imade BENELALLAM

IA

Systme de Rsolution de Problme


Tout est Problme
Rsoudre des problmes explicites (en Mathmatique, en Physique, en Mcanique, en Informatique, en Ingnierie, dans la Vie Quotidienne, etc.) Dmontrer la vracit dune proposition/argument constitue un problme => Raisonnement Atteindre un Objectif/But constitue un Problme => Planification Prendre une dcision; effectuer un choix, constitue un problme => Prise de Dcision Comprendre/Interprter une situation, un texte, un discours constitue un problme => Comprhension/Interprtation Communiquer constitue un problme => Communication Gagner dans un Jeu (situation de comptition) constitue un problme => Jeux Etc.

Pr. Imade BENELALLAM

IA

Systme de Rsolution de Problme


=/= types de problmes => =/= types de systmes de rsolution de problmes:
Systme de Rsolution de Problmes (changement dtats) Systme de Raisonnement Systme de Planification Systme de Prise de Dcision Systme de Comprhension et dInterprtation Systme de Communication Etc
Pr. Imade BENELALLAM IA

Systme de Rsolution de Problme

En tudiant les diffrents systmes cognitifs (Raisonnement, Planification, Comprhension, etc.), on dcouvre encore et encore les mmes concepts caractrisant le Systme de Rsolution de Problmes:
Espace de Recherche Ensemble de rgles de transformation/production Stratgie de Recherche Connaissance supplmentaire (Heuristique) Etc.

Pr. Imade BENELALLAM

IA

Composantes d un SRP
Un espace de recherche Nature: espace dtats, de problmes, de plans.. Reprsentation: LP, Rseaux Smantiques, Un ensemble de rgles de production: tq; Une rgle est une unit du comportement; elle permet de transformer ltat de lespace faisant ainsi avancer la recherche. ex: ``la configuration de lchiquier correspond la situation A`` ``dplacer la tour la case X`` Un mcanisme de contrle qui choisit la rgle dclencher parmi les rgles applicables. Une rgle est applicable si sa tte sunifie avec l tat courant de l espace. Plusieurs rgles peuvent tre applicables un moment donn. Le mcanisme de contrle/choix correspond la stratgie de recherche adopte pour explorer l espace. Etats initiaux. Etats finaux. Si tat courant = tat final Fin recherche
IA

Pr. Imade BENELALLAM

Le Tic-tac-toe est un jeu de rflexion se pratiquant deux joueurs au tour par tour et dont le but est de crer le premier un alignement.

Espace des tats possibles

Pr. Imade BENELALLAM

IA

Modlisation

Remarque : Un tat est gnralement dcrit par un ensemble de variables dtats. Les valeurs attribues ces variables permettront alors de dfinir de manire univoque un tat donn. Ces variables dcrivent gnralement les attributs des diffrents objets (ou situations, faits, ) de lenvironnement du problme.
Pr. Imade BENELALLAM IA

Rsolution
Pour atteindre ltat but, le processus de rsolution doit disposer doprateurs de transformation dtat (dits aussi de transition) qui permettent de passer progressivement de ltat initial ltat but. On peut voir ces oprateurs comme des moyens de rduction de la diffrence entre ltat initial et ltat but.

Pr. Imade BENELALLAM

IA

Etapes de Rsolution
Ainsi, dans ce cas la rsolution dun problme va consister en trois tapes :
1. La reprsentation formelle des tats du problme (lensemble des variables dtats) : cette tape peut faire appel lun des formalismes de reprsentation de connaissances ou directement des structures de donnes comme les listes et les tableaux; 2. La reprsentation formelle des oprateurs de transformation : les formalismes logiques peuvent remplir ce rle ou comme nous allons le voir, lutilisation des rgles de production peut tre un choix judicieux ; 3. Le choix de lalgorithme de recherche qui va choisir quels oprateurs il va appliquer et sur quels tats du problme en vue de trouver ltat but le plus vite possible. Cet algorithme doit donc disposer de procdures de test des tats pour dterminer sil a oui ou non atteint son but.

Pr. Imade BENELALLAM

IA

Exemple 1
Le problme du Fermier, du Loup, de la Chvre, du chou et de la traverse de la rivire: Un fermier avec son loup, sa chvre et son chou veulent traverser la rivire. Il y a un canot bord, mais seul le fermier peut ramer, et il ne peut contenir que deux entits la fois (y compris le rameur). Si le loup reste seul avec la chvre, il va la manger, si la chvre reste seule avec le chou, elle va manger le chou. Que devrait tre la squence des traverses pour que les quatre soient sur lautre bord .

Pr. Imade BENELALLAM

IA

Exemple de squence sans tenir compte des contraintes:

State(Farmer, Wolf, Goat, Cabbage)chacun est soit la position w(est) ou e(ast)


Pr. Imade BENELALLAM IA

Portion du graphe de lespace dtat

Pr. Imade BENELALLAM

IA

Exemple 2: Micromonde des blocs


Le micro-monde des blocs
Un robot : R Trois boites : B1, B2, B3 Quatre places : a, b, c, d Etats : lensemble de toutes les formules (prdicats) spcifiant la position de chaque objet at(B1, x) at(B2, y) at(B3, z) at(R, t) tq x, y, z, t (a, b, c, d). Etat initial : Ei (So) : at(B1, b) at(B2, c) at(B3, d) at(R, a) Etat final (i.e. tat dsir, le But) : Eb (Sg) : at(B1, x) at(B2, x) at(B3, x)

Pr. Imade BENELALLAM

IA

Exemple 2: Micromonde Robot


Fonction de transition : Deux actions : PUSH et GOTO
PUSH(obj, x, y) Pr-conditions (ce qui doit tre vrai avant lexcution de laction) : at(obj, x) at(R, x) addList (ce qui sera vrai aprs lexcution de laction) : at(R, y); at(obj, y) deleteList (ce qui nest plus vrai aprs lexcution de laction) : at(R, x); at(obj, x)

Solution :
Trouver un plan, i.e. une suite dactions Sur un tat courant, plusieurs actions sont possible Un plan est un chemin parmi plusieurs chemins possible (y compris les chemins qui ne mnent pas ltat final)

Pr. Imade BENELALLAM

IA

Exemple 2: espace dtat

Pr. Imade BENELALLAM

IA

Stratgies de recherche
Dans la session prcdente nous avons vu quun grand nombre de problmes peuvent tre reprsents de manire formelle sous forme despace dtats et que pour ces problmes les algorithmes de recherche constituent une technique gnrale de rsolution.
En effet, ces algorithmes permettent de guider la recherche dune solution en faisant des choix concernant les tats dvelopper et en grant le retour sur ces choix tout en vitant lexplosion combinatoire.

Pr. Imade BENELALLAM

IA

Recherche systmatique
Nous allons nous intress la recherche systmatique (mthodique, organise) Exemple: Combien y a-t-il de triangles de toute grandeur dans cette figure ?

Dmarche. Quatre rgles seront appliques pour rendre la recherche systmatique. 1. On trouve les triangles commenant par A, puis par B, etc. 2. On ne considre pas les lettres antrieures la premire. Quand on arrive C, par exemple, on considre ni A ni B. 3. On identifie un triangle en plaant les lettres par ordre alphabtique. 4. La liste des triangles est faite par ordre alphabtique.
IA

Pr. Imade BENELALLAM

Stratgies de recherche

Les stratgies de recherche permettent de dire lalgorithme quel tat il doit dvelopper en premier Le but de la stratgie est donc dorganiser lexploration de lespace dtats dun problme.
Soit Struct la structure de donnes reprsentant les noeuds en attente de dveloppement de larbre de recherche chaque tape.

Fonction Recherche ( problme, stratgie)


1. 2. 3. 4. 5. 6. 7. Initialiser Struct au nud correspondant ltat initial du problme (la racine de larbre) Tant que il existe des nuds dans Struct faire Choisir lun des nuds pour dveloppement en respectant la stratgie Si le nud choisit correspond un tat but alors sortir et retourner la solution correspondante Sinon dvelopper le nud choisit en ajoutant ses successeurs Struct. Fin Tant que Retourner Echec

Pr. Imade BENELALLAM

IA

Stratgies de recherche
Les critres de choix dune stratgie de recherche sont essentiellement : La compltude : Lorsque la mthode garantit de trouver une solution si elle existe ; La terminaison (dcidabilit) : Mme si la solution nexiste pas, il sarrte en signalant un chec condition que lespace dtats soit fini. La complexit en temps : ce critre correspond lefficacit algorithmique qui dpend du nombre dtats dvelopps ; La complexit en espace : ce critre se rfre la quantit mmoire utilise ; Loptimalit (admissibilit): ce critre concerne loptimalit de la solution trouve par rapport celles qui existent- en se basant sur une fonction de cot.

Pr. Imade BENELALLAM

IA

Stratgies de recherche

La complexit (en temps ou en espace) est mesure selon : b : le facteur de branchement maximal de larbre de recherche et qui correspond au nombre maximal de successeurs pour un tat. d : la profondeur laquelle se trouve le (meilleur) nud solution. m : la profondeur maximale de larbre de recherche correspondant lespace dtats et qui peut tre infinie.

Pr. Imade BENELALLAM

IA

Stratgies de recherche

Trouver un chemin, lors de lexploration de lespace, qui mne de ltat initial ltat final: Recherche systmatique non-informe (aveugle): En-Profondeur et En-Largeur (couteux) Recherche avec Information sur le nud Hill-Climbing, Beam et Best-First Recherche Informe sur le nud et larc : A* Recherches dans les jeux : MINIMAX et ALPAH-BETA

Pr. Imade BENELALLAM

IA

Recherche en profondeur dabord

Pr. Imade BENELALLAM

IA

Recherche en profondeur dabord


E1

E2

E8

E9

E3

E7 Note: Le mmoire est gre comme une pile

E4

E5

E6

Pr. Imade BENELALLAM

IA

Recherche en profondeur dabord


Empiler le nud correspondant ltat initial (racine de larbre) dans P Tant que P est non vide faire Dpiler le sommet N de P Si N correspond un tat but alors Sortir de lalgorithme avec cette solution Sinon Gnrer la liste L des successeurs de N Pour chaque lment S de L (de droite gauche !) faire Empiler S (Rq : le plus gauche sera en sommet) Fin de Tant que Retourner Echec

Pr. Imade BENELALLAM

IA

Problme de k-reines
Description : Il faut placer k reines dans un chiquier de dimension kxk sans qu'aucune d'entres elles ne soit en prise par une autre. On dit que deux reines sont en prise, si elles se trouvent sur une mme ligne, une mme colonne ou une mme diagonale.
Exercice: 1. Proposer une modlisation pour le problme 4-reines. 2. Donner une solution de ce problme avec la stratgie en profondeur dabord

Pr. Imade BENELALLAM

IA

Problme de k-reines la solution

Pr. Imade BENELALLAM

IA

Proprits
Les proprits de la recherche en profondeur sont comme suit : La compltude : Incomplet si lespace dtats est infini ou si on peut tomber sur des nuds correspondant au mme tat dans larbre de recherche ce qui entrane des boucles. Pour remdier ce problme, il faut ajouter des tests pour viter quun nud correspondant un tat dj trait par un autre nud ne soit dvelopp et ce, on sauvegardant dans une liste, par exemple, les nuds dj traits. Sinon il est complet et mme si la solution nexiste pas il sarrte en signalant un chec; La complexit en temps : Le nombre de nuds dvelopps est de lordre de bm (1+b+b2+..+bm=O(bm)) avec b le facteur de branchement et m la profondeur maximale de larbre. La complexit en espace : elle est linaire de lordre de b*m (O(b*m)). Loptimalit : Non. Il ne garantit pas de trouver le plus court chemin qui mne la solution (en termes de profondeur du nud solution).

Pr. Imade BENELALLAM

IA

Recherche en Largeur dabord

Pr. Imade BENELALLAM

IA

Recherche en Largeur dabord


E1

E2

E3

E4

E5

E6 Note: Le mmoire est gre comme une file

E7

E8

E9

Pr. Imade BENELALLAM

IA

Recherche en Largeur dabord


Insrer le nud correspondant ltat initial (racine de larbre) dans F Tant que F est non vide faire Extraire la tte (le nud le plus ancien) N de F Si N correspond un tat but alors Sortir de lalgorithme avec cette solution Sinon Gnrer la liste L des successeurs de N Pour chaque lment S de L (de gauche droite !) faire Insrer S dans F(en fin de la file) Fin de Tant que Retourner Echec

Pr. Imade BENELALLAM

IA

Problme de 4-reines

Pr. Imade BENELALLAM

IA

Proprits
A la diffrence de la stratgie de profondeur, la recherche en largeur possde les proprits suivantes :
La compltude/ terminaison : Oui (Si le facteur de branchement b est fini). La complexit en temps : Le nombre de nuds dvelopps est de lordre de bd (O(bd)) avec b le facteur de branchement et d la profondeur de la meilleure solution. La complexit en espace : elle est exponentielle de lordre de bd. (car il faut stocker dans la file tous les nuds dvelopps) Loptimalit : Oui (Si la gnration de successeurs est sans cot ou cot uniforme) .

Pr. Imade BENELALLAM

IA

Recherche avec information sur le nud

Hill-Climbing & Beam search


Critre pour slectionner le prochain fils gnrer pour un nud n : h(n); fonction heuristique
Information incertaine mais plausible Heuristique h(n) fournit le cot pour atteindre ltat final. h(n) incorpore et reprsente une source dinformation externe lespace de recherche. Ex: h(n) = la distance qui spare la ville n de la ville de destination.

En-Profondeur + h(n) = Hill-Climbing search En-Largeur + h(n) = Beam search


Pr. Imade BENELALLAM IA

Hill-Climbing vs Parcours en Largeur

Pr. Imade BENELALLAM

IA

La stratgie de recherche Best-First


Avec Hill-Climbing et Beam, la slection ne se fait que sur les fils du nud courant.
La slection est locale

Best-First considre tout moment tous les nuds explorer et choisit le nud au meilleur cot.
La slection est globale La mmoire est gre comme une liste
Pr. Imade BENELALLAM IA

La stratgie de recherche Best-First


Insrer le nud correspondant ltat initial (racine de larbre) dans F Tant que F est non vide faire Extraire la tte N de F(h(N) est la plus petite (ou plus grande) parmi celle des autres nuds de F) Si N correspond un tat but alors Sortir de lalgorithme avec cette solution Sinon Gnrer la liste L des successeurs de N Pour chaque lment S de L faire Insrer S dans F(en fin ou en tte de la file) Trier les lments n de F selon un ordre croissant (parfois dcroissant) de h(n) Fin de Tant que Retourner Echec
Pr. Imade BENELALLAM IA

La stratgie de recherche Best-First


Heuristique jeux de taquin : Une heuristique h1 qui pour chaque nud elle associe le nombre de pices mal places dans ltat correspondant ; Une heuristique h2 qui calcule pour chaque nud la somme des dplacements minimaux pour amener une pice sa place.

Pr. Imade BENELALLAM

IA

Jeu de taquin: Best-First

Pr. Imade BENELALLAM

IA

Jeux de taquin: BestFirst


Les proprits de la recherche informe meilleur en premier sont les suivantes : La compltude/ terminaison : Oui, si lespace de recherche est fini et si on procde une vrification dabsence de boucle La complexit en temps : Le nombre de nuds dvelopps est de lordre de O(bm). La complexit en espace : elle est de lordre de O(bm). Car on garde dans la file tous les nuds des niveaux prcdents. Loptimalit : En gnral, Non, car on ne considre pas la distance dj parcourue pour arriver un nud, mais seulement ce qui reste parcourir pour atteindre le but.

Pr. Imade BENELALLAM

IA

La stratgie de recherche A*
Lalgorithme de recherche A* peut tre considr comme une amlioration de lalgorithme de recherche meilleur en premier se basant non seulement sur une fonction heuristique h mais aussi sur une fonction g destimation du cot minimal depuis le nud correspondant ltat initial jusquun nud n. Recherche doublement informe Un poids est associ chaque nud. Un poids est associ chaque arc (action). Chercher le meilleur chemin, qui mne de ltat initial ltat final, en fonction du cot associ chaque chemin. Le graphe (qui reprsente lespace) est construit progressivement On part de ltat initial et on dveloppe progressivement les chemins vers ltat final. La mmoire est une liste de chemins pondrs.
IA

Pr. Imade BENELALLAM

Chemin optimal A*

CheminOptimal(n,m) = min [cheminOptimal(n,mi) + p(mi,m)]; mi : prdcesseur de m, p(mi,m) : poids de l arc mi m. 5 B 3 A 2 8 7 C E 2

6 G 1

4
D
Pr. Imade BENELALLAM IA

Les tapes de base A*

Sur quel critre seffectue le choix du prochain chemin dvelopper ? Selon la fonction f : chaque chemin est associ son cot et le cot du dernier nud n atteint : f(n) = g(n) + h(n);
g(n) donne le cot du chemin optimal, du nud initial au nud n; h(n) estime le cot du chemin restant, de n au nud final.

Pr. Imade BENELALLAM

IA

Les tapes de base A*


Comment dvelopper le chemin (s .. n) ?
Gnrer les successeurs de n, dterminer leur poids et calculer g, h et f pour chaque succ. g(a) = g(n) + p1 h(a) f(a) = g(a) + h(a) s a (a n .. s) p1 n g(n) g(b) = g(n) + p2 b (n .. s) h(n) p2 (b n .. s) h(b) f(b) = g(b) + h(b)
Eliminer le chemin (s .. n). Ajouter tout chemin succ. optimal : (X n .. s) est optimal sil est le seul chemin ou si, par rapport d autres (X..s), son g(X) est le plus petit. On conserve ainsi le chemin optimal (X .. n)
Pr. Imade BENELALLAM IA

Les tapes de base A*

Pr. Imade BENELALLAM

IA

Exercice 1: Dans quels cas la recherche par lalgorithme Hill Climbing serait-elle meilleure que la recherche meilleure en premier? Justifiez votre rponse. Exercice 2 : Dans lespace de recherche ci-dessous, le nombre plac ct de chaque arc reprsente le cot qui lui est associ et h la valeur donne par lheuristique au nud comme estimation de sa proximit du but.

a-Donner f(n) pour chacun des nuds b-Donner lordre dans lequel les nuds seront visits par lalgorithme A*.
IA

Pr. Imade BENELALLAM

Algorithmes de jeux

Ltude des jeux est lun des domaines favoris et fascinants de lIA, il concerne ltude rigoureuse des situations dans lesquelles plusieurs joueurs (acteurs) sont amens effectuer des choix qui dtermineront, du moins en partie, la situation future. Dans plusieurs problmes de jeu, les techniques de recherche vues dans la session prcdente, peuvent tre exploites par les joueurs (notamment les machines) pour optimiser leurs coups et gagner la partie (atteindre ltatbut). Toutefois, dans certains jeux (les plus intressants) dautres techniques sont souvent ncessaires pour guider et restreindre les choix afin dchapper au pige de lexplosion combinatoire et aussi pour prendre en compte la rivalit entre les joueurs pour les jeux avec plus dun joueur.

Pr. Imade BENELALLAM

IA

Classification des jeux

Les jeux peuvent tre classs suivant diffrents critres : linformation disponible aux joueurs au moment de la prise de dcision ; Le nombre de joueurs ; le caractre isol ou rpt du jeu ; la possibilit ou non de coopration entre les joueurs, etc. Le premier critre est celui utilis dans la classification des jeux

Pr. Imade BENELALLAM

IA

Jeux information complte et dterministe


Il sagit des jeux dans lesquels chaque joueur connait en permanence ltat global du jeu, en termes des choix que peut effectuer chacun des joueurs, des consquences de ceux-ci (prochain tat du jeu, gains des diffrents joueurs) et des motivations de chaque joueur (en gnral, chaque joueur vise maximiser son gain et minimiser celui de son (ses) adversaires ). Dans cette catgorie, on trouve des jeux comme les checs, les dames

Pr. Imade BENELALLAM

IA

Jeux information incomplte


Il sagit des jeux o les joueurs peuvent manquer de certaines informations au moment de leur prise de dcision concernant le prochain coup jouer. Linformation manquante est souvent due lintroduction du facteur du hasard dans les rgles du jeu. Cest le cas des jeux de et des jeux de cartes comme le bridge, le poker, le black-jack, etc.

Pr. Imade BENELALLAM

IA

Jeux information complte et nondterministe


Entre les deux catgories ci-dessus, se trouve une troisime catgorie : les jeux information complte mais non dterministe. Ce sont des jeux o les joueurs ne connaissent pas le comportement immdiat des autres joueurs mme sils connaissent lensemble des choix possibles (concernant les coups jouer) et leurs consquences. Cest le cas des jeux dans lesquels les coups des joueurs sont simultans comme les jeux Pierre/Ciseaux/Papier,

Pr. Imade BENELALLAM

IA

Stratgies de recherche Pour les Jeux


Les composants de base d'un algorithme de jeu sont gnralement comme suit : Un gnrateur de coups qui gnre les coups valides, voire plausibles, partir de l'tat courant ; Un test de terminaison qui vrifie si l'tat courant est un gain, une perte ou un nul ; Une fonction d'valuation statique (dite aussi fonction de gain ou d'utilit) qui value la pertinence d'un tat donn indpendamment des coups passs ou futurs ; Une stratgie de recherche heuristique qui permet de choisir entre diffrents coups celui qui semble le plus prometteur.

Pr. Imade BENELALLAM

IA

Stratgies de recherche Pour les Jeux


Dans le cadre du jeu, un nud de lespace de recherche reprsente une configuration, suite un coup de lun des joueurs.
On attribut un score un nud. Au lieu de minimiser le cot, on maximise le score.

Le dveloppement de lespace rsulte dune alternance entre deux joueurs antagonistes. Alternance de niveaux MAX/Agent-A et MIN/Agent-B ?
Pr. Imade BENELALLAM IA

La stratgie de jeu MINIMAX


Niveau MAX : Lagent A choisira le successeur avec le plus grand score. Niveau MIN : Partant d une configuration gnre suite une action de Agent-A, Agent-B devrait choisir le successeur avec le plus petit score; minimise le score de son adversaire. E1 MAX E2 E5 E6 MIN

E3
Pr. Imade BENELALLAM

E4

MAX
IA

La stratgie de jeu MINIMAX


Pour effectuer son choix, lagent-A/MAX ne se limite pas aux successeurs immdiats, il doit envisager plusieurs coups lavance (si je fais .. mon adversaire fera et moi ) et en fonction de cela, il dcidera du successeur prendre. Le choix du successeur direct dpendra des squences que ce dernier pourrait engendrer. La longueur de la squence; le degr de profondeur de lanalyse est fix au dpart. Idem. pour lagent-B/MIN. Score dun nud : calculer ou dtermin directement.
Pr. Imade BENELALLAM IA

exploration en Profondeur MINIMAX


score(a) = max(score(b), score(c), score(d)); score(b) = min(score(e), score(f)); MAX sait que MIN va prendre le nud avec le plus petit score et cest ce score qui sera associ au pre. MAX A
8 8 G 3
Pr. Imade BENELALLAM

C F

D 10 M 2

MIN MAX MIN

E H 8 I 5 J 1 K 9
IA

L 10

Pr. Imade BENELALLAM

IA

Exemple : jeu du TicTac-Toe


Supposons que deux joueurs A et B ont procd ce jeu, en choisissant que A va jouer en premier et avec les symboles de type croix (X) et que B va jouer avec ceux de type cercle (0). Au dbut de la partie, le joueur A (MAX ) a le choix entre 9 cases vide pour placer son premier X. Ensuite, le joueur B (B) devrait choisir entre 8 cases vides pour placer son premier O et ainsi de suite. Supposons quon est arriv ltat suivant et que cest au tour de A de jouer :

Pr. Imade BENELALLAM

IA

Exemple : jeu du TicTac-Toe


valeurs des nuds terminaux ?

Pr. Imade BENELALLAM

IA

ALPHA-BETA
Avec MINIMAX, exploration exhaustive de lespace, .. selon le niveau de profondeur requis. a
b e 7 f 9 5 g 5 4 h i 10

2 j 2 k 7 3 l

1 n

m 9

A-t-on besoin dune recherche exhaustive ?


Pr. Imade BENELALLAM IA

ALPHA-BETA
Avec ALPHA-BETA: recherche slective MAX espre que (b) > (a) mais MIN va essayer de minimiser le (b) Ds que (b) < (a) arrter la recherche du succ pour b MAX = - , 5 a
= + , 7 , 5 b e 7
Pr. Imade BENELALLAM

7 3 k 7

MIN

g f
5 9

h 4
IA

l
3

Pr. Imade BENELALLAM

IA