Vous êtes sur la page 1sur 14

Thorie des jeux

Introduction :.................................................................................................1 Chapitre 1 : Notions de base...........................................................................2 Section 1 : Dfinitions pralables................................................................2 A- Distinction entre jeux coopratifs et jeux non coopratifs....................2 B- Distinction entre jeux information complte et jeux information incomplte.............................................................................................3 C- Distinction entre jeux information parfaite et jeux information imparfaite..............................................................................................3 D- Distinction entre jeux dynamiques et jeux statiques............................3 Section 2 : Prsentation des jeux sous forme normale (stratgique).............3 A- Dfinition initiale................................................................................3 B- Dfinition stricte................................................................................3 C- Exemples : jeux sous forme normale....................................................4 1- Jeu du dilemme du prisonnier..........................................................4 2- Jeu bataille des sexes......................................................................5 3- Jeux trois stratgies et somme nulle (papier, caillou, ciseaux).....5 4- Jeu pile ou face...............................................................................5 5- Jeu dit poule mouille ................................................................5 6- Jeu dentre....................................................................................5 Section 3 : Forme extensive........................................................................6 A- Prsentation......................................................................................6 B- Ecriture stricte...................................................................................7 C- Exemples et passage de la forme normale la forme extensive............7 1- Rcriture pile face.......................................................................7 2- Rcriture jeu pilote terroriste........................................................8 3- Autre cas : Elections ONU................................................................8 Section 4 : Stratgies pures / mixtes...........................................................8 A- Dfinition :.........................................................................................8 B- Evaluation..........................................................................................8 1- Jeu bataille des sexes......................................................................9 2- Exemple 2 :.....................................................................................9 Chapitre 2 : Notions dquilibre......................................................................9 Section 1 : Equilibre en forme normale......................................................10 A- Dominance.......................................................................................10 1- Stratgie dominante.....................................................................10 2- Equilibre en stratgie dominante...................................................10 3- Limites.........................................................................................11 4- Passages stratgies domines....................................................11 5- Equilibre par limination itratives stratgie domines..................11 6- Limites.........................................................................................12 7- Conclusion :..................................................................................13 B- Equilibre de Nash.............................................................................13 a- Dfinition.....................................................................................13 b- Exemples et intuition dun quilibre de Nash..................................13

Introduction :
Dfinition gnrale : la thorie des jeux est un ensemble doutils ou de techniques pour prdire les rsultats quun groupe dagents en interaction peut obtenir. Laction dun agent affecte directement les rsultats ou les paiements des autres agents participant laction globale. Le jeu est un conflit issu dune situation dinteractions. Outils signifie quil y a une dimension technique. Peut-on poser un cadre qui ait une reproductibilit ? La thorie des jeux fait suite logiquement la thorie de la dcision (Savage, ). Dans la thorie de la dcision, les solutions analyses sont celles dun agent face un ensemble

de choix risqus ou non. En thorie des jeux, il y a plusieurs agents. Lide de jeu est issue de la ressemblance formelle entre des problmes de dcision en situation dinteraction et les jeux au sens traditionnel (checs, bridge). La thorie des jeux va sappliquer dans le cas o le nombre dagents est restreint, notamment en conomie. Cest seulement dans ce cas que laction dun agent peut influencer laction et les rsultats dun autre agent. Sinon, laction individuelle dun agent est considr comme nulle (concurrence parfaite). La thorie des jeux pourra tre utilise ds quon aura un nombre restreint dagents : oligopole, duopole. On va avoir un traitement rationnel de linteraction. Les applications sont trs nombreuses, en conomie, conomie industrielle, conomie internationale (USA, Europe, Japon), en conomie du travail (patron, syndicat), en politique, jeux de partis ; en sciences naturelles, biologie (deux populations). On peut analyser toutes les questions lies aux conditions dmergence dun accord (issus dune condition dinteraction). Aujourdhui, lagent peut tre un agent humain, un animal, une machine. Historique : Les anctres de la thorie des jeux taient mathmaticiens. On voque Zermelo en 1913 qui a travaill sur le jeu dchecs et mis le thorme selon lequel le jeu dchecs avait une solution. On considre que le rapport entre conomie et thorie des jeux dbute en 1944 avec le livre de V. Neumann et Morgenstein, Thorie des Jeux et Comportements Economiques. Cest la premire fois quon montre que le conflit peut tre mathmatiquement analys. En 1950-1951, John Nash fait apparatre lquilibre de Nash. On va avoir la thorie des jeux coopratifs et non coopratifs. Jusquen 1970, la thorie des jeux reste un domaine autonome avec peu dinfluence sur lconomie, mis part dans le livre de T. Schelling, The Strategy of conflict. A partir des annes 70, il y a un fort dveloppement en conomie car le problme de linformation des agents devient central. La confirmation de la russite est le prix Nobel dconomie Selten, Haisanyi et Nashen en 1994. Importance conomique : On a un renouvellement de la microconomie, passage du monde walrassien au monde de linteraction entre agents. On passe dune concurrence parfaite une concurrence imparfaite. On va avoir des situations dquilibre multiple. On va au lieu davoir une construction conomique grandiose, lquilibre gnral, on a une srie de cas-types, dhistoriettes.

Plan : I- Notions de base II- Recherche de solutions (quilibres) III- Applications Bibliographie : Yildizoglu, Introduction la thorie des jeux, Dunod 2004 Umbhaver, Thorie des jeux, Vuilbert 2004 Rasmusen, Jeux et info, De Boeck 2004

Chapitre 1 : Notions de base


Section 1 : Dfinitions pralables. A- Distinction entre jeux coopratifs et jeux non coopratifs. Aujourdhui, il y a deux branches distinctes en thorie des jeux. Jeux coopratifs Unit danalyse : coalition (groupes de joueurs agents individuels). La coopration Jeux non coopratifs Unit danalyse : lagent individuel recherche maximiser son intrt, respect

rsulte du fait que les agents sont tenus de signer des accords contraignant sur les stratgies mises en uvre. La coalition forme un but commun. Les firmes forment un cartel dans le but de maximiser leurs produits joints pratiquent un jeu coopratif.

rgles du jeu. Si il y a comptition entre agents, le jeu ne peut avoir lieu que si les intrts les meilleurs de chaque individu pris sparment sont en uvre. Les firmes en situation de monopole la Cournot sont dans un jeu non coopratif.

B- Distinction entre jeux information complte et jeux information incomplte. Il faut introduire lide de structure du jeu. Cest le nombre de joueurs, les actions ou stratgies possibles, les rgles et les gains. Si il y a une information pour chacun des joueurs sur lensemble de la structure du jeu, on est dans un jeu information complte. Si au moins un joueur na pas dinformations sur un lment de la structure du jeu, on est dans un jeu informations incompltes. Ici, on examine que des jeux dinformation complte. C- Distinction entre jeux information parfaite et jeux information imparfaite. La distinction repose sur un seul lment de la structure du jeu, linformation sur les dcisions prises par les autres joueurs. Si chaque joueur au moment de jouer connat les dcisions que lautre joueur a prises antrieurement, on est dans un jeu information parfaite. Si, au contraire, au moins un joueur na pas dinformation sur ce qua jou lautre joueur, on est dans un jeu information imparfaite. Dans les jeux o il y a des dcisions simultanes, on est dans des jeux information imparfaite. D- Distinction entre jeux dynamiques et jeux statiques. Les jeux dynamiques sont les jeux dans lesquels linformation des joueurs volue au cours du jeu (jeux squentiels). Au contraire, les jeux dits statiques sont des jeux pour lesquels il ny a aucune volution de linformation des joueurs au cours du temps. Section 2 : Prsentation des jeux sous forme normale (stratgique). A- Dfinition initiale. Un jeu sous forme normale ou stratgique est une prsentation du jeu telle quon suppose que les joueurs jouent simultanment et disposent de la mme information au moment o ils jouent. Ce sont donc des jeux information imparfaite car les joueurs au moment o ils jouent ne savent pas o ils sont dans larbre de dcision. Cest donc la caractristique dinformation qui est importante ici. B- Dfinition stricte. Un jeu sous forme normale ou stratgique est dfini par les lments suivants : = { N, S, } Le jeu va tre dfini par un ensemble de joueurs dont les noms sont numrs dans lensemble I. I = { 1, 2, , N } Chaque joueur i, avec i N dispose dun ensemble de stratgies Si . Si est lensemble de toutes les stratgies disponibles de i. Si Si indique une stratgie particulire choisie par je joueur i. Alors, lensemble des stratgies du joueur i va tre la liste de toutes les stratgies disponibles pour ce joueur. i i si Si = { s1 , s2 ,..., ni } o ni est le nombre de stratgies disponibles pour le joueur i. On pose s = ( s1 , s2 ,..., i ,..., n ) s s La liste des stratgies choisies par chaque joueur. Cette liste est appele profil de stratgies. Chaque joueur a une fonction de paiement, i , qui assigne chaque profil de stratgies un nombre rel i (s). Chaque fonction de paiement i correspond un vecteur N dimensions. S = ( s1 ,..., n ) s

Et lui assigne un nombre rel

i (s)

Prcisions : Bien distinguer lensemble des stratgies Si qui est lensemble des stratgies disponibles pour un joueur particulier i ; et un profil de stratgies s qui est une liste des stratgies particulires choisies par tous les joueurs. Normalement, on assure que chaque joueur a un nombre fini de stratgies mais cette hypothse peut tre leve, par exemple en conomie industrielle quand on suppose que la firme a un choix de prix infini (non ngatif). La notation { } indique un ensemble dans lequel lordre des lments na aucune importance. La notation ( ) indique un ensemble o un vecteur dans lequel lordre des lments importe. Dans un vecteur qui tablira la liste des stratgies, la premire stratgie sur la liste sera celle du joueur 1, puis du joueur 2, On peut introduire dans le jeu un joueur quon peut appeler nature et qui sera un pseudo-joueur qui jouera alatoirement (par exemple monopole). Dans la thorie des jeux sous forme normale ou autre, les joueurs sont rationnels, cest--dire respectent laxiomatique de la microconomie en univers certain ou incertain. Les prfrences des joueurs ont des proprits qui permettent de traduire les issues, les solutions dun jeu en terme numrique. Un peut dsigner un nombre appel utilit chaque solution du jeu. C- Exemples : jeux sous forme normale 1- Jeu du dilemme du prisonnier Joueur 1 2 Dnonce Se tait Joueur Dnonce (-10 ; -10) (-12 ; 0) Se tait (0 ; -12) (-1 ; -1)

On suppose que deux individus ont t arrts avec prsomption davoir commis ensemble un crime. Ils sont placs sparment en cellules et la police donne chacun deux loption de dnoncer lautre avec la rgle suivante : - Si seulement un des deux dcide de dnoncer, il est libre alors que lautre prend douze ans. - Si les deux se dnoncent, ils prennent dix ans chacun. - Si aucun ne collabore avec la police, il y a peu de condamnation car il y a un manque de preuve. Le dilemme rside dans le fait que les deux joueurs gagnent collectivement se taire mais quindividuellement, ils ont intrt dnoncer quel que soit le comportement de lautre. Joueur 1 2 Paix Guerre Joueur Paix (2 ; 2) (3 ; 0) Guerre (0 ; 3) (1 ; 1)

Remarque : N=2 S1 = S2 = { paix, guerre } Quatre profils de stratgie : (P, P) , (P, G), (G, P), (G, G) Les paiements s =
1

(p, p) = 2

Les joueurs doivent communiquer et pouvoir prendre des engagements formels. Ici on a un jeu 2 * 2, chacun des deux joueurs a deux stratgies disponibles. Le type de jeu dilemme du prisonnier suppose des conditions sur les paiements a < c , a > g > c, b < d et b > h > f On peut transposer le jeu du dilemme du prisonnier sur les cas de course aux armements, de marchandage politique, de formation de prix doligopole, doffres denchres.

2- Jeu bataille des sexes. Joueur 1 2 Foot Shopping Joueur Foot (3 ; 2) (0 ; 0) Shopping (1 ; 1) (2 ; 3)

Cest aussi un jeu standard. Un jeune couple doit dcider dune date o ils font une sortie ensemble. Ils ont dj anticip leurs possibilits, soit football, soit shopping. Si ils dcident le premier choix, ils se rencontreront au stade lheure de dmarrage du match. Sils dcident le second choix, ils se trouvent lentre des Nouvelles Galeries une heure prcise, on suppose quils nont pas de tlphone portable et que la dcision doit tre prise sparment au mme moment. Les prfrences de chacun des individus sont les suivantes ; la fille veut aller au match, et le garon faire du shopping. Dans tous les cas, ils prfrent faire quelque chose ensemble plutt qutre spars. Les paiements sont lis ces prfrences. Ce qui caractrise le jeu cest que les situations o ils sont ensemble (F, F) et (S, S) sont les plus satisfaisantes. Ce jeu va tre aisment transposable des problmes conomiques de standard technologique. Firme 1 A ou B Firme 2 A ou B Entente sur A ou sur B sinon cot important. 3- Jeux trois stratgies et somme nulle (papier, caillou, ciseaux). Joueur Joueur 2 Papier Caillou Ciseaux 1 Papier (0 ; 0) (-1 ; +1) (+1 ; -1) Caillou (+1 ; -1) (0 ; 0) (-1 ; +1) Ciseaux (-1 ; +1) (+1 ; -1) (0 ; 0)

Si le joueur 1 gagne, le joueur 2 perd. Si le joueur 1 nul, le joueur 2 nul. Si le joueur 1 perd, le joueur 2 gagne. 4- Jeu pile ou face. Joueur 1 2 Pile Face Joueur Pile (+1 ; -1) (-1 ; +1) Face (-1 ; +1) (+1 ; -1)

Chacun des joueurs crit son choix sur on bout de papier. Si ils font la mme chose 2 donne 1. Sinon 1 donne 2. 5- Jeu dit poule mouille . Joueur 1 2 R A Joueur R (1 ; 1) (2 ; 0) A (0 ; 2) (-1 ; -1)

Deux voitures se dirigent lune en direction de lautre forte vitesse dans une rue trop troite pour quelles se croisent sans tre endommages moins quun des conducteurs ne ralentisse. Si un conducteur ralentit alors que lautre continue la mme vitesse, cest celui qui na pas ralenti qui gagne, si les deux ralentissent, le degr damour propre sera non modifi pour les deux joueurs et si aucun des deux ne ralentit, il y aura des consquences ngatives pour les deux. 6- Jeu dentre.

Joueur 1 2 Nentre pas Entre

Joueur

Bataille (0 ; 2) (-1 ; -1)

Concession (0 ; 2) (+1 ; +1)

On considre deux firmes qui veulent tre prsentes sur un march. La firme 2 est dj prsente sur le march alors que la firme 1 se demande si elle va rentrer ou pas face la raction de la firme 2 qui peut soit se battre (guerre des prix) ou au contraire faire des concessions. Remarque : Dans un jeu symtrique, les paiements des joueurs sont strictement quivalents le long de la diagonale du jeu. Quand on est dans un jeu symtrique, la stratgie rationnelle du joueur 1 est automatiquement celle du joueur 2. Bien sur, un jeu de structure simple ne peut expliquer la complexit de la ralit conomique mais le but de la thorie des jeux nest pas de remplacer le dcideur et lui fournir la solution son problme dinteraction, mais cest seulement indiquer que certains proprits dun contexte stratgique, contrairement dautres contextes, sont susceptibles davoir un impact sur les rsultats. Il suffit denrichir la stratgie pour guider laction. Un langage strict existe dans la thorie des jeux pour dcrire diffrents contextes stratgiques. On a donc une cohrence pour traiter des problmes de nature diffrente mais identiques sur le plan stratgique. Il faut faire attention aux exigences de rigueur qui permettent de passer dun contexte conomique un jeu, et aux solutions ventuelles. Section 3 : Forme extensive. A- Prsentation. Cest la forme de prsentation dun jeu la plus rigoureuse, dont la forme normale nest quun cas particulier. On prsente le jeu comme si les joueurs choisissaient en mme temps, donc disposent du mme type dinformations. Dans la prsentation sous forme extensive, les joueurs jouent plusieurs tapes, le temps intervient ; les dcisions sont donc squentielles. Linformation est les actions joues possibles chaque tape sont alors plus prcises. Cest la forme la plus fondamentale et la plus complte pour reprsenter le jeu. La forme normale est apparemment plus simple mais elle est trompeuse lorsque le jeu devient complexe et la spcification totale du jeu est seulement rendue par la forme extensible. Le jeu sous forme extensible va tre reprsent par un arbre avec un sommet initial, des sommets intermdiaires et des sommets terminaux, des arcs (branches) qui lient sommets de dcision aux sommets terminaux pour dcrire les actions dun joueur sur un sommet de dcision prcis. Exemple :

Un avion doit aller New York. Mais un terroriste est dans lavion pour le dtourner Cuba. La menace repose sur le fait quil peut faire sauter lavion avec une bombe. On suppose ici que chaque joueur sait ce que lautre va faire quand cest son tour de jouer. On associe les gains sur les sommets terminaux. En dehors de ces arcs et de ces sommets, on va reprsenter lensemble des actions sous la forme suivante
t A c = {B, N,

B} avec ici le fait que lensemble des actions est le mme pour deux sommets pour le joueur terroriste mais ce nest pas obligatoire. Les paiements sont associs chaque sommet terminal. B- Ecriture stricte. On va crire le jeu sous une forme plus stricte avec six lments : - Une liste de N 1 joueurs, indexs par i = 1, 2, , n (0 si nature) - Un ensemble de sommets formant une partition : V = { Vo } u V u Vt Vo na pas de prdcesseur : sommet initial. V \ Vt cest--dire V priv de Vt : ensemble des sommets de dcision. Vt ensemble des sommets terminaux. Il y a un arbre dlments. Un joueur est associ chaque sommet V \ Vt. Il doit prendre alors une dcision. Cest son tour de jouer (un joueur peut tre associ plusieurs sommets). Il y a donc un ordre du jeu. Pour chaque sommet de dcision V, il y a un ensemble fini dactions A (V) (non de stratgies). Chaque action mne un unique successeur immdiat de V. Ainsi, on donne un nom chaque arbre de larc. Des ensembles dinformations qui sont une partition des sommets de dcision V \ Vt. On les introduit pour indiquer que le joueur peut tre amen jouer sans savoir les dcisions prises aux tapes antrieures du jeu (alors jeu information imparfaite). Dans ce cas, il ne sait distinguer entre deux sommets de larbre (ou lindique alors par un trait pointill ou patate liant les deux sommets). Donc un ensemble dinformations pour un joueur est une collection de sommets de dcisions telle que : - Cest son tour de prendre sa dcision. - Si on est dans un jeu information imparfaite, on est en prsence de singleton. Sinon, ils peuvent grouper plusieurs sommets de dcisions. A chaque sommet terminal dans lensemble Vt, on associe des paiements pour chacun des joueurs. Quelques prcisions : Diffrence entre actions et stratgies : on a employ dans la dfinition le terme action car dans un jeu forme extensive, la dfinition dune stratgie est plus labore que dans la forme normale. En effet, dans la forme normale, chaque joueur possde un seul ensemble dinformations. Donc ce quon appelle stratgie pour le joueur i dans un jeu sous forme extensible va spcifier laction que prend le joueur i tous les ensembles dinformation o cest son tour de jouer. Ainsi dans notre jeu pilote terroriste, le joueur 1 pilote a deux stratgies New York ou Cuba. Dans ce cas, lensemble de ces actions est quivalent lensemble de ses stratgies car il nest appel jouer quune seule fois au sommet initial. Par contre, le joueur 2 a quatre stratgies possibles partir de deux actions St = { (B ; B) ; (B ; NB) ; (NB ; B) ; (NB ; NB)} dans lequel la stratgie (B ; NB) indique que le joueur 2 opte pour laction bombe si le joueur 1 va New York et pour laction non bombe si le joueur 1 va Cuba. Donc, dans la stratgie, le premier lment se rfre laction du terroriste au sommet de c ; la deuxime laction du terroriste au sommet de n. Une stratgie est une fonction qui associe chaque ensemble dinformations une action. Sous forme extensive, les sommets et les arcs dun jeu doivent respecter certaines conditions, par exemple, il faut une racine unique du jeu, on interdit les cycles (boucles), puisque, dans ce cas, il ny aura pas dissues au jeu. Donc cela veut dire que toute partie du jeu traverse un ensemble dinformations quune seule fois. Enfin, on exclut aussi les situations o il y a deux arcs ou plus conduisant au mme sommet. C- Exemples et passage de la forme normale la forme extensive. 1- Rcriture pile face. Joueur Pile Face (+1 ; -1) (-1 ; +1) (-1 ; +1) (+1 ; -1)

Joueur 1 2 Pile Face

On peut reprsenter le jeu sous forme extensive mme si en gnral un jeu sous forme normale correspond diffrents jeux sous forme extensive. Pilote Terroriste New York Cuba 2- Rcriture jeu pilote terroriste. B;B B ; NB NB ; B -1 ; -1 -1 ; -1 -1 ; -1 1;1 2;0 -1 ; -1 NB ; NB 2;0 1;1

3- Autre cas : Elections ONU. On doit lire un secrtaire gnral de lONU sur la priode 1997-2001. Il y a un premier candidat B et un deuxime candidat A. B tait secrtaire gnral dans la priode antrieure, mais fait face lopposition amricaine. Une candidate H, premier ministre finlandais a la faveur des Etats-Unis. Mais les pays africains souhaitent un membre issu de leur continent. Pour analyser llection, on tente de construire un modle simple de thorie des jeux. On considre quil y a seulement deux votants, USA et Afrique. On considre que les Etats-Unis votent dabord en mettant un veto sur un des trois candidats. LAfrique joue et met un veto sur lun des deux candidats restants. On suppose que les prfrences des joueurs sont les suivantes, pour les USA H > A > B ; pour lAfrique, B > A > H. On suppose les paiements suivants, on gagnera 1 si son meilleur candidat est lu, 0 si cest le deuxime choix, -1 si cest le troisime choix. Le problme est de reprsenter le jeu sous forme extensive et sous forme normale. Section 4 : Stratgies pures / mixtes. A- Dfinition : Les stratgies mixtes sont une classe diffrente des stratgies pures. Pour le moment, nous navons eu faire qu des stratgies pures. Une stratgie mixte, cest pour le joueur une distribution de probabilits sur ces stratgies pures. Si un joueur i a n stratgies pures, une stratgie mixte sera un vecteur de probabilits (p1, p2, , pn) avec pk

0, k = 1, , M et

k =1

pk = 1.

Une stratgie pure est finalement aussi une stratgie mixte dans le sens o p1 = 1 et pk = 0. Tout type de jeu a des stratgies pures et des stratgies mixtes alors quil existe des stratgies spcifiques en jeux sous forme extensive. B- Evaluation. Comment valuer des paiements associs des stratgies mixtes ? On va utiliser le premier thorme de lutilit espre. Une fonction dutilit sur une distribution de probabilits peut tre dcrite comme lutilit espre du rsultat issu de cette loterie (transitivit, compltude). Donc si on a une loterie avec n rsultats possibles x1, x2, , xn et une liste associe de probabilits pour chacun des rsultats, alors le thorme nous dit que lutilit de cette loterie est gale lutilit espre. On retrouve les fonctions dutilit habituelles mais en univers incertain. Sous certaines restrictions, on peut reprsenter les fonctions dutilit sur les loteries par les fonctions dutilit sur les gains. Ceci permet une comparaison entre distribution de probabilits. Sur cette base, il faut donc deux oprations pour dterminer le paiement anticip. On va pondrer le paiement de chaque stratgie pure par la probabilit avec laquelle elle est joue, puis on ajoute les paiements par leur probabilit.

Joueur 1 2 Foot Shopping

1- Jeu bataille des sexes. Joueur Foot (3 ; 2) (0 ; 0)

Shopping (1 ; 1) (2 ; 3)

Supposons que lhomme fasse du shopping avec une probabilit 1/3 et aille voir un match avec une probabilit 2/3 ; et que la femme joue en stratgie pure football. La probabilit que les deux joueurs aillent voir un match est 2/3 ; la probabilit pour que lhomme soit seul pour faire du shopping est 1/3. Paiement de lhomme = 2/3 * 2 + 1/3 * 1 = 5/3. Si la femme joue en stratgie pure shopping Paiement de lhomme = 1/3 * 3 = 1 2- Exemple 2 :

On sait que le produit de la probabilit de chaque stratgie est la probabilit pour que les deux individus se retrouvent en un mme lieu. Le paiement anticip de lhomme sera (3 * 1/3) + (1 * 1/6) = 7/6. A quoi ces rsultats servent-ils ? Pourquoi un joueur raisonnerait-il en mixte plutt quen pur ? Il y a deux raisons : Dordre technique, parce quon peut montrer que les gains du joueur sont suprieurs parfois en mixte quen pur. En plus, on peut trouver en stratgie mixte des solutions quon ne trouve pas en stratgie pure. Dans le jeu pile face, il ny a pas de solutions en stratgie pure. Or ce jeu, en stratgie mixte, trouve une solution. Plus gnralement, on vrifie que dans un jeu o le nombre de joueurs et de stratgies pour chacun des joueurs est fini, lensemble des stratgies mixtes garantit toujours, de par leurs proprits mathmatiques, des solutions. Dordre conomique. Elle peut se justifier par plusieurs concepts : - En finances, par un choix alatoire on obtenait des rsultats suprieurs aux modles labors par des choix en stratgie pure (exemple placement en A ou en B). - Dans une entreprises, ouvriers dentretien / chef datelier. Il y a un conflit et les ouvriers dentretien cherchent faire respecter certaines ngligences aux chefs. Ils cherchent donc une stratgie, sils laissent passer des petites ngligences nombreuses, ils vont se faire remarquer, de mme que de grosses ngligences ponctuelles. Selon Unbauer, le choix alatoire est celui o ils risquent le moins de se faire remarquer.

Chapitre 2 : Notions dquilibre


Une X quon a dfini le jeu (passage de la situation conomique une historiette qui dtermine les rgles du jeu), on peut chercher les diffrents profils de stratgie. Dans les jeux Z * Z, il y a quatre profils de stratgie, et on va faire une prvision de lissue du jeu. Exemple : Est-ce que le jeu guerre / paix se finit-il ? Donc la thorie des jeux prtend de plus en plus offrir une prvision de lissue du jeu. Pour faire ces prvisions on a besoin de mthodes et de dfinitions dalgorithmes pour rapprocher lensemble de tous les profils possibles vers un petit nombre de profils quon va appeler quilibre. Il va falloir spcifier les notions dquilibre et la thorie des jeux va prendre de nouvelles notions dquilibre. Idalement on aimerait trouver une mthode qui slectionne un seul profil et non un seul quilibre, dans ce cas-l, le profil sera unique. Cependant, en thorie des jeux les quilibres ne sont pas uniques et parfois on ne trouve pas dquilibre. On rappelle quon profil de jeux scrit s = (s1, s2, s3, , si, , sn). On notera s-i la liste de ce que tous les joueurs autre que i jouent.

Section 1 : Equilibre en forme normale. Deux types : - Notion de dominance. - Notion dquilibre de Nash. A- Dominance. 1- Stratgie dominante. Une stratgie particulire joueur i si le paiement li cette stratgie est strictement suprieur au paiement de tout autre stratgie sans tenir compte de la stratgie choisie par les autres joueurs, ainsi :
i s S i est appele stratgie strictement dominante par le

i s ; s i > i ( s i ; s i ) pour tout si et tout s-i.


Exemple : Jeux guerre / paix Pays 1 Guerre Paix Pays 2 Guerre (+1 ; +1) (+3 ; 0) Paix (+3 ; 0) (+2 ; +2)

On peut montrer que s1 = guerre est une stratgie dominante pour le joueur 1. Preuve : Recensons toutes les actions possibles joues par le joueur 2 - Si le joueur 1 joue s1 = guerre alors 1 (guerre, guerre) = 1 > 0 = 1 (paix, guerre) - Si le joueur 2 joue s2 = paix alors 1 (guerre, paix) = 3 > 2 = 1 (paix, paix) Exemple : Top Bottom Left 7 7 Right 6 3

La stratgie top est faiblement dominante pour le joueur 1 sur la stratgie bottom . Une stratgie particulire
i s S i est appele stratgie faiblement dominante pour un

joueur i sur une autre stratgie

i -i i s ; s i i ( s ; s i ) pour tout s

i ^ i i ^ i ^ i s ; s i s ; s pour tout s -1.


La stratgie

s , si

^ -1

fait au moins aussi bien que

-1

contre chaque stratgie des autres

joueurs et elle fait strictement mieux contre certaines dentre elles 2- Equilibre en stratgie dominante. Le profil de stratgies

^ -1

i s ; s ;...; s o s S i pour tout i = 1, 2, , N est dite quilibre en i s est une stratgie dominante pour chaque joueur i.

stratgies dominantes si

Exemple : Jeu guerre / paix - Si le joueur 2 joue s1 = guerre alors 1 (guerre, guerre) = 1 > 0 - Si le joueur 2 joue s2 = paix alors 1 (guerre, paix) = 3 > 2 = 1 (paix, paix)

Dans ce cas l, la solution du joueur 2 cest (paix, paix) Donc on peut montrer que dans le jeu droite / gauche, la stratgie faiblement dominante du joueur 1 top et pour le joueur 2 la stratgie faiblement dominante est left . Le profil dquilibre en stratgie dominante sera (T, L) = (7, 3) 3- Limites. Il existe des situations de jeu pour lesquelles on narrive pas identifier un quilibre en stratgie dominante. Exemple : Jeu bataille des sexes Jacob Rachel Opra Foot

Opra (2 ; 1) (0 ; 0)

Foot (0 ; 0) (1 ; 2)

On veut montrer quil ny a pas dquilibre en stratgie dominante dans certains jeux. Preuve : Il suffit pour montrer que lun des joueurs na pas de stratgie dominante alors il ny aura pas dquilibre en stratgie dominante.
J J (w, w) = ( , w) Si Rachel va au foot, sR = alors Jacob choisira car J ( , ) = 1 > 0 = J ( w, )

Jacob : Si Jacob choisit sR = opra,

Donc le joueur 1 na pas de stratgie dominante. Labsence dquilibre en stratgie strictement dominante : Joueur 1 2 1 2 3 Joueur 1 2 1 2 3 Joueur 1 (1 ; -1) (-1 ; 1) (-2 ; 5) Joueur 1 (1 ; -1) (-1 ; 1) (-2 ; 5) 4- Passages stratgies domines. Dfinition : Une stratgie
i i s est strictement domine par un joueur i par la stratgie s n si

2 (-1 ; 1) (1 ; -1) (-3 ; 2) 2 -1 1 -3

elle assure un paiement plus faible quune autre stratgie, quel que soit le comportement des joueurs autre que i.
i i i s ; s i < i ( s N ; s i ) pour tout s i S i quel que soit s .

De mme, on aura une stratgie faiblement domine si une stratgie alternative fait au moins aussi bien quelle tout le temps et quelque fois strictement mieux. 5- Equilibre par limination itratives stratgie domines. On peut obtenir un quilibre si en liminant successivement les stratgies domines dans le choix rationnel des agents, il subsiste un seul profil quon appellera quilibre par diminution itrative des stratgies domines. Up Middle Down Left (1 ; 1) (0 ; 2) (0 ; -1) Right (0 ; 1) (1 ; 0) (0 ; 0)

Down est faiblement domine par up. Il lenlve.

Rationnel donc on sait que 1 est rationnel et a vir down. Right est faiblement domin donc il lenlve. Rationnel donc on sait que 2 a vir right. Il choisit up. Profil dquilibre : (UP, LEFT) On a au moins une stratgie faiblement domine par le joueur 1 down. Pour le joueur 2, la stratgie right est domine faiblement. Up => (U, L) Exemple : Elections ONU. A B H HAA (-1 ; 1) (1 ; -1) (-1 ; 1) HHA (-1 ; 1) (0 ; 0) (-1 ; 1) HAB (-1 ; 1) (1 ; -1) (0 ; 0) HHB (1 ; -1) (0 ; 0) (0 ; 0) BAA (1 ; -1) (1 ; -1) (-1 ; 1) BHA (1 ; -1) (0 ; 0) (-1 ; 1) BAB (1 ; -1) (1 ; -1) (0 ; 0) BHB (1 ; -1) (0 ; 0) (0 ; 0)

USA : H > A > B Afrique : B > A > H Partons avec lAfrique : Entre B et H, B est prfr Entre A et H, A est prfr Entre A et B, B est prfr HHA domine toutes les autres stratgies. Le jeu devient : USA A B H Afrique (-1 ; 1) (0 ; 0) (-1 ; 1)

A et H sont domins par la stratgie B. La meilleure chose que les Etats-Unis puissent faire, cest user de leur veto pour B. LAfrique met son veto sur A. Kofi Annan est lu. 6- Limites. La recherche dquilibre par limination ditrations est simple mais elle prsente trois problmes : -> Problme de la dfinition de la rationalit : Aucun joueur ne joue une stratgie domine, cest une hypothse rationnelle. Aucun joueur ne joue une stratgie domine avant que les stratgies domines des autres aient t limines est une hypothse rationnelle. Par contre, aucun joueur ne joue une stratgie qui devient domine aprs cinquante coups dlimination des stratgies domines semblent moins rationnelles. Ceci suppose que chaque joueur saccorde ce que les autres soient rationnels chaque round dordre suprieur. Il ny a donc pas de droit lerreur. Cette hypothse est appele hypothse de connaissances communes . Un fait F est une connaissance commune de deux joueurs i et j si et seulement si i sait F, j sait F, i sait que j sait F, j sait que i sait F, i sait que j sait que i sait F Les agents risquent de faire des erreurs. On retrouve le mme problme quen microconomie sur la rationalit des agents, et le problme de ralisme des hypothses. -> Dans le processus dlimination itratif des stratgies domines, lordre importe quand la domination est faible Joueur Joueur 2 Top 1 Left (0 ; 0) Right (0 ; 1)

Bottom

(1 ; 0)

(0 ; 0)

Le joueur 1 limine top. Le joueur 2 limine left. Le joueur 1 quilibre (B, R) = (0 ; 0). -> Dans certains cas, il ny a pas de solutions. Joueur 1 Left Joueur 2 Top (1 ; 1) Bottom (0 ; 0) Il ny a pas de stratgie dominante ni de stratgie domine. 7- Conclusion : Il faut donc passer une autre dfinition de lquilibre et donc videmment un autre algorithme. Prcision : stratgie dominante / domine. On compare pour le joueur 1 les lments de chaque ligne entre eux et pour le joueur 2 les lments de chaque colonne entre eux. B- Equilibre de Nash. a- Dfinition. En 1951, John Nash (matheux au dpart) a fourni la preuve de lexistence dun concept dquilibre qui est devenu la notion la plus couramment utilise pour analyser les jeux. Cette notion apparaissait implicitement chez Cournot dans lquilibre du duopole. Un profil de stratgies Right (0 ; 0) (2 ; 2)

s,

s = (s
^

^1

quilibre de Nash (NE) si aucun joueur ne trouve bnfice dvier, tant donn la non dviation de tous les autres de leur quilibre de Nash. Pour tout i, i = 1, 2, , n

^2 ^N ^i ; s ;...; s o s S i pour tout i = 1, 2, , N est dit

Si on a ingalit strict, alors lquilibre de Nash est strict donc il y a une unique stratgie. Joueur 1 2 H M B b- Exemples et intuition dun quilibre de Nash. Joueur G D (3 ; 0) (0 ; 0) (1 ; 1) (0 ; 1) (3 ; 1) (1 ; 0)

^ i ^ i ^ i ^i i s ; s i s i ; s pour tout s i S i ; s i s

Il ny a pas de dominance. Lide de Nash est de constituer une peine danticipation de stratgies telles que si chacun que son adversaire jouer la stratgie qui lui appartient alors il aura intrt jouer la stratgie que son adversaire anticipe. Si une telle situation existe, alors les anticipations des joueurs seraient auto-ralises telles que aucun des deux naurait intrt ne pas se conformer lanticipation de lautre. Exemple : Keynes, sur les marchs financiers parlait de concours de beaut . Le but du concours de beaut est de trouver la fille la plus belle. Keynes dit que ce nest pas vrai, il ne faut pas trouver la fille la plus belle mais la fille que les autres trouveront la plus belle. Il faut se caler sur lanticipation de lautre. Le march financier fonctionne sur lide quil faut que je trouve la valeur sur laquelle les autres anticipent. On a toujours intrt se conformer lide de lautre. Chez Keynes, il ny a pas de jeu conomique individuel du calcul strictement microconomique.

Les quilibres en stratgie dominante ou domine indiquent une solution dans laquelle peu importe ce que lautre fait. On sort de ce que fait lautre. Au contraire ici on se fait une certaine ide de ce que lautre fait. Ici je choisis la stratgie A sans avoir besoin de savoir que A fait mieux que contre toutes les autres stratgies de lautre joueur, jai juste besoin de savoir si a fait mieux contre la stratgie spcifique de mon adversaire. On dit dans ce cas que la stratgie a est une meilleure stratgie best reply contre la stratgie connue de lautre stratgie si elle fait mieux que les stratgies contre elle. La stratgie connue veut dire que lon ne sait pas ce que lautre veut jouer. Si deux joueurs jouent une meilleure rponse alors on aura un quilibre de Nash. En dautres termes, si chaque joueur joue un best reply et que les stratgies sont correctes, aucun joueur nest incit dvier alors je suis en quilibre de Nash.

Vous aimerez peut-être aussi