Vous êtes sur la page 1sur 88

Introduction à la théorie

des jeux

Dr. Mouna ELAMCHKOUR


Avant d’introduire le plan!
En quoi consiste la théorie des jeux ?

D’où vient-elle ?

Comment peut-elle nous être utile ?

S2
Master IoT 2
Introduction:

S2
Master IoT 3
Théorie des jeux?
Analyse des comportements stratégiques des agents
Utilisée en économie, relations internationales,
jeux d‘argent ou de société, réseaux et télécom,
etc.

En quoi consiste la théorie des jeux ?

On parle de jeu dés que des personnes interagissent :


Vente aux enchères
Fixation d’un prix par une firme
Gestion de congestion sur un canal
Négociation de contrat S2
Master IoT 4
Introduction:
Sécurité
Financial

Sécurité Éducation Ecosystème

Reproducti
Adaptation
on

Travail Bien-être Familial


Bien-être

Stabilité
Nourriture évolutionnai
re
Environne
Santé
ment
Environnem
ent
Activité
social

S2
Master IoT 5
Pour le télécom:
Le bien-être est:
◦ Performance,
◦ cout,
◦ satisfaction,
◦ délai de transfer,
◦ débit,
◦ consommation de l’énérgie,
◦ QoS, QoE, …
Concernant:
◦ Un utilisateur,
◦ un nœud,
◦ un sous-réseau,
◦ un opérateur…

S2
Master IoT 6
Qu’est ce qu’un jeu?
Prise de décision intéractive
Un jeu n’est pas toujours competitif
◦ Les jeux coopératifs s’interéssent à la coopération la coalition la
négociation, l’enchair, l’équipe, contrôl distribué, …
Cooperatif ou non-coopératif, o parle toujours stratégie
Elements de base:
◦ Joueurs
◦ Actions,
◦ Préferences
◦ Gain,
◦ Information
◦ L’ordre du jeu

Cournot 1838, Bertrand 1883, Borel 1921, Edgeworth 1925, von Neumann1928, Fisher 1930
Stackelberg 1934,Ville 1938, Nash 1950, Isaacs 1965, Hamilton 1967, etc
S2
Master IoT 7
Définition
Un jeu est une situation où

◦ des individus (les joueurs) sont conduits à


faire
◦ des choix (actions) parmi un certain
nombre d'actions possibles
◦ dans un cadre défini à l'avance (les règles du
jeu).

S2
Master IoT 8
Définition
Théorie des jeux : description de ce qui
se passe quand des joueurs interagissent
de manière rationnelle
La rationalité est une propriété qui
concerne les choix : un joueur est
rationnel s’il choisit une meilleure
réponse face à ses croyances.

S2
Master IoT 9
Définition
La théorie des jeux peut être définie
comme l’étude des modèles
mathématiques de conflit et de
coopération entre des décideurs
intelligents et rationnels
(Myerson 1991)

Le joueur rationnel fonde ses décisions


afin d’atteindre ses objectifs personnels
◦ Ex. maximisation de ses gains espérés
S2
Master IoT 10
Jeux statiques
Ce sont les jeux les plus simples que l’on
peut rencontrer.
Chaque joueur joue une seule fois, sans
connaitre les choix des autres joueurs.
De ce fait, les décisions sont prises dans
un contexte d’information imparfaite.

S2
Master IoT 11
La bi-matrice des réglements
Formellement, un jeu statique est défini
par la donnée de trois éléments :
◦ l’ensemble de joueurs (qui joue ?),
◦ Les ensembles de stratégies (que peuvent
faire les joueurs ?)
◦ et les fonctions de réglements (combien
obtiennent les joueurs ?).
En cas de 2 joueurs, ces éléments
peuvent être synthétisés dans un tableau
appelé « bi-matrice des règlement »
S2
Master IoT 12
Exemple: dilemme de prisonniers
Le jeu dans sa forme classique
◦ Deux suspects son arrêtés par la police, mais
la police manque de preuve pour les
emprisonner.
◦ Il ne peuvent les condamner qu’à un an de
prison pour des faits mineurs.
◦ La police doit les faire avouer.

Comment s’y prendre ?

S2
Master IoT 13
Dilemme de prisonniers
Les policiers proposent un marché
◦ Si les deux avouent, ils auront chacun 5 ans, si l’un
avoue et l’autre nie, ils encourent 1 ou 10 ans, si les
deux nient, chacun aura 2 ans de prison

2ème criminel
Matrice des gains
avoue nie

avoue (5;5) (1;10)


1er criminel
nie (10;1) (2;2)
S2
Master IoT 14
Même exemple:

Les stratégies optimales sont donc bien définies et le résultat du jeu (ou
équilibre) est donné par le « profil » de stratégies (prix bas, prix bas) ; ce
faisant, les joueurs obtiennent un règlement de 40 chacun.

S2
Master IoT 15
Exemple: le vote stratégique
Ce célèbre paradoxe illustre la façon dont la théorie des jeux est
susceptible d’éclairer une situation de vote.
Trois personnes, 1, 2 et 3, doivent choisir une option parmi trois
possibilités, A, B et C.
La règle appliquée est la suivante : chaque personne vote pour une option
et l’option choisie est celle qui recueille le plus de voix ; en cas d’égalite,
c’est 1 qui, en tant que « président » (chairman), impose son choix.
L’ordre de préférence de 1 est A, B, C (il préfère A à B, B à C et A à C) ;
ceux de 2 et 3 sont respectivement C, A, B et B, C, A (ces préférences sont
connues de tous).
Si chacun vote naïvement, chaque option obtient une voix et la préférence
de 1 s’impose : A sera élue. Mais qu’en est-il si les électeurs votent
stratégiquement ? Il est clair que personne n’a intérêt à voter pour son
dernier choix ; chaque électeur peut donc a priori envisager deux
stratégies : voter pour son premier choix ou bien voter pour son
deuxième choix (« vote utile »).

S2
Master IoT 16
Exemple: le vote stratégique

Pour 1 la stratégie dominante (faiblement) est A, et puisque c’est sa préférence


Donc il choisit A

Préférant C à A, le 2 choisit C. 3 : il sait que 1 vote A et que 2 vote C. En comparant


les résultats de ses deux stratégies (A s’il vote B, C s’il vote C), il choisira de voter
S2
pour C (son second choix) qui sera donc élue. Master IoT 17
D’où vient la Théorie des Jeux ?

XIXème siècle : deux économistes français,


Cournot puis Bertrand, formalisent l’interaction
stratégique d’entreprises en concurrence sur un
marché

Evolution de la théorie des jeux (1944)


The theory of games and economic behavior Von
Neumann et Morgenstern

S2
Master IoT 18
Classification de jeux

Von Neumann : deux approches de la théorie


des jeux :

◦ L’approche stratégique ou Théorie des Jeux NON


COOPERATIFS

◦ L’approche en termes de coalitions ou Théorie des Jeux


COOPERATIFS

S2
Master IoT 19
Jeux non-coopératifs

Les plus étudiés


Principe :
◦ On détermine ce que les joueurs peuvent faire au
cours du jeu (Règles du jeu)
◦ On recherche une stratégie optimale pour chaque
joueur
Ce qui est optimal n’est pas tjrs immédiat…
◦ Dépend de ce qu’on pense être la stratégie optimale de
l’adversaire

S2
Master IoT 20
Cas particulier résolu par Von Neumann &
Morgenstern :
◦ Jeux à somme nulle (ou strictement
compétitifs)
◦ jeux à 2 joueurs dans lesquels tout gain d’un
joueur est immédiatement compensé par une
perte correspondante de l’autre

Ex. échecs, poker…

S2
Master IoT 21
Théorie des jeux coopératifs
Approche coalitionnelle
Principe : cherchent à décrire le comportement
optimal dans les jeux à plusieurs joueurs.
Plus difficile VNM n’ont pas cherché à
indiquer la stratégie optimale pour chaque
joueur
Mais une classification des modèles de
coalitions correspondant à un comportement
rationnel

S2
Master IoT 22
D’où vient la th. des jeux (suite)

Début des années 50 : John Nash (mathématicien)

l’équilibre dans les stratégies (jeux non


coop.)

… idée déjà suggérée par Cournot (1832), mais


sur laquelle VNM avaient buté (d’où leur
limitation aux jeux à somme nulle)

S2
Master IoT 23
Equilibre de Nash

Outil le + important de la théorie des jeux

Déf. L’équilibre de Nash se produit lorsque le


choix stratégique de chaque joueur est la
meilleure réponse aux choix stratégiques des
autres joueurs

S2
Master IoT 24
Equilibre de Nash (suite)
Implication :
on est à l’équilibre (de Nash) si aucun joueur
n’a intérêt à dévier unilatéralement de cette
situation

… c. à d. qu’aucun joueur n’a moyen d’agir


individuellement pour améliorer ses gains.

S2
Master IoT 25
CE QU’ON A VU …

Théorie des jeux : introduction & définition

Rappelons!

S2
Master IoT 26
Qu’est-ce que la théorie des jeux ?
Eber: « outil mathématique permettant
d’analyser les interactions stratégiques
entre individus, en particulier quand ils
ont des intérêts divergents »

Rasmussen: « la théorie des jeux a pour but


d’analyser les actions prises par des
décideurs conscients que leurs actions
ont des conséquences sur chacun d’eux »
S2
Master IoT 27
D’où vient la théorie des jeux ?
Von Neumann et Morgenstern (1944), Nash (1950,1952), Luce &
Raiffa (1957)
Prix Nobel d’économie dans le domaine de la théorie des jeux :
En 1994, John Nash, Reinhard Selten et John Harsanyi reçoivent le
« prix Nobel d'économie » pour leurs travaux sur la théorie des
jeux.
En 2005, les théoriciens des jeux Thomas Schelling et Robert
Aumann reçoivent le « prix Nobel d'économie »
En 2007, Leonid Hurwicz, Eric Maskin et Roger Myerson reçoivent
le « prix Nobel d'économie » pour avoir posé les fondations de la
théorie des mécanismes d'incitation.
En 2012, Alvin Roth et Lloyd Shapley, un pionnier de la théorie des
jeux, reçoivent le « prix Nobel d'économie » pour leurs travaux sur
les marchés et la façon d'ajuster offre et demande.
En 2014, Jean Tirole reçoit le « prix Nobel d'économie » pour son
« analyse du pouvoir de marché et de sa régulation »

S2
Master IoT 28
D’où vient la Théorie des Jeux ?

XIXème siècle : deux économistes français,


Cournot puis Bertrand, formalisent l’interaction
stratégique d’entreprises en concurrence sur un
marché

Evolution de la théorie des jeux (1944)


The theory of games and economic behavior Von
Neumann et Morgenstern

S2
Master IoT 29
Von Neumann : deux approches de la théorie
des jeux :

◦ L’approche stratégique ou Théorie des Jeux NON


COOPERATIFS

◦ L’approche en termes de coalitions ou Théorie des Jeux


COOPERATIFS

S2
Master IoT 30
D’où vient la th. des jeux (suite)

Début des années 50 : John Nash (mathématicien)

l’équilibre dans les stratégies (jeux non


coop.)

… idée déjà suggérée par Cournot (1832), mais


sur laquelle VNM avaient buté (d’où leur
limitation aux jeux à somme nulle)

S2
Master IoT 31
Equilibre de Nash

Outil le + important de la théorie des jeux

Déf. L’équilibre de Nash se produit lorsque le choix


stratégique de chaque joueur est la meilleure
réponse aux choix stratégiques des autres joueurs

on est à l’équilibre (de Nash) si aucun joueur n’a


intérêt à dévier unilatéralement de cette situation

c. à d. qu’aucun joueur n’a moyen d’agir


individuellement pour améliorerS2 ses gains.
Master IoT 32
Historique des solutions de la TJ
Objectifs :

années 1940 à 1960 : analyser


mathématiquement le conflit et le
marchandage

depuis les années 1970 : agir


rationnellement avec une information
limitée
S2
Master IoT 33
Qu’est-ce qu’un jeu ?
JEU = ensemble de joueurs et de règles.
Les joueurs :
fonctions de gains: paiements, payoffs, fonctions d’utilité…

ensemble des décisions possibles: actions


Les règles :
l’information dont disposent les joueurs, en particulier l’information sur ce
que savent les autres.
les modalités de prise de décision
◦ simultanées/séquentielles
◦ durée du jeux (nombre de décisions) : « tours » ou « périodes »
◦ possibilité ou non de conclure des accords contraignants :
si oui : jeu coopératif
si non : jeu non–coopératif
◦ possibilité ou non de communiquer
Donc, les éléments essentiels d’un jeu :
JAPI = Joueurs, Actions, Paiements, Information … + « modalités »

S2
Master IoT 34
En d’autres termes:
Un jeu stratégique se caractérise par un ensemble de
règles de jeu spécifiant :

– les joueurs
– les espaces de stratégies (actions ou décisions)
– la séquence des décisions
– les gains ou l’utilité des joueurs (fonction des
décisions des joueurs)
– l’information à la disposition des joueurs (complète /
parfaite)

S2
Master IoT 35
Typologie des jeux
La théorie des jeux classifie les jeux en catégories en
fonction de leurs approches de résolution.

Les catégories les plus courantes sont :

◦ Jeux coopératifs / jeux non coopératifs


◦ Jeux simultanés / jeux séquentiels
◦ Jeux finis / Jeux répétés
◦ Jeux à somme nulle / somme non nulle
◦ Jeu est à information complète / incomplète ou jeux bayésiens.
◦ Jeu à information parfaite / imparfaite

S2
Master IoT 36
Encore quelques définitions
Une stratégie : un plan d'action complet spécifiant ce
que le joueur fera à chaque étape de décision et face à
chacune des situations pouvant survenir au cours du
jeu.

Hypothèse forte sur la rationalité des joueurs


◦ Rationalité parfaite = capacité de compréhension du jeu, de
calcul et de raisonnement par induction à rebours (backward
induction)
◦ Connaissance commune du jeu= je comprends le jeu, et je sais
que les autres comprennent aussi le jeu et je sais qu'ils savent
que je comprends le jeu et je sais qu'ils savent que je sais qu'ils
comprennent aussi le jeu, etc …
S2
Master IoT 37
Encore quelques définitions
Une stratégie dominante pour un joueur est
une stratégie qui lui donne toujours un gain
supérieur ou égal au gain qu’il peut attendre de
toutes ses autres stratégies (quelles que soient les
stratégies des autres joueurs)
◦ Une stratégie dominante domine toutes les autres
stratégies
◦ si chacun des joueurs possède une stratégie
dominante, alors il existe au moins un équilibre de
Nash consistant pour les joueurs à choisir leur
stratégie dominante
Un équilibre en stratégies dominantes est un
équilibre de Nash
La réciproque non vérifiée
S2
Master IoT 38
Encore quelques définitions
Une stratégie dominée pour un joueur est une
stratégie qui lui donne toujours un gain inférieur à celui
d’au moins une des autres stratégies à sa disposition
(quelles que soient les stratégies des autres joueurs).

◦ Une stratégie peut n'être dominée que par une seule stratégie

Une stratégie dominée n’est jamais jouée

◦ Recherche des équilibres de Nash par élimination des stratégies


dominées

S2
Master IoT 39
Jeux coopératifs
Dans les jeux coopératifs, les joueurs
forment des coalitions.
On étudie la formation de coalitions
entre les joueurs afin d’obtenir le meilleur
résultat possible pour chacun de ses
membres.
On aura ainsi une compétition entre
coalitions qu’entre joueurs individuels.
On s’intéresse à la valeur de la coalition
en plus de la façon à repartir les gains
S2
Master IoT 40
Jeux simultanés et séquentiels

Dans les jeux simultanés, les joueurs prennent leurs


décisions sans connaître celles prises par les autres joueurs
ou les joueurs prennent leurs décisions en même temps.

Dans les jeux séquentiels, les joueurs jouent les uns après les
autres, en disposant à chaque fois de l’information sur le
coup adverse, en d’autres mots chaque protagoniste connaît
l’historique du jeu et l’action de l’adversaire au moment de
formuler son choix.

Le jeu de pierre, papier, ciseaux est un jeu simultané, car les


joueurs doivent montrer leur main en même temps.
Le dilemme du prisonnier ou encore la guerre des sexes
sont des jeux simultanés, car les décisions sont prises sans
connaître le choix de l’autre.

S2
Master IoT 41
jeux non coopératifs :
Information :
◦ complète : la fonction de gain de chaque joueur est connaissance
commune
◦ incomplète : un joueur ne connaît pas avec certitude la fonction de gain
d’un autre (plusieurs « types » de joueurs possibles).
Ordre des décisions : jeu statique ou dynamique

Information Information
complète incomplète

Jeu statique (1) équilibre de Nash (3) équilibre (de Nash)


bayésien

Jeu dynamique (2) équilibre (de Nash) (4) équilibre (de


parfait Nash) bayésien
S2
Master IoT 42
Représentations de jeux
1. Forme normale
Un jeu est dit sous forme normale, ou stratégique, si l’ensemble des
joueurs N = {1, . . . ,n}, l’ensemble des stratégies pour chaque joueur et
tous les gains correspondant à chacune des combinaisons possibles
sont donnés.
Si le jeu ne comporte que deux joueurs et un nombre fini et
raisonnable de stratégies possibles, alors on peut représenter le
jeu sous forme d’un tableau appelé matrice des gains.
Une extension de cette représentation à trois ou quatre joueurs
est également possible, mais avec beaucoup de stratégies il devient
difficile de s’y retrouver.
Dans le cas de deux joueurs, nous adoptons la convention que le
joueur 1 choisit la ligne et que le joueur 2 choisit la colonne de la
matrice des gains.
S2
Master IoT 43
Représentations de jeux
2. Forme extensive
Dans la représentation d’un jeu sous forme extensive, les stratégies
peuvent être représentées sous la forme d’un arbre, dont chaque
noeud ou sommet est associé au joueur qui fait son choix.

Chaque stratégie constitue une branche ou une arête de l’arbre.

Les gains de tous sont associés aux terminaisons ou feuilles de


l’arbre.

En d’autres termes, la forme extensive d’un jeu est un arbre de


décision décrivant les choix possibles des joueurs à chaque niveau
du jeu, la séquence de tours de jeu des joueurs, ainsi que
l’information dont les joueurs disposent à chaque niveau pour
formuler leur stratégie S2
Master IoT 44
Exemple: Jeu « pierre, feuille, ciseau»
Forme normale:
Joueur 2
Pierre Feuille Ciseaux
Pierre (0;0) (-1;1) (1;-1)
Joueur 1
Feuille (1;-1) (0;0) (-1;1)
Ciseaux (-1;1) (1;-1) (0; 0)
Forme extensive:

S2
Master IoT 45
Stratégies pures et mixtes
Une stratégie pure du joueur i est un plan
d'action qui prescrit une action de ce joueur
pour chaque fois qu'il est susceptible de jouer.

Une stratégie mixte du joueur i est une


distribution de probabilités pi dénie sur
l'ensemble des stratégies pures du joueur i.
Une stratégie mixte est un vecteur de
probabilités dont chaque coordonnée décrit la
probabilité de jouer une stratégie pure.
S2
Master IoT 46
Exemple: bataille des sexes
Une femme et son mari cherchent une idée de sortie, le mari
propose d'aller à un match de foot de son équipe préférée et la
femme propose elle d'aller à un concert de son chanteur préféré.
Chacun essai donc de convaincre son partenaire mais il est sûr que
aucun des deux n'a intérêt d'aller à sa sortie non accompagné de
son époux ou de son épouse.

Femme

Foot Concert

Homme Foot (4; 2) (1; 1)

Concert (0; 0) (2; 4)


S2
Master IoT 47
Jeux statiques à information complète:
Concept de solution
Résoudre revient à trouver une combinaison de stratégies
des joueurs.
Un équilibre est une combinaison de stratégies constituées
d’une « meilleure » stratégie pour chacun des joueurs.
Une issue du jeu est une combinaison quelconque de
stratégies.
Pour trouver l’équilibre, il faut définir ce qu’on entend par «
meilleure stratégie » (définir un « concept d’équilibre »)

Hypothèses sous-jacente : chaque joueur est supposé…

◦ être rationnel (cherchant à maximiser son paiement) ;


◦ considérer que chaque joueur est rationnel.

S2
Master IoT 48
1- Meilleure réponse
Meilleure réponse du joueur i aux stratégies
des autres : la stratégie qui lui procure le
paiement le plus élevé étant données les
stratégies des autres
on note
◦ s-i les stratégies adoptées par les adversaires de i
◦ si la stratégie adoptée par i
◦ ui(si ; s-i) le paiement du joueur i
si* est la meilleure réponse de i à s-i si,
◦ pour tout si’ ≠ si* :
ui (si* ; s-i) ≥ ui (si’ ; s-i)
S2
Master IoT 49
2- L’équilibre en stratégies dominantes

Stratégie dominante du joueur i : une stratégie qui lui


procure « toujours » un paiement plus élevé que
n’importe quelle autre stratégie.
si* est une stratégie dominante de i si,
◦ pour tout s-i
◦ pour tout si’ ≠ si* :
ui (si* ; s-i) > ui (si’ ; s-i)
Une stratégie dominante est donc jouée à tous les
coups, quelques soient les choix des adversaires (même
s’ils sont irrationnels).

S2
Master IoT 50
Exemple: jeu de tarification

Firme 2
Agressive Pacifique
Firme 1 Agressive 10; 10 27; 0
Pacifique 0; 27 18; 18

Un équilibre en stratégies dominantes est une


combinaison de stratégies comprenant la
stratégie dominante de chaque joueur.

S2
Master IoT 51
3. L’équilibre de dominance itérée
Stratégie dominée du joueur i : une stratégie qui lui
procure « toujours » un paiement moins élevé
qu’une autre stratégie.
si’ est strictement dominée par si’’ si,
◦ pour tout s-i
◦ ui (si’ ; s-i) < ui (si’’ ; s-i)
si’ est faiblement dominée par si’’ si,
◦ pour tout s-i : ui (si’ ; s-i) ≤ ui (si’’ ; s-i)
◦ pour au moins un s-i : ui(si’ ; s-i) < ui (si’’ ; s-i)

Une stratégie dominée n’est jamais adoptée par


un joueur rationnel.

S2
Master IoT 52
3. L’équilibre de dominance itérée
La procédure d’élimination itérée des stratégies
dominées est la suivante :

Un jeu G est résoluble par élimination itérée de


stratégies dominées si pour tout i, S∞i est un singleton.

S2
Master IoT 53
Exemples simples
Rappel des concepts solutions..
I. Equilibre en stratégies strictement dominantes
◦ si* est une stratégie dominante de i si,
pour tout s-i
pour tout si’ ≠ si* :

ui (si* ; s-i) > ui (si’ ; s-i)

◦ Quoi que fasse les autres joueur (-i), jouer si* permet au joueur i
d’obtenir de meilleurs règlements (strictement) que si’
◦ L’équilibre en stratégies strictement dominantes est le profil
formé des stratégies strictement dominantes des joueurs.
◦ Dilemme de prisonnier
a n
a (-5;-5) (-1;-10)
n (-10;-1) S2 (-2;-2)
Master IoT 55
I. Equilibre en stratégies strictement
dominantes (dilemme de prisonnier)
Comparer les distributions de règlements qui sont générées par
chacune des stratégies
◦ Le joueur 1 :
u1(a; ) = (-5; -1)
u1(n; ) = (-10; -2)
pour ce joueur:
(-5; -1) >>(-10; -2)

La stratégie ‘a’ est strictement dominante pour le joueur 1.


◦ Le joueur 2:
Par le même raisonnement, on trouve que la stratégie ‘a’ est strictement
dominante pour le joueur 2
Le profil (s1*; s2*) =(a; a) est un équilibre en stratégies strictement
dominantes, avec des règlements d’équilibre :
(u1, u2)=(-5; -5)

S2
Master IoT 56
Rappel des concepts solutions..
II. Equilibre par élimination itérée de stratégies strictement dominées
◦ si’ est strictement dominée par si’’ si, pour tout s-i
ui (si’ ; s-i) < ui (si’’ ; s-i)
ui (si* ; s-i) > ui (si’ ; s-i)
Une stratégie dominée n’est jamais adoptée par un joueur
rationnel.
Exemple:

x y z
a (1;0) (1;2) (0;1)
B (0;3) (0;1) (2;0)

S2
Master IoT 57
Résolution par élimination itérée de
stratégies strictement dominées
x y z
a (1;0) (1;2) (0;1)
B (0;3) (0;1) (2;0)

u1(a; ) = (1;1;0) ; u1(b; ) = (0;0;2)


u2(; x) =(0; 3)’ ; u2(; y) =(2; 1)’ ; u2(; z) =(1; 0)’
On compare les stratégies des joueurs:
u2(; y)> u2(; z) on annulle z pour joueur 2
La matrice devient x y
a (1;0) (1;2)
B (0;3) (0;1)
La stratégie ‘b’ est dominée, la matrice devient

x y
a (1;0) (1;2)*

S2
Master IoT 58
L’éfficacité de l’équilibre: O. Pareto
Est-ce que cet équilibre est optimal? (exple dilemme de prisonnier)
(u1(a; a), u2(a; a)) = (-5; -5)
(u1(n; n), u2(n; n)) = (-2; -2)
et (-2; -2)>>(-5; -5)
Le profil (s1*; s2*)= (a; a) est dominé par le profil (n; n)

Optimum au sens de Pareto


on ne peut pas améliorer la situation d’un agent sans détériorer
celle d’un autre (au moins)
(u1,… ui,…un) >P (u’1,… u’i,…u’n) ssi ∀i ∈ [1,n], ui ≥ u’i

S2
Master IoT 59
4- Equilibre de Nash

La notion d' équilibre de Nash est une situation telle


qu'aucun joueur n'a intérêt à dévier (seul) de la situation
obtenue.
◦ Un équilibre de Nash est un profil de stratégies s* = {s1*, …,
sn*} tel que pour tout joueur i, pour toute stratégie s’ ∈ Si :

ui (si*, s-i*)≥ui (s’, s-i*)

S2
Master IoT 60
Equilibre de Nash et fonction de meilleure
réponse
La fonction de meilleure réponse du joueur i est la
fonction MRi qui associe à chaque combinaison de
stratégies des autres joueurs s-i les stratégies du joueur
i qui maximise son utilité:

MRi (s-i) = {si ∈ S i t.q. u i(s i; s-i) ≥ ui(si’, s-i) pour tout s’i ∈ S i
}

Un équilibre de Nash est un profil s tel que la stratégie


du joueur i est une meilleure réponse:
◦ S*i ∈ MRi (s-i) pour tout i ∈ N

S2
Master IoT 61
Equilibre de Nash et fonction de meilleure
réponse
Un profil est en équilibre de Nash si les stratégies qu’il
spécifie sont en meilleures réponses les unes aux
autres.
la stratégie de chacun, compte tenu de ce que fait
l’autre, est optimale ;
personne n.est incité à s’écarter de sa stratégie si
l’autre en fait autant ;
personne ne regrette ce qu’il a joué compte tenu de ce
qu’a joué l’autre.

S2
Master IoT 62
1- déterminer les « fonctions de réaction » ou «
fonctions de meilleures réponses » des joueurs

2- trouver « l’intersection » des fonctions de


réactions résoudre le système d’équations :

S2
Master IoT 63
Exemples

S2
Master IoT 64
Exemples

S2
Master IoT 65
Autres applications

S2
Master IoT 66
Stratégies mixtes
Pourquoi a-t-on besoin des stratégies mixtes?
Pour certains jeux, l’équilibre de Nash en
stratégies pures n’existe pas
Le jeu de ”Pierre, Papier, Ciseaux” :

Joueur 2
Pierre Feuille Ciseaux
Pierre (0;0) (-1;1) (1;-1)
Joueur 1
Feuille (1;-1) (0;0) (-1;1)
Ciseaux (-1;1) (1;-1) (0; 0)

S2
Master IoT 67
Préférence au sens de Pareto >P
Un profil s est optimal au sens de Pareto si il est impossible
d’augmenter l’utilité d’un joueur sans diminuer celle d’au moins
un autre joueur.

(u1,… ui,…un) >P (u’1,… u’i,…u’n) ssi ∀


∀i ∈ N, ui ≥ u’I

Optimum de Pareto: maximum de cette relation

Un profil s est optimal au sens de Pareto si il est impossible


d’augmenter l’utilité d’un joueur sans diminuer celle d’au moins
un autre joueur.

Un profil s domine un profile s’ au sens de Pareto si il est au


moins aussi bon pour tous les joueurs et si s est strictement
meilleur pour au moins l'un d'entre eux.
S2
Master IoT 68
Optimum/domination de Pareto
Soient deux profils s, s’ Є S. Si
(i) pour tout i Є N, s≥i s’, et
(ii) pour un i Є N, s >i s’,
on dit que s Pareto-domine s’.

Un profil s Є S est Pareto-optimal ou efficace ou optimal au


sens de Pareto s’il n’existe pas d’autre profil s’ tel que
(i) pour tout i Є N, s’ ≥i s, et
(ii) pour un i Є I, s’ >i s

si s est Pareto-optimal, alors il est impossible d’améliorer le


sort de certains sans dégrader celui d’autres

S2
Master IoT 69
Optimum de Pareto/efficacité
Dilemme des prisoniers
a n
a (-5;-5) (-1;-10)
n (-10;-1) (-2;-2)

• équilibre de Nash: (a,a)


• optimum de Pareto: (n,n)
• Pour l’atteindre: suite de coups avec mémoire

S2
Master IoT 70
Niveau de sécurité
J1/J2 u v
x (10; 10) (0; 9)
y (9; 0) (8; 8)
Principe:
◦ Qu’est-ce que j’obtiens au pire?
Le niveau de sécurité d'une stratégie si pour le joueur i
est le gain minimum que peut apporter cette stratégie
quel que soit le choix des autres joueurs, mins-i ui (si ; s-i)

Une stratégie donnée est dite à « tactique prudente »


lorsque le gain d'un des joueurs est tel que lorsque
par rapport à une stratégie choisie, l'ensemble des
choix de son concurrent apporte un gain maximal à
ce dernier. Le gain minimal assuré de J1 est appelé le
"niveau de sécurité" de J1
S2
Master IoT 71
Niveau de sécurité
Déterminer le niveau de sécurité pou les
deux joueurs J1 et J2
J1 / J 2 b1 b2 b3 b4
a1 5 ,5 6 ,4 0 , 10 4 ,6
a2 1 ,9 7 ,3 5 ,5 6 ,4
a3 6 ,4 7 ,3 7 ,3 8 ,1
a4 4 ,6 8 ,1 0 , 10 2 ,8
a5 3 ,7 5 ,5 9 ,0 0 , 10

S2
Master IoT 72
Niveau de sécurité
Le joueur A peut penser que le joueur B est très intelligent,
ou a beaucoup de chance, et est ainsi en mesure de choisir la
meilleure réponse possible à toute tactique de A.

Ainsi :
- Si A choisit a1, B le devinant choisirait b3, et A aurait gagné 0
- Si A choisit a2, B le devinant choisirait b1, et A aurait gagné 1
- Si A choisit a3, B le devinant choisirait b1, et A aurait gagné 6
- Si A choisit a4, B le devinant choisirait b3, et A aurait gagné 0
- Si A choisit a5, B le devinant choisirait b4, et A aurait gagné 0

Le choix prudent de A est donc a3, qui lui assure de gagner


au moins 6. Ce gain minimal assuré est le niveau de sécurité.
En faisant de même pour B s'il redoute l'extrême
perspicacité de A est b1. Cette tactique lui assure un gain de
4, qui est aussi son niveau de sécurité.
S2
Master IoT 73
Maximin - jeux à somme nulle
Revenons au jeu de pierre ciseaux
J1 / J2 Pierre Ciseaux Papier
Pierre 0 1 -1
Ciseaux -1 0 1
Papier 1 -1 0

Dans le duel tactique ainsi défini, l'espérance du


joueur ligne est le maximum des minimums de
lignes, c'est-à-dire le "maximin", tandis que
l'espérance du joueur colonne est le minimum
des maximums de colonnes, c'est-à-dire le
"minimax".

S2
Master IoT 74
Maximin - jeux à somme nulle
On change les utilités dans le jeu de pierre ciseaux
J1 / J2 Pierre Ciseaux Papier J1 / J2 Pierre Ciseaux Papier
Pierre -1000 2 2000 Pierre 0 1.05 -1.07
Ciseaux 1010 2 -3000 Ciseaux -1.03 0 1.04
Papier 0 1 0 Papier 1.02 -1.01 0

Un point-selle, ou équilibre de Nash : une entrée qui


est à la fois la plus petite de sa colonne et la plus
grande de sa ligne.
Les points-selles correspondent à la définition:
Soit une matrice ( n , k ) de réels A = ( ai j ) possède un
point-selle si et seulement si

S2
Master IoT 75
Maximin - jeux à somme nulle
Un point-selle, ou équilibre de Nash : une entrée qui est
à la fois la plus petite de sa colonne et la plus grande de
sa ligne.
Les points-selles correspondent à la définition:
Soit une matrice ( n , k ) de réels A = ( ai j ) possède un
point-selle si et seulement si

Italo Calvino : « Tu sais que ce que tu peux espérer de


mieux est d'éviter le pire »

S2
Master IoT 76
NE en stratégie mixte
Une stratégie mixte est un vecteur de probabilités dont
chaque coordonnée décrit la probabilité de jouer une
stratégie pure.

Par exemple dans le jeu pierre-feuille-ciseaux, choisir la


stratégie mixte ( 1/3 1/3 1/3) c'est décider de tirer au sort
quel coup on jouera avec équiprobabilité ;
choisir la stratégie mixte ( 2/7 3/7 2/7) c'est choisir
d'annoncer « pierre » avec probabilité 2/7, « feuille » avec
probabilité 3/7 et « ciseaux » sinon ;
choisir la stratégie mixte ( 0 1 0 ) c'est décider de ne pas
tirer au sort et de jouer « feuille » dans tous les cas (les
stratégies pures peuvent être interprétées comme des cas
particuliers de stratégies mixtes).

S2
Master IoT 77
NE en stratégie mixte
• Une stratégie mixte est une mesure de probabilité x sur i
l'ensemble fini des stratégies pures, qui correspond au fait de
jouer aléatoirement en pondérant son tirage par la mesure
préalablement choisie.

•Autrement dit, une stratégie mixte est une probabilité sur


l'ensemble fini des stratégies pures accessibles à un joueur.

•On note X l’ensemble des stratégies mixtes du Joueur i. x , si la


i i
probabilité que i joue la stratégie pure si, et on a ∑si xi, si=1

S2
Master IoT 78
NE en stratégie mixte
•Pour chaque choix d'une stratégie mixte X = (x , .., x ) par le
1 k
joueur 2 et d'une stratégie mixte Y= = (y1, .., yn) ) par le joueur 1,
la probabilité que le joueur 2 joue le coup ‘pierre’ et que le
joueur 1 joue le coup ‘feuille’ est alors égale au produit yf*xp

•L’espérance de gain pour le joueur 2 sous l'hypothèse de choix


de ces deux stratégies mixtes se calcule alors comme une
espérance mathématique

∑a yx
1≤i ≤ n
ij i j

1≤ j ≤k
S2
Master IoT 79
NE en stratégie mixte
En général, pour le calcul de l’espérance de gain anticipés pour un joueur i

S2
Master IoT 80
NE en stratégie mixte: exemple

• Calculons l’espérance de gains anticipés pour le joueur 1:


E1(S1=B)=U1(B, p2)=2*t+0*(1-t)=2t
E1(S2=b)=U1(b, p2)=0*t+1*(1-t)=1-t

Le joueur 1 doit être indifférent pour les deux stratégies, donc


2t=1-t t=1/3

•De même pour le joueur 2:


E2(S1=B)=U2(B, p1)=1*q+0*(1-q)=q
E2(S2=b)=U2(b, p1)=0*q+2*(1-q)=2(1-q)
q=2/3
S2
S*=((2/3;1/3);(1/3; 2/3))
Master IoT 81
Jeu d’appariement (matching pennies)
Charles et Louise doivent placer simultanément une pièce d’un
penny sur la table, sur pile ou sur face. Si les deux pièces sont sur le
même côté, Louise les prend, si elles ont sur des côtés différents,
Charles les prend.

L
Pile Face
C Pile 1; -1 -1; 1
Face -1; 1 1; -1

C’est un « jeu à somme nulle »

S2
Master IoT 82
Jeu d’appariement (matching pennies)

S2
Master IoT 83
Exercices
EXE:
Soit un jeu de tir aux buts. Les deux joueurs sont le gardien de but
et le tireur. Le tireur a le choix entre tirer à droite (action D) ou tirer
à gauche (action G) ; le gardien de but a le choix entre plonger à
droite (action d) et plonger à gauche (action g). Le gardien arrête le
tir lorsqu'il plonge du côté du tir, sinon le tireur marque. Les gains
du gardien sont 1 s'il arrête le tir et 0 sinon. Les gains du joueur sont
1 s'il marque et 0 sinon.
1. Représentez ce jeu sous forme stratégique.
2. En déterminer le ou les équilibre(s) de Nash.

S2
Master IoT 84
Exercices
EXE:
Chercher les équilibres de Nash en stratégies pures et
en stratégies mixtes pour ces jeux.

1/2 A B
a 2; 1 0;0
b 0;0 1;2

1/2 A R
A −3, −3 2, −1
R −1, 2 0, 0

S2
Master IoT 85
Exercices
EXE: jeu d’inspection
Le matin, l’employé part sur le terrain accomplir la mission que son patron
lui confiée. Il peut fournir un effort dans ce sens, ou, au contraire se défiler.
En même temps, le patron peut décider de rester à son bureau, ou d’aller
inspecter sur le terrain le travail de l’employé. On suppose que : fournir un
effort coûte G à l’employé, et rapporte V au patron ; se défiler ne coûte rien
à l’employé, mais ne rapporte rien au patron ; si le patron reste au bureau, il
suppose que l’employé a fait son travail, et il le paye le salaire convenu, W ;
si le patron inspecte l’employé, il lui en coûte H, mais il paye le salaire
convenu W si, et seulement si, l’employé fournit l’effort suffisant (et n’est
pas tire-au-flanc).
Présenter ce scénario comme un jeu statique sous forme normale en donnant
la matrice des gains des joueurs. Déterminer les équilibres de Nash en
stratégie pure et en stratégie mixte, en supposant que : W > G > H > 0.
Commenter.
(Application numérique : G=5, W=10, H=2, V=15).

S2
Master IoT 86
S2
Master IoT 87
S2
Master IoT 88

Vous aimerez peut-être aussi