Explorer les Livres électroniques
Catégories
Explorer les Livres audio
Catégories
Explorer les Magazines
Catégories
Explorer les Documents
Catégories
des jeux
D’où vient-elle ?
S2
Master IoT 2
Introduction:
S2
Master IoT 3
Théorie des jeux?
Analyse des comportements stratégiques des agents
Utilisée en économie, relations internationales,
jeux d‘argent ou de société, réseaux et télécom,
etc.
Reproducti
Adaptation
on
Stabilité
Nourriture évolutionnai
re
Environne
Santé
ment
Environnem
ent
Activité
social
S2
Master IoT 5
Pour le télécom:
Le bien-être est:
◦ Performance,
◦ cout,
◦ satisfaction,
◦ délai de transfer,
◦ débit,
◦ consommation de l’énérgie,
◦ QoS, QoE, …
Concernant:
◦ Un utilisateur,
◦ un nœud,
◦ un sous-réseau,
◦ un opérateur…
S2
Master IoT 6
Qu’est ce qu’un jeu?
Prise de décision intéractive
Un jeu n’est pas toujours competitif
◦ Les jeux coopératifs s’interéssent à la coopération la coalition la
négociation, l’enchair, l’équipe, contrôl distribué, …
Cooperatif ou non-coopératif, o parle toujours stratégie
Elements de base:
◦ Joueurs
◦ Actions,
◦ Préferences
◦ Gain,
◦ Information
◦ L’ordre du jeu
Cournot 1838, Bertrand 1883, Borel 1921, Edgeworth 1925, von Neumann1928, Fisher 1930
Stackelberg 1934,Ville 1938, Nash 1950, Isaacs 1965, Hamilton 1967, etc
S2
Master IoT 7
Définition
Un jeu est une situation où
S2
Master IoT 8
Définition
Théorie des jeux : description de ce qui
se passe quand des joueurs interagissent
de manière rationnelle
La rationalité est une propriété qui
concerne les choix : un joueur est
rationnel s’il choisit une meilleure
réponse face à ses croyances.
S2
Master IoT 9
Définition
La théorie des jeux peut être définie
comme l’étude des modèles
mathématiques de conflit et de
coopération entre des décideurs
intelligents et rationnels
(Myerson 1991)
S2
Master IoT 11
La bi-matrice des réglements
Formellement, un jeu statique est défini
par la donnée de trois éléments :
◦ l’ensemble de joueurs (qui joue ?),
◦ Les ensembles de stratégies (que peuvent
faire les joueurs ?)
◦ et les fonctions de réglements (combien
obtiennent les joueurs ?).
En cas de 2 joueurs, ces éléments
peuvent être synthétisés dans un tableau
appelé « bi-matrice des règlement »
S2
Master IoT 12
Exemple: dilemme de prisonniers
Le jeu dans sa forme classique
◦ Deux suspects son arrêtés par la police, mais
la police manque de preuve pour les
emprisonner.
◦ Il ne peuvent les condamner qu’à un an de
prison pour des faits mineurs.
◦ La police doit les faire avouer.
S2
Master IoT 13
Dilemme de prisonniers
Les policiers proposent un marché
◦ Si les deux avouent, ils auront chacun 5 ans, si l’un
avoue et l’autre nie, ils encourent 1 ou 10 ans, si les
deux nient, chacun aura 2 ans de prison
2ème criminel
Matrice des gains
avoue nie
Les stratégies optimales sont donc bien définies et le résultat du jeu (ou
équilibre) est donné par le « profil » de stratégies (prix bas, prix bas) ; ce
faisant, les joueurs obtiennent un règlement de 40 chacun.
S2
Master IoT 15
Exemple: le vote stratégique
Ce célèbre paradoxe illustre la façon dont la théorie des jeux est
susceptible d’éclairer une situation de vote.
Trois personnes, 1, 2 et 3, doivent choisir une option parmi trois
possibilités, A, B et C.
La règle appliquée est la suivante : chaque personne vote pour une option
et l’option choisie est celle qui recueille le plus de voix ; en cas d’égalite,
c’est 1 qui, en tant que « président » (chairman), impose son choix.
L’ordre de préférence de 1 est A, B, C (il préfère A à B, B à C et A à C) ;
ceux de 2 et 3 sont respectivement C, A, B et B, C, A (ces préférences sont
connues de tous).
Si chacun vote naïvement, chaque option obtient une voix et la préférence
de 1 s’impose : A sera élue. Mais qu’en est-il si les électeurs votent
stratégiquement ? Il est clair que personne n’a intérêt à voter pour son
dernier choix ; chaque électeur peut donc a priori envisager deux
stratégies : voter pour son premier choix ou bien voter pour son
deuxième choix (« vote utile »).
S2
Master IoT 16
Exemple: le vote stratégique
S2
Master IoT 18
Classification de jeux
S2
Master IoT 19
Jeux non-coopératifs
S2
Master IoT 20
Cas particulier résolu par Von Neumann &
Morgenstern :
◦ Jeux à somme nulle (ou strictement
compétitifs)
◦ jeux à 2 joueurs dans lesquels tout gain d’un
joueur est immédiatement compensé par une
perte correspondante de l’autre
S2
Master IoT 21
Théorie des jeux coopératifs
Approche coalitionnelle
Principe : cherchent à décrire le comportement
optimal dans les jeux à plusieurs joueurs.
Plus difficile VNM n’ont pas cherché à
indiquer la stratégie optimale pour chaque
joueur
Mais une classification des modèles de
coalitions correspondant à un comportement
rationnel
S2
Master IoT 22
D’où vient la th. des jeux (suite)
S2
Master IoT 23
Equilibre de Nash
S2
Master IoT 24
Equilibre de Nash (suite)
Implication :
on est à l’équilibre (de Nash) si aucun joueur
n’a intérêt à dévier unilatéralement de cette
situation
S2
Master IoT 25
CE QU’ON A VU …
Rappelons!
S2
Master IoT 26
Qu’est-ce que la théorie des jeux ?
Eber: « outil mathématique permettant
d’analyser les interactions stratégiques
entre individus, en particulier quand ils
ont des intérêts divergents »
S2
Master IoT 28
D’où vient la Théorie des Jeux ?
S2
Master IoT 29
Von Neumann : deux approches de la théorie
des jeux :
S2
Master IoT 30
D’où vient la th. des jeux (suite)
S2
Master IoT 31
Equilibre de Nash
S2
Master IoT 34
En d’autres termes:
Un jeu stratégique se caractérise par un ensemble de
règles de jeu spécifiant :
– les joueurs
– les espaces de stratégies (actions ou décisions)
– la séquence des décisions
– les gains ou l’utilité des joueurs (fonction des
décisions des joueurs)
– l’information à la disposition des joueurs (complète /
parfaite)
S2
Master IoT 35
Typologie des jeux
La théorie des jeux classifie les jeux en catégories en
fonction de leurs approches de résolution.
S2
Master IoT 36
Encore quelques définitions
Une stratégie : un plan d'action complet spécifiant ce
que le joueur fera à chaque étape de décision et face à
chacune des situations pouvant survenir au cours du
jeu.
◦ Une stratégie peut n'être dominée que par une seule stratégie
S2
Master IoT 39
Jeux coopératifs
Dans les jeux coopératifs, les joueurs
forment des coalitions.
On étudie la formation de coalitions
entre les joueurs afin d’obtenir le meilleur
résultat possible pour chacun de ses
membres.
On aura ainsi une compétition entre
coalitions qu’entre joueurs individuels.
On s’intéresse à la valeur de la coalition
en plus de la façon à repartir les gains
S2
Master IoT 40
Jeux simultanés et séquentiels
Dans les jeux séquentiels, les joueurs jouent les uns après les
autres, en disposant à chaque fois de l’information sur le
coup adverse, en d’autres mots chaque protagoniste connaît
l’historique du jeu et l’action de l’adversaire au moment de
formuler son choix.
S2
Master IoT 41
jeux non coopératifs :
Information :
◦ complète : la fonction de gain de chaque joueur est connaissance
commune
◦ incomplète : un joueur ne connaît pas avec certitude la fonction de gain
d’un autre (plusieurs « types » de joueurs possibles).
Ordre des décisions : jeu statique ou dynamique
Information Information
complète incomplète
S2
Master IoT 45
Stratégies pures et mixtes
Une stratégie pure du joueur i est un plan
d'action qui prescrit une action de ce joueur
pour chaque fois qu'il est susceptible de jouer.
Femme
Foot Concert
S2
Master IoT 48
1- Meilleure réponse
Meilleure réponse du joueur i aux stratégies
des autres : la stratégie qui lui procure le
paiement le plus élevé étant données les
stratégies des autres
on note
◦ s-i les stratégies adoptées par les adversaires de i
◦ si la stratégie adoptée par i
◦ ui(si ; s-i) le paiement du joueur i
si* est la meilleure réponse de i à s-i si,
◦ pour tout si’ ≠ si* :
ui (si* ; s-i) ≥ ui (si’ ; s-i)
S2
Master IoT 49
2- L’équilibre en stratégies dominantes
S2
Master IoT 50
Exemple: jeu de tarification
Firme 2
Agressive Pacifique
Firme 1 Agressive 10; 10 27; 0
Pacifique 0; 27 18; 18
S2
Master IoT 51
3. L’équilibre de dominance itérée
Stratégie dominée du joueur i : une stratégie qui lui
procure « toujours » un paiement moins élevé
qu’une autre stratégie.
si’ est strictement dominée par si’’ si,
◦ pour tout s-i
◦ ui (si’ ; s-i) < ui (si’’ ; s-i)
si’ est faiblement dominée par si’’ si,
◦ pour tout s-i : ui (si’ ; s-i) ≤ ui (si’’ ; s-i)
◦ pour au moins un s-i : ui(si’ ; s-i) < ui (si’’ ; s-i)
S2
Master IoT 52
3. L’équilibre de dominance itérée
La procédure d’élimination itérée des stratégies
dominées est la suivante :
S2
Master IoT 53
Exemples simples
Rappel des concepts solutions..
I. Equilibre en stratégies strictement dominantes
◦ si* est une stratégie dominante de i si,
pour tout s-i
pour tout si’ ≠ si* :
◦ Quoi que fasse les autres joueur (-i), jouer si* permet au joueur i
d’obtenir de meilleurs règlements (strictement) que si’
◦ L’équilibre en stratégies strictement dominantes est le profil
formé des stratégies strictement dominantes des joueurs.
◦ Dilemme de prisonnier
a n
a (-5;-5) (-1;-10)
n (-10;-1) S2 (-2;-2)
Master IoT 55
I. Equilibre en stratégies strictement
dominantes (dilemme de prisonnier)
Comparer les distributions de règlements qui sont générées par
chacune des stratégies
◦ Le joueur 1 :
u1(a; ) = (-5; -1)
u1(n; ) = (-10; -2)
pour ce joueur:
(-5; -1) >>(-10; -2)
S2
Master IoT 56
Rappel des concepts solutions..
II. Equilibre par élimination itérée de stratégies strictement dominées
◦ si’ est strictement dominée par si’’ si, pour tout s-i
ui (si’ ; s-i) < ui (si’’ ; s-i)
ui (si* ; s-i) > ui (si’ ; s-i)
Une stratégie dominée n’est jamais adoptée par un joueur
rationnel.
Exemple:
x y z
a (1;0) (1;2) (0;1)
B (0;3) (0;1) (2;0)
S2
Master IoT 57
Résolution par élimination itérée de
stratégies strictement dominées
x y z
a (1;0) (1;2) (0;1)
B (0;3) (0;1) (2;0)
x y
a (1;0) (1;2)*
S2
Master IoT 58
L’éfficacité de l’équilibre: O. Pareto
Est-ce que cet équilibre est optimal? (exple dilemme de prisonnier)
(u1(a; a), u2(a; a)) = (-5; -5)
(u1(n; n), u2(n; n)) = (-2; -2)
et (-2; -2)>>(-5; -5)
Le profil (s1*; s2*)= (a; a) est dominé par le profil (n; n)
S2
Master IoT 59
4- Equilibre de Nash
S2
Master IoT 60
Equilibre de Nash et fonction de meilleure
réponse
La fonction de meilleure réponse du joueur i est la
fonction MRi qui associe à chaque combinaison de
stratégies des autres joueurs s-i les stratégies du joueur
i qui maximise son utilité:
MRi (s-i) = {si ∈ S i t.q. u i(s i; s-i) ≥ ui(si’, s-i) pour tout s’i ∈ S i
}
S2
Master IoT 61
Equilibre de Nash et fonction de meilleure
réponse
Un profil est en équilibre de Nash si les stratégies qu’il
spécifie sont en meilleures réponses les unes aux
autres.
la stratégie de chacun, compte tenu de ce que fait
l’autre, est optimale ;
personne n.est incité à s’écarter de sa stratégie si
l’autre en fait autant ;
personne ne regrette ce qu’il a joué compte tenu de ce
qu’a joué l’autre.
S2
Master IoT 62
1- déterminer les « fonctions de réaction » ou «
fonctions de meilleures réponses » des joueurs
S2
Master IoT 63
Exemples
S2
Master IoT 64
Exemples
S2
Master IoT 65
Autres applications
S2
Master IoT 66
Stratégies mixtes
Pourquoi a-t-on besoin des stratégies mixtes?
Pour certains jeux, l’équilibre de Nash en
stratégies pures n’existe pas
Le jeu de ”Pierre, Papier, Ciseaux” :
Joueur 2
Pierre Feuille Ciseaux
Pierre (0;0) (-1;1) (1;-1)
Joueur 1
Feuille (1;-1) (0;0) (-1;1)
Ciseaux (-1;1) (1;-1) (0; 0)
S2
Master IoT 67
Préférence au sens de Pareto >P
Un profil s est optimal au sens de Pareto si il est impossible
d’augmenter l’utilité d’un joueur sans diminuer celle d’au moins
un autre joueur.
S2
Master IoT 69
Optimum de Pareto/efficacité
Dilemme des prisoniers
a n
a (-5;-5) (-1;-10)
n (-10;-1) (-2;-2)
S2
Master IoT 70
Niveau de sécurité
J1/J2 u v
x (10; 10) (0; 9)
y (9; 0) (8; 8)
Principe:
◦ Qu’est-ce que j’obtiens au pire?
Le niveau de sécurité d'une stratégie si pour le joueur i
est le gain minimum que peut apporter cette stratégie
quel que soit le choix des autres joueurs, mins-i ui (si ; s-i)
S2
Master IoT 72
Niveau de sécurité
Le joueur A peut penser que le joueur B est très intelligent,
ou a beaucoup de chance, et est ainsi en mesure de choisir la
meilleure réponse possible à toute tactique de A.
Ainsi :
- Si A choisit a1, B le devinant choisirait b3, et A aurait gagné 0
- Si A choisit a2, B le devinant choisirait b1, et A aurait gagné 1
- Si A choisit a3, B le devinant choisirait b1, et A aurait gagné 6
- Si A choisit a4, B le devinant choisirait b3, et A aurait gagné 0
- Si A choisit a5, B le devinant choisirait b4, et A aurait gagné 0
S2
Master IoT 74
Maximin - jeux à somme nulle
On change les utilités dans le jeu de pierre ciseaux
J1 / J2 Pierre Ciseaux Papier J1 / J2 Pierre Ciseaux Papier
Pierre -1000 2 2000 Pierre 0 1.05 -1.07
Ciseaux 1010 2 -3000 Ciseaux -1.03 0 1.04
Papier 0 1 0 Papier 1.02 -1.01 0
S2
Master IoT 75
Maximin - jeux à somme nulle
Un point-selle, ou équilibre de Nash : une entrée qui est
à la fois la plus petite de sa colonne et la plus grande de
sa ligne.
Les points-selles correspondent à la définition:
Soit une matrice ( n , k ) de réels A = ( ai j ) possède un
point-selle si et seulement si
S2
Master IoT 76
NE en stratégie mixte
Une stratégie mixte est un vecteur de probabilités dont
chaque coordonnée décrit la probabilité de jouer une
stratégie pure.
S2
Master IoT 77
NE en stratégie mixte
• Une stratégie mixte est une mesure de probabilité x sur i
l'ensemble fini des stratégies pures, qui correspond au fait de
jouer aléatoirement en pondérant son tirage par la mesure
préalablement choisie.
S2
Master IoT 78
NE en stratégie mixte
•Pour chaque choix d'une stratégie mixte X = (x , .., x ) par le
1 k
joueur 2 et d'une stratégie mixte Y= = (y1, .., yn) ) par le joueur 1,
la probabilité que le joueur 2 joue le coup ‘pierre’ et que le
joueur 1 joue le coup ‘feuille’ est alors égale au produit yf*xp
∑a yx
1≤i ≤ n
ij i j
1≤ j ≤k
S2
Master IoT 79
NE en stratégie mixte
En général, pour le calcul de l’espérance de gain anticipés pour un joueur i
S2
Master IoT 80
NE en stratégie mixte: exemple
L
Pile Face
C Pile 1; -1 -1; 1
Face -1; 1 1; -1
S2
Master IoT 82
Jeu d’appariement (matching pennies)
S2
Master IoT 83
Exercices
EXE:
Soit un jeu de tir aux buts. Les deux joueurs sont le gardien de but
et le tireur. Le tireur a le choix entre tirer à droite (action D) ou tirer
à gauche (action G) ; le gardien de but a le choix entre plonger à
droite (action d) et plonger à gauche (action g). Le gardien arrête le
tir lorsqu'il plonge du côté du tir, sinon le tireur marque. Les gains
du gardien sont 1 s'il arrête le tir et 0 sinon. Les gains du joueur sont
1 s'il marque et 0 sinon.
1. Représentez ce jeu sous forme stratégique.
2. En déterminer le ou les équilibre(s) de Nash.
S2
Master IoT 84
Exercices
EXE:
Chercher les équilibres de Nash en stratégies pures et
en stratégies mixtes pour ces jeux.
1/2 A B
a 2; 1 0;0
b 0;0 1;2
1/2 A R
A −3, −3 2, −1
R −1, 2 0, 0
S2
Master IoT 85
Exercices
EXE: jeu d’inspection
Le matin, l’employé part sur le terrain accomplir la mission que son patron
lui confiée. Il peut fournir un effort dans ce sens, ou, au contraire se défiler.
En même temps, le patron peut décider de rester à son bureau, ou d’aller
inspecter sur le terrain le travail de l’employé. On suppose que : fournir un
effort coûte G à l’employé, et rapporte V au patron ; se défiler ne coûte rien
à l’employé, mais ne rapporte rien au patron ; si le patron reste au bureau, il
suppose que l’employé a fait son travail, et il le paye le salaire convenu, W ;
si le patron inspecte l’employé, il lui en coûte H, mais il paye le salaire
convenu W si, et seulement si, l’employé fournit l’effort suffisant (et n’est
pas tire-au-flanc).
Présenter ce scénario comme un jeu statique sous forme normale en donnant
la matrice des gains des joueurs. Déterminer les équilibres de Nash en
stratégie pure et en stratégie mixte, en supposant que : W > G > H > 0.
Commenter.
(Application numérique : G=5, W=10, H=2, V=15).
S2
Master IoT 86
S2
Master IoT 87
S2
Master IoT 88