Académique Documents
Professionnel Documents
Culture Documents
Examen SR Juin 2019
Examen SR Juin 2019
CONSIGNES
Question 1 :
Question 2 :
Question 3 :
REPONSES
Question 1 :
Les jeux répétés constituent une catégorie de jeu essentielle dans la réalité. Il s’agit du
concept de super jeu ou jeu simple qui se répète ou se réitère à l’identique un nombre
grand mais fini de fois.
C’est un schéma plus subtil que le jeu simple, en effet il permet la prise en compte du temps
d’une part et des phénomènes d’apprentissage d’autre part qui aident les joueurs à
stabiliser leurs engagements et à partager le monopole de la punition.
Dans un super jeu les participants sont soumis à un horizon temporel moins limité par
rapport à un jeu à une seule période. En effet les agents ne choisiront pas une stratégie pure
ou une stratégie mixte mais plutôt un mode de comportement qui gouvernera leurs
comportements durant toute la période du jeu
𝑈𝑖(𝑠𝑖1 𝑠𝑖 𝑠𝑗1) =
* si(1)=si1
* si(t)=si1
avec t=2,3….
Lorsque sj(T)=sj1
3
avec T=1,2….t-1
L’exemple 𝑈𝑖(𝑠𝑖1 𝑠𝑖 𝑠𝑗1) signifie que le joueur 1 jouera sa stratégie si1 aussi longtemps que
j jouera sa stratégie sj1.
A la première période du jeu l’agent i joue sa stratégie si1 et attend de voir la stratégie
jouée par l’agent j.
Si l’agent j joue une autre stratégie, ici en l’occurrence sa seconde stratégie, alors l’agent i le
« pénalisera » en jouant lui aussi sa seconde stratégie et cela ad vitam æternam autrement
dit pour ce qui reste du jeu.
Dans ce contexte comme l’écrit Hervé Moulin « un joueur peut se faire piéger une fois mais
pas deux ».
On peut définir dans un jeu à deux personnes où chaque joueur dispose de deux stratégies
pures par joueur 4 modes de comportement ou stratégies de super jeu pour chacun des
joueurs :
pour le joueur i
𝑈𝑖(𝑠𝑖1/ 𝑠𝑗1)
𝑈𝑖(𝑠𝑖1/ 𝑠𝑗2)
𝑈𝑖(𝑠𝑖2/ 𝑠𝑗1)
𝑈𝑖(𝑠𝑖2/ 𝑠𝑗2)
pour le joueur j
𝑈𝑗(𝑠𝑗1/ 𝑠𝑖1)
𝑈𝑗(𝑠𝑗1/ 𝑠𝑖2)
𝑈𝑗(𝑠𝑗2/ 𝑠𝑖1)
𝑈𝑗(𝑠𝑗2/ 𝑠𝑖2)
4
Stratégies pour 𝑈𝑗(𝑠𝑗1 / 𝑠𝑖1) 𝑈𝑗(𝑠𝑗1 / 𝑠𝑖2) 𝑈𝑗(𝑠𝑗2 / 𝑠𝑖1) 𝑈𝑗(𝑠𝑗2 / 𝑠𝑖2)
l’agent j
Stratégies pour
l’agent i
U (Ui(si1/sj1),Uj(sj1/si1)) ou U (Ui(si2/sj2),Uj(sj2/si2))
5
Question 2 :
Le second problème qui est posé par la théorie des jeux coopératifs ; après le fait d’avoir
déterminé la manière dont les individus peuvent obtenir le maximum de résultats est de
savoir comment dans une coalition S de n membres peut répartir le résultat maximum
obtenu entre ses différents membres.
La valeur de SHAPLEY
Lloyd SHAPLEY suppose qu’il existe un nombre fini d’agents et que ces agents coopèrent par
contrat. Il suppose aussi qu’il existe un moyen d’échange (par exemple la monnaie) ayant
la propriété de transférer de la valeur entre les membres d’une coalition
Axiome 1
l’indépendance de l’ordre autrement dit il y a chez Shapley un traitement égal entre les
joueurs. La valeur de Shapley ne change pas si l’on permute le rôle des joueurs.
Axiome 2
L’absence du joueur inutile. Des agents qui n’apportent rien à la collection ne toucheront
rien.
Axiome 3
L’additivité. Autrement dit la valeur obtenue lors de deux jeux successifs est la somme des
valeurs obtenue la première et la deuxième fois. On peut aussi écrire que la valeur de
Shapley pour une coalition est égale la somme des valeurs de chapelet pour chacun des
joueurs qui forment la coalition.
√ i = un joueur quelconque
i€N
{V(S)-V(S-i)} = 1 si S est une coalition gagnante pour le joueur i; autrement dit si i appartient
à cette coalition S.
t ≤ n
Exemple
Soit une société formée de quatre actionnaires : 1,2,3,4 qui détiennent respectivement
10%,20%,30% et 40% des actions. Les décisions sont prises à la majorité absolue : 50% des
voix plus 1 voix. Chaque actionnaire à autant de voix que d’actions.
Etape 1
Former toutes les coalitions possibles qui répondent au principe de la prise de décision à la
majorité absolue et qui sont : (2,4)(3,4)(1,2,3)(1,2,4) (1,3,4)(2,3,4) (1,2,3,4)
Etape 2
Pour chacun des agents former les coalitions gagnantes pour cet agent ; autrement dit les
coalitions auxquelles appartient cet agent.
(1,2,4)(2,3,4) (1,2,3,4) }
Etape 3
Si i = 1
V1 = 3{(3-1)!(4-3)!/4!}
+ {3!0!/4!} =1/2
V2 = 7/12
V3 = 7/12
V4 = 2/3
Plus le pouvoir de former des coalitions gagnantes sera élevé et plus la valeur de Shapley
sera élevée.
Plus la possibilité de former des coalitions gagnantes est élevée et plus la part du résultat qui
reviendra à cet agent sera importante.
On remarque que si deux individus ont le meme nombre de coalitions gagnantes et la meme
structure de coalitions alors leur valeur de Shapley sera identique meme si le nombre de
voix qu’ils possèdent est différent (voir agents 2 et 3).
8
Question 3 :
En partant des trois typologies définies dans le cours, on peut dire que
C’est l’idée selon laquelle tout joueur qui change seul sa stratégie ne peut pas obtenir un
niveau d’utilité supérieur à celui qu’il aurait pu avoir en situation d’équilibre ; les autres
joueurs ayant conserves leurs anciennes stratégies. Dans un jeu à n personnes ou la
formation de coalitions n’est pas possible
S* = (s1*, s2*…sn*) est dit équilibre de NASH ou équilibre non coopératif si étant donné n
– 1 stratégies le nième joueur ne peut pas augmenter ses résultats en changeant seul sa
propre stratégie.
alors il choisira si*qui maximisera son résultat étant donne son anticipation des autres
joueurs.
Formellement
S’il existe un n-tuple de stratégies ou un agent peut rester car personne n’a intérêt à changer
de décision ; les agents n’étant pas obligés de suivre ces stratégies mais ayant intérêt à les
respecter ,alors cet n-tuple est appelé EQUILIBRE DE NASH.
Si S* = (s1*, s2*…sn*)
∏i(s1*,s2*…si*…sn*)>
∏i(s1*,s2*…si®…sn*)
Avec
10
∏i(s1*,s2*…si*…sn*) =
Gain du joueur I lorsqu’il choisit si* et que les autres joueurs font un choix sj*, √j
et
∏i(s1*,s2*…si®…sn*) =
Gain du joueur I lorsqu’il dévie en jouant si® et que les autres joueurs font le meme choix
qu’auparavant.
Aucun joueur ne peut bénéficier d’une déviation et cela quelle que soit la stratégie qu’il
choisi dans son espace de stratégies.
Deux mathématiciens Melvin DRESHER et Merill FLOOD, vont inventer ce jeu en 1950 pour
tester la robustesse de l’équilibre de NASH.
i j nier Accuser i
nier (8,8) (0,10)
Accuser j (10,0) (1,1)
La présentation est faite en termes de résultats ou d’utilités obtenues par les individus.
En termes de rationalité, la logique voudrait que chaque agent accuse son partenaire, dans
ces conditions les résultats obtenus sont (1,1) qui correspond à un équilibre de NASH.
Situons nous dans le cas typique d’un jeu représenté par le dilemme du prisonnier
Exemple :
i j sj1 Sj2
si1 (8,8) (0,10)
si2 (10,0) (2,2)
Il se peut que dans ce cas chaque joueur au nom de l’intérêt individuel joue sous sa seconde
stratégie. Ce mode de comportement représente un équilibre au sens de NASH, cependant il
est non satisfaisant du point de vue de l’intérêt général. En effet en se coalisant les agents
auraient pu atteindre une situation (4,4) qui domine la situation donnée par l’équilibre de
Nash.
La situation (8,8) est optimale au sens de PARETO. On s’aperçoit que des décisions
rationnelles au niveau individuel peuvent conduire à des issues qui ne le sont pas au niveau
collectif.
Certains auteurs vont construire pour résoudre ce problème le concept du jeu impur
autrement dit des jeux qui ne sont ni strictement coopératifs ni strictement non
coopératifs. Ils supposent une hiérarchie dans le jeu : certains agents reçoivent les stratégies
de leur partenaire avant de transmettre les leurs .
En effet le problème posé auparavant peut-être partiellement résolu car ces auteurs
introduisent la notion de punition autrement dit l’agent qui communique sa stratégie en
premier va jouer en dernier.
Cependant dans un jeu à une personne et à une seule période l’agent qui joue en dernier
détient le monopole de la punition et cet individu va devenir un dictateur.
Exemple
Donc n joue avant n-1 qui joue avant n-2 …………qui joue avant 3 qui joue avant 2 qui joue
avant 1.
(Punir, dans ce contexte exprime le fait que l’agent change de stratégie en choisissant la
stratégie qui lui rapporte le plus)
Donc celui qui annonce sa décision en premier mais qui passe à l’action en dernier devient
un dictateur, autrement dit un agent que personne ne peut punir, ce qui pose le problème
du contrôle de l’agent qui passe à l’action en dernier.
Cependant, si toute chose étant égale par ailleurs, si le jeu se répète de la même manière un
grand nombre de fois on peut assister à un phénomène d’apprentissage la menace d’une
part et un partage de pouvoir de punition d’autre part.
C’est un schéma plus subtil que le jeu simple, en effet il permet la prise en compte du temps
d’une part et des phénomènes d’apprentissage d’autre part qui aident les joueurs à
stabiliser leurs engagements et à partager le monopole de la punition.
Dans un super jeu les participants sont soumis à un horizon temporel moins limité par
rapport à un jeu à une seule période. En effet les agents ne choisiront pas une stratégie pure
ou une stratégie mixte mais plutôt un mode de comportement qui gouvernera leurs
comportements durant toute la période du jeu