Vous êtes sur la page 1sur 3

Soit J1 et J2 deux joueurs, leurs stratégies respectives sont données comme suit :

S1 = {U,D,M}

S2 = {L,M,R}

Nous associerons à chaque stratégie une probabilité à être jouée, l’ensemble des
probabilités des stratégies d’un joueur i est notée σi. Dans notre exemple nous aurons ainsi :

σ1={ , , }

σ2 ={0, , }

La matrice des gains correspondant à ce joueur est la suivantes :

1 2 L M R
U (4,3) (5,1) (6,2)
D (2,1) (8,4) (3,6)
M (3,0) (9,6) (2,5)

Travail demandé

Implémenter les fonctions qui permettent de retourner/donner les résultats/valeurs


suivants :

Support : le support de l’ensemble des probabilités noté supp(σi) représente l’ensemble des
stratégies du joueur i ayant une probabilité non nulle.

Dans l’exemple présenté ci-dessus nous aurons :

supp(σ1) = {U,D,M} = S1

supp(σ2) = {M,R}

Paiement stratégie : représente le gain qu’aura le joueur i s’il jouera une de ses stratégie
selon ce que jouera l’autre joueurs (ou les autres joueurs si nous avons plus de 2 joueurs).

Elle est donnée par la formule :

∑ 𝑈(𝑆𝑖 , 𝑆 ) × 𝜎−𝑖

Où n est le nombre de stratégie du deuxième joueurs. Autrement dit, pour calculer le


paiement d’une des stratégies S1i du joueurs J1, nous allons (pour toute stratégie S2j de J2)
multiplier le gain U(S1i,S2j) par la probabilité que le joueur J2 joue la stratégie S2j.

Dans notre exemple nous aurons :


𝑈(𝑈, 𝜎 ) = 𝜎 (𝐿) × 𝑈 (𝑈, 𝐿) + 𝜎 (𝑀) × 𝑈 (𝑈, 𝑀) + 𝜎 (𝑅) × 𝑈 (𝑈, 𝑅)

𝑈(𝑈, 𝜎 ) = 0 × 4 + ×5+ ×6

Fonction d’utilité : Appelée paiement joueur également, elle représente le gain d’un joueur
en fonction des ensembles des probabilités et la matrice des gains. Elle est donnée par la
formule suivante :

𝑈𝑖(𝜎 , 𝜎 ) = ∑𝑛𝑗(𝑈𝑖(𝑆𝑖𝑗 , 𝜎 − 𝑖) × 𝜎𝑖(𝑆𝑖𝑗 ))

Ici le n représente le nombre de stratégie du premier joueur.

Dans notre exemple nous aurons :

𝑈1(𝜎 , 𝜎 ) = 𝜎 (𝑈) × 𝑈1(𝑈, 𝜎 ) + 𝜎 (𝐷) × 𝑈1(𝐷, 𝜎 ) + 𝜎 (𝑀) × 𝑈1(𝑀, 𝜎 )

𝑈1(𝜎 , 𝜎 ) = 𝜎 (𝑈) × 𝜎 (𝐿) × 𝑈 (𝑈, 𝐿) + 𝜎 (𝑀) × 𝑈 (𝑈, 𝑀) + 𝜎 (𝑅) × 𝑈 (𝑈, 𝑅)

𝜎 (𝐷) × 𝜎 (𝐿) × 𝑈 (𝐷, 𝐿) + 𝜎 (𝑀) × 𝑈 (𝐷, 𝑀) + 𝜎 (𝑅) × 𝑈 (𝐷, 𝑅)

𝜎 (𝑀) × 𝜎 (𝐿) × 𝑈 (𝑀, 𝐿) + 𝜎 (𝑀) × 𝑈 (𝑀, 𝑀) + 𝜎 (𝑅) × 𝑈 (𝑀, 𝑅)


1 1 1 1 1 1
𝑈1(𝜎 , 𝜎 ) = 0×4+ ×5+ ×6 + 0×2+ ×8+ ×3
3 2 2 3 2 2
1 1 1
+ 0×3+ ×9+ ×2
3 2 2

Indifférence au support : en utilisant la toute première définition, nous allons diviser


l’ensemble des stratégies d’un joueur Ji en deux ensembles : les stratégies appartenant au
support et les stratégies n’appartenant pas au support.

Pour pouvoir dire que le profil (𝜎 , 𝜎 ) est un équilibre de Nash, les deux conditions
suivantes doivent être vérifiées en même temps:

- Tous les paiements des stratégies appartenant au support d’un Joueur 𝐽𝑖 doivent être
égaux, cette valeur qui est égale partout doit aussi être égale à la fonction d’utilité de
𝐽𝑖.
- Tous les paiements des stratégies n’appartenant pas au support d’un Joueur 𝐽𝑖
doivent être égaux, cette valeur qui est égale partout doit être inférieure à la
fonction d’utilité de 𝐽𝑖.

Ces deux conditions doivent être vérifiées pour tous les joueurs pour dire que nous
avons un équilibre de Nash.
Lorsque vous appliquerez ces fonctions sur l’exemple donné, vous aurez ces résultats :

𝑈1(𝑈, 𝜎 ) = 5.5

𝑈1(𝐷, 𝜎 ) = 5.5

𝑈1(𝑀, 𝜎 ) = 5.5

𝑈1(𝜎 , 𝜎 ) = 5.5

Et

4
𝑈2(𝐿, 𝜎 ) =
3
11
𝑈2(𝑀, 𝜎 ) =
3
13
𝑈2(𝑅, 𝜎 ) =
3
𝑈2(𝜎 , 𝜎 ) = 4

Nous remarquons que les deux conditions sont vérifiées pour le joueur J1, cependant
nous ne pouvons pas dire que nous avons un équilibre de Nash vu que les conditions ne
sont pas toutes vérifiées pour J2 ( ≠ ≠ 4 𝑐1 𝑛𝑜𝑛 𝑣é𝑟𝑖𝑓𝑖é𝑒 𝑒𝑡 < 4 𝑐2 𝑣é𝑟𝑖𝑓𝑖é𝑒)

Vous aimerez peut-être aussi