Vous êtes sur la page 1sur 110

Analyse Multicritères

Pr. Imane. Ahdil


Organisation du cours

 Cours
 Cours magistraux
 Cas pratique et exercices d’application

 Examens
 Contrôle
 Examen final
 Prise en compte de l’assiduité dans la note finale

2
Introduction

3
Quand est ce est difficile de prendre une décision ?

 il y a trop de possibilités à comparer →


Optimisation combinatoire
 il y a plusieurs décideurs → Théorie du Choix
Social
 les conséquences des actes ne sont pas sûres →
Décision dans l’incertain
 plusieurs critères rentrent en compte → aide
multicritère à la décision

4
Aide à la décision

Définition [Roy, 1985] L’aide à la décision est l’activité


de celui qui, prenant appui sur des modèles clairement
explicités mais non nécessairement complètement
formalisés, aide à obtenir des éléments de réponses
aux questions que se pose un intervenant dans un
processus de décision, éléments concourant à éclairer
la décision et normalement à prescrire, ou simplement
à favoriser un comportement de nature à accroître la
cohérence entre l’évolution du processus d’une part, et
objectifs et système de valeurs au service desquels
cet intervenant se trouve placé d’autre part.
5
Intervenants:

Décideur : Le décideur est l’intervenant pour le compte duquel


l’aide à la décision s’exerce ; Analyste : Celui qui prend en
charge l’aide à la décision.
Action / Alternative / solution / scénario : Objet analyse, évalué
et comparé avec d’autres objets pendant le processus de
décision.
Critère : Fonction (g), définie sur l’ensemble des actions
potentielles de telle sorte qu’il soit possible de raisonner ou de
décrire le résultat de la comparaison de deux actions a et b à
partir de g(a) and g(b).
Problématiques : Choix, rangement, classification, description.
6
Anal
Intervenants:
Exemple :
Choisir un candidat pour un poste spécifique dans une
entreprise
- Décideur : le directeur du département concerné
- Analyste : consultant
- Action / Alternatif : candidats
- Critères : diplôme, expérience de travail, âge, etc.
- Problématique : choix / rangement

7
Plan du cours

1. Introduction
 Prise de décision dans un univers incertain.
 Prise de décision dans un univers risqué.
2. Problèmes de décision monocritère
 Modélisation.
 Arbres de décision.
 Eléments de la théorie des jeu.
3. Problèmes de décision multicritères
 L’agrégation des critères et l’analyse multicritère.
 Illustration des méthodes multicritères

8
1. Prise de décision dans un
univers incertain
Éléments de théorie des jeux

 Un « joueur » peut être :


- Une personne,
- Un groupe de personnes,
- Une société,
- Une région,
- Un parti politique,
- Un pays…..
Critères de prise de décision en univers incertain

Univers Incertain:
- Décisions possibles (Actions): D1; D2;….; Dn
- Evénements (Scénarii): Ω={E1, E2,…,Em}
- Fonction gain: g(Di,Ej)
E1 E2 Ej Em
D1
D2

Di G(Di,Ej)
Dn

- Si les probabilités de réalisation des événements sont


inconnues, on dit que l’univers incertain
- Sinon, l’univers est qualifié de risqué.
Critères de prise de décision en univers incertain

Règle générale: Dans un jeu à un joueur, le joueur joue


contre « le hasard » qui est supposé neutre.

Exemple: L’entreprise Alpha lance un nouveau produit.


- La demande peut être de 1000, 2000, 3000, 4000 et 5000
unités.
- La création du produit a coûté 10000 €. Le produit
renvient à 20 € et se vend 40 €.
- La société doit décider du nombre d’articles à produire.
- Pour des raisons de prestige, les invendus ne peuvent
être soldés: on liquide alors les invendus avec un coût de
10 € l’article.
Critères de prise de décision en univers incertain

 Le problème peut se présenter sous forme matricielle suivant:

Demande pour le produit


1000 2000 3000 4000 5000

1000 10000 10000 10000 10000 10000


2000 -20000 30000 30000 30000 30000
Fabrication

3000 -50000 0 50000 50000 50000

4000 -80000 -30000 20000 70000 70000

5000 -110000 -60000 -10000 40000 90000


a. Le critère de Wald: maximin

 Le critère du maximin, qui se révèle d’une utilisation fort


simple, est apprécié par de nombreux décideurs.
 Optique conservatrice (pour décideur prudent, averse
au risque et qui privilégie la sécurité): on sélectionne la
stratégie pour laquelle le gain minimal est maximal
(maximin).
 Le but principal est d’apporter une garantie: on va
gagner au moins…, ou perdre au plus…
a. Le critère de Wald: maximin

 Soit g(pi;dj ) le gain obtenu pour une production de pi


unités (i=1,…5) et une demande de dj unités (j=1,…5).
 La stratégie maximin est la stratégie maximisant ce
minimum; cela revient à choisir pk tel que:

j
 
Min g  pk ; d j   Max
i  j
 
 Min g  pi ; d j  


b. Le critère d’optimisme: maximax

 Critère du décideur extrêmement optimiste, non averse


au risque et qui privilégie le gain au détriment de la
sécurité.
 On sélectionne la stratégie qui apportera le plus grand
gain, dans le cas le plus favorable.
 C’est la stratégie telle que:

j
 
Max g  pk ; d j   Max
i  j
 
 Max g  pi ; d j  


b. Le critère d’optimisme: maximax

 Exemple: Pour la société Alpha, on a:


Maxj[g(p1;dj)]= + 10000 € pour j=1,2,…,5
Maxj[g(p2;dj)]= + 30000 € pour j=2,3,4,5
Maxj[g(p3;dj)]= + 50000 € pour j=3,4,5
Maxj[g(p4;dj)]= + 70000 € pour j=4,5
Maxj[g(p5;dj)]= +90000 € pour j=5
 La stratégie maximax est de produire 5000 unités pour un gain
potentiel de 90000 €.
 Critère pouvant provoquer d’importantes pertes en cas d’avenir
défavorable.
c. Le critère de Laplace
 On suppose que les réalisations sont équiprobables ou que les
probabilités de réalisation sont inconnues.
 Pour une stratégie i, le gain espéré est:
n
1
G ( pi )   g ( pi ; d j )
j 1 n

 𝑔 𝐷𝑖 =1/n(σ𝑛𝑗=1 𝑔(𝐷𝑖 , 𝐸𝑗 )

 On sélectionne la stratégie qui maximise l’espérance de gain.

Max G( pi )
i 1,.. n
c. Le critère de Laplace

 Exemple Alpha: Pour une production de 5000 unités, l’espérance de


gain est:
-110000/5 -60000/5 + 10000/5 + 40000/5 + 90000/5 = -30000 €
Gain espéré
Demande pour le produit Maximal
Stratégies
optimales 1000 2000 3000 4000 5000 Laplace

1000 10000 10000 10000 10000 10000 10000 €

2000 20000 €
Fabrication

-20000 30000 30000 30000 30000

3000 -50000 0 50000 50000 50000 20000 €

4000 -80000 -30000 20000 70000 70000 10000 €

5000 -110000 -60000 -10000 40000 90000 -300000



d. Le critère de Savage: Regrets

 Le critère du regret maximum, appelé aussi « critère


minimax », est avec celui du maximin le critère le plus
utisé.
 Ce critère est adapté au décideur relativement prudent;
il tempère le pessimisme du maximin.
 Sa mise en œuvre nécessite, au préalable, l’élaboration
de la matrice des regrets.
d. Le critère de Savage: Regrets

Exemple: Société Alpha


 On suppose que l’on connaît à l’avance la demande et l’on cherche
la stratégie donnant le meilleur gain pour cette demande.
 Dans la colonne correspondant à cette demande, on remplace
chaque gain par la différence entre ce gain actuel et le gain qui serait
optimal pour cette demande.
 On obtient ainsi un tableau donnant le « regret » correspondant à
une production non optimale pour cette demande.
 On choisit la stratégie qui minimise ce regret maximum.
Demande pour le produit
Matrice des gains
1000 2000 3000 4000 5000
1000 10000 10000 10000 10000 10000

2000 -20000 30000 30000 30000 30000

3000 -50000 0 50000 50000 50000

4000 -80000 -30000 20000 70000 70000

5000 -110000 -60000 -10000 40000 90000

Demande pour le produit


Matrice des regrets 1000 2000 3000 4000 5000 MiniMax

1000 0 20000 40000 60000 80000 80000

2000 30000 0 20000 40000 60000 60000

3000 60000 30000 0 20000 40000 60000

4000 90000 60000 30000 0 20000 90000

5000 120000 90000 60000 30000 0 120000


d. Le critère de Savage: Regrets

Demande pour le produit


1000 2000 3000 4000 5000 Reg. max
1000 10000 € 10000 € 10000 € 10000 € 10000 € 80000 €

2000 0€ 30000 € 30000 € 30000 € 30000 € 60000 €


Fabrication

3000 -10000 € 20000 € 50000 € 50000 € 50000 € 40000 €

4000 -20000 € 10000 € 40000 € 70000 € 70000 € 30000 €

5000 -30000 € 0€ 30000 € 60000 € 90000 € 40000 €

Le minimum des maximums des regrets est 30000 €, pour une production
de 4000 unités.
Exemple 2: choix d’investissement

 On doit choisir le meilleur des trois projets d’investissement I1, I2 , I3


pour lesquels les VAN (valeur actuelle nette) ont été calculée en
fonction de chacun des trois événements E1, E2, E3 susceptibles de se
produire et dont dépendent les cash-flows.

E E1 E2 E3
I
I1 60 0 -90

I2 120 -60 0

I3 -15 90 30
a. Le critère de Wald: maximin

Exemple 2: Choix d’investissement:


 Ce critère consiste à prendre la VAN minimum de chaque
investissement et à retenir celui dont la VAN minimum est la plus
élevée.
 L’application de ce critère donne:
 I1  VAN minimum   90 

 I 2  VAN minimum   60 Choix : I3
 I 3  VAN minimum   15  
b. Le critère d’optimisme: maximax

 Exemple 2: Choix d’investissement:

On retient l’investissement dont la VAN est la plus élevée.

 I1  VAN maximum  60 

 I 2  VAN maximum  120 Choix : I 2
 I 3  VAN maximum  90 

c. Le critère de Laplace

 Exemple. Choix d’investissement:

1 1  1 
 I1  E (VAN)  60   0     90    10
3 3  3 
1 1 1 
 I 2  E ( VAN)  120   60   0   20  Choix : I 3
3 3 3 
1 1 1 
 I 3  E (VAN)  15   90   30   35 
3 3 3 
 Remarque. Le fait de supposer que les résultats sont
équiprobables fait sortir le critère de Laplace du cadre strict de
l’avenir totalement incertain.
d. Le critère de Savage: Regrets
 On obtient la matrice des regrets suivante:

E E1 E2 E3
I
I1 60 90 120

I2 0 150 30

I3 135 0 0

 On relève le regret maximum correspondant à chaque investissement


et on choisit celui dont le regret maximum est le plus faible

 I1  Regret maximum  120 



 I 2  Regret maximum  150 Choix : I1
 I 3  Regret maximum  135 

I. Jeux à un joueur
 Remarques.
- Aucun critère n’est vraiment meilleur qu’un autre.
- Le seul critère que l’on puisse à peu près éliminer, dans
le monde de l’entreprise, est celui du maximax,
beaucoup trop optimiste et assez imprudent.
2. Prise de décision dans un
univers certain
2. Choix en avenir certain (probabilisé)

En matière de décision d’investissement, quand l’avenir est


probabilisable, il est possible de déterminer toutes les valeurs
possibles que peut prendre le cash-flow relatif à un exercice
donné et d’affecter une probabilité à chacune de ces valeurs.

 Critère Espérance - Variance


 Arbre de décisions.
 Test d’hypothèses.
Pascal: Espérance mathématique,

Probabilit 0,5 0,2 0,3


és
E1 E2 E3 Espérance

I1 60 0 -90 60*0,5-
90*0,3=3
I2 120 -60 0 48

I3 -15 90 30 19,5

𝑀𝑎𝑥𝑖𝑚𝑖𝑠𝑒𝑟 𝐸 𝑋 = ෍ 𝑃𝑖 𝑋𝑖
𝑖=1
Critère de l’espérance de l’utilité
 Présenté par Bernoulli (1738) puis généralisé par Von Neumann et
Morgenstern (1947)

 Paradoxe de Saint-Pétersbourg: Un mendiant de la ville de St-


Pétersbourg détenait un billet de loterie pouvant lui faire gagner 20 000
ducas avec 50% de chance. Quand vint passer un riche marchand qui lui
fait la proposition suivante: « Je vous donnerai 9000 ducas en échange de
votre ticket de loterie»
Décision: à prendre
D1: Accepter l’offre du riche marchand
D2: refuser l’offre

Evénements: Etats de la nature


- E1: Billet gagnant; p(E1)=0,5
- E2: Billet perdant; p(E2)=0,5
- Critère d’espérance

Probabilité 0,5 0.5


Evénements E1 E2 ESPERANCE
Décisions
D1 9000 9000 9000
D2 20000 0 10000
 Selon le critère de Laplace primant à l’époque, on doit
comparer les espérances mathématiques:
0,5 x 20 000 + 0,5 x 0= 10 000 ducas
Et
1 x 9 000= 9 000 ducas

 Selon Pascal, on doit conserver le ticket, or le mendiant


accepte l’échange: c’est le paradoxe de St-Pétersbourg.
Critère de l’espérance de l’utilité
Décision: à prendre
D1: Accepter l’offre du riche marchand
D2: refuser l’offre

Evénements: Etats de la nature


- E1: Billet gagnant; p(E1)=0,5
- E2: Billet perdant; p(E2)=0,5
- Critère d’espérance
Probabilité 0,5 0.5
Evénements E1 E2 ESPERANCE
Décisions
D1 U(9000) U(9000) U(9000)
D2 U(20000) U(0) 0,5*U(20000)+0,5*U(0)

- Perception des valeurs monétaires:


- U: R R
- g U(g)
Maximiser EU(g)
U(x)=ln(x+1)
Décision du mendiant?
EU(D1)=9,105
EU(D2)=4,95
Décision à prendre : D1
Utilité marginale: de combien varie l’utilité quand on ajoute un
dirham supplémentaire: U’
U’: décroissante; U’’ négative: fonction concave
Probabilité 0,5 0.5
Evénements E1 E2 ESPERANCE
Décisions d’utilité
D1 ln(9001) ln(9001) ln(9001)=9,105
D2 ln(20001) ln(1)=0 0,5*ln(20001)=4,95
U(x)=x^2
Décision du mendiant?
EU(D1)= 0,81 *10^8
EU(D2)=2 * 10^8
Décision à prendre : D2
Utilité marginale: de combien varie l’utilité quand on ajoute un
dirham supplémentaire: U’
U’: croissante; U’’ positive: fonction convexe
Probabilité 0,5 0.5
Evénements E1 E2 ESPERANCE
Décisions d’utilité
D1 81* 10^6 81*10^6 0,81*10^8
D2 4*10^8 0 2* 10^8
Critère de l’espérance de l’utilité

 Daniel Bernoulli a proposé deux explications afin de


lever ledit paradoxe:
- La notion d’utilité: ce qui importe aux individus ce ne
sont pas les résultats des multiples situations, mais
l’utilité qu’ils retirent des ces différents résultats.
- Le principe de l’utilité marginale décroissante qui stipule
que l’utilité augmente de moins en moins vite au fur et à
mesure que les individus s’enrichissent.
 Le mendiant doit comparer :
- 0,5 u(20000) + 0,5u(0)
à
- U(9000).
Critère de l’espérance de l’utilité

Exemple.
 Un individu détient un portefeuille constitué d’un
montant certain égal à 1 000 000 dh et d’une action BMM
qui donnera demain comme résultat 200000; 100000 et
-150000 dh avec les probabilités respectives de: 0,5; 0,3 et
0,2.
 Proposition de remplacer l’action par un bon de Trésor
valant à l’échéance 100000 dh, de façon à détenir de
façon certaine 1100 000 dh.
 Quel est le choix à faire?
Critère de l’espérance de l’utilité
 On a deux choix:
- Soit détenir 1 100 000 dh.
- Soit la situation suivante:
Valeur Probabilité
1200000 0,5
1
u ( x)  x  x 2
1100000 0,3
2  10 7
850000 0,2
Dans le second cas, la moyenne est
Critère de l’espérance de l’utilité
 Cas 1. Si on choisit comme fonction utilité:

1
u ( x)  x  x 2

2  10 7

 Cas 2. Si on choisit comme fonction utilité:

1
u ( x)  x 2

10 6
Critère de l’espérance de l’utilité
 CAS 1. Si on choisit comme fonction utilité:
1
u ( x)  x  x 2

2  10 7
 Le niveau (espérance) d’utilité apporté par le portefeuille est

0,5u (1200000)  0,3u (1100000)  0,2u (850000)  1038625

 Le niveau d’utilité apporté par le bon de Trésor et le cash


est:
u (1100000)  1039500
 On préfère donc le bon de Trésor
Critère de l’espérance de l’utilité
 CAS 2. Si on choisit comme fonction utilité:
1
u ( x)  x 2

10 6
Elle conduit à un niveau d’utilité espéré égal à :

0,5u (1200000)  0,3u (1100000)  0,2u (850000)  1227500

Le niveau de l’utilité de la richesse espérée est:

u (1100000)  1210000

Le portefeuille risqué est préféré dans ce cas.


Arbre de décision
 Outil de modélisation
 Calcul simple des espérances: événements
conditionnels
 Evénements:
 Décision:
Arbre de décision
 Prenons le cas d'un comité de direction devant statuer
sur la définition d'une stratégie pour développer le chiffre
d'affaires de leur société.
 Plusieurs options sont possibles : se concentrer sur le
marché national en développant de nouvelles gammes
de produits ou bien en intensifiant la prospection pour
gagner de nouveaux clients. Une autre alternative est
possible : se développer à l'international, soit par une
présence directe, soit en nouant un partenariat local.
Arbre de décision
Arbre de décision
3. Théorie de la décision à
deux décideurs
Modélisation d ’un jeu sous forme stratégique

Soit un jeu sous forme stratégique à


deux joueurs et deux stratégies par
joueur:

 L’ensemble des joueurs est


N={1,2}.

 L’ensemble des actions possibles


est A1={H,B} pour le joueur 1, et
A2={G,D} pour le joueur 2. Ainsi,
il existe quatre issues possibles:
A={(H,G),(H,D),(B,G),(B,D)}.

 Les fonctions de paiement des


joueurs: u1(a1 ,a2) et u2(a2 ,a1),
Matrice des paiements
où a1 ϵ A1 et a2 ϵ A2.
Modélisation d ’un jeu sous forme stratégique

Exemple 1: le dilemme des prisonniers

Deux individus sont arrêtés par la police suite à un vol à main armée et ils sont
enfermés dans deux cellules séparées sans possibilité de communiquer
Chaque individu est interrogés séparément et il a le choix de nier d’avoir commis le
vol ou dénoncer son complice comme seul responsable.

Gains des individus ( connus par eux)= années de prison ( relation négative):

- Si les deux dénoncent tous les deux, ils sont condamnés à 8 ans de prison.
- S’ils nient tous les deux, ils auront 1 année de prison du fait de l’absence de
preuves.
- Si un seul dénonce, il est relâché en récompense de sa coopération et l’autre est
condamné à 10 ans de prison.
Modélisation d ’un jeu sous forme stratégique

Solution: le dilemme des prisonniers

- Il existe 2 joueurs
- Chaque joueurs dispose de 2 actions possibles : nier N ou
dénoncer l’autre D

N D
N -1,-1 -10,0
D 0,-10 -8,-8
Modélisation d ’un jeu sous forme stratégique

Exemple 2: Un jeu de coordination

Deux amis veulent se rencontrer au lieu A ou au lieu B; leurs paiements sont


égaux et valent 1 s’ils se rencontrent effectivement et 0 sinon.

Ceci se présente par le jeu:

A B
A 1,1 0,0
B 0,0 1,1
Modélisation d ’un jeu sous forme stratégique

Exemple 3: Le jeu « Matching Pennies »

Chaque joueur possède une pièce de monnaie et choisit secrètement de la


mettre sur Pile (P) ou sur Face (F). Le joueur 1 gagne si son choix est le
même que celui du joueur 2 et, dans ce cas, le joueur 2 perd. Dans le cas
contraire c’est 2 qui gagne et 1 qui perd.

Ceci se présente par le jeu:

P F
P 1,0 0,1
F 0,1 1,0
Elimination des stratégies dominées

 Notion de dominance.
Une stratégie S1, pour un joueur, domine une
autre stratégie S2, si S1 apporte quelle que soit
l’action de l’adversaire , un résultat supérieur ou
égal à celui de la stratégie S2.
Elimination des stratégies dominées

Exemple: le dilemme des prisonniers

N D
N -1,-1 -10,0
D 0,-10 -8,-8

-Pour le prisonnier 1 : la stratégie N est dominée par la stratégie D.


On supprime N

-Pour le prisonnier 2 : la stratégie N est dominée par la stratégie D.


On supprime N

La solution optimale est de (D,D) de gain ( -8,-8)


Elimination des stratégies dominées

Exemple 1:

G M D
A 1,2 1,1 5,0
B 0,1 1,0 2,2
C 2,3 0,2 4,2

La solution optimale est de (C,G) de gain ( 2,3)


Elimination des stratégies dominées

Exemple 2:

Deux pays A et B doivent choisir entre un état de guerre (G) et un état de paix
(P). Si les 2 choisissent la guerre, chacun aura un gain de 2. Si un seul déclare la
guerre, il obtient 6 et son voisin 0. et s’ils choisissent la paix, chacun aura 4.

- Donnez l’ensemble des joueurs et l’ensembles des stratégies de joueurs?


- Représentez ce jeu sous forme stratégique?
- Déterminez la solution du jeu en éliminant les stratégies strictement
dominées?
Elimination des stratégies dominées

Solution Exemple 2:

- Donnez l’ensemble des joueurs et l’ensembles des stratégies de joueurs?


Ensemble des joueurs: ( pays 1 et Pays 2)
Ensembles des stratégies de joueurs: ( G,G) (P,P) (G,P) (P,G)
- Représentez ce jeu sous forme stratégique?
G P
G 2,2 6,0
P 0,6 4,4

- Déterminez la solution du jeu en éliminant les stratégies strictement


dominées?
La solution optimale est (G,G) de gain (2,2)
Elimination des stratégies dominées

Exemple 3:

G M D
A 2,0 1,1 4,2
B 3,4 1,2 2,3
C 1,3 0,2 3,0

PAS DE SOLUTION
La notion du point d’équilibre

 Un point d’équilibre est obtenu à chaque fois que l’on ramène un jeu
à une matrice 1x1 (c’est-à-dire à un seul élément).

 Si l’un des deux joueurs s’écarte unilatéralement de la stratégie


d’équilibre, il se trouvera en situation plus défavorable.

 Un point d’équilibre est une valeur une stratégie correspondant à la


valeur la plus grande de sa colonne et la plus petite de sa ligne.
La notion du point d’équilibre

Exemple : Le jeu « Matching Pennies »

P F
P 1,0 0,1
F 0,1 1,0

PAS DE POINT EQUILIBRE


La notion du point d’équilibre

Exemple : Le dilemme des prisonniers

N D
N -1,-1 -10,0
-
D 0,-10 -8,-8
- --

LE POINT EQUILIBRE (-8,-8)


La notion du point d’équilibre

Exemple :

LES POINTS D’EQUILIBRE (A,E) & (D,H)


La notion du point d’équilibre
R NR
R 2,2 0,4
Exemple : Fureur de vivre
NR 4,0 -2,-2

Deux conducteurs A et B dirigent leurs voitures l’une contre l’autre dans une rue trop étroite, pour
qu’ils puissent se croiser sans provoquer d’accident. Si un conducteur ralentit alors que l’autre
garde la même vitesse, il perd la face : il obtient une utilité de 0 et son adversaire obtient une utilité
de 4. Si les deux ralentissent en même temps, le jeu se termine en égalité et les 2 obtiennent une
utilité de 2. Si aucun ne ralentit, l’accident arrive et chacun obtient une utilité de -2.

- Donnez l’ensemble des joueurs et l’ensembles des stratégies de joueurs?


- Représentez ce jeu sous forme stratégique?
- Déterminez le point d’équilibre
La notion du point d’équilibre

Solution : Fureur de vivre

- Donnez l’ensemble des joueurs et l’ensembles des stratégies de joueurs?


Ensemble des joueurs: ( conducteur 1 et conducteur 2)
Ensembles des stratégies de joueurs: ( R,R) (NR,NR) (R,NR) (NR,R)
- Représentez ce jeu sous forme stratégique?
R NR
R 2,2 0,4
NR 4,0 -2,-2
- Déterminez le point d’équilibre

R NR
R 2,2 0,4
NR 4,0 -2,-2

2 équilibres en stratégie pure: (R,NR) & (NR,R)


Stratégie mixte: Equilibre de Nash

 Quand le jeu admet un point d’équilibre, la stratégie optimale est


pour chacun des adversaires une stratégie simple.
 Quand il n’y a pas de point d’équilibre, la stratégie optimale pour
un joueur sera une stratégie mixte.
 Le joueur devra appliquer une première stratégie avec une certaine
fréquence et une autre avec la fréquence complémentaire.

Exemple.
-Jouer une stratégie avec la fréquence 1/3 et une autre stratégie
avec une fréquence 2/3.
Stratégie mixte: Equilibre de Nash

 Formulation mathématique du problème.


- Soit g la borne inférieure du gain du joueur A.
- Soit p la fréquence avec laquelle A jouera pile. 0 ≤ p ≤ 1.
- Le problème de A peut s’écrire comme un programme linéaire:

Max g Maximiser la borne inf. du gain,


(2)  p  (1)  (1  p)  g Assurer le gain g si B joue Pile,


(1)  p  (0)  (1  p)  g Assurer le gain g si B joue Face,
0  p  1
Stratégie mixte: Equilibre de Nash
Exemple : Fureur de vivre

R NR
t 1-t
R p 2,2 0,4
NR 1-p 4,0 -2,-2

Joueur 1: comparaison de l'Esperance d’utilité de Joueur 2: comparaison de l'Esperance


ses 2 stratégies d’utilité de ses 2 stratégies
E(U)= 2t+0(1-t)= 2t E(U)= 2p+0(1-p)= 2p
E(U)= 4t-2(1-t)= 6t-2 E(U)= 4p-2(1-p)= 6p-2

Le J1 choisit de ralentir si : 2t > 6t-2 : t < ½ J2 choisit de ralentir si :


2t > 6t-2 donc t < ½ 2p > 6p-2 donc p < ½

La fonction de Réaction du J1: La fonction de Réaction du J2:


Stratégie mixte: Equilibre de Nash

EQUILIBRE NASH EN STRATEGIE PURE : (1,0) & (0,1)

EQUILIBRE NASH EN STRATEGIE MIXTE : ( 1/2 ; 1/2)


Jeux sous forme extensive

Tout jeu sous forme normale peut être représenté sous forme extensive.
La forme extensive est donnée par un arbre de jeu contenant un nœud
initial, des nœuds de décisions, des nœuds terminaux et des branches
reliant chaque nœud à ceux qui lui succèdent.
 Un ensemble de n 1 joueurs, indexés par i = 1, 2, . . . , n.
 Pour chaque nœud de décision, le nom du joueur qui a le droit de choisir
une stratégie à ce nœud.
 Pour chaque joueur i, la spécification de l’ensemble des actions permises
à chaque nœud ou il est susceptible de prendre une décision.
 La spécification des gains de chaque joueur à chaque nœud terminal.
Jeux sous forme extensive
Exemple:
Jeux sous forme extensive
Exemple: le dilemme des prisonniers

- Il existe 2 joueurs
- Chaque joueurs dispose de 2 actions possibles : nier N ou
dénoncer l’autre D

N D
N -1,-1 -10,0
D 0,-10 -8,-8
Jeux sous forme extensive
Exemple: Le Problème de l’Entrant Potentiel

L’entrant (E) doit choisir entre Entrer ou Ne pas entrer


S’il entre, la firme installée (I) a deux choix : Combattre en cassant les prix
ou Coopérer avec lui, de manière à créer un monopole joint.

Nous pouvons représenter ce jeu sous la forme d’un arbre ou les gains sont :
Jeux sous forme extensive
Exemple:

Jeu à information imparfaite


3. Aide à la décision multicritères
3. Aide à la décision multicritères

 Définition [Roy, 1985] L’aide à la décision est l’activité de celui qui,


prenant appui sur des modèles clairement explicités mais non
nécessairement complètement formalisés, aide à obtenir des
éléments de réponses aux questions que se pose un intervenant
dans un processus de décision, éléments concourant à éclairer la
décision et normalement à prescrire, ou simplement à favoriser un
comportement de nature à accroître la cohérence entre l’évolution
du processus d’une part, et objectifs et système de valeurs au service
desquels cet intervenant se trouve placé d’autre part.
Aide à la décision multicritères
 Décideur : Le décideur est l’intervenant pour le compte
duquel l’aide à la décision s’exerce ;
 Analyste : Celui qui prend en charge l’aide à la décision.
 Action / Alternative / solution / scénario : Objet analyse,
évalué et comparé avec d’autres objets pendant le
processus de décision.
 Critère : Fonction (g), définie sur l’ensemble des actions
potentielles de telle sorte qu’il soit possible de raisonner
ou de décrire le résultat de la comparaison de deux
actions a et b à partir de g(a) and g(b).
 Problématiques : Choix, rangement, classification,
description.
Aide à la décision multicritères

Une famille de critères doit être :

 Exhaustive : complète pour décrire le problème ;


(principe d’exhaustivité)
 Cohérente vis à vis des préférences globales Aussi
 Indépendante que possible ; (principe de non
redondance
Aide à la décision multicritères

Exemple 1: Ali désire acheter une voiture sportive. Quels


sont les critères qu’il peut considérer ?
 Coût : coût liés à la voiture sur une période (prix,
entretien, essence, assurance) calculé en unités
monétaires ;
 Accélération : temps nécessaire pour parcourir un km,
(en secondes) ;
 Freinage : échelle qualitative recodée sur un intervalle

 Tenue de route : échelle qualitative recodée sur un


intervalle
Aide à la décision multicritères

Exemple 2: Choisir un candidat pour un poste spécifique


dans une entreprise
 Décideur : le directeur du département concerné

 Analyste : consultant

 Action / Alternatif : candidats

 Critères : diplôme, expérience de travail, âge, etc.

 Problématique : choix / rangement


Aide à la décision multicritères

Exemple 3: Étude des problèmes de décision où un


groupe de votants doit prendre une décision pour choisir un
seul candidat
 Décideur : le peuple

 Analyste : personnes choisissant la procédure

 Action / Alternatif : candidats

 Critères : nombre de votants

 Problématique : choix / rangement


Aide à la décision multicritères
Aide à la décision multicritères
Aide à la décision multicritères
Aide à la décision multicritères

Exemple 4: Soit le problème du choix d’une voiture

Quel est le meilleur achat ?


Quelles sont les priorités de l’acheteur ?
Aide à la décision multicritères

Étapes d’un processus de décision multicritère:

1 Définition du problème

2 Identification des solutions (actions) possibles ou envisageables

3 Définition des critères

4 Évaluation des performances des actions au vu des critères choisis

5 Choix de la ou les solutions ’optimales’


Aide à la décision multicritères

Les méthodes de l’analyse multicritère (AM) sont des méthodes qui


permettent de résoudre les problèmes d’aide à la décision multicritère.
En effet, une fois le problème est identifié et les alternatives sont
définies, nous procédons au choix d’une ou plusieurs solutions
optimales parmi les alternatives proposées.
Les méthodes d’AM sont généralement regroupées en deux
catégories :
 Agrégation des critères en un seul critère (Somme pondérée,
AHP, etc) ;
 Méthodes basées sur le surclassent ;
Agrégation des critères en un seul
critère

1. Somme pondérée :

Soient m actions (ai) et n critères (cj). Chaque critère est défini par un
poids wj > 0
La méthode de la somme pondérée consiste à calculer pour chaque action
i le critère :

- Exemple: On cherche à identifier la ville la plus attractive et convenable


pour développer les déplacements doux (à vélos par exemple). Il s’agit de
trouver la ville ou les villes qui sont les plus attractives sur 5 villes, puis de
les classer de la plus pertinente à la moins pertinente.
Agrégation des critères en un seul
critère

1. Somme pondérée

La méthode de la somme pondérée a 2 avantages principaux :

- Il s’agit d’un modèle simple


- La solution optimale d’une somme pondérée est efficace (Pareto
optimale)

Cependant elle possède aussi de nombreuses limites, notamment sa


dépendance :
- Des Poids des critères
- De la procédure de normalisation des échelles des critères
Agrégation des critères en un seul
critère

1. Somme pondérée

Exemple 1: choisir un fournisseur


Agrégation des critères en un seul
critère

1. Somme pondérée

Solution 1: choisir un fournisseur


Agrégation des critères en un seul
critère

2. Analyse multicritère hiérarchique - AHP

La méthode AHP permet aux décideurs de structurer les problèmes


complexes auxquels ils sont confrontés en émettant des jugements selon
leur expérience et les données informationnelles disponibles. Son
application est simple, elle peut se faire par un individu seul ou en groupe.
Elle consiste à décomposer un problème selon un arborescence des
différents critères et sous-critères de décision associés à ce problème et
de comparer ces critères entre eux, deux à deux, à l’aide d’une échelle de
pondération afin de mettre en lumière la solution qui répond le mieux aux
critères de décision
Agrégation des critères en un seul
critère

2. Analyse multicritère hiérarchique - AHP

Étapes d’application de la méthode AHP:


Agrégation des critères en un seul
critère

2. Analyse multicritère hiérarchique - AHP

Échelle de pondération:
Agrégation des critères en un seul
critère

2. Analyse multicritère hiérarchique - AHP

Choix d’une université:


Méthodes basées sur le surclassent
 Par opposition à l’approche classique, l’approche dite de
sur-classement vise à construire sur l’ensemble A une
relation de sur-classement globale S enrichissant la
relation de dominance.
 Elle vise à modéliser la part des préférences globales que
l’on est en mesure d’asseoir de façon suffisamment
probante.
 La relation S est généralement construite à l’aide d’un
test de sur-classement appliqué à toutes les paires
d’actions de A. Les méthodes ELECTRE utilisent une
relation de sur-classement pour l’agrégation des critères
de décision.
Méthodes basées sur le surclassent

 Trois méthodes multicritères sont utilisées, en


fonction de la problématique considérée.
- La première méthode Electre I , est préconisée
pour répondre à une problématique de choix.
- La méthode Electre-Tri est préconisée pour les
problématiques de tri ou d’affectation.
- La méthode Electre III est utilisée pour répondre
à des problématiques de rangement ou de
classement.
Méthode ELECTRE 1
 On considère un ensemble A de m actions, qui
représentent l’objet de la décision, dont le but est
d’identifier un sous-ensemble d’actions offrant un
meilleur compromis parmi l’ensemble de départ.
 On définit pour chaque critère une fonction d’évaluation
g j (où j=1 à n, n est le nombre de critères), pour chaque
critère, on évalue un poids kj qui augmente avec
l’importance du critère.
 L’indice de concordance pour deux actions a et b est noté
par C(a,b), compris entre 1 et 0, il mesure la pertinence
de l’assertion « a surclasse b », comme suit
Méthode ELECTRE 1
 L’indice de concordance globale pour deux actions a et b est noté
par C(a,b), compris entre 1 et 0, il mesure la pertinence de l’assertion
« a surclasse b », comme suit
n

k j n

k
j , g j ( a )  g j ( b )
C ( a , b)  , K  j
K j 1

 Plus l’indice C(a,b) est proche de 1, plus l’assertion a S b est


supportée.
 On peut également définir un indice de concordance partielle et
retrouver l’indice de concordance globale comme somme pondérée
de ces indices.
 C(a,b) varie de 0 à 1 (normalisation des poids) et mesure les
arguments en faveur de “a surclasse b”
Méthode ELECTRE 1
• L’indice de discordance D(a,b) est défini par :
D ( a, b)  0 si j g j ( a )  g j (b)

Sinon 1
D ( a , b)  Max[ g j (b)  g j ( a )]
 j

ẟ: Différence maximale entre le même critère pour deux actions


données   max c ,d , j 
g (d )  g (c)
j j 
- D(a,b) mesure la force d’un argument (maximal) en défaveur de “a
est au moins aussi bonne que b”.
- D(a,b) exprime le fait que le décideur ne peut accepter la préférence
de a sur b si b est largement meilleur que a sur un critère (quel que
soit le nombre de critères en faveur de a sur b).
- L’indice D(a,b) est donc d’autant plus grand que la préférence
de a sur b est faible sur un critère.
Méthode ELECTRE 1
 La relation de sur-classement pour Electre I est construite par la
comparaison des indices de concordance et de discordance à des
seuils limites de concordance ĉ et de discordance d̂
 Règle de sur-classement: a surclasse b, si :

aSb  C ( a , b)  cˆ et D ( a , b)  dˆ
 Exemple.
L’exemple traite du choix d’un projet, parmi 6 projets concurrents pour la
réalisation d’une raffinerie. Chaque projet est évalué sur la base de 5
critères environnementaux. L’importance de chaque critère dans la prise de
décision est traduite par un poids kj tel que

Critères Cr1 Cr2 Cr3 Cr4 Cr5


Poids (kj) 3 2 3 1 1
Méthode ELECTRE 1
 Chaque projet est évalué en fonction des critères retenus à l’aide
d’une échelle qualitative et des scores. Plus le score est élève, plus
les impacts du projet sur l’environnement sont moindres. Le tableau
de performance est donné dans le tableau suivant :
Projets Cr1 Cr2 Cr3 Cr4 Cr5
P1 10 20 5 10 16
P2 0 5 5 16 10
P3 0 10 0 16 7
P4 20 5 10 10 13
P5 20 10 15 10 13
P6 20 10 20 13 13
Poids (kj) 3 2 3 1 1
Méthode ELECTRE 1
 La problématique à résoudre est de choisir le sous-ensemble de
projets avec le moins d’impacts sur l’environnement. On propose
d’utiliser ELECTRE I. Nous présentons un exemple de calcul de
l’indice de concordance :
n

k j 5

k
j , g j ( P1 )  g j ( P2 )
C ( P1 , P2 )  , K  j
K j 1

3 2  31
C ( P1 , P2 )   0,9.
10
Méthode ELECTRE 1
La matrice des indices de concordance est donnée par :

P1 P2 P3 P4 P5 P6
P1 - 0,9 0,9 0,4 0,4 0,3
P2 0,4 - 0,8 0,3 0,1 0,1
P3 0,1 0,6 - 0,3 0,3 0,3
P4 0.7 0.9 0.7 - 0.5 0.4
P5 0.7 0.9 0.9 1.0 - 0.6
P6 0.7 0.9 0.9 1.0 1.0 -
Méthode ELECTRE 1
 L’indice de discordance est calculé pour une valeur de  = 20 - 0 = 20
6
D ( P1 , P2 )   0,3.
20
15
D ( P2 , P1 )   0,75.
20
6
D ( P1 , P3 )   0,3.
20

10
D ( P3 , P1 )   0,5.
20
Méthode ELECTRE 1
 La matrice de discordance est obtenue comme suit
P1 P2 P3 P4 P5 P6
P1 - 0,3 0,3 0,5 0,5 0,75
P2 0,75 - 0,25 1 1 1
P3 0,5 0,25 - 1 1 1
P4 0.75 0.3 0.3 - 0.25 0.5
P5 0.5 0.3 0.3 0.0 - 0.25
P6 0.5 0.15 0.15 0.0 0.0 -

 La matrice des discordance fait apparaitre des 1 pour une


discordance maximale (ou dès lors qu’un critère oppose son véto).
Par exemple : D(P3,P4)=1, veut dire que la discordance est maximale
par rapport à l’assertion P3 S P4.
Méthode ELECTRE 1
 L’intérêt de la méthode Electre I est d’isoler un
sous ensemble de solutions, dans notre cas
identifier les projets avec le moins d’impacts sur
l’environnement. En considérant

cˆ  1 et dˆ  0
Graphe de surclassement

P1 P2 P3 P6

P5 P4

Les projets à retenir sont donc: P6, P5 et P4.

Vous aimerez peut-être aussi