Vous êtes sur la page 1sur 24

CHAP 1.

Les critres de dcision en


univers non mesurable

1- Le critre de Laplace
Fonction de valorisation :
valuer la moyenne des rsultats de chaque action.

1 ei en
Va j Ra j ,ei
n ei e1
Critre de choix :
Choisir laction dont la moyenne est la plus
leve.

a* arg max Va j

Exemple dapplication
Actions\tats

e1

e2

e3

e4

a1

20

25

40

100

a2

30

50

125

a3

40

50

75

1
20 25 40 100 46,25
4

Va2 5 30 50 125 52,5


4

Va3 40 50 75 0 41,25
4

Va1

arg max Va j a* a2

a2 a1 a3

Critique du critre de Laplace :


Critre de la raison insuffisante
Car tout se passe comme si on cherchait maximiser une
esprance mathmatique de gain comme si on tait dans
un univers risqu et quiprobable.

2- Le critre du MaxiMax
Fonction de valorisation :
Dterminer le rsultat maximum que peut rapporter
chaque action.

Va j sup Ra j ,ei
Critre de choix :

ei

Choisir laction dont la fonction de valorisation est la


plus leve

a* arg max Va j

Exemple dapplication
Actions\tats

e1

e2

e3

e4

a1

20

25

40

100

a2

30

50

125

a3

40

50

75

Va1 sup 20; 25; 40; 100 100


Va2 sup 5; 30; 50; 125 125

Va3 sup 40; 50; 75; 0 75

arg max Va j a* a2

Critique du critre du MaxiMax :


Critre trop optimiste
En effet, en utilisant le critre du MaxiMax, lagent se
comporte comme un optimiste qui ne voit que la possibilit
de gagner le plus possible en omettant les possibilits de
gain infrieur.

3- Le critre de WALD ou MaxiMin


Fonction de valorisation :
Dterminer le rsultat minimum que peut rapporter
chaque action.

Va j inf R j ,i
ei

Critre de choix :
Choisir laction dont la fonction de valorisation est la
plus leve.

a* arg max Va j

Exemple dapplication
Actions\tats

e1

e2

e3

e4

a1

20

25

40

100

a2

30

50

125

a3

40

50

75

Va1 inf 20; 25; 40; 100 20

Va2 inf 5; 30; 50; 125 5

Va3 inf 40; 50; 75; 0 0

arg max Va j a* a1

Critique du critre de WALD


Critre trop pessimiste
En effet, en utilisant le critre de WALD, lagent se comporte
comme un pessimiste qui se dit : je nai pas de chance donc
je vais choisir laction qui a le plus grand rsultat minimum :
je suis certain davoir au moins ce minimum .

4- Le critre dHURWICZ
Fonction de valorisation :
Dterminer une fonction prenant en compte le pire des
rsultats avec la probabilit et le meilleur rsultat avec la
probabilit (1- .

Va j . inf Ra j ,ei (1 ) sup Ra j ,ei


ei

ei

Critre de choix :
Choisir laction dont la fonction de valorisation est la
plus leve.

a* arg max Va j

Exemple dapplication
Actions\tats

e1

e2

e3

e4

a1

20

25

40

100

a2

30

50

125

a3

40

50

75

Va1 .20 (1 )100 100 80.


Va2 .5 (1 ).125 125 120.
Va3 .0 (1 ).75 75 75.

Laction a1 est prfre si :


100 80. 125 120.

100 80. 75 75.

8
5

Optimisme

Laction a2 est prfre si :

125 120. 100 80.


8

125

120
.

75

75
.

10

0
a*=a2

Laction a3 est prfre si :


75 75. 100 80.

75 75 125 120.

5
10

Pessimisme

0;1

1
a*=a1

Remarques sur le critre dHURWICZ :


Gnralisation du choix dun agent qui ne serait ni
compltement optimiste, ni compltement
pessimiste.
Si =0, lagent est rsolument optimiste
Si =1, lagent est rsolument pessimiste

Lagent doit connatre son degr doptimisme !

5- Le critre de SAVAGE
Fonction de valorisation :
On dtermine une fonction de regret qui mesure le manque
gagner en nayant pas choisi la bonne action pour
chaque tat de la nature.
ei n

Va j sup Ra j ,ei Ra j ,ei


aj
ei 1

Critre de choix :
Choisir laction dont la fonction de regret est la plus
faible.

a* arg min Va j

Exemple dapplication
Actions\tats

e1

e2

e3

e4

a1

20

25

40

100

a2

30

50

125

a3

40

50

75

Va1 40 20 50 25 75 40 125 100 105


Va2 40 5 50 30 75 50 125 125 80

Va3 40 40 50 50 75 75 125 0 125

6- Le critre MOYENNE-VARIABILITE
Fonction de valorisation :
La fonction de valorisation est caractrise par un couple
compos par la moyenne de laction et sa variabilit..

1 ei n
moy a j Ra j ,ei
n ei 1

a j sup Ra j ,ei inf Ra j ,ei


ei

ei

Critre de choix n 1 :
moy (ak ) moy (al ) et (ak ) (al )

ak al si
ou bien
moy (a ) moy (a ) et (a ) (a )
k
l
k
l

Cette rgle de comparaison est assez


restrictive :
Elle ne prend pas en considration le fait
quune forte variabilit compense par
une forte moyenne puisse tre
Doncintressante.
ce critre ne fonctionne pas toujours : il
faut le complter

Exemple dapplication
Actions\tats

e1

e2

e3

e4

a1

20

25

40

100

a2

30

50

125

a3

40

50

75

1
20 25 40 100 46,25
4
a1 100 20 80
moy a1

1
5 30 50 125 52,5
4
a2 125 5 120
moy a2

1
40 50 75 0 41,25
4
a3 75 0 75
moy a3

Pas de dcision possible

Critre de choix n 2 :
ak al

si

moy ak moy al

ak
al

Cette rgle consiste mesurer le


pourcentage de moyenne par unit de
variabilit.
La meilleur stratgie sera celle qui aura
la plus grande moyenne par unit de
variabilit

Application du critre n2 :
moy a1 46,25
moy a1
0,5781

a1 80
a1
moy a2 52,5
moy a2
0,4375

a2 120
a2
moy a3 41,25
moy a3

0,55

a3 75
a3

a1 a3 a2

Critre de choix n 3 :
ak al

si

moy a k moy al

ak al

Cette rgle apporte une notion de


dplacement mesur par le Taux
Marginal de Substitution entre la
moyenne et la variabilit.
On peut donc changer de stratgie
condition que le taux dchange soit
assez lev.
Il faut toujours tester deux actions
de telle faon que le numrateur et
le dnominateur soient positifs

Application du critre n3 :
Comparaison de a1 et de a2
a2 a1 si

moy a2 moy a1 52,5 46,25

0,15625
a2 a1
120 80

Comparaison de a2 et de a3
a2 a3 si

moy a2 moy a3 52,5 41,25

0,25
a2 a3
120 75

Comparaison de a1 et de a3
a1 a3 si

moy a1 moy a3 46,25 41,25

1
a1 a3
80 75

a1
a2
a3

a2

0,156250,25

0,156250,25

a1

a1

a3