Vous êtes sur la page 1sur 26

CHAPITRE 1.

Les critères de décision en univers


non mesurable
1- Le critère de Laplace
• Fonction de valorisation :
– Évaluer la moyenne des résultats de chaque action.
𝑒𝑖=𝑒 𝑛
1
𝑉 𝑎 = ∑ 𝑅𝑎 , 𝑒
𝑗
𝑛 𝑒 =𝑒
𝑖 1
𝑗 𝑖

• Critère de choix :
– Choisir l’action dont la moyenne est la plus
élevée.
𝑎 ∈ argmax ( 𝑉 𝑎 )

𝑗
Exemple d’application
Actions\états e1 e2 e3 e4
a1 20 25 40 100
a2 5 30 50 125
a3 40 50 75 0

}
1
¿ 𝑉 𝑎 = ( 20+25+ 40+100 )=46,25
1
4
1
¿ 𝑉 𝑎 = ( 5+30+50+125 )=52,5 ⇒ argmax ( 𝑉 𝑎 𝑗 )=𝑎∗=𝑎2
2
4
1
¿𝑉 𝑎 = ( 40 +50+75+0 )=41,25
3
4 2 𝑎 ≻𝑎 ≻𝑎
1 3
Critique du critère de Laplace :

• Critère de la raison insuffisante

– Car tout se passe comme si on cherchait à maximiser


une espérance mathématique de gain comme si on était
dans un univers risqué et équiprobable.
2- Le critère du MaxiMax
• Fonction de valorisation :
– Déterminer le résultat maximum que peut rapporter
chaque action.
¿
𝑉 𝑎 = 𝑒𝑖 ( 𝑅 𝑎 , 𝑒 )
𝑗 𝑗 𝑖
• Critère de choix :
– Choisir l’action dont la fonction de valorisation est
la plus élevée

𝑎∗ ∈ argmax ( 𝑉 𝑎 ) 𝑗
Exemple d’application
Actions\états e1 e2 e3 e4
20 25 40 100
5 30 50 125
40 50 75 0

}
¿ 𝑉 𝑎 =( 20 ; 25; 40 ; 100 ) ¿ 100
1

¿𝑉𝑎 = 2
( 5 ; 30 ; 50 ; 125 )
¿ 125 ⇒ argmax ( 𝑉 𝑎 )=𝑎∗=𝑎2
𝑗

¿ 𝑉 𝑎 =( 40; 50; 75; 0) ¿ 75


3
Critique du critère du MaxiMax :

• Critère trop optimiste

– En effet, en utilisant le critère du MaxiMax, l’agent se


comporte comme un optimiste qui ne voit que la
possibilité de gagner le plus possible en omettant les
possibilités de gain inférieur.
3- Le critère de WALD ou MaxiMin

• Fonction de valorisation :
– Déterminer le résultat minimum que peut rapporter
chaque action.

𝑉 𝑎 =inf ( 𝑅 𝑗,𝑖 )
𝑗
𝑒𝑖
• Critère de choix :
– Choisir l’action dont la fonction de valorisation est
la plus élevée.
𝑎∗ ∈ argmax ( 𝑉 𝑎 ) 𝑗
Exemple d’application
Actions\états e1 e2 e3 e4
20 25 40 100
5 30 50 125
40 50 75 0

}
¿ 𝑉 𝑎 =inf ( 20 ;25 ; 40 ;100 ) =20
1

¿ 𝑉 𝑎 =inf ( 5 ;30 ;50 ;125 )=5


2
⇒ argmax ( 𝑉 𝑎 )=𝑎∗=𝑎1
𝑗

¿𝑉 𝑎 =inf ( 40 ;50 ;75 ;0 ) =0


3
Critique du critère de WALD

• Critère trop pessimiste

– En effet, en utilisant le critère de WALD, l’agent se


comporte comme un pessimiste qui se dit : « je n’ai pas
de chance donc je vais choisir l’action qui a le plus
grand résultat minimum : je suis certain d’avoir au
moins ce minimum ».
4- Le critère d’HURWICZ
Déterminer une fonction prenant en compte le pire des
résultats avec la probabilité a et le meilleur résultat avec la
probabilité (1- a).

• Fonction de valorisation :
¿
𝑉 𝑎 =𝛼 ×inf ( 𝑅𝑎 , 𝑒 ) +(1−𝛼)× 𝑒𝑖 ( 𝑅 𝑎 , 𝑒 )
𝑗 𝑗 𝑖 𝑗 𝑖
𝑒
• Critère de choix
𝑖
:
– Choisir l’action dont la fonction de valorisation est la
plus élevée.
𝑎∗ ∈ argmax ( 𝑉 𝑎 ) 𝑗
Exemple d’application
Actions\états e1 e2 e3 e4
20 25 40 100
5 30 50 125
40 50 75 0

𝑉 𝑎 =𝛼.20+(1−𝛼)100=100−80.𝛼
1
L’action a1 est préférée si :

{
5
{¿ 100− 80. 𝛼>125 − 120.𝛼 ⇒
¿ 100− 80. 𝛼>75 − 75.𝛼
¿𝛼>
8
¿ 𝛼<5 Optimisme Pessimisme
L’action a2 est préférée si : 5
0 8 1

{
5
¿𝛼<
{¿ 125− 120. 𝛼>100 − 80.𝛼 ⇒
¿ 125 −120. 𝛼>75 −75. 𝛼
¿ 𝛼<
8
10 *= *=
9

L’action a3 est préférée si :

{ }
¿ 𝛼 >5
{ ¿ 75 − 75. 𝛼 >100 − 80.𝛼 ⇒
¿ 75− 75 𝛼>125 − 120.𝛼 ¿ 𝛼>
10 ∉ [ 0 ; 1 ]
9
Remarques sur le critère d’HURWICZ :
• Généralisation du choix d’un agent qui ne serait ni
complètement optimiste, ni complètement
pessimiste.

– Si a = 0, l’agent est résolument optimiste


– Si a , l’agent est résolument pessimiste

• L’agent doit connaître son degré d’optimisme a !


5- Le critère de SAVAGE
• Fonction de valorisation :
– On détermine une fonction de regret qui mesure le
manque à gagner en n’ayant pas choisi la « bonne
action » pour chaque état de la nature.
𝑖=𝑛
𝑉 𝑎 =∑ ¿ ( 𝑅𝑎 ,𝑒 ) − 𝑅 𝑎 , 𝑒
( )
𝑗
𝑎𝑗 𝑗 𝑖 𝑗 𝑖
𝑖=1
• Critère de choix :
– Choisir l’action dont la fonction de regret est la plus
faible.
𝑎∗ ∈ argmin ( 𝑉 𝑎 ) 𝑗
Exemple d’application
Actions\états e1 e2 e3 e4
20 25 40 100
5 30 50 125
40 50 75 0

𝑉 𝑎 =( 40−20)+(50−25)+(75−40)+(125−100 )=105
1
6- Le critère MOYENNE-VARIABILITE
• Fonction de valorisation :
– La fonction de valorisation est caractérisée par un
couple composé par la moyenne de l’action et sa
variabilité.
Critère de choix n° 1 :

{
𝑚𝑜𝑦 (𝑎𝑘 )≥ 𝑚𝑜𝑦 (𝑎𝑙 )  et   Δ(𝑎𝑘 )< Δ(𝑎𝑙 )
𝑎𝑘 ≻ 𝑎𝑙   si   ou   bien
𝑚𝑜𝑦 (𝑎𝑘 )>𝑚𝑜𝑦 (𝑎𝑙)  et   Δ(𝑎 𝑘)≤ Δ(𝑎𝑙 )
Cette règle de comparaison est assez restrictive :

Elle ne prend pas en considération le fait qu’une forte


variabilité compensée par une forte moyenne puisse
être intéressante.

Donc ce critère ne fonctionne pas toujours : il faut le


compléter
Exemple d’application
Actions\états e1 e2 e3 e4
20 25 40 100
5 30 50 125
40 50 75 0

1
𝑚𝑜𝑦 ( 𝑎1 ) = ( 20+25+40+100 )=46,25
4
1
𝑚𝑜𝑦 ( 𝑎2 ) = ( 5+30+50+125 )=52,5 Pas de décision possible !
4
1
𝑚𝑜𝑦 ( 𝑎3 ) = ( 40+50+75+0 )=41,25
4
Critère de choix n° 2 :
𝑚𝑜𝑦 ( 𝑎𝑘 ) 𝑚𝑜𝑦 ( 𝑎 𝑙 )
𝑎𝑘 ≻ 𝑎𝑙       si        >
Δ ( 𝑎𝑘 ) Δ ( 𝑎𝑙 )
Cette règle consiste à mesurer le pourcentage de
moyenne par unité de variabilité.

La meilleur stratégie sera celle qui aura la plus grande


moyenne par unité de variabilité
Application du critère n°2 :

Δ ( 𝑎1 ) =80 }
𝑚𝑜𝑦 ( 𝑎1 )=46,25 𝑚𝑜𝑦 ( 𝑎1 )

Δ ( 𝑎1 )
=0,5781

Δ ( 𝑎2 ) =120 }
𝑚𝑜𝑦 ( 𝑎2 ) =52,5 𝑚𝑜𝑦 ( 𝑎2 )

Δ ( 𝑎2 )
=0,4375 𝑎1 ≻ 𝑎3 ≻ 𝑎2

Δ ( 𝑎 3 )=75 }
𝑚𝑜𝑦 ( 𝑎 3 ) =41,25 𝑚𝑜𝑦 ( 𝑎3 )

Δ ( 𝑎3 )
=0,55
Critère de choix n° 3 :

𝑚𝑜𝑦 ( 𝑎 𝑘 ) −𝑚𝑜𝑦 ( 𝑎𝑙 )
𝑎𝑘 ≻ 𝑎𝑙        si         >𝜆
Δ ( 𝑎𝑘 ) − Δ ( 𝑎𝑙 )

Cette règle apporte une notion de déplacement


mesuré par le Taux Marginal de Substitution entre la
moyenne et la variabilité.
On peut donc changer de stratégie à condition d’avoir
un taux d’échange assez élevé.

Il faut toujours tester deux actions en s’assurant que le


numérateur et le dénominateur sont positifs
Application du critère n°3 :
Comparaison de et de
𝑚𝑜𝑦 ( 𝑎2 ) − 𝑚𝑜𝑦 ( 𝑎1 ) 52,5 − 46,25
𝑎2 ≻ 𝑎1    si       = =0,15625 <𝜆(𝑎1 ≻ 𝑎2 ,1< 𝜆)
Δ ( 𝑎2 ) − Δ ( 𝑎1 ) 120 −80
Comparaison de et de
𝑚𝑜𝑦 ( 𝑎2 ) −𝑚𝑜𝑦 ( 𝑎3 ) 52,5 − 41,25
𝑎2 ≻ 𝑎3    si       = =0,25< 𝜆(𝑎3 ≻ 𝑎2 ,1< 𝜆)
Δ ( 𝑎2 ) − Δ ( 𝑎3 ) 120 −75
Comparaison de et de
𝑚𝑜𝑦 ( 𝑎1 ) − 𝑚𝑜𝑦 ( 𝑎3 ) 46,25 − 41,25
𝑎1 ≻ 𝑎3    si       = =1< 𝜆(𝑎3 ≻ 𝑎1 , 𝜆>1)
Δ ( 𝑎1 ) − Δ ( 𝑎3 ) 80 −75
{
𝑎 2     si            0,15 ≤ 𝜆

𝑎 = 𝑎 1 si 0,15 ≤ 𝜆 ≤ 1
𝑎 3 si 𝜆 ≥ 1

Si(respectivement ) les actions (respectivement) sont


équivalentes pour le décideur. Ce dernier peut choisir en
jouant à pile ou face.
Résumé:
Si la règle de comparaison n°1 ne fonctionne pas, il faut utiliser les
règles 2 ou 3. Il s’agit de comparer les ratios et de choisir l’action
possédant la plus faible variation par unité d’espérance.

Trouver la solution optimale revient à résoudre :


Max -

Les préférences du décideur en matière d’arbitrage entre moyenne


(espérance) et variation (écart-type) sont caractérisées par le
coefficient :

- Si =0, nous savons que le décideur est indifférent au risque;


- Si =+, alors il ne supporte pas le risque.

Le coefficient est une mesure de l’aversion vis-à-vis du risque éprouvé


par l’individu
Quel est ≤degr é d ′ aversion 𝜆?

0,15625 0,25 1

𝑎2 𝑎1 𝑎1 𝑎3

Vous aimerez peut-être aussi