Académique Documents
Professionnel Documents
Culture Documents
Résumé
Dans le jeu du rouge et noir, un joueur parie, à mise égale, sur une
séquence de jeux indé- pendants avec une probabilité de succès p, jusqu'à
ce qu'il atteigne un objectif fixe ou qu'il soit ruiné. Dans cet article, nous
explorons deux stratégies : le jeu timide, dans lequel le joueur fait la mise
minimale à chaque jeu, et le jeu audacieux, dans lequel il mise, à chaque
jeu, toute sa fortune ou le montant nécessaire pour atteindre l'objectif (le
plus petit des deux). Nous étudions la probabilité de succès (la probabilité
d'atteindre la cible) et le nombre attendu de parties jouées, en tant que
fonctions de la fortune initiale. L'analyse mathématique du jeu audacieux
conduit à des résultats exotiques et magnifiques et à des liens inattendus
avec les systèmes dynamiques. Notre exposé (et le titre de l'article) est
basé sur le livre classique Inequalities for Stochastic Processes ; How to
Gamble if You Must, de Lester E. Dubbins et Leonard J. Savage.
1 Rouge et noir
Cet article explore les stratégies de l'un des modèles de jeu les plus simples.
Malgré la simplicité du modèle, l'analyse mathématique conduit à des
résultats magnifiques et parfois surprenants dont l'importance et l'application
dépassent largement le cadre des jeux de hasard. L'exposé (et le titre de
l'article) est principalement basé sur le livre classique Inequalities for
Stochastic Processes ; How to Gamble if You Must, de Lester E. Dubbins et
Leonard (Jimmie) Savage [1]. L'article et les applets sont adaptés de l'ouvrage
Virtual Laboratories in Probability and Statistics [4].
1
identiques et mises égales) est connue sous le nom de "rouge et noir" et tire son
nom du jeu de casino qu'est la roulette. D'autres exemples sont les paris "passe"
et "ne passe pas" au craps.
2
Essayons de formuler mathématiquement l'expérience de jeu. Tout
d'abord, laissons In désigner le résultat du nième jeu pour n ∈ N+ où 1 désigne
un gain et 0 une perte. Il s'agit de variables aléatoires indicatrices
indépendantes avec la
même distribution :
P(In = 1) = p, P(In = 0) = q := 1 - p
Stratégies
La stratégie du joueur peut être très complexe. Par exemple, la variable
aléatoire Yn , le pari du joueur sur la partie n, ou l'événement N = n - 1, sa
décision d'arrêter après n - 1 parties, pourrait être basée sur tout l'historique
du jeu,
jusqu'au moment n. Cet historique est le vecteur de variables aléatoires
4
Exercice 2. Utilisez le résultat de l'exercice 1 et l'hypothèse d'absence de
prescience pour montrer que
c E(Xn ) = E(Xn−1 ) si p = 21
L'exercice 3 montre que pour tout jeu dans lequel le joueur fait une mise
positive, son espérance de gain diminue strictement si les jeux sont injustes, reste
la même si les jeux sont équitables, et augmente strictement si les jeux sont
favorables.
Comme indiqué précédemment, une stratégie générale peut dépendre de
l'historique et être aléatoire. Cependant, comme les jeux de Bernoulli sous-
jacents sont indépendants, on pourrait penser que ces stratégies compliquées
ne valent pas mieux que des stratégies simples dans lesquelles le montant de
la mise et la décision de s'arrêter dépendent uniquement de la fortune actuelle
du joueur. Ces stratégies simples jouent en effet un rôle fondamental et sont
appelées stratégies stationnaires et déterministes. Une telle stratégie peut être
décrite par une fonction de pari S de l'espace des fortunes à l'espace des paris
autorisés, de sorte que S(x) est le montant que le joueur mise lorsque sa
fortune actuelle est x.
Pour une stratégie stationnaire et déterministe, l'idée essentielle est
qu'après chaque partie, le processus de fortune recommence simplement, mais
avec une valeur initiale différente. Il s'agit d'un exemple de la propriété de
Markov, nommée en l'honneur d'Andrey Markov. Ainsi, notre processus de
fortune est une chaîne de Markov, l'une des classes les plus importantes de
processus stochastiques.
La règle de l'arrêt
À partir de maintenant, nous supposerons que la règle d'arrêt du joueur est très
simple et standard : il pariera sur les jeux jusqu'à ce qu'il perde toute sa fortune et
soit ruiné, ou qu'il atteigne une fortune cible fixe a :
N = min{n ∈ N : Xn = 0 ou Xn = a}
5
interprétation, le joueur et la maison jouent des rôles symétriques, mais avec des
probabilités de gain complémentaires : le jeu continue jusqu'à ce que le joueur
soit ruiné ou que la maison soit
6
ruiné. Les variables aléatoires d'intérêt principal sont N , le nombre de parties
jouées, et la fortune finale XN du joueur. Notez que la seconde variable ne
prend que deux valeurs : 0 et a.
Exercice 4. Montrez que la moyenne et la variance de la fortune finale sont données
par
a E(XN ) = a P(XN = a)
Jeu timide À chaque partie, jusqu'à ce qu'il s'arrête, le joueur fait une petite
mise constante, disons 1 $.
Jeu audacieux À chaque jeu, jusqu'à ce qu'il s'arrête, le joueur mise soit la
totalité de sa fortune, soit le montant nécessaire pour atteindre la fortune
cible, le plus petit des deux étant retenu.
Dans la section qui suit l'examen de ces stratégies spécifiques, nous reviendrons
sur la question des stratégies optimales.
2 Jeu timide
Rappelons qu'avec la stratégie de jeu timide en rouge et noir, le joueur fait
une petite mise constante, disons 1 $, sur chaque jeu jusqu'à ce qu'il s'arrête.
Ainsi, à chaque partie, la fortune du joueur augmente de 1 ou diminue de 1,
jusqu'à ce que la fortune atteigne 0 ou la cible a (que nous supposons être un
nombre entier positif). Ainsi, le processus de fortune (X0 , X1 , . . .) est une
marche aléatoire sur l'espace de fortune
{0, 1, . . . a} avec 0 et a comme barrières absorbantes. Le graphe d'état est
présenté à la figure 1. Les marches aléatoires sont des types particulièrement
simples et importants d'algorithmes de Markov
chaînes.
7
La probabilité de gagner
Notre analyse basée sur la propriété de Markov suggère que nous traitions la
fortune initiale comme une variable. Bientôt, nous ferons également varier la
fortune cible. Ainsi, nous
8
Figure 1 : Graphique d'état du processus de fortune dans le cadre d'un jeu timide.
ce
Dans ce cas, la fonction de
réussite est
(q/p)x-1
a-1 , x ∈ {0, 1, . . . , a}
f (x, a) = (q/p)
Exercice 8. Montrer que si 2 p =1 , l'équation caractéristique a une seule
racine 1 qui a la multiplicité 2. Montrer que, dans ce cas, la fonction de
succès est simplement le rapport entre la fortune initiale et la fortune cible :
x
f (x, a) = , x ∈ {0, 1, . . . , a}
a
Nous avons donc la distribution de la fortune finale XN dans tous les cas :
Exercice 10. Montrer que f (x, a) est continue en fonction de p, pour x et a fixés.
a. Plus précisément, utilisez la règle de l'Hospital pour montrer que l'expression
2 8, lorsque p → .
de l'exercice 7 converge vers l'expression de l'exercice 1
10
Figure 3 : Le graphique de g pour différentes valeurs de
p
11
Pour de nombreux paramètres, le nombre attendu de jeux est étonnamment élevé.
grande. Par exemple, supposons que p =2 1 et que la fortune cible est de 100. Si le
Si la fortune initiale du joueur est de 1, alors le nombre attendu de parties est de
99, même si la moitié du temps, le joueur sera ruiné dès la première partie. Si la
fortune initiale est de 50, le nombre de parties attendues est de 2500.
Augmenter la mise
Que se passe-t-il si le joueur fait des mises constantes, mais avec un montant
supérieur à 1 ? La réponse à cette question peut donner une idée de ce qui se
passera avec le jeu audacieux.
Fixez p et supposez que la fortune cible est 2a et la fortune initiale est 2x.
Si le joueur joue timidement (en misant 1 $ à chaque fois), alors bien sûr, sa
probabilité d'atteindre la cible est f (2x, 2a). D'autre part :
Exercice 17. Supposons que le joueur mise 2$ à chaque partie.
Argumentez que le processus de fortune (Xi /2 : i ∈ N) correspond à un jeu
timide avec une fortune initiale x et une fortune cible a et que, par
conséquent, la probabilité que le joueur atteigne
la cible est f (x, a).
Nous devons donc comparer les probabilités f (2x, 2a) et f (x, a).
Exercice 18. Montrer que f (2x, 2a) = f (x, a)(q/p) pour x ∈ {0, 1, . . . , a} et
x+1 (q/p)a+1
donc
a f (2x, 2a) < f (x, a) si p <2 1
Il apparaît donc que l'augmentation des mises est une bonne idée si les jeux
sont déloyaux, une mauvaise idée si les jeux sont favorables, et qu'elle ne fait
aucune différence si les jeux sont loyaux.
Qu'en est-il du nombre attendu de parties jouées ? Il semble presque
évident que si les mises augmentent, le nombre attendu de parties jouées
devrait diminuer, mais une analyse directe à l'aide de l'exercice 13 est plus
difficile qu'on ne pourrait l'espérer (essayez-le !), Nous utiliserons une
méthode différente, qui donne en fait de meilleurs résultats. Plus précisément,
nous demanderons aux joueurs de 1 $ et de 2 $ de parier sur la même
séquence sous-jacente de jeux, de sorte que les deux processus de fortune
soient définis sur le même espace de probabilité. Nous pouvons alors
comparer les variables aléatoires réelles (le nombre de parties jouées), ce qui
nous amène à comparer leurs valeurs attendues. Cette méthode générale est
parfois appelée couplage.
Supposons à nouveau que la fortune initiale est de 2x et la fortune cible de
2a, où 0 < x < a. Soit Xn la fortune après n parties pour le jeu de hasard.
Les mises de 1 $ (simple jeu timide), de sorte que 2Xn - X0 est la fortune après
n parties pour le joueur qui fait des mises de 2 $ (avec la même fortune
12
initiale, en misant sur le même jeu), ce qui signifie qu'il n'y a pas d'autre choix
que de miser sur le même jeu.
séquence de jeux). Soit N1 le nombre de parties jouées par le joueur à 1 $ et N2 le
nombre de parties jouées par le joueur à 2 $,
13
Exercice 19. Argumentez que
a Si le joueur à 1 $ tombe sur la fortune x, le joueur à 2 $ est ruiné (fortune 0).
b Si le joueur à 1 $ atteint la fortune x + a, le joueur à 2 $ atteint la cible
2a.
c Le joueur à 1 $ doit toucher x avant de toucher 0 et doit toucher x + a
avant de toucher 2a.
d N2 < N1 étant donné X0 = 2x
e E(N2 |X0 = 2x) < E(N1 |X0 = 2x)
Bien entendu, les valeurs attendues concordent (et sont toutes deux égales à 0) si
x = 0 ou x = a.
L'exercice 19 montre que N2 est stochastiquement plus petit que N1 même
lorsque les joueurs ne jouent pas la même séquence de jeux (de sorte que les
variables aléatoires ne sont pas définies sur le même espace de probabilité).
Exercice 20. Généraliser l'analyse de cette sous-section pour comparer le jeu
timide avec la stratégie consistant à parier k$ à chaque partie (la fortune
initiale étant kx et la fortune cible ka
Il apparaît qu'en matière de jeux déloyaux, plus les mises sont
importantes, mieux c'est, du moins en termes de probabilité d'atteindre
l'objectif. Nous sommes donc naturellement amenés à envisager des jeux
audacieux.
3 Jeu audacieux
Rappelons qu'avec la stratégie de jeu audacieuse en rouge et noir, le joueur
mise à chaque partie soit la totalité de sa fortune, soit le montant nécessaire
pour atteindre la fortune cible, le plus petit des deux étant retenu. Comme
d'habitude, nous nous intéressons à la probabilité que le joueur atteigne la
cible et au nombre attendu d'essais. Le premier fait intéressant est que seul le
rapport entre la fortune initiale et la fortune cible compte, ce qui est tout à fait
contraire au jeu timide.
Exercice 21. Supposons que le joueur joue audacieusement avec une fortune
initiale x et une fortune cible a. Comme d'habitude, laissez X = (X0 , X1 , . . .)
représenter le processus de fortune du joueur. Argumentez que pour tout c >
0, le processus aléatoire cX = (cX0 , cX1 , . . .) est le processus de fortune pour
le jeu audacieux avec une fortune initiale cx et une fortune cible ca.
En raison de ce résultat, il est commode d'utiliser la fortune cible comme
unité mon- taire et d'autoriser des fortunes initiales irrationnelles ou
rationnelles. Ainsi, l'espace des fortunes est [0, 1]. Parfois, dans notre
analyse, nous ignorerons les états 0 ou 1 ; il n'y a évidemment aucun mal à
cela car dans ces états, le jeu est terminé.
14
Figure 4 : La fonction de mise dans le cadre d'un jeu
audacieux
Exercice 22. Rappelons que la fonction de pari S est la fonction qui donne le
montant du pari en fonction de la fortune actuelle. Montrer que
( 1
x, x ∈ [0, 2]
S(x) = min {x, - x} =
1 - x, x ∈ [1 , 1]
2
1
La probabilité de gagner
Nous appellerons F (x) la probabilité que le joueur audacieux atteigne la cible
a = 1 à partir de la fortune initiale x ∈ [0, 1]. Par l'exercice 21, la probabilité
que le joueur audacieux atteigne une autre valeur cible a, à partir de x ∈ [0, a]
est F (x/a)
Exercice 23. Exercice 3.3. En conditionnant le résultat du premier jeu, montrer
que F satisfait l'équation fonctionnelle de la partie (a). Montrer directement que F
satisfait les conditions aux limites de la partie (b) :
(
pF (2x), x ∈ [0,1 ]
a F (x) = 2
p + qF (2x - 1), x ∈ [1 , 1]
2
b F (0) = 0, F (1) = 1
L'équation fonctionnelle de l'exercice 23 est fortement non linéaire,
contrairement au résultat correspondant pour le jeu timide. En fait, il est clair
qu'un rôle important est joué par la fonction d définie sur [0, 1] par
( 1
2x, x ∈ [0,2 )
d(x) = 2x - [x♩ =
2x - 1, x ∈ [1 , 21)
16
Figure 5 : La fonction de doublement mod 2
(avec le joueur ruiné ou victorieux), les fortunes successives du joueur suivent les
itérés de la carte d. Ainsi, le jeu audacieux est intimement lié au système
dynamique associé à d.
Expansions binaires
L'une des clés de notre analyse est de représenter la fortune initiale sous forme
binaire. Le développement binaire de x ∈ [0, 1] est le suivant
∞
Σ xi
x= 2i
i=1
18
La variable aléatoire dont les bits sont les compléments des bits du jeu jouera
un rôle important dans notre analyse. Ainsi, notons
∞
Σ - Ij
W = 2j
1 i=1
Notons que W est une variable aléatoire bien définie prenant des valeurs dans [0, 1]
Exercice 26. Supposons que le joueur commence avec une fortune initiale x ∈
[0, 1]. Utiliser le résultat de l'exercice 25 pour montrer que le joueur atteint la
cible 1
si et seulement si W < x.
Exercice 27. Montrer que W a une distribution continue. En d'autres termes, montrez
que
P(W = x) = 0 pour tout x ∈ [0, 1]
Les exercices 26 et 27 montrent que F est simplement la fonction de
distribution de W :
F (x) = P(W ≤ x), x ∈ [0, 1]
En particulier, F est une fonction croissante, et puisque W a une distribution
continue, F est une fonction continue.
Exercice 28. Montrer que la fonction de succès F est l'unique solution continue
de l'équation fonctionnelle de l'exercice 23.
a Utiliser l'induction mathématique sur le rang pour montrer que deux
solutions quelconques de doivent s'accorder sur les rationnels binaires.
b Utiliser la partie (a) et la continuité pour montrer que deux solutions
continues quelconques de l'équation fonctionnelle doivent concorder
pour tout x.
Si nous introduisons un peu plus de notation, nous pouvons donner une
belle expression pour F (x), et plus tard pour le nombre attendu de jeux G(x).
Soit p0 = p et p1 = q = 1-p.
Exercice 29. Utilisez l'exercice 25 pour montrer que
∞
Σ
F (x) = px 1 - - - px n-1 pxn
n=1
20
Exercice 31. En particulier, montrez que
a F (18 ) = p3
b F (28 ) = p2
c F (38 ) = p2 + p q2
d F (48 ) = p
e F (58 ) = p + p q2
f F (68 ) = p + pq
g F (78 ) = p + pq + pq2
Exercice 32. Supposons que p =21 . Montrer que F (x) = x pour x ∈ [0, 1] dans
deux
moyens :
a En utilisant l'équation fonctionnelle de l'exercice 23.
b En utilisant la représentation de l'exercice 29.
Ainsi, Cp est l'ensemble des x ∈ [0, 1] pour lesquels la fréquence relative des
0 dans l'expansion binaire est p. Bien entendu, si p /= t, alors Cp et Ct sont
disjoints.
Exercice 33. Utiliser la loi forte des grands nombres pour montrer que
21
c Par l'exercice 33 P(W ∈ Cp ) = 1.
22
Figure 6 : Le graphique de F pour différentes valeurs
de p
∫
d Mais aussi Cp 1dx = P2 1 (W ∈ Cp ) = 0 C'est-à-dire que Cp a une mesure de
Lebesgue∫ 0.
e D'où Cp f (x)dx = 0
Lorsque p /=1 , F a une dérivée 0 en presque tout point de [0, 1] même si elle
2
est strictement croissante. Ainsi, W a une distribution singulière continue. Un tel
sont généralement considérées comme exotiques, et l'une des grandes caractéristiques
de Rouge et Noir est qu'il s'agit d'un problème appliqué honnête qui donne lieu
à une telle distribution.
b G(0) = 0, G(1) = 0
Il est intéressant de noter que l'équation fonctionnelle n'est pas satisfaite à
x = 0 ou x = 1. Comme précédemment, nous pouvons donner une autre
analyse en utilisant la représentation binaire d'une fortune initiale x ∈ [0, 1].
Exercice 36. Supposons que la fortune initiale du joueur soit x ∈ [0, 1].
Montrer que N = min{k ∈ N+ : Ik = xk ou k = r(x)}.
23
a Si x est un rationnel binaire, alors N prend des valeurs dans l'ensemble
{1, 2, . . . r(x)}. Le jeu se poursuit jusqu'à ce que le numéro du jeu
corresponde au rang de la fortune ou que a
Le bit de jeu correspond au bit de fortune correspondant, le plus petit des
deux étant retenu. Dans le premier cas, l'avant-dernière
2
fortune est1 , la
seule fortune pour laquelle
le prochain match est toujours définitif.
b Si x est un irrationnel binaire, alors N prend des valeurs dans N+ . Le jeu
continue jusqu'à ce qu'un bit de jeu soit en accord avec un bit de fortune
correspondant.
Nous pouvons donner une formule explicite pour le nombre attendu
d'essais G(x) en fonction de la représentation binaire de x.
Exercice 37. Supposons que x ∈ [0, 1] et rappelons notre notation spéciale : p0
= p, p1 = q = 1 - p. Montrez que
r(x)-1
Σ
G(x) = px 1 - - - p nx
n=0
25
Figure 7 : Le nombre attendu de parties en gras avec des parties équitables.
4 Stratégies optimales
Rappelons que la règle d'arrêt pour le rouge et le noir est de continuer à jouer
jusqu'à ce que le joueur soit ruiné ou que sa fortune atteigne la fortune cible
a. Ainsi, la stratégie du joueur est de décider combien il doit parier sur chaque
jeu avant de devoir s'arrêter. Supposons que nous disposions d'une classe de
stratégies correspondant à certaines règles de jeu valides.
fortunes et paris ; A désignera l'ensemble des fortunes et Bx désignera
l'ensemble des paris valides pour x ∈ A. Par exemple, parfois (comme pour le
jeu timide), nous pourrions vouloir restreindre les fortunes à l'ensemble des
entiers {0, 1, . . . , a} ; d'autres fois (comme avec
), nous pourrions vouloir utiliser l'intervalle [0, 1] comme espace de fortune. En tant
que
pour les mises, rappelons que le joueur ne peut pas miser ce qu'il n'a pas et ne
mise pas plus que ce dont il a besoin pour atteindre l'objectif. Ainsi, une
fonction de pari S doit satisfaire
26
Une condition d'optimalité
Voici notre principal théorème.
27
Théorème 1. Une stratégie S avec une fonction de succès V est optimale si
pV (x + y) + qV (x - y) ≤ V (x), x ∈ A, y ∈ Bx
La preuve est esquissée dans les exercices suivants. Tout d'abord, supposons
que nous commençons avec une stratégie donnée S qui a une fonction de succès
V . Nous modifions S comme suit. Si la fortune initiale est x ∈ A, nous
choisissons y ∈ Bx et misons y sur le premier jeu ;
par la suite, nous suivons la stratégie S. Appelons la nouvelle stratégie T et son
succès
fonction U .
Exercice 43. Conditionner le résultat de la première partie pour montrer que
U (x) = pV (x + y) + qV (x - y)
Ainsi, le théorème 1 peut être reformulé comme suit : Si S est optimal par
rapport à la classe de stratégies de l'exercice 43, alors S est optimal pour toutes
les stratégies.
Maintenant, avec S et V comme précédemment, prenons T comme une
stratégie arbitraire avec la fonction de succès U . Comme d'habitude, laissons (X0
, X1 , X2 , . . .) représenter la séquence des fortunes, (Y1 , Y2 , . . .) la séquence des
paris, et N le temps d'arrêt, le tout dans le cadre d'une stratégie
T . On notera que la variable aléatoire V (XN ) peut être interprétée comme la
probabilité de gagner si la stratégie du joueur est remplacée par la stratégie S
après le temps n.
Exercice 44. Conditionner l'issue du jeu n pour montrer que
b Utiliser (a) pour montrer que E[V (Xn )|X0 = x] ≤ V (x) pour n ∈ N+ et x ∈ A.
c Soit n → ∞ dans (b) pour montrer que E[V (XN )|X0 = x] ≤ V (x) pour x ∈ A.
d Montrer que E[V (XN )|X0 = x] = U (x) pour x ∈ A
e Conclure que U (x) ≤ V (x) pour x ∈ A.
29
Théorème 2. Le jeu timide est une stratégie optimale.
La preuve sera construite dans les deux exercices suivants. Tout d'abord,
rappelons la fonction de succès f pour le jeu timide, dérivée dans les
exercices 7 et 8, et la condition d'optimalité du Théorème 1.
Exercice 46. Montrer d'abord que la condition d'optimalité tient2 si p = 1
Exercice 47. Montrez que la condition d'optimalité tient si p >2 1 . Voici les
étapes.
a Montrez que la condition d'optimalité est équivalente à
Exercice 48. Montrer que la fonction de succès optimale est V (x) = 1 pour x
∈ [0, 1] a Fixer une fortune initiale rationnelle x = k/n ∈ [0, 1]. Soit m un
entier positif
et supposons que, à partir de x, le joueur mise1 surmn
chaque jeu.
b Montrer que la stratégie décrite au point (a) est équivalente au jeu timide avec
objectif de fortune
mn et la fortune initiale mk.
c La probabilité d'atteindre la cible 1 dans le cadre de la stratégie (b) est de
f (mk, mn).
30
e D'après (d), montrer que V (x) = 1 si x ∈ [0, 1] est rationnel.
f A partir de (e) et du fait que V est croissant, montrer que V (x) = 1 pour tout
x ∈ [0, 1]
31
Procès inéquitables
Nous supposerons maintenant 2 pour que les procès soient inéquitables, ou du
que p ≤ 1 moins ne soient pas
favorable. Comme précédemment, nous prendrons la fortune cible comme unité
monétaire de base et autoriserons toute fraction valide de cette unité comme pari.
Ainsi, l'ensemble des fortunes est
A = [0, 1] et l'ensemble des paris pour x ∈ A est Bx = [0, min{x, 1 - x}].
Notre résultat principal pour cette section est le suivant.
Théorème 3. Le jeu audacieux est une stratégie optimale.
Comme d'habitude, la preuve sera construite à travers une série d'exercices.
Tout d'abord, rappelons la fonction de succès F pour le jeu audacieux et la
condition d'optimalité du théorème x+y ) - pF (x) + qF (y).
2 1. Soit D(x, y) = F (
32
Figure 8 : La fonction de mise pour le jeu audacieux.
sont pas favorables au joueur. Le jeu audacieux n'est pas la seule stratégie
optimale.
sont une infinité de stratégies optimales. Rappelons tout d'abord que la
stratégie audacieuse a une fonction de pari
(
( ) = min 1 x, x ∈ [0,1 ]
= 2
S1 x {x, - x}
1 - x, x ∈ [1 , 1]
2
Exercice 53. Montrez que la stratégie audacieuse du second ordre a une fonction de
pari
S2 donné par
��X, x ∈ [0,1 ]
� 4
1
- x, x ∈ [ 41,12)
��2
S2 (x) 1 ,
2 x= 2
= 1
� 12 2 4
x - ,- xx,∈x (∈1 ,[3,]1]
��1
3
4
33
Soit F2 la fonction de succès associée à la stratégie S2 . Notre principal
théorème pour cette section est le suivant
Théorème 4. La stratégie audacieuse de second ordre est optimale. C'est-à-dire que F2
=F
34
Figure 9 : Fonction de pari pour la stratégie audacieuse de second ordre.
36
Figure 10 : La fonction de pari pour la stratégie audacieuse du troisième ordre.
Exercice 55. Montrez que la séquence des stratégies audacieuses peut être
définie de manière récursive à partir de la stratégie audacieuse de base S1
comme suit :
�
�
1
�Sn (2x), x ∈ [0,1 )
2 2
Sn+1 (x) 1
��
21
, x= 2
= 1 Sn (2x - 1), x ∈ (1 , 1])
2 2
Plus généralement, on peut définir une stratégie optimale T de la manière suivante
de la manière suivante : pour chaque x ∈ [0,1 ], sélectionnez nx ∈ N+ et laissez T (x) =
Sxn (x). Le graphe
2
de la figure 11 montre quelques-uns des graphiques des stratégies
audacieuses. Pour une stratégie optimale T , il suffit de sélectionner, pour
chaque x, un pari sur l'un des graphiques.
5 Résumé
Dans le jeu du Rouge et du Noir, un joueur joue des essais de Bernoulli (jeux
37
indépendants, identiques d'un point de vue probabiliste, avec une probabilité de
gain p) jusqu'à ce qu'il soit ruiné.
38
ou atteint un objectif fixe a. Notre intérêt principal est sa probabilité de
succès, la probabilité d'atteindre son objectif. Un intérêt secondaire est le
nombre attendu de
de jeux joués. Nous nous intéressons principalement au cas injuste p <1 puisque2
c'est la situation malheureuse des casinos réels. Nous avons comparé deux
stratégies très différentes :
Avec le jeu timide, le joueur fait une petite mise constante sur chaque partie
jusqu'à ce qu'il soit ruiné ou qu'il atteigne l'objectif. Cette stratégie s'avère très
mauvaise dans les jeux injustes, mais elle présente l'avantage d'un nombre
relativement élevé de parties attendues. Si vous adoptez cette stratégie, vous
serez presque certainement ruiné, mais vous aurez au moins l'occasion de jouer
pendant un certain temps.
Avec le jeu audacieux, le joueur mise toute sa fortune ou ce dont il a besoin
pour atteindre l'objectif, le montant le plus faible étant retenu. Il s'agit d'une
stratégie optimale dans le cas injuste ; aucune stratégie ne peut faire mieux. Mais
elle est très rapide ! Si vous adoptez cette stratégie, il y a de fortes chances que
votre jeu soit terminé après quelques parties seulement (souvent une seule !).
Étonnamment, le jeu audacieux n'est pas uniquement optimal dans le cas
injuste. Le jeu audacieux peut être redimensionné pour produire une séquence
infinie de stratégies optimales. Ces stratégies audacieuses d'ordre supérieur
peuvent avoir un grand nombre de parties attendues, en fonction de la fortune
initiale (et en supposant que le casino soit assez sympathique pour vous permettre
de faire les paris fractionnaires bizarres qui seront nécessaires pour la stratégie).
Cependant, le but de cet article n'est pas de faire de vous un meilleur joueur
(malgré le titre), mais de découvrir quelques belles mathématiques. L'étude du
jeu audacieux, et de ses variantes d'ordre supérieur, conduit à un mélange
intéressant de probabilités, de systèmes dynamiques et de représentation binaire
des nombres dans [0, 1] (à la fois pour les fortunes et les probabilités). L'étude du
jeu audacieux conduit à des distributions de probabilités continues singulières,
c'est-à-dire des distributions continues qui n'ont pas de fonctions de densité. Les
généralisations du jeu rouge et noir et du jeu audacieux sont encore aujourd'hui
des sujets de recherche intéressants en mathématiques ; pour un article
relativement récent, voir [3]. Si vous souhaitez en savoir plus sur les
mathématiques des jeux de hasard, les livres [1] (qui ont inspiré cet article) et [2]
constituent un bon point de départ.
Références
[1] Dubbins, Lester E et Savage, Leonard J. Inequalities for Stochastic Pro-
cesses ; How to Gamble If You Must. Dover Publications (1976).
[2] Maitra, Ashok P et Sudderth, William D. Discrete Gambling and Stochas- tic
Games, Springer (2008).
[3] Pendergrass, Marcus et Siegrist, Kyle. "Generalizations of bold play in red
and black", Stochastic Processes and their Applications 92 (2001) 163-180.
[4] Siegrist, Kyle Laboratoires virtuels en probabilités et
39
statistiques, http://www.math.uah.edu/stat/
40