RedBlack Version Francais

Abonnez-vous à DeepL Pro pour traduire des fichiers plus volumineux.
Visitez www.DeepL.com/pro pour en savoir plus.
Comment jouer si vous devez le

faire
Kyle Siegrist
Département des sciences mathématiques
Université de l'Alabama à Huntsville
Résumé
Dans le jeu du rouge et noir, un joueur parie, à mise égale, sur une
séquence de jeux indé- pendants avec une probabilité de succès p, jusqu'à
ce qu'il atteigne un objectif fixe ou qu'il soit ruiné. Dans cet article, nous
explorons deux stratégies : le jeu timide, dans lequel le joueur fait la mise
minimale à chaque jeu, et le jeu audacieux, dans lequel il mise, à chaque
jeu, toute sa fortune ou le montant nécessaire pour atteindre l'objectif (le
plus petit des deux). Nous étudions la probabilité de succès (la probabilité
d'atteindre la cible) et le nombre attendu de parties jouées, en tant que
fonctions de la fortune initiale. L'analyse mathématique du jeu audacieux
conduit à des résultats exotiques et magnifiques et à des liens inattendus
avec les systèmes dynamiques. Notre exposé (et le titre de l'article) est
basé sur le livre classique Inequalities for Stochastic Processes ; How to
Gamble if You Must, de Lester E. Dubbins et Leonard J. Savage.
1 Rouge et noir
Cet article explore les stratégies de l'un des modèles de jeu les plus simples.
Malgré la simplicité du modèle, l'analyse mathématique conduit à des
résultats magnifiques et parfois surprenants dont l'importance et l'application
dépassent largement le cadre des jeux de hasard. L'exposé (et le titre de
l'article) est principalement basé sur le livre classique Inequalities for
Stochastic Processes ; How to Gamble if You Must, de Lester E. Dubbins et
Leonard (Jimmie) Savage [1]. L'article et les applets sont adaptés de l'ouvrage
Virtual Laboratories in Probability and Statistics [4].
Hypothèses et processus aléatoires

Voici la situation de base : Le joueur dispose d'une somme d'argent initiale. Il
parie sur des jeux indépendants, identiques du point de vue probabiliste, qui ont
chacun deux issues : gagner ou perdre. S'il gagne un jeu, il reçoit le montant de la
mise sur ce jeu ; s'il perd un jeu, il doit payer le montant de la mise. Le joueur
joue donc à enjeux égaux. Cette situation particulière (jeux indépendants,
1
identiques et mises égales) est connue sous le nom de "rouge et noir" et tire son
nom du jeu de casino qu'est la roulette. D'autres exemples sont les paris "passe"
et "ne passe pas" au craps.
2
Essayons de formuler mathématiquement l'expérience de jeu. Tout
d'abord, laissons In désigner le résultat du nième jeu pour n ∈ N+ où 1 désigne
un gain et 0 une perte. Il s'agit de variables aléatoires indicatrices
indépendantes avec la
même distribution :
P(In = 1) = p, P(In = 0) = q := 1 - p
où p ∈ [0, 1] est la probabilité de gagner un jeu individuel. Ainsi, I = (I1 , I2 , .

. .) est une séquence d'essais de Bernoulli, nommée d'après le mathémati-
cien Jacob Bernoulli. Les essais de Bernoulli constituent l'un des processus
aléatoires les plus simples et pourtant les plus importants.
Si p = 0, le joueur perd toujours et si p = 1, il gagne toujours. Ces cas
triviaux n'étant pas intéressants, nous supposerons généralement que
0 < p < 1. Dans les véritables maisons de jeu, bien sûr, 2
p <1 (c'est-à-dire que les jeux
sont
injuste pour le joueur), nous nous intéresserons donc particulièrement à ce cas.
La fortune du joueur au fil du temps est le processus aléatoire de base qui
nous intéresse : Soit X0 la fortune initiale du joueur et Xn la fortune du
joueur après n parties. La stratégie du joueur consiste à décider du
montant des mises sur les différents jeux et du moment où il abandonne.
Soit Yn le montant de la nième mise et N le nombre (généralement
aléatoire) de parties jouées par le joueur. Si nous le souhaitons, nous
pouvons toujours supposer que les jeux se poursuivent indéfiniment, mais
en supposant que le joueur mise 0 sur tous les jeux après N . Dans ces
conditions, les résultats des jeux, la fortune et les processus de mise sont
définis pour tout n.
Exercice 1. Montrez que le processus de fortune est lié au processus de pari
de la manière suivante :
Xn = Xn−1 + (2In - 1)Yn , n ∈ N+
Stratégies
La stratégie du joueur peut être très complexe. Par exemple, la variable
aléatoire Yn , le pari du joueur sur la partie n, ou l'événement N = n - 1, sa
décision d'arrêter après n - 1 parties, pourrait être basée sur tout l'historique
du jeu,
jusqu'au moment n. Cet historique est le vecteur de variables aléatoires
Hn = (X0 , Y1 , I1 , Y2 , I2 , . . . , Yn−1 , I )n−1
En outre, ses décisions peuvent comporter des sources supplémentaires d'aléa.

Par exemple, un joueur de roulette pourrait partiellement baser ses paris sur le
lancer d'un dé chanceux qu'il garde dans sa poche. Cependant, le joueur ne peut
pas voir dans
l'avenir (malheureusement de son point de vue), de sorte que nous
pouvons au moins supposer que Yn et {N = n - 1} sont indépendants de (In
, In+1 , . . .)
3
Au moins en termes de valeur attendue, toute stratégie de jeu est futile si la valeur de
l'investissement est inférieure à la valeur de l'investissement.
Les jeux sont injustes.
4
Exercice 2. Utilisez le résultat de l'exercice 1 et l'hypothèse d'absence de
prescience pour montrer que
E(Xn ) = E(Xn−1 ) + (2p - 1) E(Yn ), n ∈ {1, 2, . . .}
Exercice 3. Supposons que le joueur ait une probabilité positive de faire un

pari réel sur le jeu n, de sorte que E(Yn > 0). Utilisez le résultat de l'exercice 2
pour montrer que
a E(Xn ) < E(Xn−1 ) si p < 1
2
b E(Xn ) > E(Xn−1 ) si p > 1

2
c E(Xn ) = E(Xn−1 ) si p = 21
L'exercice 3 montre que pour tout jeu dans lequel le joueur fait une mise
positive, son espérance de gain diminue strictement si les jeux sont injustes, reste
la même si les jeux sont équitables, et augmente strictement si les jeux sont
favorables.
Comme indiqué précédemment, une stratégie générale peut dépendre de
l'historique et être aléatoire. Cependant, comme les jeux de Bernoulli sous-
jacents sont indépendants, on pourrait penser que ces stratégies compliquées
ne valent pas mieux que des stratégies simples dans lesquelles le montant de
la mise et la décision de s'arrêter dépendent uniquement de la fortune actuelle
du joueur. Ces stratégies simples jouent en effet un rôle fondamental et sont
appelées stratégies stationnaires et déterministes. Une telle stratégie peut être
décrite par une fonction de pari S de l'espace des fortunes à l'espace des paris
autorisés, de sorte que S(x) est le montant que le joueur mise lorsque sa
fortune actuelle est x.
Pour une stratégie stationnaire et déterministe, l'idée essentielle est
qu'après chaque partie, le processus de fortune recommence simplement, mais
avec une valeur initiale différente. Il s'agit d'un exemple de la propriété de
Markov, nommée en l'honneur d'Andrey Markov. Ainsi, notre processus de
fortune est une chaîne de Markov, l'une des classes les plus importantes de
processus stochastiques.
La règle de l'arrêt
À partir de maintenant, nous supposerons que la règle d'arrêt du joueur est très
simple et standard : il pariera sur les jeux jusqu'à ce qu'il perde toute sa fortune et
soit ruiné, ou qu'il atteigne une fortune cible fixe a :
N = min{n ∈ N : Xn = 0 ou Xn = a}
Ainsi, toute stratégie (fonction de pari) S doit satisfaire S(x) ≤ min{x, a -

x} pour 0 ≤ x ≤ a le joueur ne peut pas miser ce qu'il n'a pas, et ne misera pas
plus que nécessaire pour atteindre l'objectif a.
Si nous le voulons, nous pouvons considérer la différence entre la fortune
cible et la fortune initiale comme la fortune totale de la maison. Avec cette
5
interprétation, le joueur et la maison jouent des rôles symétriques, mais avec des
probabilités de gain complémentaires : le jeu continue jusqu'à ce que le joueur
soit ruiné ou que la maison soit
6
ruiné. Les variables aléatoires d'intérêt principal sont N , le nombre de parties
jouées, et la fortune finale XN du joueur. Notez que la seconde variable ne
prend que deux valeurs : 0 et a.
Exercice 4. Montrez que la moyenne et la variance de la fortune finale sont données
par
a E(XN ) = a P(XN = a)
b Var(XN ) = a2 P(XN = a)[1 - P(XN = a)]

On peut supposer que le joueur souhaite maximiser la probabilité d'atteindre
la fortune visée. Est-il préférable de miser de petits montants ou de gros
montants, ou cela n'a-t-il pas d'importance ? Comment la stratégie optimale,
s'il en existe une, dépend-elle de la fortune initiale, de la fortune cible et de la
probabilité de gain du jeu ?
Nous nous intéressons également à E(N ), le nombre attendu de parties jouées.
Il se peut qu'un objectif secondaire de la joueuse soit de maximiser le nombre
attendu de parties qu'elle peut jouer (peut-être qu'elle obtient des boissons
gratuites !). (Ces deux objectifs sont-ils compatibles ou incompatibles ? En
d'autres termes, le joueur peut-il maximiser à la fois sa probabilité d'atteindre la
cible et le nombre attendu de parties jouées, ou la maximisation d'une quantité
implique-t-elle nécessairement la minimisation de l'autre ?
Dans les deux sections suivantes, nous analyserons et comparerons deux
stratégies qui sont en quelque sorte opposées :
Jeu timide À chaque partie, jusqu'à ce qu'il s'arrête, le joueur fait une petite
mise constante, disons 1 $.
Jeu audacieux À chaque jeu, jusqu'à ce qu'il s'arrête, le joueur mise soit la
totalité de sa fortune, soit le montant nécessaire pour atteindre la fortune
cible, le plus petit des deux étant retenu.
Dans la section qui suit l'examen de ces stratégies spécifiques, nous reviendrons
sur la question des stratégies optimales.
2 Jeu timide
Rappelons qu'avec la stratégie de jeu timide en rouge et noir, le joueur fait
une petite mise constante, disons 1 $, sur chaque jeu jusqu'à ce qu'il s'arrête.
Ainsi, à chaque partie, la fortune du joueur augmente de 1 ou diminue de 1,
jusqu'à ce que la fortune atteigne 0 ou la cible a (que nous supposons être un
nombre entier positif). Ainsi, le processus de fortune (X0 , X1 , . . .) est une
marche aléatoire sur l'espace de fortune
{0, 1, . . . a} avec 0 et a comme barrières absorbantes. Le graphe d'état est
présenté à la figure 1. Les marches aléatoires sont des types particulièrement
simples et importants d'algorithmes de Markov
chaînes.
7
La probabilité de gagner
Notre analyse basée sur la propriété de Markov suggère que nous traitions la
fortune initiale comme une variable. Bientôt, nous ferons également varier la
fortune cible. Ainsi, nous
8
Figure 1 : Graphique d'état du processus de fortune dans le cadre d'un jeu timide.
désignera la probabilité que le joueur atteigne la cible a, à partir d'une fortune

initiale x par
f (x, a) = P(XN = a|X0 = a), x ∈ {0, 1, . . . , a}
Rappelons que f est appelée fonction de succès.

Exercice 5. En conditionnant le résultat du premier jeu, montrer que f
satisfait l'équation de différence de la partie (a). Montrer directement que f
satisfait les conditions aux limites dans la partie (b).
a f (x, a) = qf (x - 1, a) + pf (x + 1, a) pour x ∈ {1, 2, . . . , a - 1}

b f (0, a) = 0, f (1, a) = 1
L'équation de différence de l'exercice 5 est linéaire (dans la fonction
inconnue f ), homogène (parce que chaque terme implique la fonction inconnue f ),
à coefficients constants (parce que les facteurs multipliant f sont des
constantes) et du second ordre (parce que 2 est la différence entre la plus
grande et la plus petite valeur de la fortune initiale).
Exercice 6. Montrez que l'équation caractéristique de l'équation différentielle de
l'exercice 5 est pr2 - r + q = 0, et que les racines sont r = 1 et r = q/p
Exercice 7. Montrer que si p /= 2
1 , alors les racines sont distinctes. Montrer que, dans
ce
Dans ce cas, la fonction de
réussite est
(q/p)x-1
a-1 , x ∈ {0, 1, . . . , a}
f (x, a) = (q/p)
Exercice 8. Montrer que si 2 p =1 , l'équation caractéristique a une seule
racine 1 qui a la multiplicité 2. Montrer que, dans ce cas, la fonction de
succès est simplement le rapport entre la fortune initiale et la fortune cible :
x
f (x, a) = , x ∈ {0, 1, . . . , a}
a
Nous avons donc la distribution de la fortune finale XN dans tous les cas :
P(XN = 0|X0 = x) = 1 - f (x, a), x ∈ {0, 1, . . . , a}

P(XN = a|X0 = x) = f (x, a), x ∈ {0, 1, . . . , a}
Exercice 9. Montrer qu'en fonction de x, pour p et a fixés,
9
Figure 2 : Le graphique de f pour différentes valeurs
de p.
a f (x, a) augmente de 0 à 1 lorsque x augmente de 0 à a.

b f est concave vers le haut si p <1 et concave vers le bas si p >1 . Bien entendu,
2 2
f est linéaire si p2 = 1
Exercice 10. Montrer que f (x, a) est continue en fonction de p, pour x et a fixés.
a. Plus précisément, utilisez la règle de l'Hospital pour montrer que l'expression
2 8, lorsque p → .
de l'exercice 7 converge vers l'expression de l'exercice 1
Exercice 11. Montrer que pour x et a fixés, f (x, a) augmente de 0 à 1 comme p

passe de 0 à 1.
Le nombre attendu d'essais

Considérons maintenant le nombre attendu de parties nécessaires avec un jeu
timide, lorsque la fortune initiale est x :
g(x, a) = E(N |X0 = x), x ∈ {0, 1, . . . , a}
Exercice 12. En conditionnant le résultat du premier jeu, montrer que g

satisfait l'équation de différence de la partie (a). Montrer directement que g
satisfait les conditions aux limites dans la partie (b).
a g(x, a) = qg(x - 1, a) + pg(x + 1, a) + 1 pour x ∈ {1, 2, . . . , a - 1}

b g(0, a) = 0, g(a, a) = 0
10
Figure 3 : Le graphique de g pour différentes valeurs de
p
L'équation différentielle de l'exercice 12 est linéaire, du second ordre,

mais non homogène (à cause du terme constant 1 du côté droit). L'équation
homogène correspondante est l'équation satisfaite par la fonction de probabilité
de succès f , donnée dans l'exercice 5. Ainsi, seul un petit travail
supplémentaire est nécessaire ici.
Exercice 13. Montrer que si p /=1 alors
2
x a
g(x, a) = - f (x, a), x ∈ {0, 1, . . . , a}
q-p q-p
où f est la fonction de succès donnée dans l'exercice 7
Exercice 14. Montrer que si p =
2
1 , alors
g(x, a) = x(a - x), x ∈ {0, 1, . . . , a}
Exercice 15. Considérons g en fonction de la fortune initiale x, pour des

valeurs fixes de la probabilité de gain du jeu p et de la fortune cible a.
a Montrer que g augmente d'abord et diminue ensuite.
b Montrer que g est concave vers le bas.
Sauf lorsque p =1 , la
2
valeur de x où se produit le maximum est plutôt
compliqué.
Exercice 16. Montrer que g(x, a) est continue en fonction de p, pour x et a fixés.
Plus précisément, montrer que l'expression de l'exercice 16 converge vers
2 p → .
l'expression de l'exercice 14 lorsque 1
11
Pour de nombreux paramètres, le nombre attendu de jeux est étonnamment élevé.
grande. Par exemple, supposons que p =2 1 et que la fortune cible est de 100. Si le
Si la fortune initiale du joueur est de 1, alors le nombre attendu de parties est de
99, même si la moitié du temps, le joueur sera ruiné dès la première partie. Si la
fortune initiale est de 50, le nombre de parties attendues est de 2500.
Augmenter la mise
Que se passe-t-il si le joueur fait des mises constantes, mais avec un montant
supérieur à 1 ? La réponse à cette question peut donner une idée de ce qui se
passera avec le jeu audacieux.
Fixez p et supposez que la fortune cible est 2a et la fortune initiale est 2x.
Si le joueur joue timidement (en misant 1 $ à chaque fois), alors bien sûr, sa
probabilité d'atteindre la cible est f (2x, 2a). D'autre part :
Exercice 17. Supposons que le joueur mise 2$ à chaque partie.
Argumentez que le processus de fortune (Xi /2 : i ∈ N) correspond à un jeu
timide avec une fortune initiale x et une fortune cible a et que, par
conséquent, la probabilité que le joueur atteigne
la cible est f (x, a).
Nous devons donc comparer les probabilités f (2x, 2a) et f (x, a).
Exercice 18. Montrer que f (2x, 2a) = f (x, a)(q/p) pour x ∈ {0, 1, . . . , a} et
x+1 (q/p)a+1
donc
a f (2x, 2a) < f (x, a) si p <2 1
b f (2x, 2a) = f (x, a) si p =2 1

c f (2x, 2a) > f (x, a) si p >2 1
Il apparaît donc que l'augmentation des mises est une bonne idée si les jeux
sont déloyaux, une mauvaise idée si les jeux sont favorables, et qu'elle ne fait
aucune différence si les jeux sont loyaux.
Qu'en est-il du nombre attendu de parties jouées ? Il semble presque
évident que si les mises augmentent, le nombre attendu de parties jouées
devrait diminuer, mais une analyse directe à l'aide de l'exercice 13 est plus
difficile qu'on ne pourrait l'espérer (essayez-le !), Nous utiliserons une
méthode différente, qui donne en fait de meilleurs résultats. Plus précisément,
nous demanderons aux joueurs de 1 $ et de 2 $ de parier sur la même
séquence sous-jacente de jeux, de sorte que les deux processus de fortune
soient définis sur le même espace de probabilité. Nous pouvons alors
comparer les variables aléatoires réelles (le nombre de parties jouées), ce qui
nous amène à comparer leurs valeurs attendues. Cette méthode générale est
parfois appelée couplage.
Supposons à nouveau que la fortune initiale est de 2x et la fortune cible de
2a, où 0 < x < a. Soit Xn la fortune après n parties pour le jeu de hasard.
Les mises de 1 $ (simple jeu timide), de sorte que 2Xn - X0 est la fortune après
n parties pour le joueur qui fait des mises de 2 $ (avec la même fortune
12
initiale, en misant sur le même jeu), ce qui signifie qu'il n'y a pas d'autre choix
que de miser sur le même jeu.
séquence de jeux). Soit N1 le nombre de parties jouées par le joueur à 1 $ et N2 le
nombre de parties jouées par le joueur à 2 $,
13
Exercice 19. Argumentez que
a Si le joueur à 1 $ tombe sur la fortune x, le joueur à 2 $ est ruiné (fortune 0).
b Si le joueur à 1 $ atteint la fortune x + a, le joueur à 2 $ atteint la cible
2a.
c Le joueur à 1 $ doit toucher x avant de toucher 0 et doit toucher x + a
avant de toucher 2a.
d N2 < N1 étant donné X0 = 2x
e E(N2 |X0 = 2x) < E(N1 |X0 = 2x)
Bien entendu, les valeurs attendues concordent (et sont toutes deux égales à 0) si
x = 0 ou x = a.
L'exercice 19 montre que N2 est stochastiquement plus petit que N1 même
lorsque les joueurs ne jouent pas la même séquence de jeux (de sorte que les
variables aléatoires ne sont pas définies sur le même espace de probabilité).
Exercice 20. Généraliser l'analyse de cette sous-section pour comparer le jeu
timide avec la stratégie consistant à parier k$ à chaque partie (la fortune
initiale étant kx et la fortune cible ka
Il apparaît qu'en matière de jeux déloyaux, plus les mises sont
importantes, mieux c'est, du moins en termes de probabilité d'atteindre
l'objectif. Nous sommes donc naturellement amenés à envisager des jeux
audacieux.
3 Jeu audacieux
Rappelons qu'avec la stratégie de jeu audacieuse en rouge et noir, le joueur
mise à chaque partie soit la totalité de sa fortune, soit le montant nécessaire
pour atteindre la fortune cible, le plus petit des deux étant retenu. Comme
d'habitude, nous nous intéressons à la probabilité que le joueur atteigne la
cible et au nombre attendu d'essais. Le premier fait intéressant est que seul le
rapport entre la fortune initiale et la fortune cible compte, ce qui est tout à fait
contraire au jeu timide.
Exercice 21. Supposons que le joueur joue audacieusement avec une fortune
initiale x et une fortune cible a. Comme d'habitude, laissez X = (X0 , X1 , . . .)
représenter le processus de fortune du joueur. Argumentez que pour tout c >
0, le processus aléatoire cX = (cX0 , cX1 , . . .) est le processus de fortune pour
le jeu audacieux avec une fortune initiale cx et une fortune cible ca.
En raison de ce résultat, il est commode d'utiliser la fortune cible comme
unité mon- taire et d'autoriser des fortunes initiales irrationnelles ou
rationnelles. Ainsi, l'espace des fortunes est [0, 1]. Parfois, dans notre
analyse, nous ignorerons les états 0 ou 1 ; il n'y a évidemment aucun mal à
cela car dans ces états, le jeu est terminé.
14
Figure 4 : La fonction de mise dans le cadre d'un jeu
audacieux
Exercice 22. Rappelons que la fonction de pari S est la fonction qui donne le
montant du pari en fonction de la fortune actuelle. Montrer que
( 1
x, x ∈ [0, 2]
S(x) = min {x, - x} =
1 - x, x ∈ [1 , 1]
2
1
La probabilité de gagner
Nous appellerons F (x) la probabilité que le joueur audacieux atteigne la cible
a = 1 à partir de la fortune initiale x ∈ [0, 1]. Par l'exercice 21, la probabilité
que le joueur audacieux atteigne une autre valeur cible a, à partir de x ∈ [0, a]
est F (x/a)
Exercice 23. Exercice 3.3. En conditionnant le résultat du premier jeu, montrer
que F satisfait l'équation fonctionnelle de la partie (a). Montrer directement que F
satisfait les conditions aux limites de la partie (b) :
(
pF (2x), x ∈ [0,1 ]
a F (x) = 2
p + qF (2x - 1), x ∈ [1 , 1]
2
b F (0) = 0, F (1) = 1
L'équation fonctionnelle de l'exercice 23 est fortement non linéaire,
contrairement au résultat correspondant pour le jeu timide. En fait, il est clair
qu'un rôle important est joué par la fonction d définie sur [0, 1] par
( 1
2x, x ∈ [0,2 )
d(x) = 2x - [x♩ =
2x - 1, x ∈ [1 , 21)
La fonction d est parfois appelée fonction de doublement, mod 1, car d(x)

donne la partie fractionnaire de 2x. Notez que jusqu'à la dernière mise qui met
15
fin au jeu
16
Figure 5 : La fonction de doublement mod 2
(avec le joueur ruiné ou victorieux), les fortunes successives du joueur suivent les
itérés de la carte d. Ainsi, le jeu audacieux est intimement lié au système
dynamique associé à d.
Expansions binaires
L'une des clés de notre analyse est de représenter la fortune initiale sous forme
binaire. Le développement binaire de x ∈ [0, 1] est le suivant
∞
Σ xi
x= 2i
i=1
où xi ∈ {0, 1} pour chaque i ∈ N+ . Cette représentation est unique sauf

lorsque x est un rationnel binaire (parfois aussi appelé rationnel dyadique),
c'est-à-dire un nombre de la forme k/xn où n ∈ N+ et k ∈ {1, 3, . . . , 2n - 1} ;
l'entier positif n est appelé le rang de x. Pour un rationnel binaire x de rang
n, nous utiliserons l'expression
représentation terminale standard où xn = 1 et xi = 0 pour i > n. Le rang peut
être étendu à tous les nombres dans [0, 1] en définissant le rang de 0 comme
étant 0 (0 est
également considéré comme un rationnel binaire) et en définissant le rang
d'un irrationnel binaire comme étant ∞. Nous noterons le rang de x par r(x).
Appliquée aux séquences binaires, la fonction de doublement d est
l'opérateur de décalage :
Exercice 24. Montrer que d(x)i = xi+1 pour x ∈ [0, 1)
Le jeu audacieux en rouge et noir peut être élégamment décrit en comparant
les bits de la fortune initiale avec les bits aléatoires qui décrivent les résultats des
jeux.
Exercice 25. Supposons que le joueur commence avec une fortune initiale x ∈
[0, 1]. Montrez que le joueur atteint finalement la cible 1 si et seulement s'il
existe un entier positif k tel que Ij = 1 - xj pour j ∈ {1, 2, . . . , k - 1} et Ik =
xk . En d'autres termes, le joueur gagne si et seulement si, lorsque le bit du jeu
17
est en accord avec le bit du jeu, la cible est atteinte.
correspondant au bit de fortune pour la première fois, ce bit est à 1.
18
La variable aléatoire dont les bits sont les compléments des bits du jeu jouera
un rôle important dans notre analyse. Ainsi, notons
∞
Σ - Ij
W = 2j
1 i=1
Notons que W est une variable aléatoire bien définie prenant des valeurs dans [0, 1]
Exercice 26. Supposons que le joueur commence avec une fortune initiale x ∈
[0, 1]. Utiliser le résultat de l'exercice 25 pour montrer que le joueur atteint la
cible 1
si et seulement si W < x.
Exercice 27. Montrer que W a une distribution continue. En d'autres termes, montrez
que
P(W = x) = 0 pour tout x ∈ [0, 1]
Les exercices 26 et 27 montrent que F est simplement la fonction de
distribution de W :
F (x) = P(W ≤ x), x ∈ [0, 1]
En particulier, F est une fonction croissante, et puisque W a une distribution
continue, F est une fonction continue.
Exercice 28. Montrer que la fonction de succès F est l'unique solution continue
de l'équation fonctionnelle de l'exercice 23.
a Utiliser l'induction mathématique sur le rang pour montrer que deux
solutions quelconques de doivent s'accorder sur les rationnels binaires.
b Utiliser la partie (a) et la continuité pour montrer que deux solutions
continues quelconques de l'équation fonctionnelle doivent concorder
pour tout x.
Si nous introduisons un peu plus de notation, nous pouvons donner une
belle expression pour F (x), et plus tard pour le nombre attendu de jeux G(x).
Soit p0 = p et p1 = q = 1-p.
Exercice 29. Utilisez l'exercice 25 pour montrer que
∞
Σ
F (x) = px 1 - - - px n-1 pxn
n=1
Non, l'équation de l'exercice 28 ne comporte pas de faute de frappe. La

dernière partie est en fait p fois xn . Ainsi, seuls les termes avec xn = 1 sont inclus
dans la somme. De nouveau, le joueur doit gagner une partie lorsque2 sa fortune
actuelle est dans [1 , 1] (ce qui se produit bien sûr avec une probabilité p et
s'avère être la dernière partie). Avant cela, il doit gagner lorsque sa fortune se
trouve dans [0,1 ] et perdre lorsque sa fortune se trouve dans [0, ].
2
dans2 (1 , 1], de sorte que le jeu ne se termine pas plus tôt.
Exercice 30. Montrer que F est strictement croissante sur [0, 1]. Cela signifie
19
que la distribution de W a pour support [0, 1] ; c'est-à-dire qu'il n'y a pas de
sous-intervalles de [0, 1] qui ont une longueur positive, mais une probabilité
de 0.
20
Exercice 31. En particulier, montrez que
a F (18 ) = p3
b F (28 ) = p2
c F (38 ) = p2 + p q2
d F (48 ) = p
e F (58 ) = p + p q2
f F (68 ) = p + pq
g F (78 ) = p + pq + pq2
Exercice 32. Supposons que p =21 . Montrer que F (x) = x pour x ∈ [0, 1] dans
deux
moyens :
a En utilisant l'équation fonctionnelle de l'exercice 23.
b En utilisant la représentation de l'exercice 29.
Ainsi, pour p =21 (essais équitables), la probabilité que le joueur audacieux

atteigne la fortune cible a à partir de la fortune initiale x est x/a, tout comme
pour le joueur timide. Notons également que la variable aléatoire W a la
forme uniforme
sur [0, 1]. Lorsque p /=1 , la distribution de W est assez étrange. Pour énoncer
2
le résultat de manière succincte, nous indiquerons la dépendance de la de la
de la de la
mesure de probabilité P sur le paramètre p ∈ (0, 1). Nous définissons tout d'abord
( n ∞)
1Σ
Cp = x ∈ [0, 1] : (1 - xi ) → p lorsque n →
n
i=1
Ainsi, Cp est l'ensemble des x ∈ [0, 1] pour lesquels la fréquence relative des
0 dans l'expansion binaire est p. Bien entendu, si p /= t, alors Cp et Ct sont
disjoints.
Exercice 33. Utiliser la loi forte des grands nombres pour montrer que
a Pp (W ∈ Cp ) = 1 pour p ∈ (0, 1).

b Pp (W ∈ Ct ) = 0 pour p, t ∈ (0, 1), avec p /= t.
Exercice 34. Montrer que lorsque p /=1 , W n'a pas de fonction de densité de
2
probabilité, même si elle a une distribution continue. Les étapes suivantes
esquisser une preuve par la contradiction
a Supposons que W ait une fonction de densité de probabilité f .
∫
b Alors Pp (W ∈ Cp ) = Cp f (x)dx.
21
c Par l'exercice 33 P(W ∈ Cp ) = 1.
22
Figure 6 : Le graphique de F pour différentes valeurs
de p
∫
d Mais aussi Cp 1dx = P2 1 (W ∈ Cp ) = 0 C'est-à-dire que Cp a une mesure de
Lebesgue∫ 0.
e D'où Cp f (x)dx = 0
Lorsque p /=1 , F a une dérivée 0 en presque tout point de [0, 1] même si elle
2
est strictement croissante. Ainsi, W a une distribution singulière continue. Un tel
sont généralement considérées comme exotiques, et l'une des grandes caractéristiques
de Rouge et Noir est qu'il s'agit d'un problème appliqué honnête qui donne lieu
à une telle distribution.
Le nombre attendu d'essais

Soit G(x) = E(N |X0 = x) pour x ∈ [0, 1], le nombre attendu d'essais
commençant à x. Pour toute autre fortune cible a ∈ (0, ∞), le nombre
attendu d'essais commençant à x ∈ [0, a] est simplement G(x/a).
Exercice 35. En conditionnant le résultat du premier jeu, montrer que G satisfait
l'équation fonctionnelle en (a). Montrer directement que G satisfait les conditions
aux limites (b).
(
1 + pG(2x), x ∈ (0,1 ]
a G(x) = 2
1 + qG(2x - 1), x ∈ [ , 21)

1
b G(0) = 0, G(1) = 0
Il est intéressant de noter que l'équation fonctionnelle n'est pas satisfaite à
x = 0 ou x = 1. Comme précédemment, nous pouvons donner une autre
analyse en utilisant la représentation binaire d'une fortune initiale x ∈ [0, 1].
Exercice 36. Supposons que la fortune initiale du joueur soit x ∈ [0, 1].
Montrer que N = min{k ∈ N+ : Ik = xk ou k = r(x)}.
23
a Si x est un rationnel binaire, alors N prend des valeurs dans l'ensemble
{1, 2, . . . r(x)}. Le jeu se poursuit jusqu'à ce que le numéro du jeu
corresponde au rang de la fortune ou que a
Le bit de jeu correspond au bit de fortune correspondant, le plus petit des
deux étant retenu. Dans le premier cas, l'avant-dernière
2
fortune est1 , la
seule fortune pour laquelle
le prochain match est toujours définitif.
b Si x est un irrationnel binaire, alors N prend des valeurs dans N+ . Le jeu
continue jusqu'à ce qu'un bit de jeu soit en accord avec un bit de fortune
correspondant.
Nous pouvons donner une formule explicite pour le nombre attendu
d'essais G(x) en fonction de la représentation binaire de x.
Exercice 37. Supposons que x ∈ [0, 1] et rappelons notre notation spéciale : p0
= p, p1 = q = 1 - p. Montrez que
r(x)-1
Σ
G(x) = px 1 - - - p nx
n=0
a Notez que le terme n = 0 est 1, puisque le produit est vide.

b La somme a un nombre fini de termes si x est un rationnel binaire.
c La somme a un nombre infini de termes si x est un irrationnel binaire.
Exercice 38. Utilisez le résultat de l'exercice 37 pour vérifier les valeurs suivantes :
a G(18) = 1 + p + p2 .
b G(28) = 1 + p.
c G(38 ) = 1 + p + pq,
d G(48) = 1.
e G(58) = 1 + q + pq
f G(68) = 1 + q
g G(78 ) = 1 + q + q2
Exercice 39. Supposons que p =12 . Utilisez l'exercice 37 pour montrer que
(
2 -1 2r(x)-1, x est un rationnel binaire
G(x) =
2, x est un irrationnel
binaire
Exercice 40. Pour x fixé, montrer que G est continue en fonction de p.
Cependant, en fonction de la fortune initiale x, pour p fixé, la fonction G
est très irrégulière.
Exercice 41. Montrer que G est discontinue sur les rationnels binaires dans [0, 1]
24
et continue sur les irrationnels binaires.
25
Figure 7 : Le nombre attendu de parties en gras avec des parties équitables.
4 Stratégies optimales
Rappelons que la règle d'arrêt pour le rouge et le noir est de continuer à jouer
jusqu'à ce que le joueur soit ruiné ou que sa fortune atteigne la fortune cible
a. Ainsi, la stratégie du joueur est de décider combien il doit parier sur chaque
jeu avant de devoir s'arrêter. Supposons que nous disposions d'une classe de
stratégies correspondant à certaines règles de jeu valides.
fortunes et paris ; A désignera l'ensemble des fortunes et Bx désignera
l'ensemble des paris valides pour x ∈ A. Par exemple, parfois (comme pour le
jeu timide), nous pourrions vouloir restreindre les fortunes à l'ensemble des
entiers {0, 1, . . . , a} ; d'autres fois (comme avec
), nous pourrions vouloir utiliser l'intervalle [0, 1] comme espace de fortune. En tant
que
pour les mises, rappelons que le joueur ne peut pas miser ce qu'il n'a pas et ne
mise pas plus que ce dont il a besoin pour atteindre l'objectif. Ainsi, une
fonction de pari S doit satisfaire
S(x) = min{x, a - x}, x ∈ A

En outre, nous limitons toujours nos stratégies à celles pour lesquelles le
temps d'arrêt est N fini.
La fonction de succès d'une stratégie est la probabilité que le joueur
atteigne la cible a avec cette stratégie, en fonction de la fortune initiale x. Une
stratégie avec une fonction de succès V est optimale si pour toute autre stratégie avec
une fonction de succès
U , on a U (x) ≤ V (x) pour x ∈ A.
Exercice 42. Montrer que s'il existe une stratégie optimale, alors la fonction de
succès optimale est unique.
Cependant, il se peut qu'il n'existe pas de stratégie optimale ou qu'il y ait
plusieurs stratégies optimales. En outre, la question de l'optimalité dépend de
la valeur de la probabilité de gain du jeu p, ainsi que de la structure des
fortunes et des paris.
26
Une condition d'optimalité
Voici notre principal théorème.
27
Théorème 1. Une stratégie S avec une fonction de succès V est optimale si
pV (x + y) + qV (x - y) ≤ V (x), x ∈ A, y ∈ Bx
La preuve est esquissée dans les exercices suivants. Tout d'abord, supposons
que nous commençons avec une stratégie donnée S qui a une fonction de succès
V . Nous modifions S comme suit. Si la fortune initiale est x ∈ A, nous
choisissons y ∈ Bx et misons y sur le premier jeu ;
par la suite, nous suivons la stratégie S. Appelons la nouvelle stratégie T et son
succès
fonction U .
Exercice 43. Conditionner le résultat de la première partie pour montrer que
U (x) = pV (x + y) + qV (x - y)
Ainsi, le théorème 1 peut être reformulé comme suit : Si S est optimal par
rapport à la classe de stratégies de l'exercice 43, alors S est optimal pour toutes
les stratégies.
Maintenant, avec S et V comme précédemment, prenons T comme une
stratégie arbitraire avec la fonction de succès U . Comme d'habitude, laissons (X0
, X1 , X2 , . . .) représenter la séquence des fortunes, (Y1 , Y2 , . . .) la séquence des
paris, et N le temps d'arrêt, le tout dans le cadre d'une stratégie
T . On notera que la variable aléatoire V (XN ) peut être interprétée comme la
probabilité de gagner si la stratégie du joueur est remplacée par la stratégie S
après le temps n.
Exercice 44. Conditionner l'issue du jeu n pour montrer que
E[V (XN )|X0 = x] = E[pV (Xn−1 + Yn ) + qV (Xn−1 - Yn )|X0 = x]

Nous pouvons maintenant terminer la preuve du Théorème 4.1.
Exercice 45. Supposons que la fonction de succès V dans le cadre de la
stratégie S satisfasse à la condition du théorème 1.
a Utilisez l'exercice 44 et la condition d'optimalité pour montrer que
E[V (Xn )|X0 = x] ≤ E[V (Xn−1 |X0 = x], n ∈ N+ , x ∈ A.
b Utiliser (a) pour montrer que E[V (Xn )|X0 = x] ≤ V (x) pour n ∈ N+ et x ∈ A.
c Soit n → ∞ dans (b) pour montrer que E[V (XN )|X0 = x] ≤ V (x) pour x ∈ A.
d Montrer que E[V (XN )|X0 = x] = U (x) pour x ∈ A
e Conclure que U (x) ≤ V (x) pour x ∈ A.
Essais favorables avec une mise minimale

Supposons maintenant 2que p ≥1 pour que les essais soient favorables (ou du
moins pas injustes) au joueur. Supposons ensuite que toutes les mises doivent
28
être des multiples d'une unité de base,
que nous pourrions tout aussi bien supposer être de 1 $. Bien entendu, les
maisons de jeu réelles ont cette restriction. Ainsi, l'ensemble des fortunes
valides est A = {0, 1, . . . , a} et l'ensemble des paris valides pour x ∈ A est
Bx = {0, 1, . . . , min{x, a - x}}. Notre résultat principal pour ce
La sous-section est
29
Théorème 2. Le jeu timide est une stratégie optimale.
La preuve sera construite dans les deux exercices suivants. Tout d'abord,
rappelons la fonction de succès f pour le jeu timide, dérivée dans les
exercices 7 et 8, et la condition d'optimalité du Théorème 1.
Exercice 46. Montrer d'abord que la condition d'optimalité tient2 si p = 1
Exercice 47. Montrez que la condition d'optimalité tient si p >2 1 . Voici les
étapes.
a Montrez que la condition d'optimalité est équivalente à
p(q/p)x+y + q(q/p)x−y ≥ (q/p)x b
Montrer que l'inégalité en (a) est équivalente à
pq(py - qy )(py−1 - qy−1 ) ≤ 0 c
Montrer que l'inégalité en (b) tient puisque p >1 . 2
Essais favorables sans mise minimale

Nous allons maintenant supposer que la maison autorise des mises 2
arbitrairement petites et que p >1 , de sorte que les essais sont strictement
favorables. Dans ce cas, il est naturel de prendre la cible comme unité
monétaire, de sorte que l'ensemble des fortunes est A = [0, 1], et l'ensemble
des fortunes de
pour x ∈ A est Bx = [0, min{x, 1 - x}]. Notre résultat principal, et une esquisse
de la preuve, sont donnés dans l'exercice suivant. Les résultats pour le jeu
timide seront joués
joue un rôle important dans l'analyse, aussi nous laisserons f (j, a) désigner la
probabilité d'atteindre une cible entière a, à partir de l'entier j ∈ [0, a] avec
des paris unitaires.
Exercice 48. Montrer que la fonction de succès optimale est V (x) = 1 pour x
∈ [0, 1] a Fixer une fortune initiale rationnelle x = k/n ∈ [0, 1]. Soit m un
entier positif
et supposons que, à partir de x, le joueur mise1 surmn
chaque jeu.
b Montrer que la stratégie décrite au point (a) est équivalente au jeu timide avec
objectif de fortune
mn et la fortune initiale mk.
c La probabilité d'atteindre la cible 1 dans le cadre de la stratégie (b) est de
f (mk, mn).
d Montrer que f (mk, mn) → 1 lorsque m → ∞.
30
e D'après (d), montrer que V (x) = 1 si x ∈ [0, 1] est rationnel.
f A partir de (e) et du fait que V est croissant, montrer que V (x) = 1 pour tout
x ∈ [0, 1]
31
Procès inéquitables
Nous supposerons maintenant 2 pour que les procès soient inéquitables, ou du
que p ≤ 1 moins ne soient pas
favorable. Comme précédemment, nous prendrons la fortune cible comme unité
monétaire de base et autoriserons toute fraction valide de cette unité comme pari.
Ainsi, l'ensemble des fortunes est
A = [0, 1] et l'ensemble des paris pour x ∈ A est Bx = [0, min{x, 1 - x}].
Notre résultat principal pour cette section est le suivant.
Théorème 3. Le jeu audacieux est une stratégie optimale.
Comme d'habitude, la preuve sera construite à travers une série d'exercices.
Tout d'abord, rappelons la fonction de succès F pour le jeu audacieux et la
condition d'optimalité du théorème x+y ) - pF (x) + qF (y).
2 1. Soit D(x, y) = F (
Exercice 49. Montrer que la condition d'optimalité est équivalente à D(x,

y) ≤ 0 pour 0 ≤ x ≤ y ≤ 1.
Exercice 50. Utiliser la continuité de F pour montrer qu'il suffit de prouver
l'inégalité de l'exercice 49 lorsque x et y sont des rationnels binaires.
La preuve est complétée en utilisant l'induction sur le rang de x et y.
Exercice 51. Montrer que l'inégalité de l'exercice 49 est valable lorsque x et y
sont de rang 0 :
a x = 0, y = 0
b x = 0, y = 1
c x = 1, y = 1
Exercice 52. Supposons que l'inégalité de l'exercice 49 soit valable lorsque x
et y sont de rang m ou moins. Montrer que l'inégalité est valable lorsque x et y
sont de rang m + 1 ou moins.
a Supposons que x ≤ y ≤21 Montrer que D(x, y) = pD(2x, 2y).
2 ≤ x ≤ y. Montrons que D(x, y) = qD(2x - 1, 2y - 1).

b Supposons que1
c Supposons que x ≤ (x + y)/2 ≤12 ≤ y et que 2y - 1 ≤ 2x. Montrer que

D(x, y) = (q - p)F (2y - 1) + qD(2y - 1, 2x).
d Supposons que x ≤ (x + y)/2 ≤12 ≤ y et que 2x ≤ 2y - 1. Montrez que
D(x, y) = (q - p)F (2x) + qD(2x, 2y - 1).
e Supposons que x ≤21 ≤ (x + y)/2 ≤ y et que 2y - 1 ≤ 2x. Montrer que
D(x, y) = p(q - p)[1 - F (2x)] + pD(2y - 1, 2x).
f Supposons que x ≤21 ≤ (x + y)/2 ≤ y et que 2x ≤ 2y - 1. Montrer que
D(x, y) = p(q - p)[1 - F (2y - 1)] + pD(2x, 2y - 1).
32
Figure 8 : La fonction de mise pour le jeu audacieux.
Autres stratégies optimales dans le cas d'une concurrence

déloyale
Considérons à nouveau le cas sous-équitable 2 où p ≤ de sorte que les essais ne
1
sont pas favorables au joueur. Le jeu audacieux n'est pas la seule stratégie
optimale.
sont une infinité de stratégies optimales. Rappelons tout d'abord que la
stratégie audacieuse a une fonction de pari
(
( ) = min 1 x, x ∈ [0,1 ]
= 2
S1 x {x, - x}
1 - x, x ∈ [1 , 1]
2
Considérons maintenant la stratégie suivante, que nous appellerons la

stratégie audacieuse de deuxième ordre :
• Avec une fortune x ∈ (0,1 ), jouez hardiment avec l'objectif d'atteindre1 avant
que
2 2
tombant à 0.
• Avec la fortune x ∈ (1 , 1) jouez hardiment avec l'objectif d'atteindre 1 sans
2
en dessous de1 2.
• Avec fortune1 , pari1 .
2 2
Exercice 53. Montrez que la stratégie audacieuse du second ordre a une fonction de
pari
S2 donné par
��X, x ∈ [0,1 ]
� 4
1
- x, x ∈ [ 41,12)
��2
S2 (x) 1 ,
2 x= 2
= 1
� 12 2 4
x - ,- xx,∈x (∈1 ,[3,]1]
��1
3
4
33
Soit F2 la fonction de succès associée à la stratégie S2 . Notre principal
théorème pour cette section est le suivant
Théorème 4. La stratégie audacieuse de second ordre est optimale. C'est-à-dire que F2
=F
34
Figure 9 : Fonction de pari pour la stratégie audacieuse de second ordre.
Preuve. L'outil principal est l'équation fonctionnelle pour la fonction de

succès F en cas de jeu audacieux. Tout d'abord, supposons que le joueur
2
commence avec une fortune x ∈ (0,1 ) et utilise la stratégie S2 . Notez que le
joueur atteint la cible 1 si et seulement si il atteint
1 et gagne ensuite la dernière partie. Considérons donc la séquence des fortunes jusqu'à
2
1
le joueur atteint 0 ou2 . Si nous doublons les fortunes, nous obtenons la
séquence des fortunes dans le cadre de la stratégie audacieuse ordinaire S,
commençant à 2x et se terminant à 0 ou 1. Il s'ensuit que
F2 (x) = pF (2x) = F (x)
Supposons maintenant que le joueur commence avec une fortune

2 x ∈ (1 , 1). et qu'il utilise
une stratégie
S2 . Notez que le joueur atteint la cible 1 si et seulement s'il atteint 1 sans
en retombant à21 , ou si elle retombe à1 et2 gagne ensuite la partie finale. Ainsi,
1
considérons la séquence des fortunes jusqu'à ce que le joueur atteigne2 ou 1. Si
nous doublons les fortunes et soustrayons 1, nous obtenons la séquence des
fortunes dans le cadre de la stratégie audacieuse ordinaire, commençant à 2x - 1
et se terminant à 0 ou 1. Il s'ensuit que
F2 (x) = F (2x - 1) + [1 - F (2x - 1)]p = p + qF (2x - 1) = F (x)
Bien sûr, trivialement F2 (0) = F (0) = 0, F2 (1) = F (1) = 1, et F (21 ) = F (1 ) = p
2 2
Ainsi, F2 (x) = F (x) pour tout x ∈ [0, 1].
Une fois que nous avons compris comment cette construction est réalisée,
il est facile de définir la stratégie audacieuse de troisième ordre et de montrer
qu'elle est également optimale. Le graphique de la fonction de pari est illustré
à la figure 10.
Exercice 54. Donnez explicitement la fonction de pari du troisième ordre et
montrez que la stratégie est optimale.
Plus généralement, nous pouvons définir la stratégie audacieuse d'ordre n
35
et montrer qu'elle est également optimale.
36
Figure 10 : La fonction de pari pour la stratégie audacieuse du troisième ordre.
Figure 11 : Fonctions de pari pour les quatre premières stratégies audacieuses.
Exercice 55. Montrez que la séquence des stratégies audacieuses peut être
définie de manière récursive à partir de la stratégie audacieuse de base S1
comme suit :
�
�
1
�Sn (2x), x ∈ [0,1 )
2 2
Sn+1 (x) 1
��
21
, x= 2
= 1 Sn (2x - 1), x ∈ (1 , 1])
2 2
Plus généralement, on peut définir une stratégie optimale T de la manière suivante
de la manière suivante : pour chaque x ∈ [0,1 ], sélectionnez nx ∈ N+ et laissez T (x) =
Sxn (x). Le graphe
2
de la figure 11 montre quelques-uns des graphiques des stratégies
audacieuses. Pour une stratégie optimale T , il suffit de sélectionner, pour
chaque x, un pari sur l'un des graphiques.
5 Résumé
Dans le jeu du Rouge et du Noir, un joueur joue des essais de Bernoulli (jeux
37
indépendants, identiques d'un point de vue probabiliste, avec une probabilité de
gain p) jusqu'à ce qu'il soit ruiné.
38
ou atteint un objectif fixe a. Notre intérêt principal est sa probabilité de
succès, la probabilité d'atteindre son objectif. Un intérêt secondaire est le
nombre attendu de
de jeux joués. Nous nous intéressons principalement au cas injuste p <1 puisque2
c'est la situation malheureuse des casinos réels. Nous avons comparé deux
stratégies très différentes :
Avec le jeu timide, le joueur fait une petite mise constante sur chaque partie
jusqu'à ce qu'il soit ruiné ou qu'il atteigne l'objectif. Cette stratégie s'avère très
mauvaise dans les jeux injustes, mais elle présente l'avantage d'un nombre
relativement élevé de parties attendues. Si vous adoptez cette stratégie, vous
serez presque certainement ruiné, mais vous aurez au moins l'occasion de jouer
pendant un certain temps.
Avec le jeu audacieux, le joueur mise toute sa fortune ou ce dont il a besoin
pour atteindre l'objectif, le montant le plus faible étant retenu. Il s'agit d'une
stratégie optimale dans le cas injuste ; aucune stratégie ne peut faire mieux. Mais
elle est très rapide ! Si vous adoptez cette stratégie, il y a de fortes chances que
votre jeu soit terminé après quelques parties seulement (souvent une seule !).
Étonnamment, le jeu audacieux n'est pas uniquement optimal dans le cas
injuste. Le jeu audacieux peut être redimensionné pour produire une séquence
infinie de stratégies optimales. Ces stratégies audacieuses d'ordre supérieur
peuvent avoir un grand nombre de parties attendues, en fonction de la fortune
initiale (et en supposant que le casino soit assez sympathique pour vous permettre
de faire les paris fractionnaires bizarres qui seront nécessaires pour la stratégie).
Cependant, le but de cet article n'est pas de faire de vous un meilleur joueur
(malgré le titre), mais de découvrir quelques belles mathématiques. L'étude du
jeu audacieux, et de ses variantes d'ordre supérieur, conduit à un mélange
intéressant de probabilités, de systèmes dynamiques et de représentation binaire
des nombres dans [0, 1] (à la fois pour les fortunes et les probabilités). L'étude du
jeu audacieux conduit à des distributions de probabilités continues singulières,
c'est-à-dire des distributions continues qui n'ont pas de fonctions de densité. Les
généralisations du jeu rouge et noir et du jeu audacieux sont encore aujourd'hui
des sujets de recherche intéressants en mathématiques ; pour un article
relativement récent, voir [3]. Si vous souhaitez en savoir plus sur les
mathématiques des jeux de hasard, les livres [1] (qui ont inspiré cet article) et [2]
constituent un bon point de départ.
Références
[1] Dubbins, Lester E et Savage, Leonard J. Inequalities for Stochastic Pro-
cesses ; How to Gamble If You Must. Dover Publications (1976).
[2] Maitra, Ashok P et Sudderth, William D. Discrete Gambling and Stochas- tic
Games, Springer (2008).
[3] Pendergrass, Marcus et Siegrist, Kyle. "Generalizations of bold play in red
and black", Stochastic Processes and their Applications 92 (2001) 163-180.
[4] Siegrist, Kyle Laboratoires virtuels en probabilités et
39
statistiques, http://www.math.uah.edu/stat/
40

RedBlack Version Francais

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

RedBlack Version Francais

Transféré par

Droits d'auteur :

Formats disponibles

Abonnez-vous à DeepL Pro pour traduire des fichiers plus volumineux.

Visitez www.DeepL.com/pro pour en savoir plus.

Comment jouer si vous devez le

Hypothèses et processus aléatoires

où p ∈ [0, 1] est la probabilité de gagner un jeu individuel. Ainsi, I = (I1 , I2 , .

Hn = (X0 , Y1 , I1 , Y2 , I2 , . . . , Yn−1 , I )n−1

En outre, ses décisions peuvent comporter des sources supplémentaires d'aléa.

E(Xn ) = E(Xn−1 ) + (2p - 1) E(Yn ), n ∈ {1, 2, . . .}

Exercice 3. Supposons que le joueur ait une probabilité positive de faire un

b E(Xn ) > E(Xn−1 ) si p > 1

Ainsi, toute stratégie (fonction de pari) S doit satisfaire S(x) ≤ min{x, a -

b Var(XN ) = a2 P(XN = a)[1 - P(XN = a)]

désignera la probabilité que le joueur atteigne la cible a, à partir d'une fortune

f (x, a) = P(XN = a|X0 = a), x ∈ {0, 1, . . . , a}

Rappelons que f est appelée fonction de succès.

a f (x, a) = qf (x - 1, a) + pf (x + 1, a) pour x ∈ {1, 2, . . . , a - 1}

P(XN = 0|X0 = x) = 1 - f (x, a), x ∈ {0, 1, . . . , a}

a f (x, a) augmente de 0 à 1 lorsque x augmente de 0 à a.

Exercice 11. Montrer que pour x et a fixés, f (x, a) augmente de 0 à 1 comme p

Le nombre attendu d'essais

g(x, a) = E(N |X0 = x), x ∈ {0, 1, . . . , a}

Exercice 12. En conditionnant le résultat du premier jeu, montrer que g

a g(x, a) = qg(x - 1, a) + pg(x + 1, a) + 1 pour x ∈ {1, 2, . . . , a - 1}

L'équation différentielle de l'exercice 12 est linéaire, du second ordre,

g(x, a) = x(a - x), x ∈ {0, 1, . . . , a}

Exercice 15. Considérons g en fonction de la fortune initiale x, pour des

b f (2x, 2a) = f (x, a) si p =2 1

La fonction d est parfois appelée fonction de doublement, mod 1, car d(x)

où xi ∈ {0, 1} pour chaque i ∈ N+ . Cette représentation est unique sauf

Non, l'équation de l'exercice 28 ne comporte pas de faute de frappe. La

Ainsi, pour p =21 (essais équitables), la probabilité que le joueur audacieux

a Pp (W ∈ Cp ) = 1 pour p ∈ (0, 1).

Le nombre attendu d'essais

1 + qG(2x - 1), x ∈ [ , 21)

a Notez que le terme n = 0 est 1, puisque le produit est vide.

S(x) = min{x, a - x}, x ∈ A

E[V (XN )|X0 = x] = E[pV (Xn−1 + Yn ) + qV (Xn−1 - Yn )|X0 = x]

E[V (Xn )|X0 = x] ≤ E[V (Xn−1 |X0 = x], n ∈ N+ , x ∈ A.

Essais favorables avec une mise minimale

p(q/p)x+y + q(q/p)x−y ≥ (q/p)x b

Montrer que l'inégalité en (a) est équivalente à

pq(py - qy )(py−1 - qy−1 ) ≤ 0 c

Montrer que l'inégalité en (b) tient puisque p >1 . 2

Essais favorables sans mise minimale

d Montrer que f (mk, mn) → 1 lorsque m → ∞.

Exercice 49. Montrer que la condition d'optimalité est équivalente à D(x,

a Supposons que x ≤ y ≤21 Montrer que D(x, y) = pD(2x, 2y).

2 ≤ x ≤ y. Montrons que D(x, y) = qD(2x - 1, 2y - 1).

c Supposons que x ≤ (x + y)/2 ≤12 ≤ y et que 2y - 1 ≤ 2x. Montrer que

Autres stratégies optimales dans le cas d'une concurrence

Considérons maintenant la stratégie suivante, que nous appellerons la

Preuve. L'outil principal est l'équation fonctionnelle pour la fonction de

F2 (x) = pF (2x) = F (x)

Supposons maintenant que le joueur commence avec une fortune

Figure 11 : Fonctions de pari pour les quatre premières stratégies audacieuses.

Vous aimerez peut-être aussi