Académique Documents
Professionnel Documents
Culture Documents
Reçu le 29 février 2000 ; reçu sous forme révisée le 1er août 2000 ; accepté le 9 août 2000
Résumé
La stratégie du jeu audacieux dans le jeu du rouge et du noir conduit à un certain nombre de
propriétés mathématiques intéressantes : la fortune du joueur suit une carte déterministe, avant la
transition qui met fin au jeu ; la stratégie audacieuse peut être "remise à l'échelle" pour produire de
nouvelles stratégies avec la même probabilité de gain ; la probabilité de gain est une fonction
continue de la fortune initiale, et dans le cas équitable, elle est égale à la fortune initiale. Nous
considérons plusieurs chaînes de Markov dans des contextes plus généraux et étudions dans quelle
mesure les propriétés sont préservées. En particulier, nous étudions deux chaînes de Markov à "k
joueurs"
modèles. ⃝c 2001 Elsevier Science B.V. Tous droits réservés.
1. Introduction
Rappelons que dans le jeu du rouge et du noir (Dubins et Savage, 1965 ; Maitra et
Sudderth, 1996), le joueur commence avec une fortune initiale x (normalisée pour se
situer dans [0 ; 1]), puis parie sur une séquence d'essais de Bernoulli, à enjeux égaux,
jusqu'à ce qu'il atteigne s a cible (1) ou qu'il soit ruiné (0). Un résultat célèbre est que
dans le cas subfair, une stratégie optimale est le jeu audacieux, dans lequel à chaque
essai, le joueur mise toute sa fortune ou juste ce qui est nécessaire pour atteindre la cible,
selon ce qui est le plus petit.
Outre l'optimalité, la stratégie audacieuse présente un certain nombre de propriétés intéressantes :
(1) Avant la fin du jeu, le processus de fortune est déterministe et suit la carte.
x '→ 2x mod 1.
(2) La stratégie audacieuse peut être "redimensionnée", sur des sous-intervalles binaires de [0 ; 1], ce
qui donne
de nouvelles stratégies avec la même fonction de probabilité de gain.
(3) La probabilité de gain est une fonction continue de la fortune initiale.
(4) Dans le cas équitable, la probabilité de gain est la même que la fortune initiale du
joueur. L'objectif de ce document est d'étudier les chaînes de Markov dans un cadre plus
général qui préserve certaines de ces propriétés. Dans la section 3, nous étudions une
classe générale de chaînes de Markov partiellement équitables.
0304-4149/01/$ - see front matter ⃝c 2001 Elsevier Science B.V. Tous droits réservés.
PII : S 0 3 0 4 - 4 1 4 9 ( 0 0 ) 0 0 0 6 9 - 7
164 M. Pendergrass, K. Siegrist / Stochastic Processes and their Applications 92 (2001) 163-180
chaînes déterministes - chaînes qui suivent une carte déterministe avant d'entrer dans un
ensemble d'états D. Nous obtenons des résultats pour la distribution du temps et du lieu
de frappe dans D. Les chaînes étudiées dans le reste du document appartiennent toutes à
cette classe générale.
Dans la section 4, nous étudions une chaîne sur l'espace des séquences {0, 1 , . . . , k - 1}∞ .
Lorsque k =2
et les séquences sont interprétées comme les coordonnées binaires de la fortune du joueur, le
correspond à un jeu audacieux standard en rouge et noir. Avec D comme ensemble de
séquences constantes, nous montrons que la chaîne possède la propriété de remise à
l'échelle pour tout k, et nous obtenons des résultats comparant le temps de frappe attendu
à D pour les chaînes remises à l'échelle. Les comparaisons de la valeur attendue sont
nouvelles même pour k =2. Malheureusement, sauf pour k =2, les chaînes sur l'espace des
séquences ne semblent pas avoir une interprétation naturelle des jeux de hasard.
Cependant, pour nous, le rouge et le noir est également intéressant en raison de ses
propriétés mathématiques et, en particulier, de ses liens avec les systèmes dynamiques.
Dans ce contexte, le modèle de l'espace des séquences est le foyer mathématique naturel
de la propriété de remise à l'échelle.
Dans la section 5, nous étudions les chaînes de Markov qui généralisent naturellement
le jeu audacieux avec k joueurs. Fondamentalement, les joueurs actifs parient sur des
essais multinomiaux, chacun misant la fortune minimale, le gagnant emportant la mise
totale. Lorsqu'un joueur est ruiné, il a b a n d o n n e . Là encore, lorsque k = 2, la
chaîne correspond à un jeu audacieux en rouge et noir standard. Pour k général, nous
montrons que la probabilité qu'un joueur donné soit le gagnant final est une fonction
continue de l'état initial et, dans le cas équitable, est égale à sa fortune initiale. Le résultat
de la continuité est particulièrement intéressant pour deux raisons. Premièrement, les
probabilités qu'un joueur survive aux éliminations intermédiaires sont des fonctions
discontinues de l'état initial. Deuxièmement, le résultat de continuité ne dépend pas de la
façon dont les proba- bilités de gain des essais sont réattribuées lorsqu'un joueur
abandonne. D'autre part, sauf lorsque k = 2, la propriété de remise à l'échelle ne semble
pas se vérifier, du moins d'une manière qui préserve la structure de base du modèle.
Le fait que nos deux modèles "k-dimensionnels" ne s'accordent que lorsque k = 2
suggère que le jeu audacieux standard en rouge et noir est très spécial.
2. Préliminaires
Lemma 3. Pour A ⊂ D, x '→ Px (Xτ ∈ A) est la plus petite fonction non négative sur S
satisfaisant
�1(x ∈ A) si x ∈ D,
Σ
Px (Xτ ∈ A)= P(x, y)P (X ∈ A) si x ∈ S - D. (1)
, y τ
y∈Sx
Théorème 4. Pour x ∈ S, A ⊆ S,
Corollaire 5. Pour x ∈ S,
Px (T = ∞) = pn (x).
lim
n→∞
∞
Σ
Ex (T )= pn (x).
n=0
Corollaire 6. Le temps d'arrêt T a la propriété suivante d'être sans mémoire par rapport à
σ : Pour x ∈ S et n, m = 0, 1,...,
Px (T ¿ n + m)= Px (T ¿ n)Pσ n (x)(T ¿ m).
n ¡ τ ⇒ Xn = σn (X0 ).
Ainsi, avant l'entrée dans D, la chaîne évolue de manière déterministe, selon la carte
σ. Dans ce c a s , T et τ sont en accord.
Ainsi, le théorème 4 et ses corollaires sont valables (avec T remplacé par τ).
Comme XT ∈ D si T ¡ ∞, la distribution de XT a une forme simple, que nous donnons
en termes de valeur attendue.
M. Pendergrass, K. Siegrist / Stochastic Processes and their Applications 92 (2001) 163-180 169
Plusieurs faits méritent d'être notés. Tout d'abord, seules les valeurs de σ sur S -D sont
pertinentes dans la définition 7. Trivialement, toute chaîne suit σ avant d'atteindre S, pour
tout σ. À l'autre extrême, une chaîne qui suit σ avant d'atteindre ∅ est purement
déterministe, à l'exception de l'état initial. Un cas particulier important est celui où D est
fermé par rapport à X :
Xn ∈ D ⇒ Xn+1 ∈ D.
En fait, dans de nombreux cas intéressants, il existe une chaîne d'ensembles,
Dk ⊆ Dk−1 ⊆ - - - ⊆ D0 = S,
Dans cette section, nous étudierons les chaînes de Markov sur un espace de séquences
qui généralisent les stratégies audacieuses standard et les stratégies audacieuses
redimensionnées en rouge et en noir, lorsque les fortunes sont exprimées en coordonnées
binaires.
Soit K = {0, 1 , . . . , k - 1} où k¿2 est un entier et soit S = K∞ . Nous donnons à K le nom de
la topologie discrète, S la topologie du produit correspondant et la σ-algèbre de Borel. En général,
nous appellerons les séquences (finies ou infinies) des chaînes de caractères :
x = x x12 . . . .
Si x est une séquence finie et y une séquence, xy désigne la concaténation de x avec
y. Si a ∈ K, a∗ ∈ S désigne la suite constante aaa...............Soit D = {a∗ : a ∈ K }.
Les coordonnées de x ∈ S peuvent être interprétées comme les coordonnées de base k pour un
nombre
dans [0, 1], tel que défini par la carte
∞
Σ
x '→ i . (2)
ki
x i=1
La carte est onto, mais pas one-to-one bien sûr. Plus précisément, si xj <k - 1 alors
les séquences
Σ
r(x)-1
G(x)= Ex (T )= px 1 - - - p x n .
n=0
Si k = 3, la chaîne sur S peut être considérée comme une chaîne sur [0, 1], via la carte
(2), si et seulement si les conditions de cohérence suivantes sont remplies :
p0 = 0, p1 = 1, p2 = 0.
La chaîne résultante est déterministe, et donc triviale. Si k ¿ 3, la chaîne sur S ne
correspond jamais à une chaîne sur [0, 1], quelle que soit la définition des pi .
Néanmoins, comme nous le montrerons plus loin, la formulation de l'espace des
séquences est une généralisation naturelle en raison de la propriété de remise à l'échelle.
La chaîne d'ordre j est définie comme la chaîne de Markov avec des probabilités de transition
Pj
comme suit :
Pj (x, σj (x)) = px j , Pj (x, ρ j (x))=1 - px j si r(x)¿j,
Pj (x, x ) = 1 si r(x)= 0.
Notez que si i<j, la chaîne d'ordre i et la chaîne d'ordre j ont les mêmes
probabilités de transition et se comportent donc de la même manière, en commençant
par un état de rang i ou inférieur.
En fin de compte, la chaîne d'ordre j est absorbée dans un état a∗ ∈ D. L'ingrédient clé pour le
développement d'une chaîne d'ordre j est le suivant
L'un des résultats les plus importants de cette section est la propriété de cohérence suivante en cas de
décalage.
La preuve découle directement des définitions.
Vj (x, a ∗ )= Px (XT = a∗ ), x ∈ S, a∗ ∈ D,
où T est le temps d'impact de X sur D. L'équation fonctionnelle générale (1) devient dans
ce cas
Vj (x, a ∗ )= pjx Vj (σj (x), a ∗ )+ (1 - pj x )Vj (ρj (x), a∗ ). (8)
D'autre part, nous avons également
Le théorème 12 généralise donc le résultat bien connu en rouge et noir standard selon
lequel les stratégies échelonnées conduisent à la même fonction de probabilité de gain
que la stratégie audacieuse.
Soit J : S - D → {1, 2,...} qui satisfait J (x)6r(x). Pour x ∈ S - D, définissons
σJ (x)= σJ(x) (x),
pJ (x)= px J (x) .
Pour être complet, définissons σJ (x)= ρJ (x)= x pour x ∈ D.
La chaîne de Markov associée à J est définie comme suit :
PJ (x, x ) = 1 si r(x)= 0,
La chaîne associée à J est finalement absorbée dans un état de D. Ainsi, avec notre
notation habituelle, laissons T représenter le temps d'accès à D, GJ la fonction de valeur
attendue pour T, et VJ le noyau d'accès pour T .
Ex (T ) = Ex (U ) + [1 - Px (XU =1 x∗ )].
Mais d'après le lemme 10
Ex (U ) = Gj (σ(x))
et
Px (XU = x ∗ )= V (σ(x), x∗ ).
1 1
Théorème 16. Si r(x) < ∞, alors Gj (x)= Gr(x) (x) pour j¿r(x). Si r(x)=∞ alors Gj (x) ↑
∞ comme j → ∞.
Gj+1 (x) - G j (x)= G(σj+1 (x)) - G(σj (x)) + W (σj (x)). (11)
Si r(x)6j alors σj (x) ∈ D et σj+1 (x) ∈ D donc
G(σj+1 (x)) = G(σj (x)) = W (σj (x))= 0,
et donc Gj+1 (x)= Gj (x). Supposons donc que r(x)= ∞. Dans ce cas
G(σ j (x))=1+ px j+1 G(σj+1 (x)),
de sorte que la substitution dans (11)
donne
Lorsque k = 2 et que la condition de cohérence (7) est remplie, Gj (x) est le temps
de jeu attendu en rouge et noir avec la fonction de pari βj définie dans (9) et (10).
Même dans ce cas, le théorème 16 est nouveau, à notre connaissance. Le théorème
montre que dans le cas subfair, à partir d'une fortune irrationnelle binaire x, il existe
des stratégies optimales avec un temps de jeu attendu arbitrairement grand. Pour
d'autres résultats concernant le temps de jeu dans les jeux liés au rouge et au noir,
voir Klugman, 1977 ; Kulldorff, 1993 et Ross, 1974.
Ensuite, nous considérons une formulation naturelle du jeu audacieux avec k joueurs
dans un espace d'état général ; un cas spécial correspond au jeu audacieux en rouge et
noir avec k joueurs. Nous prouverons un résultat général de continuité pour la valeur
attendue d'une fonction de l'état final. Un cas particulier donnera la continuité, en tant
que fonction de l'état initial, de la probabilité de gain d'un joueur pour le jeu audacieux en
rouge et noir à k joueurs. En nous spécialisant davantage dans le cas équitable, nous
montrerons que la probabilité de gain d'un joueur est égale à sa fortune initiale
(normalisée).
Soit S un espace topologique, et que {Si : 06i6k - 1} soit un espace fermé, ne se
chevauchant pas, et que {S : 06i6k - 1} soit un espace fermé, ne se chevauchant pas.
couverture topologique de S. Cela signifie que
[
k-1
S= Si , (15a)
i=0
Si = int Si , (15b)
les états dans lesquels deux joueurs ou plus ont tous deux la fortune minimale. Les Si 's
forment en fait une couverture topologique fermée et sans chevauchement de S. Les
cartes de joueurs σi sont définies sur S par
(
xi + (k - 1)β(x) si j = i,
σij (x) =
xj - β(x) si j /=
i,
où β(x) est la mise de chaque joueur, définie par
En se référant à la figure 1, la carte des joueurs σi dans un jeu à trois joueurs étire le
triangle Si linéairement sur l'espace d'état complet S, tandis que les points en dehors de Si
sont forcés à la frontière D. Le gagnant de chaque essai collecte les paris de tous les
autres joueurs. Notez que chaque joueur mise un montant égal à la fortune du joueur
minimum. Le modèle peut donc être considéré comme k joueurs audacieux qui jouent un
"jeu amical", dans lequel le joueur ayant la fortune minimale contrôle les mises. Les
cartes de joueurs σi sont continues sur
S. Soit σ toute carte satisfaisant σ(x) ∈ {σi (x) : x ∈ Si }. Encore une fois, cela force σ(x)=
σi (x) si x ∈ int Si . Nous sommes maintenant dans le cadre défini ci-dessus, et en
particulier, le jeu à k joueurs.
La chaîne audacieuse X suit σ avant d'atteindre D. Lorsqu'un ou plusieurs joueurs ayant la
fortune minimale perdent un essai, ces joueurs a b a n d o n n e n t et la chaîne entre en D,
en procédant à partir de ce point avec des cartes de joueurs et des probabilités différentes,
correspondant au nouveau nombre de joueurs. Nous appellerons ce modèle le modèle de
base à k joueurs.
Le cas équitable, dans lequel chaque joueur a la même probabilité de gagner un essai à
chaque étape du jeu, est particulièrement intéressant. Pour x ∈ S, n o t o n s N (x) les
joueurs actifs, et n(x) le nombre de joueurs actifs :
Alors p i (x)= 1/n(x) pour tout x ∈ S. Le jeu continue jusqu'à ce qu'un joueur ait tout
l'argent. Ainsi, A = {ei : 06i6k - 1} sont les états terminaux, où les ei sont les
vecteurs unitaires standard dans Rk . Soit TA le temps d'accès à A. La probabilité que
le joueur i remporte le
est Px (XT A = ei ). La substitution directe montre que la correspondance x '→ xi satisfait
(1) du Lemma 3, et donc
182 M.
Px Pendergrass,
(XT A = e K. Siegrist / Stochastic Processes and their Applications 92 (2001) 163-180
i )= xi , (17)
M. Pendergrass, K. Siegrist / Stochastic Processes and their Applications 92 (2001) 163-180 183
généralisant un résultat de base dans les jeux de hasard standard rouge et noir.
(L'équation (17) découle également du théorème de l'échantillonnage optionnel, puisque
le processus de fortune du joueur i est une martingale dans le cas équitable).
Soit TD le temps d'accès à D. Le corollaire 5 implique que pour x ∈ S - D
1 1 1
E x [T D ]= 1 + 1 - 6 1 + ,
kr(x)
k-1 k-1
de
sorte k-1
que
Σ
Ex [TA ]6k + (18)
1 i
i=2
Lemma 17.
[
k-1
D1 = @Si .
i=0
Preuve. Si x ∈ D1 , alors σ(x) ∈ D, ce qui implique que σi (x) ∈ D pour tout i avec x ∈
Si . Par (16c), cela implique que x ∈ @Si . D'autre part, si x ∈ @Si pour certains i,
alors x /∈ int Sj pour tous les j. Ainsi, σj (x) ∈ D pour tous les j, et donc σ(x) ∈ D.
L'union de tous les Dn est l'ensemble DF des points de rang fini, et le complément de
DF dans S est l'ensemble D∞ des points de rang infini. Notons que par le lemme 17, les
points de rang infini ont des orbites sous σ qui restent toujours dans les intérieurs du
partitionnement
définit Si .
Le domaine de sn est donc S - Dn+1 . Les points dans D1 ont des itinéraires vides, les points dans S - D ont
des itinéraires vides, les points dans S - D ont des itinéraires vides.
Dn , n¿1 ont des itinéraires finis, et les points de D∞ ont des itinéraires infinis.
Le lemme suivant est nécessaire pour prouver le résultat de continuité. Les preuves sont directes.
en avant.
Théorème 20. Supposons que g : D → R est borné et continu sur D dans la topologie
du sous-espace. Soit TD le temps d'accès à D. Alors la cartographie f : x '→ Ex [g(XT
D )] de S vers R est une extension continue de g.
où a = PD g. Pour voir la continuité de f sur D∞ , notons que pour tout x ∈ D∞ nous avons
n
|pn (x)a(σn (x))|6 p a .
La série en (19) converge donc uniformément sur D∞ . Par conséquent, f sera
continue sur D∞ si aσn et pσn le sont. Tout d'abord, nous affirmons que a et p sont
S
effectivement continus sur leurs domaines entiers S - D1 . C'est clair pour i=0 p, puisque
S - D1 =k−1 int Si , et p(x) = pi pour x ∈ int Si . Pour a, notons que i /= s0 (x) implique
σi (x) ∈ D. Puisque f est
continue par rapport à D, pour tout ε> 0 il existe un ensemble ouvert Vi contenant σi (x)
tel que |f(σi (x)-f(y)| <ε pour tout y ∈ Vi ∩D. Or σi est continue en x, donc il
existe un voisinage Ui de x avec σi (x′ ) ∈ Vi pour tout x′ ∈ Ui . Puisque x ∈ S -D1
⇒ x ∈ int Ss 0 (x),
on peut supposer que Ui ⊆ int Ss 0 (x). Ainsi, puisque i /= s0 (x), on a
x′ ∈ Ui ⇒ σi (x′ ) ∈ Vi ∩ D ⇒ |f(σi (x)) - f(σi (x′ ))| < ε.
Soit U = k-1 Ui . Alors U est un voisinage de x, et
i=/s0 (x)
T
x′ ∈ U ⇒ |f(σi (x)) - f(σi (x′ ))| <ε
pour tout i /= s0 (x). De ceci |a(x)-a(x′ )| <ε découle facilement, prouvant que a est
continue sur S - D1 . Ainsi a ◦ σn et p ◦ σn sont continues sur D∞ pour tout n par le
Lemma 19, et la convergence uniforme mentionnée ci-dessus implique maintenant
que f est continue sur D∞ .
Ensuite, nous affirmons que f est continue sur (plutôt que simplement relative
à) D. Pour le voir, prenons x ∈ D et ε> 0. Choisissons c¿1 tel que
c
p f < ε/4. (20)
Puisque f est continue par rapport à D, il existe un voisinage N1 de x tel que y ∈ N1 ∩D
implique que |f(x)-f(y)| < (1-�p )ε/2. Par la partie 2 du Lemma 19, il existe un
voisinage N2 de x tel que σi n σi n-1 . . . σi 1 (y) ∈ N1 pour tout y ∈ N2 , tout n = 0,
1 , . . , c, et toutes les sélections d'indices in , i n − 1 ,..., i1 . Nous montrerons que
|f(x) - f(y)| <ε pour tout y ∈ N2 .
Notons d'abord que, pour tout n, si r(y)¿n + 1, alors
Σ
n-1
f(y)= pn (y)f(σn (y)) + a(σt (y))pt (y)
t=0
= ps0
ps1
186 M. Pendergrass, K. Siegrist / Stochastic Processes
n and their Applications 92 (2001) 163-180
- - - ps n-1 1 ... ps - t-1 a(
1 Σ σt
0
f(σ
n (y)) + ps (y
t ))
ps =
0
,
M. Pendergrass, K. Siegrist / Stochastic Processes and their Applications 92 (2001) 163-180 187
où, pour faciliter la notation, nous avons écrit st = s t (y)= s0 (σt (y)). Écriture
n-1
Σ
ƒ(x)= ps 0 ps 1 . . . ps n-1 ƒ(x)+ ps 0 ps 1 . . . ps t-1 (1 - ps t ) ƒ(x)
t=0
t=0
Σn-1
+ (1 -� p ) ε/2 ps 0 ps 1 . . . ps t-1 (1 - ps t )
t=0
où nous avons utilisé (20) et (22) (notez que t6c - 1 dans (25)). Par conséquent, ƒ est
continue sur D = D0 .
188 M. Pendergrass, K. Siegrist / Stochastic Processes and their Applications 92 (2001) 163-180
Pour compléter la preuve, il suffit de montrer que si ƒ est continue sur Dn , alors ƒ
est continue sur Dn+1 . Soit x ∈ Dn+1 - Dn et ε> 0. Alors σi (x) ∈ Dn pour tout i.
Puisque ƒ est continue sur Dn , pour tout i il existe un voisinage Vi de σi (x) tel que
y ∈ Vi impliqueƒ(σi (x)) - ƒ(y)| <ε. Puisque σi est continue, il existe pour chaque
T i
un voisinage Ui de x tel que y ∈ Ui implique que σi (y) ∈ Vi . Soit U =k−1 i=0 i .
U
Alors U est un voisinage de x, et y ∈ U implique σi (y) ∈ Vi pour tout i, ce qui
implique à son tour que |ƒ(σi (x)) - ƒ(σi (y))| <ε pour tout i. Il s'ensuit facilement
que |ƒ(x) - ƒ(y)| <ε.
Dans le cas d'un jeu audacieux à deux joueurs standard, notons V0 (x) la probabilité de victoire du
joueur zéro à partir de
x ∈ [0, 1] : V0 (x)=Px (XT D =1), où D ={0, 1} et Xn est la fortune du joueur zéro à l'instant
n. Par la propriété de Markov forte, V0 (x)= Ex [g(XT D )], où g : D → R est défini par g(x)
= x, x ∈ D. En appliquant le théorème 20, nous retrouvons le résultat standard selon
lequel les probabilités de gain dans les jeux audacieux à deux joueurs sont des fonctions
continues des fortunes initiales.
Considérons maintenant un jeu à trois joueurs. À partir de x ∈ int S(3) , le jeu se
poursuit, régi par des essais multinomiaux, jusqu'à ce qu'un joueur soit éliminé. A ce
moment, les joueurs restants
se poursuivent dans un jeu à deux joueurs, régi par des épreuves binomiales.
i Soit V(3) (x)
la probabilité que le joueur i gagne le jeu à partir de x ∈ S . Par la propriété de Markov
(3)
forte
V(3) (x)= Ex [g(XT )],
i D
où g(y) est la probabilité du joueur i de gagner dans le jeu à deux joueurs à partir de y
∈ D. Mais les probabilités de gain à deux joueurs varient continuellement avec la
fortune initiale, et il s'ensuit que g est continu par rapport à D. Par conséquent,
i par le
Théorème 20, V(3) est continu.
sur S(3) . Un argument d'induction évident établit le théorème suivant.
Théorème 21. Dans le jeu de base à k joueurs, les probabilités de gain des joueurs sont
des fonctions continues des fortunes initiales.
Le théorème 21 est plus surprenant qu'il n'y paraît à première vue. Si nous laissons Ui
(x)=1(xi /= 0), il est simple de montrer que
Remerciements
Nous remercions l'arbitre pour plusieurs suggestions utiles et pour une référence
supplémentaire.
Références
Billingsley, P., 1986. Probability and Measure, 2e édition. Wiley, New York.
Dubins, L.E., Savage, L.J., 1965. Inequalities for Stochastic Processes : How to Gamble If You Must. Dover
Publications, New York.
Ikeda, N., Nagasawa, M., Watanabe, S., 1966. A construction of Markov processes by piecing out. Proc.
Japon. Acad. Ser. A, Math. Sci. 42, 370-375.
Klugman, S., 1977. Discounted and rapid subfair red-and-black. Ann. Statist. 5, 734-745.
Kulldorff, M., 1993. Optimal control of favorable games with a time limit. SIAM J. Control Optim. 31, 52-69.
Maitra, A.P., Sudderth, W.D., 1996. Discrete Gambling and Stochastic Games. Springer, New York. Ross,
S.N., 1974. Dynamic programming and gambling models. Adv. Appl. Probab. 6, 593-606.
Wilkins Jr, J.E., 1972. The bold strategy in presence of house limit. Proc. Amer. Math. Soc. 12, 567-570.