Vous êtes sur la page 1sur 8

PSI* — 2019/2020 — Corrigé du D.M.

7 Page 1
Exercice : temps d’attente à un guichet
1) X1 ֒→ G (p) donc
1 q
X1 (Ω) = N∗ , P (X1 = k) = q k−1 p, E (X1 ) = et V (X1 ) = 2 .
p p

+∞
2) (∆ = 0) = (X1 = X2 ) = (X1 = k) ∩ (X2 = k) (incompatibles) donc
k=1
+∞
P (∆ = 0) = P (X1 = k) P (X2 = k) (indépendance)
k=1
+∞
= q 2(k−1) p2 en réindexant
k=1
+∞
2 2h
=p q avec q 2 < 1
k=0
p2 p2
= =
1 − q2 (1 − q) (1 + q)
En conclusion :
p
P (∆ = 0) = .
1+q

3) Soit n ∈ N∗ .
a) (X1 − X2 = n) = (X2 = k) ∩ (X1 = n + k) avec comme contraintes k ∈ N∗ et n + k ∈ N∗ , soit
k
+∞
(X1 − X2 = n) = (X2 = k) ∩ (X1 = n + k)
k=1
donc (incompatibilité et indépendance)
+∞
P (X1 − X2 = n) = P (X2 = k) P (X1 = n + k).
k=1

b) Somme que l’on calcule :


+∞ +∞
P (X1 − X2 = n) = q k−1 pq n+k−1 p = p2 qn q 2(k−1)
k=1 k=1
1
= p2 q n car q 2 < 1
1 − q2
p2 q n pq n
= =
(1 − q) (1 + q) 1+q
Or |X1 − X2 | = n ⇐⇒ X1 − X2 = n ou X1 − X2 = −n (incompatibles car n ∈ N∗ )
avec X1 − X2 = −n ⇐⇒ X2 − X1 = n qui, par symétrie des rôles de X1 et X2 , aura donc la même
probabilité
Finalement P (|X1 − X2 | = n) = P (X1 − X2 = n) + P (X1 − X2 = −n), d’où
pq n
P (∆ = n) = 2 .
1+q

4) a) La série nP (∆ = n) est à termes positifs donc l’absolue convergence équivaut à la convergence.


N N
N pq n p
nP (∆ = n) = 0 + 2n =2 nqn
n=0 n=1
1+q 1+q n=1
p q 1 q
−→ 2 2 =2
N→∞ 1 + q (1 − q) 1 + q (1 − q)
Donc
2q
∆ a une espérance finie et E (∆) = .
1 − q2
PSI* — 2019/2020 — Corrigé du D.M. 7 Page 2

b) J’ai :
E (X1 − X2 )2 = E X12 − 2X1 X2 + X22
= E X12 − 2E (X1 X2 ) + E X22 (indépendance)
= E X12 − 2E (X1 ) E (X2 ) + E X22

et comme X1 et X2 ont même loi, elles ont même espérance, donc


E (X1 − X2 )2 = 2 E X12 − E (X1 )
= 2V (X1 )
de plus ∆2 = |X1 − X2 |2 = (X1 − X2 )2 donc ∆2 a une espérance finie et E ∆2 = 2V (X1 )
∆ a donc une variance finie et
V (∆) = E ∆2 − E (∆)2
2
q q q q2
=2 − 2 =2 − 4
p2 1 − q2 p2 p2 (1 + q)2
(1 + q)2 − 2q 1 + 2q + q 2 − 2q
= 2q 2 = 2q
p2 (1 + q) p2 (1 + q)2
1 + q2
= 2q
p2 (1 + q)2
Finalement
2q 1 + q 2
V (∆) = .
(1 − q 2 )2

5) Je remarque que : A = min (X1 , X2 ) + X3 > max (X1 , X2 ) = X3 > max (X1 , X2 ) − min (X1 , X2 ) .
Si X1 ≥ X2 alors max (X1 , X2 ) − min (X1 , X2 ) = X1 − X2 = |X1 − X2 | = ∆
et si X1 ≤ X2 alors max (X1 , X2 ) − min (X1 , X2 ) = X2 − X1 = |X1 − X2 | = ∆
En conclusion
A = (X3 > ∆).

6) a) Je décompose : [X3 > ∆] = (∆ = k) ∩ (X3 > k) incompatibles donc
k=0
+∞
P (X3 > ∆) = P (∆ = k) P (X3 > k)
k=0
car ∆ fonction de X1 et X2 est indépendante de X3 .
b) Avec, pour tout k ∈ N : P (X3 > k) = q k (on n’a que des échecs jusqu’à k) ;
on a donc
+∞
P (A) = P (∆ = 0) P (X3 > 0) + P (∆ = k) P (X3 > k)
k=1
p +∞ pq k k p p +∞ k
= ·1+ 2 q = +2 q2
1+q k=1 1 + q 1+q 1+q k=1
p 1
= 1 + 2q 2 car q 2 < 1
1+q 1 − q2
p 1 − q 2 + 2q2
=
1+q 1 − q2
Finalement
1 + q2
P (A) = .
(1 + q)2
PSI* — 2019/2020 — Corrigé du D.M. 7 Page 3

Problème : le critère de Kelly

I. Quitte ou double

1) J’ai deux conditions à vérifier : pour Xn+1 = 0 je dois avoir Cn+1 = Cn − Mn+1 et pour Xn+1 = 1 je
dois avoir Cn+1 = Cn + Mn+1 . Je souhaite donc (a, b) tel que :
Cn + bMn+1 = Cn − Mn+1
;
Cn + (a + b) Mn+1 = Cn + Mn+1
il suffit de choisir b = −1 et a = 2. En conclusion
Cn+1 = Cn + (2Xn+1 − 1) Mn+1 .

2) Je cherche une relation de récurrence sur E (Cn ) :


E (Cn+1 ) = E (Cn ) + 2E (Xn+1 ) − 1 E (Mn+1 )
(car Xn+1 et Mn+1 indépendants) et
E (Cn+1 ) = E (Cn ) + (2p − 1) E (Mn+1 )
d’où par récurrence :
1
• pour n = 1 : C0 + (2p − 1) E (Mk ) = C0 + (2p − 1) E (M1 ) = E (C1 ) d’après le 1).
k=1
n
• soit n ∈ N∗ tel que E (Cn ) = C0 + (2p − 1) k=1 E (Mk ) alors
E (Cn+1 ) = E (Cn ) + (2p − 1) E (Mn+1 )
n
= C0 + (2p − 1) E (Mk ) + E (Mn+1 )
k=1
n+1
= C0 + (2p − 1) E (Mk )
k=1

En conclusion
n
∀n ∈ N∗ E (Cn ) = C0 + (2p − 1) E (Mk ) .
k=1
n
Comme (2p − 1) > 0, plus E (Mk ) est grande, plus E (Cn ) est grande. et comme Mk+1 ≤ Ck , on
k=1
n
aura E (Cn ) ≤ C0 + (2p − 1) E (Ck−1 ) ce majorant étant atteint si et seulement si Mk+1 = Ck pour
k=1
tout k. Donc
Pour maximiser E (Cn ) il faut miser tout son capital à chaque pari.

3) Si l’on mise la totalité de son capital à chaque pari, on est ruiné si Xn = 0.


∞ N
Donc “ne pas être ruiné” est l’événement (Xn = 1) de probabilité lim P (Xn = 1) (conti-
n=1 N→+∞ n=1
N
nuité décroissante). Or P (Xn = 1) = pN car les Xn sont indépendants, on a donc
n=1
N
lim P (Xn = 1) = 0
N→+∞ n=1
par conséquent la probabilité de ne jamais être ruiné est nulle.
Si le joueur mise tout son capital, la ruine est quasi certaine.
Notons T le “temps d’attente” de la ruine, c’est-à-dire le rang de la partie se soldant par la ruine du
joueur. T suit la loi géométrique de paramètre 1 − p, donc
1
Le nombre moyen de parties conduisant à la ruine est E (T ) = .
1−p
PSI* — 2019/2020 — Corrigé du D.M. 7 Page 4

II. Stratégie à mises proportionnelles

1) J’ai Cn+1 = Cn + (2Xn+1 − 1) Mn+1 = Cn + (2Xn+1 − 1) αCn donc


• si Xn+1 = 1 alors (1 + α)Xn+1 (1 − α)1−Xn+1 Cn = (1 + α) Cn = Cn+1
• si Xn+1 = 0 alors (1 + α)Xn+1 (1 − α)1−Xn+1 Cn = (1 − α) Cn = Cn+1
Soit :
∀n ∈ N Cn+1 = (1 + α)Xn+1 (1 − α)1−Xn+1 Cn .
n
2) Je pose Sn = Xk . Sn représente le nombre de succès pendant les n premières épreuves.
k=1
Ces épreuves étant indépendantes et ayant la même probabilité p de succès,
Sn ֒→ B (n, p) et E (Sn ) = np.

3) J’ai par récurrence :


• pour n = 1 : (1 + α)S1 (1 − α)1−S1 C0 = (1 + α)X1 (1 − α)1−X1 C0 . = C1
• Soit n ∈ N∗ tel que Cn = (1 + α)Sn (1 − α)n−Sn C0 , alors
Cn+1 = (1 + α)Xn+1 (1 − α)1−Xn+1 Cn
Xn+1
= (1 + α)Sn + (1 − α)n−Sn −Xn+1 C0
= (1 + α)Sn+1 (1 − α)n−Sn+1 C0

En conclusion
∀n ∈ N∗ Cn = (1 + α)Sn (1 − α)n−Sn C0 .

4) J’ai
Cn
= (1 + α)Sn (1 − α)n−Sn donc
C0
Cn
ln = Sn ln (1 + α) + (n − Sn ) ln (1 − α) car > 0
C0
1 Cn Sn Sn
ln = ln (1 + α) + 1 − ln (1 − α) et donc
n C0 n n
1 Cn Sn Sn
E ln = E ln (1 + α) + 1 − E ln (1 − α)
n C0 n n
= p ln (1 + α) + (1 − p) ln (1 − α)
Ainsi
1 Cn
E ln = p ln (1 + α) + (1 − p) ln (1 − α).
n C0

III. Optimisation : le critère de Kelly

1) Étude de f
a) f est C 2 sur ]0, 1[ (car 1 + x > 0 et 1 − x > 0) et
p 1−p 2p − 1 − x
f ′ (x) = − =
1+x 1−x 1 − x2
2
x − 1 + 2x (2p − 1 − x) −x2 + 2 (2p − 1) x − 1
f ′′ (x) = =
(1 − x2 )2 (1 − x2 )2
Soit g (x) = −x2 + 2 (2p − 1) x − 1. g est dérivable sur [0, 1] et
g ′ (x) = −2x + 2 (2p − 1) = −2 (x − (2p − 1))

et comme 1 > p > 1/2 alors 2p − 1 ∈ ]0, 1[.


g (2p − 1) = − (2p − 1)2 + 2 (2p − 1)2 − 1 = (2p − 1)2 − 1 < 0 car 2p − 1 ∈ ]0, 1[
PSI* — 2019/2020 — Corrigé du D.M. 7 Page 5
x 0 2p − 1 1
g′ + 0 −
g ր− g (2p − 1) < 0 ց−
f ′′ − −
2p − 1 − x + 0 −
f′ + 0 −
f 0 ր ց −∞
Ainsi
f ′ est décroissante (f ′′ < 0 ) et f atteint son maximum en αK = 2p − 1.
b) J’ai lim f (x) = −∞. Quand la proportion misée (α) tend vers 1, le taux moyen de croissance du
x→1
capital tend vers −∞ (on court à la ruine !).
c) Comme f (0) = 0 et que f est strictement croissante sur [0, αK ] alors f (αK ) > 0.
Comme f est continue et strictement décroissante sur [αk , 1[ elle est bijective de [αk , 1[ dans
lim f, f (αk ) = ]−∞, f (αK )].
1
Et comme 0 < f (αK ) alors 0 ∈ ]−∞, f (αK )].
Donc f (x) = 0 a une unique solution αc dans [αk , 1[ qui n’est pas αK .
En conclusion
f s’annule deux fois exactement sur [0, 1[ : en 0 et en un réel αc vérifiant αK < αc .

d) Asymptote verticale en 1. Tangente au point (0, 0) de coefficient directeur f ′ (0) = 2p − 1 > 0.


Maximum en 2p − 1, annulation en αc . Ci-dessous le graphe pour p = 0, 72 :

2) Pour p = 1/2, on a αK = 0 donc quand on a autant de chances de gagner que de perdre, pour gagner
en moyenne, il vaut mieux ne rien miser.
Pour p = 1, on a αK = 1 donc, quand on est sûr de gagner, on peut tout miser à chaque fois.

IV. Étude de la valeur critique αc

1) a) ϕ est C ∞ sur ]0, 1[ en vertu des théorèmes opératoires classiques.


x
De plus ϕ (x) ∼ = −1, ln (1 + x) −→− ln 2 et ln (1 − x) −→− −∞ donc
x→0 −x x→1 x→1

ϕ est prolongeable en 0 par ϕ (0) = −1 et en 1 par ϕ (1) = 0.


PSI* — 2019/2020 — Corrigé du D.M. 7 Page 6

b) J’ai, pour tout x de ]0, 1[ :


1 1
ln (1 − x) + ln (1 + x)
ϕ′ (x) = 1+x 1−x
[ln (1 − x)]2
(1 − x) ln (1 − x) + (1 + x) ln (1 + x)
=
(1 − x2 ) [ln (1 − x)]2
Soit
h (x)
ϕ′ (x) = avec h (x) = (1 − x) ln (1 − x) + (1 + x) ln (1 + x).
(1 − x2 ) [ln (1 − x)]2

c) h est dérivable sur ]0, 1[ et


h′ (x) = − ln (1 − x) − 1 + ln (1 + x) + 1
1+x
= ln
1−x
1+x
Pour x ∈ ]0, 1[ on a 0 < 1 − x < 1 + x donc > 1 et h′ (x) > 0 :
1−x
h est strictement croissante sur ]0, 1[.

Or en 0 : (1 − x) ln (1 − x) + (1 + x) ln (1 + x) −→ 0, donc h est strictement positive sur ]0, 1[.


x→0
En 1 : avec t = 1 − x → 0+ j’ai (1 − x) ln (1 − x) = t ln (t) −→+ 0 donc h (x) −→− 2 ln (2).
t→0 x→1

d) D’après b) et c), ϕ est continue et strictement croissante sur [0, 1] et donc bijective de [0, 1] dans
[ϕ (0) , ϕ (1)] = [−1, 0].

2) J’ai
x2 x2
h (x) = + (1 − x) −x − + o x2 + (1 + x) x − + o x2
x→0 2 2
= x2 + o x2
x→0+
2
d’où, comme [ln (1 − x)] ∼ x2 , ϕ′ (x) −→+ 1. Or ϕ est continue sur [0, 1] et dérivable sur ]0, 1[,
x→0+ x→0
donc, grâce au théorème de la limite de la dérivée,
ϕ est dérivable en 0 et ϕ′ (0) = 1.

3) a) Pour p ∈ ]1/2, 1[ on a f (αc ) = 0 donc p ln (1 + αc ) + (1 − p) ln (1 − αc ) = 0 donc


ln (1 + αc ) p−1 1
= = 1 − 1/p soit ϕ (αc ) = 1 −
ln (1 − αc ) p p
Et comme αc ∈ [0, 1]
∀p ∈ ]1/2, 1[ , αc (p) = ϕ−1 (1 − 1/p).

b) Quand p → 1/2+ j’ai 1 − 1/p → −1+ et comme ϕ (x) −→ −1 alors ϕ−1 (t) −→ 0 donc
x→0 t→−1
−1
ϕ (1 − 1/p) −→ 0.
p→1/2
En conclusion
αc est prolongeable par continuité en 1/2 par αc (1/2) = 0.

La fonction prolongée est alors donnée par αc (p) = ϕ−1 (1 − 1/p).


ϕ est dérivable sur [0, 1[ et ϕ′ > 0 donc ϕ−1 est dérivable sur [−1, 0[ et
′ 1
ϕ−1 (x) = ′ −1
ϕ (ϕ (x))
PSI* — 2019/2020 — Corrigé du D.M. 7 Page 7

donc αc est dérivable en tout p tel que p = 0 et 1 − 1/p ∈ [−1, 0[, donc sur [1/2, 1[ et
′ 1
α′c (p) = ϕ−1 (1 − 1/p) 2
p
′ 4
α′c (1/2) = 4 ϕ−1 (−1) = ′ =4
ϕ (0)
Ce prolongement est dérivable en 1/2 et α′c (1/2) = 4.
c) La dérivée en 1/2 est la limite du taux d’accroissement :
αc (p) − αc (1/2) αc (p) − 0
−→ 4 donc −→ 1
p − 1/2 p→1/2 2 (2p − 1) p→1/2
αc ∼ 2αK .
p→1/2

V. Simulation informatique

1) On rejoue tant que le capital cible n’est pas atteint, d’où la première condition ligne 5.
Comme le joueur ne mise qu’une fraction de son capital (on a supposé α ∈ ]0, 1[), ce dernier restera
toujours positif, il n’est donc pas utile d’ajouter la condition cap > 0.
En revanche, il vaut mieux tenir compte des cas où le capital ne dépasserait pas la valeur cible au
bout d’un temps “raisonnable” (même si c’est peu probable), d’où la seconde condition sur le nombre
de parties en ligne 5.
Le capital suit la relation :
• si Xn+1 = 1 alors Cn+1 = (1 + α) Cn
• si Xn+1 = 0 alors Cn+1 = (1 − α) Cn
Le cas u < p correspond au gain, d’où les mises à jour de cap aux lignes 8 et 10.
n compte le nombre de parties jouées, d’où l’incrémentation ligne 11.
1 from random import random

2 def kelly1(p, alpha, cible) :


3 cap = 100
4 n = 0
5 while cap < cible and n < 10000 :
6 u = random()
7 if u < p :
8 cap += alpha*cap
9 else :
10 cap -= alpha*cap
11 n += 1
12 return n, cap
PSI* — 2019/2020 — Corrigé du D.M. 7 Page 8

2) J’ajoute un second capital capK que je fais évoluer en parallèle de cap en utilisant la proportion optimale
alphaK :
1 from random import random

2 def kelly2(p, alpha, cible) :


3 cap = 100
4 n = 0
5 capK = 100
6 alphaK = 2*p - 1
7 while cap < cible and n < 10000 :
8 u = random()
9 if u < p :
10 cap += alpha*cap
11 capK += alphaK*capK
12 else :
13 cap -= alpha*cap
14 capK -= alphaK*capK
15 n += 1
16 return n, cap, capK

Les résultats sont édifiants, voici le résultat d’une simulation : une moyenne de 1 000 appels de
kelly2(0.54, 0.04, 1000) (alors que αK = 0.08) renvoie (959.2, 1018.8, 2868.4).

Vous aimerez peut-être aussi