Académique Documents
Professionnel Documents
Culture Documents
(Gerard Letac) Calcul Des Probabilite Deug 2eme A (Bokos-Z1) PDF
(Gerard Letac) Calcul Des Probabilite Deug 2eme A (Bokos-Z1) PDF
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
1
2
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
7
7
9
13
15
20
20
21
22
24
24
25
26
.
.
.
.
28
28
30
32
33
35
35
40
44
49
53
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
ii
www.L es-M athematiques.net
Chapitre
Lespace de probabilits
(,A,P )
Par Grard Letac
1.1 Introduction
Le calcul des probabilits est la science qui modlise les phnomnes alatoires.
Une modlisation implique donc certainement une simplification des phnomnes,
mais cette simplification conduit une quantification, donc la possibilit de faire
des calculs et prdire. Le jet dun d, le tirage du Loto pourraient tre analyss par
les lois de la mcanique, mais ce serait trop compliqu pour tre utile. La modlisation
du calcul des probabilits a t invente par A. N. Kolmogorov dans un livre paru en
1933. Cette modlisation est faite partir de 3 objets (,A,P ) que nous allons dcrire.
1.2
Nous conviendrons que effectuer une exprience, cest slectionner par un procd
quelconque un lment dans un ensemble : jeter un d revient slectionner un
lment de = {1,2,3,4,5,6}; jeter ensemble deux ds rouge et vert revient slectionner un lment de lensemble = {1,2,3,4,5,6} des couples ordonns (i,j) avec
1 i 6 et 1 j 6 (ici a 36 points). Plus dlicat: jeter ensemble deux ds indiscernables revient slectionner un lment de lensemble des couples (i,j) avec
1 i j 6 (ici a 6+ 12 65 = 21 points). Observer la dure de vie dune ampoule
de 100 watts revient slectionner un lment de = [0, + [. Mesurer la dure de
vie de 12 ampoules de 100 watts est slectionner un lment de = [0, + [12 .
Cet ensemble est appel lespace des observables. On dit aussi dans la littrature
lespace chantillon, lespace des vnements - lmentaires, lexprimental ou encore
lvnementiel. Ses points sont appels observables ou vnements-lmentaires. Il
est trs important quil soit clairement dfini. On peut sexercer dfinir dans les 2
cas suivants : jeter 12 fois de suite la mme pice de monnaie, jeter en mme temps
12 pices de monnaie identiques (on admet que la pice tombe sur pile ou sur face, et
jamais sur la tranche).
1.3
Les questions quon se pose sur le rsultat dune exprience sont systmatiquement
du type suivant: on choisit un sous ensemble A de lespace dobservables et on se
demande: le rsultat de lexprience va-t-il tomber dans A ou non? Les parties de
pour lesquelles on se pose ce genre de question sont appeles des vnements. Un
des premiers points dlicats de la thorie est que on ne va pas toujours considrer tous
les sous ensembles de comme des vnements. Dans lexemple de la lampe de 100
watts, il parait inintressant de se demander si sa dure de vie, mesure en heures, est
un nombre irrationnel, et intressant de se demander si elle tombe dans lintervalle
[300,400]. Lide de Kolmogorov est que lensemble A des vnements a une structure
de tribu:
Dfinition Soit un ensemble et soit A une partie de P(). A a une structure de
tribu si il satisfait aux trois axiomes:
1. Si A A, alors son complmentaire Ac = \ A est aussi dans A.
2. Si on a une suite
S finie ou dnombrable A1 , . . . ,An , . . . dlments de A, alors
leur runion n1 An est aussi dans A.
3. Lensemble vide est dans A.
Un lment de A est appel un vnement.
Tirons quelques consquences de ces axiomes.
Proposition 1.1 Soit A une tribu de parties de lensemble . Alors A. De
plus, si on a une
T suite finie ou dnombrable A1 , . . . ,An , . . . dlments de A, alors leur
intersection n1 An est aussi dans A.
Dmonstration En appliquant les axiomes 1 et 3, on a le premier rsultat. Pour
le second, il suffit de se rappeler que le complmentaire dune runion finie ou infinie
densembles est lintersection des complmentaires ("Loi de Morgan"). Donc
\
[
An = (
Acn )c ,
n1
n1
Le langage de la thorie des ensembles permet des calculs systmatiques sur les
vnements. Toutefois, il faut savoir que le langage courant, que nous utilisons dans
une premire tape pour dcrire des vnements a sa traduction ensembliste. Voici un
petit dictionnaire :
Ensemble :
vnement certain
2
www.L es-M athematiques.net
1.4. LA PROBABILIT P
Ensemble vide:
vnement impossible
A B:
A ou B sont raliss ("ou" non exclusif)
A B:
A et B sont raliss
A et B sont disjoints: les vnements A et B sont incompatibles
Ac = \ A:
vnement contraire de A.
1.4
La probabilit P
3
www.L es-M athematiques.net
1.4. LA PROBABILIT P
dans [0,1] , donc un procd qui associe tout vnement A un nombre P (A) compris
entre 0 et 1 appel probabilit de A, et qui satisfait aux axiomes suivants
L vnement certain est de probabilit 1: P () = 1.
Axiome dadditivit dnombrable: pour toute suite A1 ,A2 , . . . ,An . . . dvnements de A qui sont de plus deux deux disjoints, cest dire tels que Ak Aj =
si k 6= j, alors la srie
X
P (Ak )
k=1
S
converge et a pour somme P ( k1 Ak ).
Le triplet (,A,P ) est alors appel un espace de probabilit.
Voici quelques consquences immdiates des axiomes.
Thorme 1.2 Soit (,A,P ) un espace de probabilit. Alors
1. P () = 0.
2. Si A1 ,A2 , . . . ,An dans A sont deux deux disjoints, alors
P (A1 An ) = P (A1 ) + + P (An );
en particulier P (Ac ) = 1 P (A).
3. Si A et B sont dans A et si A B alors P (A) P (B).
Dmonstration
1) Laxiome dadditivit dnombrable est appliquable la suite constante dfinie
par An = , qui est effectivement forme dvnements deux deux disjoints. La srie
dont le terme gnral P () est constant ne peut converger que si ce terme gnral est
0.
2) Sa premire partie se dmontre en appliquant laxiome dadditivit dnombrable
A1 ,A2 , . . . ,An continue par = An+1 = An+2 = , et en utilisant le 1). Appliquer a n = 2, A1 = A et A2 = A0 fournit 1 = P () = P (A) + P (Ac ) en utilisant
le premier axiome dune probabilit.
3) On crit B = A (B \ A) comme runion de deux ensembles disjoints (notez
que B\A = BA0 est bien dans A), et on applique le 2): P (B) = P (A)+P (B\A)
P (A).
Thorme 1.3 Soit (,A,P ) un espace de probabilit. Alors
1. Si A et B sont dans A, mais ne sont pas ncessairement disjoints, alors
P (A B) = P (A) + P (B) P (A B).
Si les A1 ,A2 , . . . ,An dans A ne sont pas ncessairement deux deux disjoints,
alors
P (A1 An ) P (A1 ) + + P (An ).
2. Continuits croissante et dcroissante: Soit une suite B1 ,B2 , . . . ,Bn . . . dvnements de A qui soit ou bien croissante (cest dire que pour tout n 1 on
4
www.L es-M athematiques.net
1.4. LA PROBABILIT P
n1
n+
Bn ).
n1
A1 ,A2 , . . . ,An . . . sont alors deux deux disjoints. La srie k=1 P (Ak ) est
donc convergente. Daprs la partie 2) de la proposition prcdente, on a
P (Bn ) = P (A1 An ) =
n
X
P (Ak )
k=1
n+
P (Ak ).
k=1
S
Or daprs laxiome dadditivit dnombrable,
S le second membre est P ( k1 Ak ),
qui est aussi par dfinition des An gal P ( n1 Bn ).
Dans le cas dcroissant, on se ramne au cas prcdent par passage au complmentaires, laide de la loi de Morgan: le complmentaire dune union est
lintersection des complmentaires:
lim P (Bn ) = 1 lim P (Bnc ) = 1 P (n1 Bnc ) = 1 (1 P (n1 Bn )) =
P (n1 Bn ).
5
www.L es-M athematiques.net
1.4. LA PROBABILIT P
n1
n+
P (Bk ).
k=1
Montrer qualors f est une probabilit. Mthode: si (An ) est une suite dvnements deux deux disjoints, considrer
Bn = kn+1 Ak .
6
www.L es-M athematiques.net
Chapitre
2.1
Dans ce cas on suppose habituellement que la tribu des vnements A est P(),
lensemble de toutes les parties de . Par exemple, si est form de 2 lments nots
a et b, alors P() est constitu des 4 sous ensembles suivants: lensemble vide , les
deux singletons {a} et {b} et = {a,b} lui mme. Plus gnralement, on a le fait
suivant:
Proposition 2.1 Si un ensemble a un nombre fini N dlments, alors lensemble des parties de : P() a 2N lments.
Dmonstration On procde par rcurrence sur N . Cest trivial pour N = 1 ou 0.
Si cest vrai pour N , considrons
= {a1 , . . . ,aN ,aN +1 } et 0 = {a1 , . . . ,aN }.
Les parties de se partagent en deux catgories:
Catgorie 1: celles qui ne contiennent pas aN +1 .
Catgorie 2: celles qui contiennent aN +1 .
Il est clair que la catgorie 1 est gale P(0 ) et que la catgorie 2 est en bijection avec P(0 ), la bijection tant obtenue en ajoutant aN +1 aux lments de P(0 ).
Comme daprs lhypothse de rcurrence P(0 ) a 2N lments, on en conclut que
P() a 2N + 2N = 2N +1 lments, et la rcurrence est tendue.
Proposition 2.2 Si est infini dnombrable, alors P() est infini non dnombrable.
Dmonstration La dmonstration est analogue la dmonstration de Cantor. Sans
perte de gnralit on suppose gal lensemble N des entiers positifs ou nuls. Si
7
px .
xA
de la srie n=0 pxn . Toutefois, ce nombre ne dpend que de A, et non de la numro au thorme suivant sur les sries,
tation particulire de A choisie par n 7 xn , grCce
que nous admettrons, ainsi que la proposition elle mme:
P
Thorme 2.4 Si la srie n=0 un est absolument
convergente de somme S, et si
P
n 7 (n) est une bijection de N sur lui mme, alors n=0 u(n) est aussi absolument
convergente et de somme S.
Exercices sur 2.1.
1. Soit > 0. Soit P la probabilit dfinie sur (N,P(N)) par
P ({n}) = e
n
.
n!
Soit A lensemble des nombres pairs. Calculer P (A). Soit N un entier, montrer
que
Z
tN
P ({0,1, . . . ,N }) = 1
et dt
N!
0
8
www.L es-M athematiques.net
(Mthode: considrer les deux membres comme des fonctions de dont on montrera quelles ont mme valeur pour = 0 et mme drive).
2. Soit P la probabilit dfinie sur (N ,P(N )) par P ({n}) = 2n . Calculer la
probabilit de tirer un nombre n > 3; un nombre n multiple de 3; un nombre
dont le reste est 3 si on le divise par 4.
2.2
Le cas quiprobable.
|A|
nombre de cas favorables
=
.
||
nombre de cas possibles
Pour exploiter cette galit, il est ncessaire de possder quelques principes gnraux de dnombrement densembles et de fonctions contenus dans les deux prochains
thormes. Si E et F sont des ensembles, on note par E F leur produit cartsien,
cest--dire lensemble des couples (x,y) tels que x E et y F. On note par F E
lensemble des fonctions f dfinies sur E et valeurs dans F. Si E est fini et est de
taille n = |E| et si k est un entier avec 0 k n on note par Pk (E) lensemble des
parties de E de taille k.
Thorme 2.5
1. Si E et F sont des ensembles finis, alors |E F | = |E||F |. Plus gnralement,
si F1 , . . . ,Fn sont des ensembles finis: |F1 Fn | = |F1 | |Fn |. Ensuite
|F E | = |F ||E| . Enfin, si p = |F | n = |E|, le nombre de fonctions injectives
de E vers F est p(p 1)(p 2) (p n + 1). En particulier, le nombre de
fonctions bijectives de E vers E, appeles permutations de E, est gal n!
2. Si E est fini et est de taille n = |E| et si k est un entier avec 0 k n alors
|Pk (E)| = Cnk =
n!
n(n 1) (n k + 1)
=
.
k!(n k)!
k!
Dmonstration
1. La premire formule est vidente : si e1 , . . . ,en et f1 , . . . ,fp sont les lments
de E et F , le nombre de couples (ei ,fj ) est np. Lextension n facteurs est
immdiate galement. Cette extension est ensuite applique au cas particulier o
tous les ensembles Fj sont gaux au mme ensemble F. Si |E| = n, il y a alors
bijection entre F E et F F (n fois). Do |F E | = |F | |F | =
|F |n = |F ||E| . Quant au nombre de fonctions injectives, la formule donne se
justifie facilement: on identifie E (1,2, . . . ,n), et limage de 1 peut occuper p
positions, limage de 2 peut occuper une des p 1 positions restantes, limage
de 3 une des p 2 positions restantes, etc. Faire E = F pour le nombre de
permutations de E (on rappelle que si |E| = |F | avec E fini, alors une fonction
f de E vers F est injective si et seulement si elle est surjective).
9
www.L es-M athematiques.net
Dmonstration
Cnk1 + Cnk =
1
1
(n + 1)!
n!
k
+
=
= Cn+1
.
(k 1)!(n k)! n k + 1 k
k)!(n + 1 k)!
Pour prouver 2) on observe que cest trivial pour k = 0, puis on fixe k > 0 et on
montre 2) par rcurrence sur n. Cest trivial pour n = k. Supposons enfin 2) vrai pour
n et supposons que E ait n + 1 lments, quon prend gaux 1,2, . . . ,n + 1 sans
perte de gnralit. Soit aussi E 0 lensemble des n premiers entiers. On partage alors
les lments de Pk (E) en deux catgories:
Catgorie 1: ceux qui ne contiennent pas n + 1.
Catgorie 2: ceux qui contiennent n + 1.
La catgorie 1 est gale Pk (E 0 ) et a donc Cnk lments par lhypothse de rcurrence. La catgorie 2 est en bijection avec Pk1 (E 0 ) ( enlever n + 1 un membre de la
catgorie 2 pour avoir un lment de Pk1 (E 0 )) et donc par lhypothse de rcurrence
k
a Cnk1 lments. La formule de Pascal montre alors que Pk (E) a Cn+1
lments et la
rcurrence est tendue.
Voici un exemple dapplication du thorme prcdent.
Proposition Anniversaires. n personnes sont runies. Quelle est la probabilit que
au moins deux dentre elles aient le mme anniversaire?
On formalise le problme en le simplifiant un peu: on ignore dabord le problme
du 29 fvrier, et on postule donc que lespace des observablesest = F E o E est
lensemble des personnes et o F est lensemble des p = 365 jours de lanne: on
observe donc la fonction f qui chaque personne associe son anniversaire. On
postule ensuite quon est dans le cas quiprobable, ce qui nest quune approximation:
il y a plus denfants conus au printemps et en t quen novembre sous nos climats.
Finalement, il est plus facile de calculer la probabilit du complmentaire Ac de lvnement A "deux personnes au moins ont le mme anniversaire", car cest la probabilit
que la fonction f soit injective. Daprs le thorme 2.5 1), cest
P (Ac ) =
n1
n1
Y
X
1
k
k
365(3651)
(365n+1)
=
(1
)
=
exp
log(1
).
n
365
365
365
k=1
k=1
Si n nest pas grand, une valuation approximative de cette somme se fait en remplaant
log(1 x) par x et en utilisant la somme dune progression arithmtique tudie en
Terminale
n1
X
1
k = n(n 1) n/2,
2
k=1
10
www.L es-M athematiques.net
qui conduit lapproximation P (Ac ) exp(n/730). Pour voir par exemple pour
quel n on a P (Ac ) 1/2 on prend n 730 log 2 23. Pour un calcul plus srieux,
on peut utiliser lencadrement pour 0 < x < 1 :
x
x
< log(1 x) < x ;
2(1 x)
2
k2 =
k=1
1
n(2n 1)(n 1) n3 /3,
6
n(n 1)(2n + 1)
1
365
n(n 1) 1
<
2
2
365
6
2 365 365 n + 1
n(n 1) 1
n(n 1)(2n + 1)
1
.
2
365
6
2 3652
Par exemple, si n = 35 on trouve P (Ac ) = 0,186... Si 35 personnes sont runies,
la probabilit que deux dentre elles au moins aient le mme anniversaire est donc
0,813...
Le prochain thorme sert en particulier rsoudre le problme plus difficile du
calcul du nombre de fonctions surjectives.
log P (Ac ) <
(1)|A\B| f (B).
BA
Dmonstration Si C A E notons
X
F (A,C) =
(1)|A\B| .
CBA
k
Si
Pn|A \ C| =k n,k puisque il y a Cn parties de A \ nC de taille k on peut crire F (A,C) =
est son tour (1 + (1)) cause de la formule du binme de
k=0 (1) Cn , quiP
n
nk k k
Pascal (a + b)n =
b Cn . Donc si n > 0, cest--dire si C 6= A, on a
k=0 a
F (A,C) = 0. Si n = 0, cest--dire si C = A on a F (A,C) = 1. Calculons alors le
second membre de lgalit dmontrer:
X
X
X
(1)|A\B| f (B) =
(1)|A\B|
g(C) =
BA
BA
CB
11
www.L es-M athematiques.net
g(C)
CB
(1)|A\B| =
CBA
CB
BF
p
X
Cpk (1)pk k n .
k=0
n
X
Cnk (1)nk k! =
k=0
n!
n
X
(1)nk
k=0
n!
n
X
1
=
(n k)!
(1)k
k=0
1
.
k!
12
www.L es-M athematiques.net
Si est lensemble des permutations de E et si il est muni de la probabilit quiprobable, la probabilit pour quune permutation alatoire soit sans point fixe est donc
n
X
(1)k
k=0
1
,
k!
2.3
Le schma Succs-Echec.
donc daprs le Thorme 2.5 b), |A| = Cnk . Enfin puisque tous les {} contenus dans
A ont la mme probabilit pk (1 p)nk on obtient
X
P (A) =
P ({}) = |A|pk (1 p)nk = Cnk pk (1 p)nk .
A
14
www.L es-M athematiques.net
des comprenant au moins un succs, alors P (A) = 1. En effet, si Bn est lensemble des comprenant au moins un succs avant linstant n ou linstant n,
alors A = n1 Bn et Bn Bn+1 . Par continuit monotone (Th. 1.3, (2)) on a donc
lim P (Bn ) = P (A). Comme P (B c ) = (1 p)n tend vers 0, on a le rsultat. Plus gnralement on peut montrer que toute squence a finie donne lavance ( par exemple
SSEESSEESSEESSEE, ou le codage en binaire dune fable de La Fontaine) finira par
arriver. Plus prcisment:
Thorme 2.11 Soit a = (a1 , . . . ,an ) {E,S}n une suite fixe de longueur n de
succs et dchecs, et soit
A = { ; il existe N 0 avec N +1 = a1 , . . . ,N +n = an }.
Alors P (A) = 1.
Dmonstration Soit k le nombre de S dans la suite a. Notons
AN = { ; N +1 = a1 , . . . ,N +n = an }.
Alors P (AN ) = pk (1 p)nk par dfinition de P. Introduisons Bm = m1
j=0 Ajn .
Alors Bm Bm+1 et
A = N 0 AN B = m0 Bm .
On a de plus
c
c
k
nk m
P (Bm
) = P (m1
) m 0.
j=0 Ajn ) = (1 p (1 p)
2.4
Le cas o = IR.
Ce cas est naturellement le plus important de tous. La tribu mise sur IR est la tribu
de Borel B dfinie la section 1 comme la plus petite tribu contenant les intervalles
(ouverts, ferms, semi ouverts, demi droites) Parmi ses lments, les borliens, les seuls
quon aura concrtement manipuler sont les runions dintervalles.
Pour dcrire les probabilits sur (IR,B), introduisons une dfinition importante:
Dfinition Soit F une fonction de IR dans IR. On dit que F est une fonction de
rpartition si elle satisfait aux trois proprits suivantes:
F est croissante (au sens large);
limx F (x) = 0 et limx+ F (x) = 1;
F est continue droite en tout point x, cest--dire limh&0 F (x + h) = F (x).
Alors FP est une fonction de rpartition. Inversement, si F est une fonction de rpartition, alors il existe une et une seule probabilit sur (IR,B) telle que FP = F.
Dmonstration Si x < y, alors A =] ,x] B =] ,y], et donc FP (x) =
P (A) P (B) = FP (y). Ensuite, si (xn ) tend vers en dcroissant et si An =
] ,xn ], alors An An+1 et n1 An = ; par continuit monotone P (An ) tend
vers 0. Donc limn FP (xn ) = 0. Comme ceci est vrai quelle que soit la suite (xn )
tendant vers en dcroissant, on en dduit limx FP (x) = 0. De mme, si (yn )
tend vers en croissant et si Bn =] ,yn ], alors Bn Bn+1 et n1 Bn = IR; par
continuit monotone P (Bn ) tend vers P (IR) = 1 et on a limy+ FP (y) = 1.
Enfin, si hn & 0, soit Cn =],x + hn ]. Alors Cn Cn+1 et n1 Cn =],x].
Par continuit monotone on a donc limn+ F (x + hn ) = FP (x), do la continuit
droite annonce de la fonction FP .
Nous admettrons la rciproque, qui est la partie difficile.
Commentaires: Ce rsultat est assez rassurant: bien quon connaisse mal la tribu
B, et donc les probabilits dfinies dessus, il y a en fait bijection entre lensemble de
toutes les probabilits sur IR et lensemble moins abstrait de toutes les fonctions de
rpartition. Mais la dmonstration complte est rserve la 3 me anne.
La fonction de rpartition permet de calculer les probabilits de tous les intervalles.
Pour simplifier, adoptons la notation pour la limite gauche en x de la fonction croissante F :
F (x 0) = lim F (x + h).
h%0
16
www.L es-M athematiques.net
Dfinition Fonctions de rpartition densit. Soit f une fonction positive dfinie sur IR qui ait des discontinuits au plus
R aen un nombre fini de points a1 < a2 <
< aN et qui soit telle que les intgrales aii+1 f (x)dx convergent et satisfassent
N Z
X
i=0
ai+1
f (x)dx = 1,
ai
avec la convention a0 = et aN +1 = +. R
x
On dfinit alors la fonction F par F (x) = f (t)dt. Il est clair que F est une
fonction de rpartition. Ici, elle est de plus continue et, daprs le thorme fondamental
du calcul intgral, elle satisfait F 0 (x) = f (x) pour tout x
/ {a1 , . . . ,aN }. La fonction
f sappelle alors la densit de la fonction de rpartition F .
1
Par exemple f1 (x) = 12 e|x| , f2 (x) = 1 1+x
, f3 (x) = 0 si x 0 et f3 (x) =
si x > 0, quil est plus rapide de dfinir par
1 ex
x
1
f3 (x) = ex 1]0,[ (x),
x
o 1E (x) = 1 si x E et 1E (x) = 0 sinon: la fonction 1E sappellera dsormais
lindicateur de lensemble E. Dernier exemple:
f4 (x) = 1[0,1] (x).
Dans ces exemples, N = 0 pour f1 et f2 , N = 1 pour f3 et N = 2 pour f4 .
Il est important de ne pas confondre les deux fonctions F et f . Pour les exemples ci
dessus de densits, les fonctions de rpartition correspondantes seront respectivement
1 x
1
e pour x 0, F1 (x) = 1 ex ,
2
2
1
1
F2 (x) = + arctan x,
2
F4 (x) = 0 pour x 0, F4 (x) = x pour 0 x 1, F4 (x) = 1 pour 1 x,
F1 (x) =
a
17
www.L es-M athematiques.net
pj .
j;aj A
dont le graphe est celui dune fonction en escalier croissante, o le saut en aj est gal
pj . Ce cas revient un peu au cas o navait quun nombre fini de points, puisquici
P est concentre sur {a1 , . . . ,aN }.
Si on remplace la suite finie prcdente par un ensemble dnombrable de IR, lextension est facile.
Dfinition Probabilit discrte. On sintresse lensemble dnombrable form
des points dune P
suite (an ) telle que a1 < a2 < < an < et soit pn des nombres
X
P (A) =
pn an (A),
1
dont la fonction de rpartition est en escalier croissante vec une infinit de points de
discontinuits.
Dfinition Type mixte. On rencontre un peu rarement des fonctions de rpartition de la forme F = G + (1 )H o G est une fonction de rpartition densit,
comme vu lexemple 1, o H est une fonction de rpartition dune probabilit discrte, comme vu aux exemples 2, 3 ou 4, et o 0 < < 1. Si H a une discontinuit en
a de saut p, alors F a une discontinuit en a de saut (1 )p.
Exercices sur 2.4.
1. Calculer la densit des fonctions de rpartition suivantes:
F1 (x) = 0 si x 0 et F1 (x) = 1 exp(x) si x > 0;
F2 (x) = 0 si x 1 et F2 (x) = 1 x1a si x > 1 (avec a>0).
2. Calculer la fonction de rpartition de la densit suivante:
f (x) = 1/2 si 2 < x < 1, f (x) = 1/2 si 1 < x < 2, et 0 ailleurs.
18
www.L es-M athematiques.net
19
www.L es-M athematiques.net
Chapitre
Probabilits conditionnelles et
indpendance
Par Grard Letac
3.1
Conditionnement
P (A B)
,
P (B)
quon note aussi PB (A) = P (A|B), et qui se lit "probabilit de A conditionne par
B", ou "sachant B", ou "sachant que B est ralis".
(,A,PB ) est un authentique espace de probabilit, puisque PB () = P (
B)/P (B) = 1 et que, si les (An )n1 sont deux deux disjoints et dans A, on a bien
PB (n1 An ) =
X
1
1 X
PB (An ).
P (n1 (An B)) =
P (An B)) =
P (B)
P (B)
n1
n1
Il faut toutefois raliser que la probabilit PB est concentre sur B et ne charge pas
Bc.
Pour noncer le prochain rsultat, il est commode dintroduire un nouveau terme:
+
Dfinition une suite finie (Bn )N
n=1 ou dnombrable (Bn )n=1 dvnements est
appele une partition de si les Bn sont deux deux disjoints et si leur runion est
gale .
Thorme 3.1 Soit (,A,P ) un espace de probabilit, soit (Bn )n1 une partition
de finie ou dnombrable avec P (Bn ) > 0 pour tout n, et soit A A tel que P (A) >
0.
1. Si P (B) > 0, alors P (A B) = P (A|B)P (B) = P (B|A)P (A).
20
n1
P (A|Bn )P (Bn ).
P (A|Bk )P (Bk )
.
n1 P (A|Bn )P (Bn )
P (Bk |A) = P
Dmonstration Cet nonc est dcor du titre de thorme plutt par son importance pratique que par la difficult de sa dmonstration: pour le 1), utiliser la dfinition
de P (A|B). Pour le 2) observer que les
P A Bn forment une partition de A et donc
daprs laxiome dadditivit P (A) = n1 P (A Bn ) et terminer en utilisant le 1).
Pour le 3) on a
X
P (A|Bk )P (Bk ) = P (A Bk ) = P (Bk |A)P (A) = P (Bk |A)
P (A|Bn )P (Bn ),
n1
successivement en utilisant deux fois le 1) puis une fois le 2). Le rsultat est quivalent
au 3).
Exemple: Dans une population le nombre de chtains est de 50%, et le nombre de
blonds, de noirs ou dautres couleurs est gal. La gntique nous apprend que les probabilits conditionnelles pour quun enfant soit chtain (vnement A) sachant que
son pre est blond (vnement B) est P (A|B) = 0,2, et que de mme, avec des
notations videntes P (A|C) = 0,7, P (A|N ) = 0,6 et P (A|R) = 0,1. Calculons
P (A) et P (B|A). Les vnements B,C,N,R forment une partition avec P (B) =
P (N ) = P (R) = 1/6 et P (C) = 1/2. Les probabilits totales donnent donc P (A) =
0,2 1/6 + 0,7 1/2 + 0,6 1/6 + 0,1 1/6 = 1/2 et la formule de Bayes donne
P (B|A) = P (A|B)P (B)/P (A) = 1/15.
3.2
Indpendance dvnements.
Parfois A et B sont tels que PB (A) = P (A): savoir que B est ralis ne modifie
pas la probabilit de A. Ainsi dans le schma succs chec fini avec N = 2, a 4 lments SS,SE,ES,EE de probabilits respectives p,p(1 p),(1 p)p,(1 p). Si B =
(SS,SE) est lvnement: "le premier essai est un succs" et A = (SS,ES) est lvnement: "le second essai est un succs" alors AB = (SS) , P (A) = p+(1p)p = p,
P (B) = p + p(1 p) = p, P (A B) = p et donc PB (A) = P (A). Cest le phnomne essentiel pour les probabilits des vnements indpendants (quil ne faut pas
confondre avec les vnements disjoints) et que nous allons dfinir.
Dfinition Soit {A1 , . . . ,AN } une famille finie dvnements dun espace de probabilit (,A,P ). On dit que cest une famille indpendante ( on dit parfois un "systme indpendant dvnements") si pour toute partie non vide I de {1,2, . . . ,N } on
a
Y
P (iI Ai ) =
P (Ai ).
iI
21
www.L es-M athematiques.net
Par exemple si N = 2, la famille dvnements {A,B} est indpendante si et seulement si P (A B) = P (A)P (B); dans le cas o P (B) > 0 il serait quivalent de dire
PB (A) = P (A). On a coutume de dire par abus de langage que A et B sont indpendants (abus, car ladjectif qualificatif "indpendant" na de sens que sil sapplique
la paire) ou plus correctement que A est indpendant de B, expression qui ne rend
toutefois pas justice la symtrie de la dfinition d indpendance.
Si N = 3 la famille dvnements {A,B,C} est indpendante si et seulement si
P (A B) = P (A)P (B), P (B C) = P (B)P (C), P (C A) = P (C)P (A),
P (A B C) = P (A)P (B)P (C).
Notez que la deuxime ligne nest pas entrane par la premire. Si a 4 points 1,2,3,4
de probabilit 1/4 chacun, les 3 vnements A = 1,2, B = 1,3 et C = 1,4 satisfont la
premire ligne et pas la deuxime: ils sont seulement deux deux indpendants.
Si N est quelconque, il ny a pour montrer lindpendance que 2N 1 N galits vrifier, puisque lensemble vide pour I est exclu et que les N cas o I est un
singleton sont triviaux. Notez aussi que lensemble vide et lensemble sont indpendants de nimporte quoi et quune sous famille dune famille indpendante est encore
indpendante. Enfin, on convient de dire:
Dfinition Une famille infinie dvnements est indpendante si toute sous famille finie est indpendante.
Comme exemple dindpendance de N vnements, considrons dans le schma
succs chec fini avec N essais un lment particulier a = (a1 , . . . ,an ) de , cest-dire une suite particulire de succs et dchecs. Notons k = X(a) le nombre de
succs que comprend la suite a. Soit
Aj = { = (1 , . . . ,N ) ; j = aj }.
Alors {A1 , . . . ,AN } est une famille indpendante. En effet P (Aj ) = p si aj = S
et 1 p si aj = E. De plus, par dfinition du schma, P ({a}) = pk (1 p)nk
QN
N
Comme N
j=1 Aj = {a} on a bien P (j=1 Aj ) =
j=1 P (Aj ). La dmonstration
pour nimporte quel sous ensemble I est analogue.
3.3
22
www.L es-M athematiques.net
(Plus la peine donc dexaminer tous les sous ensembles I.) En fait, cest une puissante gnralisation de la notion dvnements indpendants, daprs le thorme suivant:
Thorme 3.2 Soient A1 , . . . ,AN des vnements. Soient les tribus quatre lments engendres par les Aj :
Aj = {,Aj ,Acj ,}.
Alors la famille de sous tribus {A1 , . . . ,AN } est indpendante si et seulement si la
famille dvnements {A1 , . . . ,AN } est indpendante.
Dmonstration Pour , soit I une partie de (1,2, . . . ,N ). Prenons alors Bj = Aj
si j I et Bj = sinon. Alors
Y
P (iI Ai ) = P (B1 B2 . . . BN ) = P (B1 ) . . . P (BN ) =
P (Ai ).
iI
Bien quune dmonstration par rcurrence soit possible immdiatement pour la rciproque, nous attendons la section 5 pour avoir une dmonstration plus simple.
Exercices sur la section 3.
1. Dans le schma Succs Echec fini N essais,on suppose p = 1/2 et on considre
les deux vnements A= que des succs ou que des checs, et B= pas plus dun
succs. Montrer que A et B sont indpendants si et seulement si N = 3.
2. On munit le segment = [0,1] de la probabilit P telle que P ([a,b]) = b a
pour tout intervalle [a,b] [0,1]. On considre les trois vnements A = [0,1/2],
B = [1/4,3/4], C = [3/8,7/8]. Quelles sont les paires dvnements parmi
A,B,C qui sont indpendantes?
23
www.L es-M athematiques.net
Chapitre
4.1
Fonctions mesurables
Quand en mathmatiques une nouvelle structure est introduite, comme celle despace vectoriel, ou comme prsentement celle despace de probabilit, une dmarche
fconde est de rechercher les transformations qui prservent cette structure. Pour les
espaces vectoriels, ce sont les applications linaires. Pour les espaces de probabilit, ce
sont les "fonctions mesurables" quon va introduire dans un instant. Le cas particulier
important en sera les "variables alatoires". Auparavant, adoptons la notation suivante:
Dfinition si E et F sont des ensembles quelconques, si f est une fonction dfinie
sur E et valeurs dans F , et si enfin B est un sous ensemble de F , lensemble A des x
de E tels que f (x) soit dans B sera dsormais not par A = f 1 (B). Nous lappellerons limage inverse de B par f .
Insistons sur le fait que f nest pas ncessairement injective ni surjective. On vrifie
facilement que:
Proposition Si B1 et B2 sont des sous ensembles de F alors on a
f 1 (B1 B2 ) = f 1 (B1 ) f 1 (B2 ) et f 1 (B1 B2 ) = f 1 (B1 ) f 1 (B2 ).
24
4.2
26
www.L es-M athematiques.net
27
www.L es-M athematiques.net
Chapitre
Lesprance mathmatique
dune variable alatoire
Par Grard Letac
5.1
En fait, E est un espace vectoriel et X 7 IE(X) est une forme linaire positive
dessus, comme le montre le thorme suivant:
Thorme 5.1 (Linarit et positivit de lesprance)
Si X et Y sont des v.a. tages sur alors X + Y , pour des rels et , est encore une v.a. tage. De plus IE(X + Y ) = IE(X) + IE(Y ). Enfin IE(X) IE(Y )
si X Y.
Dmonstration Introduisons les lois de X et Y :
PX = p1 a1 + + pN aN , PY = q1 b1 + + qM bM ,
notons X 1 ({ai }) = Ai , Y 1 ({bj }) = Bj et Cij = Ai Bj et rij = P (Cij ). La
matrice (rij ) a pour somme des lignes le vecteur ligne (q1 , . . . ,qM ) et pour somme des
colonnes le vecteur colonne t (p1 , . . . ,pN ). Les valeurs prises par Z = X + Y sont
28
rij cij =
ij
ai
rij (ai + bj ) =
ij
rij +
X
j
bj
Quant lingalit, il suffit dobserver que IE(X Y ) 0 par dfinition de lesprance et dappliquer ensuite la linarit quon vient de dmontrer.
Dfinition Variable alatoire de Bernoulli. Un exemple particulirement simple
et important de v.a tage est celui o X ne prend que les valeurs 0 et 1, cest dire o
la loi de X est
PX = (1 p)0 + p1 ,
o p [0,1]. Sa loi est appele une loi de Bernoulli. p est appel le paramtre de la
loi de Bernoulli.
Proposition Lesprance dune loi de Bernoulli X de paramtre p est p. Si X est
dfinie sur lespace de probabilit (,A,P ), soit A = { ; X() = 1} alors X = 1A
est lindicateur de A, et on a donc
IE(1A ) = P (A).
Inversement, un indicateur a toujours une loi de Bernoulli.
Nous allons utiliser le thorme prcdent et les indicateurs pour terminer la dmonstration du thorme 3.2. On veut donc montrer que si Bj Aj = {,Aj ,Acj ,}
et si les Aj sont indpendants, alors
P (N
j=1 Bj ) =
N
Y
P (Bj ).
j=1
On le montre en remarquant dabord que dans les 4 cas possibles pour Bj , il existe
deux nombres aj et bj tels que
1Bj = aj + bj 1Aj ;
on prend en effet aj = bj = 0 si Bj est vide, aj = 1, bj = 0 si Bj est plein, aj = 0,
bj = 1 si Bj = Aj , aj = 1, bj = 1 si Bj = Acj . Do le calcul:
P (N
j=1 Bj ) = IE(
N
Y
1Bj ) = IE(
j=1
N
Y
j=1
Y
X Y
(aj + bj 1Aj )) = IE[ (
aj )( bj 1Aj )] =
I
jI c
jI
Y
Y
Y
X Y
X Y
aj )( bj )P (jI Aj ) =
aj )( bj )IE( 1Aj ) =
(
(
I
jI c
jI
jI
jI c
jI
29
www.L es-M athematiques.net
N
N
N
X Y
Y
Y
Y
Y
Y
(
aj )( bj )( P (Aj )) =
(aj + bj P (Aj )) =
IE(1Bj ) =
P (Bj ).
jI c
jI
jI
j=1
j=1
j=1
Dans cette chane de 9 galits, la premire, la cinquime et les 2 dernires sappuient sur le fait que lesprance de lindicateur est la probabilit, la deuxime sur la
dfinition des aj et bj , la troisime et la septime sur un dveloppement algbrique;
enfin, surtout, la quatrime sappuie sur le thorme prcdent et la sixime sur lindpendance des Aj .
5.2
Toutes les variables alatoires ne sont pas tages, mais toutes sont approchables
par des v.a. tages, et cela va permettre de dfinir lesprance dune v.a. quelconque.
Plus prcisment, on a le thorme suivant:
Thorme 5.2 Soit (,A,P ) un espace de probabilit, et X : IR une variable
alatoire positive. Alors
1. Il existe une suite croissante de v.a. tages (Xn ) telle X = limn+ Xn .
2. Si la suite (Xn ) ci dessus est telle que IE(Xn ) soit borne, alors le nombre
lim IE(Xn ) = IE(X)
n+
ne dpend que de X et non de la suite particulire (Xn ), dans le sens que si (Xn0 )
a les proprits demandes (Xn ) au 1), alors la suite IE(Xn0 ) a la mme limite.
IE(X) est lesprance de la variable alatoire positive X.
3. Si Y est une autre v.a positive sur (,A,P ) telle que E(Y ) existe, et si et
sont des nombres 0, alors IE(X + Y ) existe et est gale IE(X) + IE(Y ).
4. Si 0 X Y et si IE(Y ) existe, alors IE(X) existe et IE(X) IE(Y ).
5. Si X 0, alors IE(X) = 0 si et seulement si la loi de X est la probabilit de
Dirac en 0.
Nous omettons la dmonstration, bien que celle ci ne soit pas difficile. Il faut insister sur le fait que lesprance de cette v.a. positive nexiste pas toujours.
Ce thorme dfinit donc IE(X) pour des v.a positives. Pour passer au cas dune v.a
de signe quelconque, voici la dmarche suivre:
Dfinition On considre une v.a. X dfinie sur (,A,P ) et on crit cette fonction
de comme diffrence de deux fonctions positives X = X+ X , o a+ signifie
max(a,0) et a = (a)+ (rappelons que cela implique a = a+ a et |a| = a+ +a ).
Donc |X| = X+ X . On dira que IE(X) existe si, au sens du thorme 5.2, lesprance de |X| existe. Dans ces conditions, daprs le 2) du thorme 5.2, IE(X+ ) et
IE(X ) existent, et on dfinit lesprance de X par IE(X) = IE(X+ ) IE(X ).
On a alors limportante extension du thorme de linarit et de positivit:
30
www.L es-M athematiques.net
Corollaire 5.3 Soit (,A,P ) un espace de probabilit, soit L1 lensemble des variables alatoires X sur cet espace telles que IE(X) existe (ou, de faon quivalente,
telles que IE(|X|) soit finie). Alors L1 est un espace vectoriel et X 7 IE(X) est une
forme linaire sur L1 , telle que de plus IE(X) IE(Y ) si X Y.
Appliquons cela deux cas particuliers importants, celui o X est discrte et positive et celui o la loi de X a une densit.
Proposition 5.4 Soit X une v.a discrte avec
PX =
pj aj
j=1
P
p = 1. Alors lesprance de X, E(X) existe si et seulement si la srie
o
P j=1 j
p
a
j
j est absolument convergente. Sil en est ainsi, alors
j=1
IE(X) =
pj aj .
j=1
Dmonstration
Montrons le dabord si les an sont positifs ou nuls. Alors puisque
P
X =
a
1
,
j} sont deux deux disjoints
j=1 j Aj o les vnements Aj = {X =P
n
dans , il suffit de considrer la v.a. tage Xn =
j=1 aj 1Aj , qui est nulle sur
j=n+1 Aj , et qui dfinit une suite ayant les proprits requises au thorme 5.2. Le
rsultat est alors clair.
) et les deux sries
PSi les an ne sont
Ppas positifs on crit an = (an )+ (anP
j=1 pj (aj )+ et
j=1 pj (aj ) convergent si et seulement si
j=1 pj aj est absolument convergente. Cela permet de conclure facilement.
Proposition 5.5 Supposons que la loi de la v.a. X ait une densit f avec un nombre
fini de points de discontinuits
a1 < . . . < aN . Alors lesprance de X, E(X) existe
R
si et seulement si xf (x)dx est absolument convergente. Sil en est ainsi, alors
IE(X) =
xf (x)dx.
xf (x)dx IE(Xn ) =
n2 Z
X
k=0
xk+1
xk
31
www.L es-M athematiques.net
(x xk )f (x)dx.
R
Soit > 0. Il existe un entier A tel que A xf (x)dx . Soit alors K tel que xK = A
et soit F la fonction de rpartition de X. On partage alors Dn en deux sommes An et
Bn , avec
An =
n2n Z
X
k=K
Bn =
K1
X Z xk+1
k=0
xk+1
(x xk )f (x)dx 2
xk
xf (x)dx 2,
(x xk )f (x)dx =
xk
F (x)dx +
K1
X
(xk+1 xk )F (xk+1 ),
k=0
4
n .
n(n + 1)(n + 2)
n=1
2. Pour quelles valeurs de a > 0 la variable alatoire X ayant pour fonction de
1
rpartition FX (x) = 1 (1+x)
a si x>0, et FX (x) = 0 si x 0, possde-t-elle
une esprance?
5.3
Thorme du transport.
Il arrive souvent quon ait besoin de calculer, non lesprance de la variable alatoire X, mais lesprance dune fonction Y = g(X) de celle ci. Si on applique la
dfinition de lesprance, cela suppose quon calcule la loi de Y , ce qui peut tre trs
incommode. Le rsultat suivant simplifie ce problme.
Thorme 5.6 ( du transport ) Soit X une v.a. sur lespace de probabilit (,A,P ).
Soit x 7 y = g(x) une fonction mesurable de IR dans IR. Si X est tage ou discrte
et de loi
X
PX =
pj aj ,
j1
est absolument convergente, et dans ce cas IE(g(X)) est gale la somme de lintgrale.
Dmonstration On montre dabord le rsultat quand X est tage, puis quand X
est positive en appliquant la dfinition de lesprance dune variable alatoire positive,
et on passe facilement au cas o X est de signe quelconque.
Exercices sur 5.3
1. Soit une variable alatoire X de densit 12 exp(|x|). Soit z un nombre rel et
soit g(x) = exp(zx). Pour quelles valeurs de z Y = g(X) a-t-elle une esprance? La calculer quand elle existe.
2. X une variable alatoire de densit 21 1[1,1] (x) et soit Y = tan( 2 X). Etudier
de deux manires lexistence ventuelle de IE(Y ) : soit laide du thorme du
transport, soit en calculant la densit de Y : pour cela, crire dabord la fonction
de rpartition de Y puis driver.
5.4
Dfinition Soit (X1 , . . . ,XN ) une suite de v.a. sur (,A,P ). On se rappelle que
si B est la tribu de Borel, alors par dfinition des variables alatoires Xj1 (B) = Aj
est une sous tribu de A.
Nous dirons que cest une suite de variables alatoires indpendantes si la famille
de sous tribus {A1 , . . . ,AN } est une famille indpendante.
Ceci entrane un fait simple et utile: si les Xj sont des v.a. indpendantes, et si fj
est une fonction relle quelconque, alors les Yj = fj (Xj ) sont des v.a. indpendantes
aussi.
Dans le thorme suivant, qui sert caractriser lindpendance pratiquement, contentons nous de N = 2 : la gnralisation N > 2 est vidente.
Thorme 5.7 Soit X et Y deux variables alatoires sur (,A,P ). Alors elles sont
indpendantes si et seulement si pour tous x et y rels on a
P (X x; Y y) = FX (x)FY (y) = P (X x)P (Y y).
En particulier, si elles sont discrtes de lois respectives
X
X
PX =
pi ai , PY =
q j bj ,
i1
j1
34
www.L es-M athematiques.net
Chapitre
Moments, fonctions
gnratrices, transformes de
Laplace
Par Grard Letac
6.1
Moments et variance
Thorme 6.1 Soit (,A,P ) un espace de probabilit, et soit n un entier > 0. Soit
Ln lensemble des v.a. X sur cet espace telles que lesprance mn = IE(X n ), appele
moment dordre n, existe. Alors Ln est un espace vectoriel, et on a
L1 L2 Ln .
Dmonstration Puisque f (x) = xn dfinit une fonction convexe sur la demidroite positive, on peut crire pour x et y positif que
(
x+y n
1
) (xn + y n ),
2
2
35
quon vrifie immdiatement en tudiant les cas |X| 1 et |X| 1. Le fait que
Ln1 Ln sen dduit.
Dfinition Le moment centr dordre n de la variable alatoire X est dfini par
IE[(X m1 )n ] o m1 = IE(X) .
Remarquons au passage que si le moment non centr mn existe, alors le moment
centr existe, puisque cest lesprance dun polynme en X de degr n et quon vient
de voir que les moments de degr infrieur n existaient.
Le cas particulier rellement important est le cas o n = 2.
Dfinition Soit X une variable alatoire relle. On appelle le moment centr
dordre 2 de X la variance de X, et sa racine carre positive lcart type de X, encore
appel dviation standard. On note lcart type (X) et la variance ((X))2 , ou plus
rarement V (X).
Insistons sur le fait que lcart type a la dimension de la variable alatoire: si celle
ci sexprime en centimtres, lcart type sexprime en centimtres et la variance en
centimtres carrs. Il faut connatre les deux formules suivantes:
Proposition 6.2 Si X a un moment dordre 2, alors pour rel
2 (X) = 2 2 (X),
et Formule de Huyghens:
2 (X) = IE(X 2 ) (IE(X))2 .
En particulier, (IE(X))2 IE(X 2 ), avec galit si et seulement si la loi de X est une
probabilit de Dirac.
Dmonstration La premire formule est immdiate. Pour Huyghens:
2 (X) = IE(X 2 2m1 X + m21 ) = IE(X 2 ) 2m1 IE(X) + m21 = IE(X 2 ) (IE(X))2 .
Ici on a utilis le fait que lesprance dune constante est la constante elle mme et
que m1 = IE(X). Quant la dernire ingalit elle vient du fait quune variance est
toujours positive ou nulle. Si la variance est nulle, alors appliquant le 5) du thorme
5.2 la v.a. positive Y = (X m1 )2 , alors la loi de Y est 0 et celle de X est donc m1 .
Il y a galement connatre deux ingalits clbres:
Proposition 6.3 Ingalit de Markov Si Y est une variable alatoire positive ou
nulle dont lesprance existe, alors pour tout y > 0 on a
P (Y y)
1
IE(Y ).
y
1 2
(X).
t2
36
www.L es-M athematiques.net
Dmonstration
IE(Y ) = IE(Y 1Y y + Y 1Y <y ) IE(Y 1Y y )
IE(y1Y y ) yIE(1Y y ) = yP (Y y),
ce qui est quivalent lingalit de Markov en divisant les extrmits par y.
On applique ensuite Markov Y = (X m1 )2 et y = t2 . Comme
P (|X m1 | t) = P ((X m1 )2 t2 )
1
1
IE((X m1 )2 ) = 2 2 (X),
t2
t
Dmonstration Procdons par rcurrence sur N . Cest trivial pour N = 1. Montrons le pour N = 2. Notons pour simplifier X = X1 IE(X1 ) et Y = X2 IE(X2 ).
Tous deux sont desprance nulle. Alors
2 (X1 + X2 ) = IE((X + Y )2 ) = IE(X 2 ) + 2IE(XY ) + IE(Y 2 ) = 2 (X1 ) + 2 (X2 ),
car IE(XY ) = IE(X)IE(Y ) = 0 en utilisant lindpendance de X et de Y . Ensuite,
supposons le rsultat vrai lordre N 1. Alors appliquant le rsultat pour N = 2 au
couple X = X1 + + XN 1 et Y = XN , puis lhypothse de rcurrence, on arrive
au rsultat.
En corollaire, on a donc la loi faible des grands nombres qui dit que en un certain
sens, si des variables alatoires sont indpendantes et de mme loi, alors leur moyenne
arithmtique tend vers leur esprance commune. Plus prcisment:
Thorme 6.5 Loi faible des grands nombres Soit X1 ,X2 , . . . une suite infinie
de v.a. indpendantes et de mme loi, et possdant un second moment. Alors, pour tout
nombre > 0 fix on a
X1 + + Xn
lim P |
IE(X1 )| = 0.
n
n
Ici on a utilis successivement les propositions 6.2 puis 6.4, puis le fait que les Xj sont
de mme loi et ont donc mme variance. Appliquons alors lingalit de Tchebychev
X = Sn /n et t = ; on obtient
1
X1 + + Xn
IE(X1 )| 2 2 (X1 ),
P |
n
n
qui tend bien vers 0 pour fix.
Commentaires: limportance philosophique de la loi des grands nombres est non
ngligeable: elle justifie la dmarche que nous avons adopte pour modliser le calcul
des probabilits. Lide dexprience dcrite au dbut de ce cours est la slection dun
point dans un espace dobservables , mais par un procd susceptible dtre rpt
ad libitum et dans les mmes conditions. Soit S une partie de , comptons le nombre
de fois o S est ralis en n essais, divisons ce nombre par n et notons par fn la fraction, ou la frquence, ainsi obtenue. Lide de probabilit est base sur la constatation
physique que la suite des fn converge vers un nombre P (S) quon appellera probabilit de S. Si la thorie est bien faite, cest dire si les axiomes sont bien choisis, on doit
retrouver cette constatation physique quelque part ltat de thorme dans la thorie
dveloppe partir de ces axiomes. Cest leQ
cas. En effet, le initial dcrivant une
exprience est remplac par un produit infini j=1 j o les j sont identiques l
initial, et sont les rsultats possibles de lexprience rpte linstant j. Les points de
ce produit sont donc des suites infinies = (j )
j=1 . Quant la probabilit sur le produit, elle est telle que toutes les fonctions fj () = j soient indpendantes. Ceci fait,
notons Xj () = 1 si j S et Xj () = 0 sinon. On a une suite de v.a. de Bernoulli
indpendantes et de mme loi desprance p = P (S). La loi faible des grands nombres
dit que fn = n1 (X1 + + Xn ) converge vers P (S), dans le sens dcrit au thorme
6.5. Il existe un thorme avec une conclusion plus prcise, appel loi forte des grands
nombres, que nous exposons maintenant.
Thorme 6.6 loi forte des grands nombres Soit X1 , . . . ,Xn , . . . des variables
alatoires de Bernoulli indpendantes et de mme loi q0 + p1 , avec 0 < p = 1 q <
1. Alors
1
Pr( lim (X1 + + Xn ) = p) = 1.
n n
Dmonstration Elle sappuie sur le lemme de Borel:
Lemme de Lebesgue Si (An )n1 est une suite dvnements telle que
converge, alors Pr(k1 nk An ) = 0.
n1
Pr(An )
La dmonstration de ce lemme est peu prs triviale: Puisque la suite (rk )k1 des
restes de la srie convergente tend vers 0 et que pour tout entier k on peut crire
X
Pr(k1 nk An ) Pr(nk An )
Pr(An ) = rk ,
nk
1
(X1 + + Xn ) p ,
n
38
39
www.L es-M athematiques.net
A laide dun nombre s > 0 arbitraire, nous donnons dabord une autre prsentation de
cet vnement:
1
An = {( (X1 + + Xn ) > p + } = {es(X1 ++Xn ) > esn(p+ }.
n
On applique alors lingalit de Markov (proposition 6.3) Y = es(X1 ++Xn ) et
y = esn(p+) . On en tire
Pr(An )
=
=
=
=
1
IE(Y )
y
esn(p+) IE(es(X1 ++Xn ) )
(es(p+) IE(esX1 ))n
(es(p+) (q + pes ))n
(qesps + pesqs )n .
Insistons sur le fait que cette ingalit est valable pour tout s > 0. Observons alors
quil existe des valeurs de s telles que s 7 (s) = qesps + pesqs soit < 1. Une
manire de le voir est de calculer (0) = 1 et 0 (0) = . Cela entrane videmment,
puisque = 0 (0) = lims0 (1 (s))/s, quil existe s0 > 0 proche de 0 tel que
r = (s0 ) < 1. Comme > 0 cela termine la dmonstration.
Exercices sur 6.1
1. Soit X une variable alatoire telles que 0 X 1. Montrer que 2 (X) 14 .
Mthode: si m = IE(X), crire
1
1
(X m)2 = ( m)2 + X(1 X)
4
2
et prendre lesprance de chaque membre.
6.2
Nous allons nous concentrer pour un moment sur les variables valeurs dans lensemble N des entiers 0. Dans ce cas les moments seront plus faciles calculer grce
lintroduction de la notion de fonction gnratrice de X :
Thorme 6.6 Soit X une v.a. valeurs dans N de loi PX =
dsigne par fX (z) la somme de la srie entire
+
X
P+
n=0
pn n . On
pn z n
n=0
1
2. Pour tout n on a pn = n!
fX (0). En particulier, la connaissance de fX donne la
connaissance de la loi de X.
40
www.L es-M athematiques.net
IE(X(X 1) (X n + 1)) =
(n)
fX (1)
k(k 1) (k n + 1)pn ;
k=n
0
00
0
en particulier IE(X) = fX
(1), IE(X 2 ) = fX
(1) + fX
(1).
4. Si X1 ,X2 , . . . ,XN sont des variables alatoires indpendantes valeurs dans N
et si S = X1 + X2 + + XN alors pour |z| 1:
z
n=0
n=0
P+
Or si 0 z 1 on a 1 + z + + z n1 n. Comme n=0 npn converge la srie
prcdente converge normalement et sa limite est pour z tendant vers 1 est IE(X).
0
Inversement, supposons que la drive gauche en 1, note fX
(1) existe. Appliquons le thorme des accroissement finis lintervalle [z,1] et la fonction fX . Il
existe donc c ]z,1[ tel que
+
X
1 fX (z)
0
= fX
(c) =
npn cn1 .
1z
n=1
Ceci tend vers une limite finie si z croit vers 1 par hypothse. Il est clair puisque c tend
vers 1 avec
z, que cette limite est suprieure ou gale toutes les sommes partielles de
P+
la srie n=0 npn , ce qui prouve que cette srie converge. Enfin, trivialement,
+
X
pn cn1
n=1
+
X
npn ,
n=1
0
ce qui montre finalement que fX
(1) = IE(X).
Le 4) est une consquence immdiate du fait que si les Xj sont indpendants, alors
les z Xj sont indpendants, et que lesprance du produit de variables indpendantes est
le produit des esprances:
N
X
k
CN
(1 p)N k pk k .
k=0
X
n
e n .
n!
n=0
Sa fonction gnratrice est f (z) = exp((z 1)), son esprance et sa variance sont
toutes deux gales .
On remarque que si X et Y sont indpendantes et de lois respectives P et P ,
alors la loi de X + Y est P+ , comme on le voit par la fonction gnratrice.
La manire la plus courante de rencontrer cette loi de Poisson dans la nature est en
tant quapproximation de la loi binomiale. En effet, la suite de lois BN,/N tend vers
P dans le sens suivant: pour tout entier k on a
lim BN,/N ({k}) = P ({k}).
42
www.L es-M athematiques.net
N (N 1) (N k + 1)
N k k
)
( ) =
(1 )k (1 )N .
k
N
N
N
N
k!
N
Si ensuite on sintresse au temps dattente Tk du k ime succs, il est intuitivement clair, bien que pas si facile montrer rigoureusement, que cest la somme de k
variables alatoires indpendantes I1 , . . . ,Ik , de mme loi que T1 : la v.a. Ik reprsente
lintervalle de temps entre les k 1 ime et k ime succs. La fonction gnratrice est
pz
donc fTk (z) = ( 1(1p)z
)k , la moyenne k/p et la variance k(1 p)/p2 . Toutefois,
la loi de Tk est concentre sur les entiers suprieurs ou gaux k, et il y a avantage
en vue dune gnralisation considrer plutt la loi de Tk k, concentre sur N, de
fonction gnratrice
fTk k (z) = (
X
p
1
)k =
k(k + 1) (k + n 1)pk (1 p)n z n ,
1 (1 p)z
n!
n=0
1
k(k + 1) (n 1)pk (1 p)nk =
(n k)!
k1 k
Cn1
p (1 p)nk ,
43
www.L es-M athematiques.net
X
1
( + 1) ( + n 1)p (1 p)n n .
n!
n=0
Une variable alatoire X qui suit une telle loi est donc telle que si n N :
P (X = n) =
1
( + 1) ( + n 1)p (1 p)n ,
n!
p
sa fonction gnratrice est fX (z) = ( 1(1p)z
) , sa moyenne est (1 p)/p et sa
variance est (1 p)/p2 .
ayant
au moins un zro rel, et que fX+Y (z)/z 2 na que des zros imaginaires.
2. Une fonction gnratrice fX est telle que fX (z) = (1 1 z)/z. Quelle est
la probabilit pour que X = n? Est ce que IE(X) existe?
3. Soit X et Y deux variables alatoires indpendantes qui suivent des lois de Pascal pas ncessairement identiques. Soit Z = min(X,Y ). Calculer pour n fix
P (X > n, P (Y > n), P (Z > n), P (Z = n). Montrer que Z suit une loi de
Pascal. Exprimer sa moyenne en fonction des moyennes de X et Y .
6.3
Thorme 6.7 Soit X une variable alatoire. Soit IX lensemble des z rels tels
que LX (z) = IE(ezX ) existe. La fonction z 7 LX (z) dfinie sur IX est appele la
transforme de Laplace de X. Alors
1. Lensemble IX est un intervalle contenant 0.
2. Si 0 est dans lintrieur de IX , la transforme de Laplace est dveloppable en
(n)
srie entire et les coefficients de cette srie sont les LX (0)/n! = IE(X n )/n! :
LX (z) =
X
IE(X n ) n
z .
n!
n=0
44
www.L es-M athematiques.net
N
X
X
X
(Xz)n
IE(X n ) n
(Xz)n
z = IE(exp(zX)
LX (z)
= IE(
n!
n!
n!
n=0
IE
n=0
X
|Xz|n
n!
= IE exp |zX|
n=N +1
n=N +1
N
X
|Xz|n
n!
n=0
= IE(YN ).
La variable alatoire YN dcroit vers 0: un thorme de 3me anne dit que cela
suffit pour entraner que limN IE(YN ) = 0; ce qui achve la dmonstration du 2).
La partie 3) est beaucoup plus difficile et nous admettrons ce rsultat.
La partie 4) est une consquence du thorme 5.8 appliqu N = 2 et (X1 ,X2 ) =
(exp(zX), exp(zY )). La partie 5) est immdiate.
A cause du 2) on appelle parfois la transforme de Laplace la fonction gnratrice
des moments. Cest viter, pour ne pas confondre avec la fonction gnratrice dune
variable alatoire X valeurs dans N. Dailleurs, pour un tel X, les deux notions sont
relies par fX (exp z) = LX (z) et lintrieur de IX est alors ] , log R[ o R est le
rayon de convergence de la srie entire de somme fX . Les transformes de Laplace
sont surtout utilises pour caractriser des v.a. densit. Nous en donnons 3 exemples
importants.
Dfinition - Proposition La loi normale Nm,2 . Cest la loi la plus importante
du calcul des probabilits. On lappelle aussi une loi gaussienne, une loi de LaplaceGauss, ou encore une seconde loi de Laplace. Si m IR et si > 0, elle est dfinie par
sa densit:
1
(x m)2
exp
.
2 2
2
Le fait que ce soit une densit de probabilit nest pas vident, car il faut vrifier
que lintgrale de cette fonction > 0 est 1. Si on ladmet pour le cas m = 0 et = 1,
on se ramne facilement ce cas particulier en posant x = y + m. Cette remarque
permet alors de montrer que la transforme de Laplace dune variable alatoire Y de
loi N0,1 est
Z +
y2
z2
1
LY (z) = IE(ezY ) =
e 2 +zy dy = e 2 .
2
Pour voir cette dernire galit il suffit dcrire que la densit de Nz,1 est dintgrale 1.
Remarquons que lintervalle dexistence est IY = IR
45
www.L es-M athematiques.net
Ensuite, on remarque que si Y est de loi N0,1 , alors X = Y + m est de loi Nm,2 .
Pour le voir, il suffit dcrire la fonction de rpartition de X de la manire suivante:
FX (x) = P (Y + m x) = P (Y
xm
xm
) = FY (
);
on drive alors les deux membres extrmes de la ligne ci dessus: gauche on obtient
la densit cherche de X, droite en utilisant le thorme de drivation des fonctions
y2
composes et le fait que la densit de Y est par hypothse 12 e 2 : ceci fournit pour
X la densit de la loi Nm,2 comme annonc.
Enfin, pour avoir la transforme de Laplace de X partir de Y on utilise le 5) du
thorme 6.7 pour obtenir que si X est de loi Nm,2 , alors
LX (z) = exp(
2 z2
+ mz).
2
intervalle [a,b] on a
lim P
X Np
a p
b
N p(1 p)
1
=
2
y2
2
dy.
L XN p (z) = (1 p + p p
N p(1p)
N p(1 p)
N pz
)N exp p
N p(1 p)
46
www.L es-M athematiques.net
N exp
z2
,
2
On la rencontre dans la nature car cest une loi sans mmoire: si X suit une loi
exponentielle de moyenne q et si x et y sont > 0, alors
P (X > x+y|X > y) =
P (X > x + y)
1 F (x + y)
=
= exp(x/q) = P (X > x).
P (X > y)
1 F (y)
Par exemple une ampoule lectrique ne suse pas, et le fait que nous sachions quelle a
dj dur un temps y ne nous donne aucune information pour savoir si elle va durer au
moins un temps x partir de maintenant.
La transforme de Laplace dune variable alatoire X de loi exponentielle existe
1
sur IX =] ,1/q[ et est gale LX (z) = 1qz
. Ceci montre avec le thorme 6.7,
2
2
2), que IE(X) = q, IE(X ) = 2q et, par la formule de Huyghens, que 2 (X) = q 2 .
Si p est un nombre entier positif et si X1 , ,Xp sont des v.a. indpendantes et
1
de mme loi 1,q , la transforme de Laplace de X1 + + Xp est donc ( 1qz
)p sur
] ,1/q[. Comme la transforme de Laplace dtermine la loi, il suffit de montrer (par
une intgration par parties qui permet de faire une rcurrence sur p) que
Z +
1
1
exp(zx x/q)q p xp1 dx = (
)p
(p 1)! 0
1 qz
pour en dduire que la densit de X1 + + Xp est
Z +
1
exp(x/q)q p xp1 1]0,+[ (x) :
(p 1)! 0
cest la densit de la loi p,q .
En fait, comme pour la loi ngative binomiale qui a t obtenue par une interpolation des entiers, il est possible dans la loi p,q de remplacer le paramtre entier par le
paramtre p > 0. Pour cela on introduit une importante fonction de p appele fonction
Gamma dEuler et dfinie pour p > 0 par
Z +
(p) =
exp(x)xp1 dx.
0
Une intgration par parties montre que (p + 1) = p(p). Comme (1) = 1 on en tire
que si p est entier (p) = (p 1)!: cette fonction Gamma interpole les factorielles.
On dfinit alors la loi p,q pour p > 0 non ncessairement entier par sa densit :
Z
1 +
exp(x/q)q p xp1 1]0,+[ (x)
0
1
qui a pour transforme de Laplace ( 1qz
)p . On dduit de cette transforme de Laplace
que la moyenne est pq et que la variance est pq 2 . On appelle p le paramtre de forme
47
www.L es-M athematiques.net
et q le paramtre dchelon. En effet, on voit facilement, soit avec les fonctions de rpartition, soit avec les transformes de Laplace, que si X est de loi p,1 alors qX est
de loi p,q . Changer q est un simple changement dunits de mesure, changer p change
de faon importante lallure de la densit.
Dfinition - Proposition La loi uniforme sur [a,b]. Cest la loi U[a,b] , de den1
sit ba
1[a,b] (x). Sa fonction de rpartition F (x) est nulle si x < a, gale
x [a,b] et gale 1 si x > b.
xa
ba
si
Il est facile de voir que si X est de loi U[0,1] alors Y = a + (b a)X est de loi
U[a,b] (on dit aussi que Y est uniformment rpartie sur [a,b]). La transforme de Laplace nest pas spcialement remarquable. Pour U[0,1] , cest L(z) = z1 (ez 1) si z 6= 0
et L(0) = 1 Le moment dordre n pour U[0,1] sobtient directement partir de la dfinition : cest 1/(n + 1). Les variables uniformes sont intensment utilises en simulation.
48
www.L es-M athematiques.net
Chapitre
Appendice 1: Grandes
dviations
Par Grard Letac
que lintervalle des rels satisfaisant L() = ex (dx) < ait un intrieur
non vide. On considre la fonction strictement convexe sur gale k = log L et
lintervalle ouvert M = k 0 (), et on note par : M la fonction rciproque de
k0 .
Soit m = k 0 () fix dans M et X1 , . . . ,Xn sont des variables alatoires indpendantes et de mme loi exk() (dx). Soit enfin a M avec m < a et les nombres
un
h(m,a)
1
Pr( (X1 + + Xn ) a)
n
Z a
=
(a x) 0 (x)dx = a((m) (a)) + k((a)) k((m)).
= eh(m,a) .
Commentaires: 1) Une insupportable confusion rgne dans la littrature denseignement concernant ce rsultat, d Cramer (1938), principalement cause de ses gnralisations des hypothses plus faibles (et peu intressantes) dans IR ainsi qu IRd ,
o les rsultats nont pas lharmonie du rsultat ci dessus.
2) Dans sa prsentation, le thorme fait jouer un rle symtrique toute la famille
de lois de probabilits exk() (dx) quand varie dans . Cette famille est appele
49
une famille exponentielle naturelle engendre par . Attention, nest pas unique: 0
engendre la mme famille exponentielle, cest dire le mme ensemble de probabilits, indpendamment du paramtrage, si et seulement si il existe a et b rels tels que
0 (dx) = eax+b (dx). Il est clair que la loi dune variable alatoire relle X telle quil
existe > 0 avec IE(e|X| ) < appartient une famille exponentielle naturelle: il
suffit de prendre pour la loi de X. Toutefois, pour la loi de X donne, souvent avec un
paramtre, il nest pas toujours apparent de relier cette loi avec la famille exponentielle
laquelle elle appartient. Par exemple la loi de Bernoulli (1 p)0 + p1 appartient
e
la famille exponentielle engendre par = 0 + 1 : prendre p = 1+e
.
3) Implicitement, lnonc utilise des rsultats simples comme le fait que soit
un intervalle et comme la convexit de k, qui se dmontrent comme le 1) et le 6) du
thorme 6.7 du cours de Deug. De plus, il est facile de voir que avec les notations du
thorme, lesprance des Xi est m = k 0 () et leur variance est k 00 () = 1/ 0 (m).
4) La partie 2) du thorme est plus difficile. La partie 1) est comme on va le
voir amusante et lmentaire. Elle fournit une dmonstration de poche de la loi forte
des grands nombres qui affirme que si X1 , . . . ,Xn , . . . sont des variables alatoires
indpendantes et de mme loi de moyenne m, alors Pr(limn Sn /n = m) = 1. Si
on fait lhypothse suplmentaire de lexistence de moments exponentiels, cest dire
quil existe > 0 avec IE(e|Xn | ) < , alors lingalit des grandes
dviations et le
P
critre de Cauchy, du fait que h(m,a) < 0, entraine que la srie un converge, et on
procde alors comme au Thorme 6.6 du cours pour conclure avec le lemme de Borel.
5) Travaux pratiques: Voici quelques mesures classiques, et les lois et les fonctions h(m,a) qui vont avec.
Loi de Bernoulli: = 0 + 1 , L() = 1 + e , = IR, k() = log(1 + e ),
e
m
k 0 () = 1+e
, M =]0,1[, (m) = log 1m , k((m)) = log(1 m) et
h(m,a) = a log
a
1a
+ (1 a) log
.
m
1m
P 1
Loi de Poisson: = n=0 n!
n , L() = exp e , = IR, k() = e , k 0 () = e ,
M =]0,[, (m) = log m, k((m)) = m et
h(m,a) = a log
m
+ a m.
a
1
1
Loi gamma: Soit > 0 fix. = ()
x1 1]0,[ (x)dx, L() = ()
si =]
0
,0[, k() = log(), k () = , M =]0,[, (m) = m , k((m)) = log m
et
a
a
h(m,a) = + log .
m
m
2 2
2 ,
1
2
2 2
x
exp( 2
2 )dx, L() = exp(
2 ), = IR,
k 0 () = 2 , M = IR, (m) =
h(m,a) =
m
2 ,
k((m)) =
m2
2 2
et
(a m)2
.
2 2
{Sn /n a} et {etSn enta } sont les mmes (comme la Prop. 6.6). On crit,
laide de lingalit de Markov (voir cours de Deug, Prop. 6.2) applique Y = etSn
et y = enta :
un = Pr(etSn enta ) enta IE(etSn ) = [eta IE(etX1 )]n = [eta
L( + t) n
] .
L()
1/n
51
www.L es-M athematiques.net
s
s
s
s
s1 + (1 )0) t(s1 ) + (1 )t(0).
s1
s1
s1
s1
1
s1 t(s1 ).
Comme
1
1
1
1
p s = exp( log p) exp( log p) = p s1 ,
s
s1
3/4
1
}.
2
On a alors
vnn
3/4
(1)
IE[e( )Vn /n
3/4
(2)
1Vn 0 ]
(3) 1
1
Pr(An Bn ) (Pr(An ) Pr(Bn )).
2
2
Dans cette chane dingalits, (1) vient du lemme appliqu f = e( )Vn 1Vn 0
et au couple s1 = 1 et s = 1/n3/4 , (2) est lingalit de Markov applique Y =
3/4
fn
et y = 1/2, et (3) vient du fait que si A et B sont deux vnements alors
A (A B) B et donc Pr(A B) Pr(A) Pr(B). Faisons
alors tendre n
vers linfini. Daprs le thorme central limite, la loi de Vn / n tend vers une loi
normale centre. On en dduit que Pr(An ) tend vers 1/2 et, puisque Bn est aussi
2 1/4
Vn
Bn = {
(log
}, on en dduit que Pr(Bn ) tend vers 0. Par consquent,
) n
n
3/4
1
la limite infrieure de vnn
est 1/4. Mais lim inf n3/4
log vn log 4 entraine
1
naturellement que lim inf n log vn 0. Comme log vn 0 la limite de n1 log vn est
bien 0 et le thorme des grandes dviations est dmontr.
52
www.L es-M athematiques.net
Chapitre
Cet appendice montre une chose peu connue: cest que la suite des lois binomiales
de paramtres convenables converge vers une loi de Poisson, non seulement faiblement, mais aussi au sens de la convergence en norme de mesures. Cet appendice peut
intresser aussi les tudiants dagrgation qui ont traiter du sujet lois binomiales,
lois de Poisson.
Adoptons les notations suivantes: a dsigne la masse de Dirac en a; si m > 0, on
dfinit la loi de Poisson de moyenne m par
pm (dx) =
em
n=0
mn
n (dx)
n!
Toutefois, un rsultat plus fort est vrai, puisque en fait (bn,m/n )n>m converge fortement vers pm . Sagissant ici de probabilits concentres sur lensemble N des entiers,
cette convergence forte est une convergence dans l 1 (N) et revient affirmer que
n
k
k
X
X
k
m nk m k
m m
m m
kbn,m/n pm k =
C
1
e
+
e
n
n
n
k!
k!
k=0
k=n+1
4m2
.
n
Dmonstration Posons pour simplifier p = m/n ]0,1[ et considrons des variables alatoires (X1 ,Y1 ), . . . ,(Xn ,Yn ) de N2 indpendantes et de mme loi mp dfinie par
mp (0,0) = ep p + pep
mp (0,1) = p pep
mp (1,1) = pep
pn p
mp (n,0) =
e si n 2,
n!
et mp (a,b) = 0 ailleurs. Alors on constate facilement que Xi suit une loi de Poisson et que Yi suit une loi de Bernoulli, toutes deux de moyenne p. Elles ne sont pas
indpendantes, et satisfont lingalit
Pr(Xi = Yi ) = mp (0,0) + mp (1,1) = ep p + 2pep 1 2p2 ,
hrite du fait que ep 1 p pour tout rel p. Notons pour simplifier X = X1 +
+ Xn , qui est donc de loi de Poisson pm , et Y = Y1 + + Yn , de loi binomiale
bn,p . Donc
Pr(X 6= Y )
Pr(ni=1 (Xi
6= Yi )
n
X
Pr(Xi 6= Yi ) 2np2 .
i=1
2m2
.
n
4m2
,
n
n+
1
E(|X (X m)|).
2
1
(k (k m))
(8.2)
2
par un calcul standard et laborieux de dveloppement limit (voir le dtail de ce calcul
dix lignes ci dessous). On est donc fond de penser que
lim ak (n) =
n+
lim
n+
k=0
pk |ak (n)| =
1X
pk |k (k m)|.
2
(8.3)
k=0
Le point dlicat est alors de justifier cette interversion de limites. On va le faire par
convergence domine. Lide pour cela est de considrer pour k fix
1 k
m nk m k
Cn 1
pk
n
n
comme une fonction fk de 1/n, en introduisant donc
fk (h) = (1 h)(1 2h) . . . (1 (k 1)h)(1 mh)k exp[m +
1
log(1 mh)].
h
Cette fonction fk est dfinie sur h > 1/m, et une reformulation de (2) est daffirmer
que fk0 (0) = 12 (k (k m)); on le voit ainsi:
1
fk (h) = [1(1+2+ +k1)h+o(h)][1+kmh+o(h)] exp[m+ (mhmh/2+o(h))]
h
= [1
k(k 1)
m
1
h+o(h)][1+kmh+o(h)][1 h+o(h)] = 1+ (k(km))h+o(h).
2
2
2
55
www.L es-M athematiques.net
Soit maintenant
Mk0 = max0h k1 |fk0 (h)|.
Montrons que M 0 = supk>k0 k 3 Mk est fini. Notons G(h) =
1
h
log(1 mh) si h 6= 0
Alors
k1
X j
fk0 (h)
km
=
+ G0 (h)
.
fk (h)
1 mh
1 jh
j=1
1
Ensuite, si 0 h k1 k10 < m
, alors
k1
X
X j k1
j
j=1 1 jh j=1 1
et
j
k
k1
X
j=
j=1
k(k 1)
,
2
km
km
km
.
m
1 mh
1 k
k0 m
Donc
0
fk (h)
km
k(k 1)
0
.
fk (h) k0 m + K +
2
M
Mm
M K0
M
Mm
M K0
(1 1/k) +
+
+
+
.
2
k(k0 m)
k3
2
k0 (k0 m)
k03
00 3
n=0 M k pk converge. On est donc dans les conditions dapplication du thorme
de la convergence domine et donc (3) est dmontr.
56
www.L es-M athematiques.net
A
X
X
1
1
E(|P (X|) = E(|P (X)| + P (X)) =
pk P (k) =
pk P (k)
2
2
r<k<R
=m
A
X
(pk2 + 2pk1 pk ) = m
k=a+1
A2
X
k=a+1
pk + 2
k=a1
A1
X
pk
k=a
A
X
pk
k=a+1
a + a = r1 (a) m < r1 (a + 1) = a + 1 + a + 1.
Donc sur lintervalle
In = {m; a = n} = [n +
n,n + 1 +
n + 1)
mn (m n)
.
n!
Elle est donc bien positive. Sa limite lextrmit droite de In est bien q(n + 1 +
JN = {m; A = N } = [N N ,N + 1 N + 1),
la fonction Q prend la valeur
Q(m) = em
mN (N m)
.
N!
57
www.L es-M athematiques.net
58
www.L es-M athematiques.net
Chapitre
60
www.L es-M athematiques.net
61
www.L es-M athematiques.net
z2
,
(1 pz)(1 qz)
et prciser leurs rayons de convergence (on distiguera les cas p = q et p < q).
(2,5 points)
2. Soit 0 < p 1/2 et q = 1 p. On considre les variables alatoires indpendantes et valeurs dans les entiers 1 de lois respectives
PX =
q n1 pn , et PY =
n=1
pn1 qn ,
n=1
sh(2x)
.
2 shx
log ch(
k=1
k=1
z
sh(z)
.
) = log n
2k
2 sh( 2zn )
62
www.L es-M athematiques.net
n
X
Xk
k=1
2k
Calculer laide du 2) pour z rel non nul LSn (z) = IE(ezSn ). Montrer que
X
Xk
k=1
2k
est convergente. On dsigne par S la somme de cette srie. On admet que LS (z) =
IE(ezS ) = limn LSn (z). A laide du 2) et du 1), comparer LS et LU . (2,5
points)
63
www.L es-M athematiques.net
de Newton on a (1 pz)2 =
PExercice 2:nSinp = q, daprs la formule du binSme
n=0 (n + 1)p z et donc
z 2 (1 pz)2 =
(n + 1)pn z n+2 =
n=0
(n 1)pn2 z n .
n=2
Ces deux sries entires convergent si et seulement si |pz| < 1 et donc sont de rayon
de convergence R = 1/p.
Si p < q on dcompose la premire fraction rationnelle en lments simples:
1
1
q
p
=
=
(1 pz)(1 qz)
q p 1 qz
1 pz
!
X
X
X
1
q n+1 pn+1 n
n n
n n
q
q z p
p z
=
z .
qp
qp
n=0
n=0
n=0
Daprs le thorme sur le rayon de convergence de la somme de deux sries entires,
le rayon de convergence est ici le plus petit des deux nombres 1/p et 1/q, soit donc
R = 1/q. Quant la deuxime srie, il suffit de tout dcaler de deux:
X
z2
q n1 pn1 n
=
z .
(1 pz)(1 qz) n=2
qp
n=1
q n1 pz n =
X
pz
qz
, fY (z) =
pn1 qz n =
.
1 qz
1
pz
n=1
X
n1 n
z ,
2n
n=2
X
pq n qpn n
z ,
qp
n=2
n
qp
avec pour rayon de convergence 1/q, et P [X + Y = n] = pq qp
si n 2.
0
2
00
Enfin, on calcule fX (z) = p/(1 qz) , fX (z) = 2pq/(1 qz)3 , et on en tire,
puisque le rayon de convergence est > 1 :
0
00
IE(X) = fX
(1), IE(X(X 1)) = fX
(1) = 2q/p2 ,
64
www.L es-M athematiques.net
1
2
ezx dx =
shz
.
z
log
log ch(
z
sh(z)
z
) = log n
+ log ch( n+1 ) =
z
k
2
2 sh( 2n )
2
2z
))
sh( 2n+1
sh(z)
sh(z)
= log n+1
,
+
log
z
z
z
2 sh( 2n+1
)
2
sh( 2n+1
)
2n sh( 2n )
n
Y
exp(zXk /2k )) =
k=1
n
Y
k=1
n
Y
IE(exp(zXk /2k )) =
k=1
ch(
z
sh(z)
.
)= n
2k
2 sh( 2zn )
k
La srie k=1 X
est absolument convergente car |Xn | = 1, que la srie gomtrique
2k
de terme gnral 1/2n est de raison < 1. La deuxime partie du 2) permet daffirmer
que
sh(z)
LS (z) = lim LSn (z) =
= LU (z).
n
z
Daprs un thorme admis du cours, on peut remarquer dailleurs que cela entraNne
que S et U sont de mme loi, cest dire que FU est la fonction de rpartition de S.
65
www.L es-M athematiques.net
0,5
z2
2
dz
= 0,6914....
2
66
www.L es-M athematiques.net
67
www.L es-M athematiques.net
1
(X1 + + Xn ) = IE(X1 ).
n
Question a). On sait que la fonction de rpartition F = FU est F (u) = u si 0 < u < 1
et est gale 1 pour 1 u et 0 pour u 0. Donc
Z
F (z + v)dv =
z+1
F (u)du,
z+1
udu =
puis pour 0 z 1 :
FZ (z) =
udu =
1
(z + 1)2 ,
2
1
(1 z 2 ),
2
1cos x
x2 .
Question d). Puisque les v.a. sont indpendantes et de mme loi que X on a Sn (z) =
n
(X (z))n = (1 |z|)n+ , et donc Sn /n (z) = Sn (z/n) = (1 |z|
n )+ , et donc
68
www.L es-M athematiques.net
limn Sn /n (z) = e|z| . On remarque z 7 exp |z| est continue. Daprs le thorme de Paul Lvy, cela garantit la convergence en loi de la suite (Sn /n. On remarque
ensuite que la fonction z 7 exp |z| est intgrable.
Daprs la formule dinversion de
R izx|z|
1
e
dz =
Fourier, la densit de la loi limite est donc 2
1
2
eizx+z dz +
1
2
eizxz dz =
1
1
1
1
(
+
)=
.
2 1 ix 1 + ix
(1 + x2 )
69
www.L es-M athematiques.net
Universit Paul Sabatier. NL 12, Licence de mathmatiques pour lenseignement, Examen du 23 juin 2000.
Dure: 2heures. Aucun document. Affichage des rsultats le 27 juin 14:00.
Question de cours. Soit X et Y deux variables alatoires dfinies sur un mme espace
de probabilit et possdant des variances finies non nulles. Donner la dfinition du
coefficient de corrlation r(X,Y ) de (X,Y ). Si (X,Y ) est de loi normale dans IR2 ,
expliquer pourquoi X et Y sont indpendantes lorsque r(X,Y ) = 0.
Problme. On admet la formule suivante: pour p > 0 et t > 0 on a
Z
p2
2 p2t
3/2 2u
tu
()
u
e
du =
e
.
p
0
a) Si p > 0 et > 0, soit U une variable alatoire (v.a) de loi
p2
u
p
(p)
P (du) = u3/2 e 2u 2 +p 1]0,[ (u)du.
2
1
2
R1
n ),
( )3/2
70
www.L es-M athematiques.net
cov(X,Y )
.
(X)(Y )
.
fX,Y (x,y) =
exp (x a,y b)
yb
2
2 det
Dans le cas particulier qui nous occupe, on a alors
fX,Y (x,y)
(xa)2
(yb)2
1
e 22 (X) 22 (Y )
2(X)(Y )
(xa)2
(yb)2
1
1
e 22 (X)
e 22 (Y )
2(X)
2(Y )
=
=
La densit fX,Y (x,y) tant le produit dune fonction de x seul et de y seul est
donc la densit dun couple de v.a. indpendantes.
Ou bien en considrant la transforme de Laplace ou de Fourier de (X,Y ). Procdons par exemple avec la transforme de Fourier. Elle est en gnral
1
t
X,Y (t,s) = exp(iat + ibs (t,s)
).
s
2
Dans le cas particulier qui nous occupe, on a alors
X,Y (t,s)
=
=
1
exp(iat + ibs + ( 2 (X)t2 + 2 (Y )s2 ))
2
1 2
1
exp(iat (X)t2 ) exp(ibs 2 (Y )s2 )
2
2
71
www.L es-M athematiques.net
R
(p)
converge, ce qui entrane que la fonction dfinie par lintgrale z 7 ezu P (du) est
=
=
d
exp(p p 2z)
dz
exp(p p 2z)
2z
IE(U 2 exp(zU ))
=
=
p .
De la mme manire:
d2
exp(p p 2z)
2
dz
p2
p
(
+
)
exp(p
p
2z).
2z
( 2z)3
2
p )
( )3
et en utilisant la formule
p
2 (U ) = IE(U 2 ) (IE(U ))2 = .
( )3
Questions b) et c). Puisque U et V sont indpendantes, pour z < /2 on a
IE(exp(z(U + V ))
= IE(exp(zU ))IE(exp(zV ))
1
.
n( )3
n2
s
n
(n)
P (ds) = s3/2 e 2s 2 +n 1]0,[ (s)ds.
2
Cest dire que si on prend pour mesure de rfrence la mesure
n2
n
(ds) = s3/2 e 2s 1]0,[ (s)ds,
2
72
www.L es-M athematiques.net
(n)
S
7 e 2 +n ,
ou encore la fonction
7 lS () =
S
+ n .
2
Ltude des variations de lS sur ]0, + [ est facile: sa drive est lS0 () = 12 ( n S) et
sannule seulement en = n2 /S 2 . Cette drive est >0 avant et <0 aprs. Lestimateur
du maximum de vraisemblance est donc 0 (S) = n2 /S 2 .
Question e). Notons plutt S = Sn . Le thorme central limite affirme que la suite des
lois des v.a.
(Sn n )
n
( )3/2
converge vers N0,1 . Donc la probabilit pour que cette v.a. soit 1 est approximativement 1 0,8413.
73
www.L es-M athematiques.net
A1 A2 . . . Ak1 Bk
k=2
1/n
de convergence des
n
X
A1 A2 . . . Ak1 Bk .
k=2
Si X est une variable alatoire positive indpendante des (An ,Bn )n1 , dire pourquoi
les v.a. Wn (X) et Zn (X) sont de mme loi.
D) Montrer laide de la question B) que la suite de v.a. (Zn (X))n1 converge presque
srement vers une v.a. quon note Z. Pourquoi la v.a Z est elle la mme quelle que soit
la v.a. X? Pourquoi la suite de v.a. (Zn (X))n1 converge t-elle en loi? A laide de la
question C), montrer que la suite des lois des v.a. (Wn (X))n1 converge vers la loi de
Z.
E) On suppose maintenant de plus que la loi de X est telle que X et F1 (X) = A1 X +
B1 sont de mme loi. En dduire qualors X et Z sont de mme loi (mthode: montrer
74
www.L es-M athematiques.net
par rcurrence sur n que la v.a. Wn (X) est de mme loi que X, et appliquer la question
D)).
F) (Exemple) On rappelle (cours) que si > 0 et > 0 alors
Z
0
()()
t1
dt =
.
+
(1 + t)
( + )
(9.1)
On fixe deux nombres p > 0 et q > 0 et on suppose que la v.a. X a pour loi
(p + q)
xp1
1]0,[ (x)dx,
(p)(q) (1 + x)p+q
que la v.a. A1 a pour loi
ap1
(2p + q)
1]0,[ (a)da,
(p)(p + q) (1 + a)2p+q
et quenfin B1 = A1 . On suppose toujours X et A1 indpendantes. En appliquant (9.1)
des et convenables, montrer que si p < s < q on a
IE(As1 ) =
(p + s)(p + q s)
,
(p)(p + q)
IE((1 + X)s ) =
(p + q)(q s)
,
(p + q s)(q)
X
Z=
A1 A2 . . . Ak .
k=1
1
En particulier, si q > 0 et si Pr(A1 a) = (1+a)
1+q pour tout a 0, calculer
Pr(Z z) pour tout z 0 (mthode: calculer la densit de A1 , puis celle de Z).
75
www.L es-M athematiques.net
k IE(Y1 ) 1.IE(Y1 ) = 0.
k
k
k k1
B) On applique la loi des grands nombres la suite Yk = log Ak et on obtient
1
(A1 . . . An )1/n = exp( (log A1 + + log An )) n exp(IE(log A1 )).
n
De plus, on sait que IE(log A1 ) < 0 et donc que exp(IE(log A1 )) < 1. Si un =
P
1/n
A1 . . . An , puisque limn un < 1 la srie n=1 un converge, son terme gnral
tend donc vers 0 et on a bien limn A1 . . . An = 0 presque srement. De la mme
facon, on applique le A) Yk = log Bk et on en tire que limk k1 log Bk = 0 et donc
limk (Bk )1/k = 1. Considrons enfin uk = A1 A2 . . . Ak1 Bk . Alors, daprs les
rsultats prcdents on a
1/k
(1)
(2)
Zn (Fn+1 (x))
A1 A2 . . . An (An+1 x + Bn+1 ) + B1 +
n
X
A1 A2 . . . Ak1 Bk
k=2
(3)
A1 A2 . . . An An+1 x + B1 +
n+1
X
A1 A2 . . . Ak1 Bk ,
k=2
o (1) vient de la dfinition de Zn+1 (x), (2) de lhypothse de rcurrence et (3) dun
rarrangement. La rcurrence est donc tendue.
Puisque les (An ,Bn ) sont de mme loi, il est clair que les fonctions affines Zn et
Wn sont de mme loi. Leur valuation en une v.a. X indpendante des (An ,Bn ), et
donc indpendante de Zn et Wn sont donc des v.a. de mme loi.
P
D) On a vu au B) que la srie B1 + k=2 A1 A2 . . . Ak1 Bk converge. Notons par Z
sa somme. On a galement vu au B) que limn A1 . . . An = 0 presque srement:
cela entrane que limn Zn (X) = Z presque srement. Par dfinition, Z ne dpend
pas de X. La convergence presque sre entranant la convergence en loi, on en dduit
que la suite des lois de Zn (X) converge vers la loi de Z. On a vu la question C)
que Wn (X) et Zn (X) sont de mme loi. On en dduit que la suite des lois de Wn (X)
converge vers la loi de Z.
E) Montrons par rcurrence sur n que Wn (X) et X sont de mme loi. Cest vrai par
hypothse pour n = 1. Supposons ce rsultat vrai pour n. On sait que Wn+1 (X) =
76
www.L es-M athematiques.net
Fn+1 (Wn (X)). De plus Wn (X) est indpendante de Fn+1 , car Wn (X) est une fonction de X,A1 , . . . ,Bn et Fn+1 dpend de (An+1 ,Bn+1 ). Enfin Fn+1 est de mme loi
que F1 par dfinition, et Wn (X) est de mme loi que X, par hypothse de rcurrence.
Donc Fn+1 (Wn (X)) est de mme loi que F1 (X), qui est de mme loi que X par
hypothse. La rcurrence est donc tendue.
Or on sait daprs D) que la suite des lois de Wn (X) converge vers la loi de Z.
Comme toutes les lois des Wn (X) sont identiques celle de X, on en dduit que X et
Z sont de mme loi.
F) Par dfinition, puis en appliquant (9.1) = s + p > 0 et = 2p + q (s + p) =
p + q s > 0, on a
IE(As1 ) =
(2p + q)
(p)(p + q)
as+p1
(p + s)(p + q s)
da =
.
(1 + a)2p+q
(p)(p + q)
Z
0
xp1
(p + q)(q s)
dx =
.
p+qs
(1 + x)
(p + q s)(q)
on a
d
IE(As1 ) = IE(As1 log A1 ),
ds
d
0 (p) 0 (p + q)
s
IE(log A1 ) =
log IE(A1 )
=
.
ds
(p)
(p + q)
s=0
0
(t)
Le problme est donc de montrer que t 7 (t)
est croissante sur ]0,[, ou de montrer
que t 7 log (t) est strictement convexe. Cela vient de
Z
1
0 (t) 2 t1 x
00
(log (t)) =
[log x
] x e dx > 0.
(t) 0
(t)
77
www.L es-M athematiques.net
Universit Paul Sabatier. NT 12, Licence de mathmatiques pour lenseignement, Examen du 13 septembre 2000.
Dure: 2heures. Aucun document. Affichage des rsultats le 20 septembre 14:00.
Question de cours. Soit et (n )n1 des probabilits sur IR. On rappelle que on dit
que la suite (n )n1 converge en loi vers si pour toute fonction continue borne
relle ou complexe sur IR on a
Z
Z
lim
f (x)n (dx) =
f (x)( dx).
n
X
( + 1) . . . ( + n 1) n
1
t =
.
n!
(1 t)
n=1
Soit X une variable alatoire (v.a.) qui suit une loi ngative binomiale N B,p , avec
> 0 et 0 < p = 1 q < 1, donc de loi concentre sur lensemble N des entiers 0
dfinie par
X
( + 1) . . . ( + n 1) n
p q n .
p 0 +
n!
n=1
A. Calculer la fonction gnratrice de X, cest dire IE(z X ) avec |z| 1. Dduire du
rsultat IE(X), IE(X 2 X), IE(X 2 ) et la variance 2 (X) de X. Montrer que IE(X) <
2 (X).
B. Soient X1 , . . . ,Xn des v.a. indpendantes et de mme loi que X. On pose X n =
1
n (X1 + + Xn ). Quelle est la loi de nX n ? (mthode: considrer sa fonction gn2
Sn2 =
1 X
(Xk X n )2 .
n1
k=1
Pn
n
1
2
Dmontrer que Sn2 = n1
X n + n1
k=1 Xk . En dduire laide du A et du B
que la valeur de IE(Sn2 ) est la variance de X.
dite des moments. Si X n et Sn2 sont considrs comme des estimateurs de la moyenne
et de la variance de X respectivement, dire si ces estimateurs sont biaiss ou non. On
n et pn = 1 qn par les quations
dfinit les estimateurs
n qn
n q2
n qn
= X n, 2 n +
= Sn2 .
pn
pn
pn
n > 0 et 0 < pn < 1 si et seulement si S 2 X n > 0. Au vu de la question
Montrer
n
D, cette mthode est elle raisonnable?
79
www.L es-M athematiques.net