Vous êtes sur la page 1sur 82

Calcul des probabilits Deug 2ime anne

Grard Letac , Universit Paul Sabatier , Toulouse


Juin 2001

Table des matires

Lespace de probabilits (,A,P )


1.1 Introduction . . . . . . . . . .
1.2 Lespace des observables . .
1.3 La tribu des vnements A. .
1.4 La probabilit P . . . . . . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

1
1
1
2
3

Quatre espaces de probabilit importants


2.1 Lespace est fini ou dnombrable. .
2.2 Le cas quiprobable. . . . . . . . . .
2.3 Le schma Succs-Echec. . . . . . . .
2.4 Le cas o = IR. . . . . . . . . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

7
7
9
13
15

Probabilits conditionnelles et indpendance


3.1 Conditionnement . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2 Indpendance dvnements. . . . . . . . . . . . . . . . . . . . . . .
3.3 Indpendance de sous tribus. . . . . . . . . . . . . . . . . . . . . . .

20
20
21
22

Image dune probabilit, variables alatoires


4.1 Fonctions mesurables . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Image dune probabilit. . . . . . . . . . . . . . . . . . . . . . . . .
4.3 Les variables alatoires relles et leurs lois. . . . . . . . . . . . . . .

24
24
25
26

Lesprance mathmatique dune variable alatoire


5.1 Les variables alatoires tages. . . . . . . . . . . . . . .
5.2 Esprance dune variable alatoire quelconque. . . . . . .
5.3 Thorme du transport. . . . . . . . . . . . . . . . . . . .
5.4 Variables alatoires indpendantes et esprance du produit.

.
.
.
.

28
28
30
32
33

Moments, fonctions gnratrices, transformes de Laplace


6.1 Moments et variance . . . . . . . . . . . . . . . . . . . . . . . . . .
6.2 Les variables alatoires valeurs entires. . . . . . . . . . . . . . . .
6.3 Transforme de Laplace dune variable alatoire. . . . . . . . . . . .

35
35
40
44

Appendice 1: Grandes dviations

49

Appendice 2: Convergence des lois binomiales vers la loi de Poisson

53

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

TABLE DES MATIRES

Appendice 3: Annales des problmes de probabilits de Deug et de licence 59

ii
www.L es-M athematiques.net

Chapitre

Lespace de probabilits
(,A,P )
Par Grard Letac

1.1 Introduction
Le calcul des probabilits est la science qui modlise les phnomnes alatoires.
Une modlisation implique donc certainement une simplification des phnomnes,
mais cette simplification conduit une quantification, donc la possibilit de faire
des calculs et prdire. Le jet dun d, le tirage du Loto pourraient tre analyss par
les lois de la mcanique, mais ce serait trop compliqu pour tre utile. La modlisation
du calcul des probabilits a t invente par A. N. Kolmogorov dans un livre paru en
1933. Cette modlisation est faite partir de 3 objets (,A,P ) que nous allons dcrire.

1.2

Lespace des observables .

Nous conviendrons que effectuer une exprience, cest slectionner par un procd
quelconque un lment dans un ensemble : jeter un d revient slectionner un
lment de = {1,2,3,4,5,6}; jeter ensemble deux ds rouge et vert revient slectionner un lment de lensemble = {1,2,3,4,5,6} des couples ordonns (i,j) avec
1 i 6 et 1 j 6 (ici a 36 points). Plus dlicat: jeter ensemble deux ds indiscernables revient slectionner un lment de lensemble des couples (i,j) avec
1 i j 6 (ici a 6+ 12 65 = 21 points). Observer la dure de vie dune ampoule
de 100 watts revient slectionner un lment de = [0, + [. Mesurer la dure de
vie de 12 ampoules de 100 watts est slectionner un lment de = [0, + [12 .
Cet ensemble est appel lespace des observables. On dit aussi dans la littrature
lespace chantillon, lespace des vnements - lmentaires, lexprimental ou encore
lvnementiel. Ses points sont appels observables ou vnements-lmentaires. Il
est trs important quil soit clairement dfini. On peut sexercer dfinir dans les 2
cas suivants : jeter 12 fois de suite la mme pice de monnaie, jeter en mme temps

1.3. LA TRIBU DES VNEMENTS A.

12 pices de monnaie identiques (on admet que la pice tombe sur pile ou sur face, et
jamais sur la tranche).

1.3

La tribu des vnements A.

Les questions quon se pose sur le rsultat dune exprience sont systmatiquement
du type suivant: on choisit un sous ensemble A de lespace dobservables et on se
demande: le rsultat de lexprience va-t-il tomber dans A ou non? Les parties de
pour lesquelles on se pose ce genre de question sont appeles des vnements. Un
des premiers points dlicats de la thorie est que on ne va pas toujours considrer tous
les sous ensembles de comme des vnements. Dans lexemple de la lampe de 100
watts, il parait inintressant de se demander si sa dure de vie, mesure en heures, est
un nombre irrationnel, et intressant de se demander si elle tombe dans lintervalle
[300,400]. Lide de Kolmogorov est que lensemble A des vnements a une structure
de tribu:
Dfinition Soit un ensemble et soit A une partie de P(). A a une structure de
tribu si il satisfait aux trois axiomes:
1. Si A A, alors son complmentaire Ac = \ A est aussi dans A.
2. Si on a une suite
S finie ou dnombrable A1 , . . . ,An , . . . dlments de A, alors
leur runion n1 An est aussi dans A.
3. Lensemble vide est dans A.
Un lment de A est appel un vnement.
Tirons quelques consquences de ces axiomes.
Proposition 1.1 Soit A une tribu de parties de lensemble . Alors A. De
plus, si on a une
T suite finie ou dnombrable A1 , . . . ,An , . . . dlments de A, alors leur
intersection n1 An est aussi dans A.
Dmonstration En appliquant les axiomes 1 et 3, on a le premier rsultat. Pour
le second, il suffit de se rappeler que le complmentaire dune runion finie ou infinie
densembles est lintersection des complmentaires ("Loi de Morgan"). Donc
\
[
An = (
Acn )c ,
n1

n1

et le deuxime membre de cette galit est donc dans A : on applique successivement


laxiome 1, puis 2, puis 1 nouveau.

Le langage de la thorie des ensembles permet des calculs systmatiques sur les
vnements. Toutefois, il faut savoir que le langage courant, que nous utilisons dans
une premire tape pour dcrire des vnements a sa traduction ensembliste. Voici un
petit dictionnaire :
Ensemble :

vnement certain
2
www.L es-M athematiques.net

1.4. LA PROBABILIT P

Ensemble vide:
vnement impossible
A B:
A ou B sont raliss ("ou" non exclusif)
A B:
A et B sont raliss
A et B sont disjoints: les vnements A et B sont incompatibles
Ac = \ A:
vnement contraire de A.

Le fait que on ne sorte pas de la famille des vnements intressants considrer en


prenant une intersection ou une runion dvnements est raisonnable si ceux ci sont en
nombre fini. Le fait de se permettre ceci galement quand on en a une infinit est plus
subtil: les mathmatiques ne maniant que des ensembles finis sont lmentaires mais
les rsultats exacts auquels elles conduisent sont trop compliqus pour tre utilisables.
Le passage linfini est le passage de lalgbre lanalyse, donc des approximations
maniables et de puissantes techniques issues du calcul diffrentiel et intgral. Quant
au fait que dans ce passage linfini, on se limite une infinit dnombrable dvnements, cest un point technique quon ne justifiera que dans un cours de 3 me anne
duniversit. Rappelons quun ensemble E avec une infinit dlments est dit dnombrable si il existe une bijection entre E et lensemble N des entiers positifs: lensemble
Q des nombres rationnels est dnombrable, le segment [0,1] ne lest pas, comme nous
lavons vu en premire anne.
Finalement, ce point dlicat: "on ne considre pas ncessairement tout sous ensemble A de comme un lment de la tribu A des vnements" ne jouera pas un
grand rle dans la suite. Typiquement, nous envisagerons deux cas particuliers importants:
Le cas o lui mme est dnombrable, et nous prendrons comme tribu A la
famille P() de tous les sous ensembles de .
Le cas o est la droite relle IR. Nous prendrons alors pour tribu A la tribu B
(dite tribu de Borel, dont les lments sont appels des borliens) qui est la plus
petite tribu qui contient tous les intervalles de IR.
On peut laborieusement dmontrer que B 6= P(IR); toutefois, une description
complte des lments de B nest pas possible, et en fait pas trs utile en pratique:
les seuls borliens que nous aurons manipuler seront les intervalles (attention,
IR ou une demi droite sont aussi des intervalles) ou des runions finies, ou plus
rarement, dnombrables, dintervalles.
Ce ne sont pas les seuls espaces de probabilit utiliss: on verra le schma Succs
Echec la section 2 et le cas = IR ou IRn plus tard.
Dfinition La plus petite tribu qui contient les ouverts de R muni de sa topologie
canonique est appele tribu de Borel. Les lments de cette tribu sont appels les borliens de R .

1.4

La probabilit P

Dfinition Etant donns un espace dobservables et une tribu dvnements A


forme de certains sous ensembles de , une probabilit P est une application de A

3
www.L es-M athematiques.net

1.4. LA PROBABILIT P

dans [0,1] , donc un procd qui associe tout vnement A un nombre P (A) compris
entre 0 et 1 appel probabilit de A, et qui satisfait aux axiomes suivants
L vnement certain est de probabilit 1: P () = 1.
Axiome dadditivit dnombrable: pour toute suite A1 ,A2 , . . . ,An . . . dvnements de A qui sont de plus deux deux disjoints, cest dire tels que Ak Aj =
si k 6= j, alors la srie

X
P (Ak )
k=1

S
converge et a pour somme P ( k1 Ak ).
Le triplet (,A,P ) est alors appel un espace de probabilit.
Voici quelques consquences immdiates des axiomes.
Thorme 1.2 Soit (,A,P ) un espace de probabilit. Alors
1. P () = 0.
2. Si A1 ,A2 , . . . ,An dans A sont deux deux disjoints, alors
P (A1 An ) = P (A1 ) + + P (An );
en particulier P (Ac ) = 1 P (A).
3. Si A et B sont dans A et si A B alors P (A) P (B).

Dmonstration
1) Laxiome dadditivit dnombrable est appliquable la suite constante dfinie
par An = , qui est effectivement forme dvnements deux deux disjoints. La srie
dont le terme gnral P () est constant ne peut converger que si ce terme gnral est
0.
2) Sa premire partie se dmontre en appliquant laxiome dadditivit dnombrable
A1 ,A2 , . . . ,An continue par = An+1 = An+2 = , et en utilisant le 1). Appliquer a n = 2, A1 = A et A2 = A0 fournit 1 = P () = P (A) + P (Ac ) en utilisant
le premier axiome dune probabilit.
3) On crit B = A (B \ A) comme runion de deux ensembles disjoints (notez
que B\A = BA0 est bien dans A), et on applique le 2): P (B) = P (A)+P (B\A)
P (A).
Thorme 1.3 Soit (,A,P ) un espace de probabilit. Alors
1. Si A et B sont dans A, mais ne sont pas ncessairement disjoints, alors
P (A B) = P (A) + P (B) P (A B).
Si les A1 ,A2 , . . . ,An dans A ne sont pas ncessairement deux deux disjoints,
alors
P (A1 An ) P (A1 ) + + P (An ).
2. Continuits croissante et dcroissante: Soit une suite B1 ,B2 , . . . ,Bn . . . dvnements de A qui soit ou bien croissante (cest dire que pour tout n 1 on

4
www.L es-M athematiques.net

1.4. LA PROBABILIT P

a Bn Bn+1 ) ou bien dcroissante (cest dire que pour tout n 1 on a


Bn Bn+1 ). Alors, dans le cas croissant:
[
lim P (Bn ) = P (
Bn );
n+

n1

et dans le cas dcroissant:


lim P (Bn ) = P (

n+

Bn ).

n1

3. Sous additivit dnombrable:


PSoit une suite B1 ,B2 , . . . ,Bn . . . dvnements de
A. Alors ou bien la srieS k=1 P (Bk ) diverge; ou bien elle converge et dans ce
cas sa somme est P ( n1 Bn ).
Dmonstration
1. On crit comme dans la dmonstration prcdente:
P (B) = P (A B) + P (B \ A), P (A) = P (A B) + P (A \ B),
puis on crit A B = (A B) (B \ A) (A \ B) comme runion de trois
ensembles deux deux disjoints et on applique le 2):
P (A B) = P (A B) + P (B \ A) + P (A \ B) =
P (AB)+(P (B)P (AB))+(P (A)P (AB)) = P (A)+P (B)P (AB);
Pour terminer le 1) on dmontre le rsultat par rcurrence sur n. Cest trivial
pour n = 1. Si cest dmontr pour n, appliquons la premire partie de ce 1)
A = A1 An et B = An+1 . On obtient, laide de lhypothse de
rcurrence
n
X
P (AB) = P (A)+P (B)P (AB) P (A)+P (B) (
P (Ak ))+P (An+1 ).
k=1

2. Dans le cas croissant, posons A1 = B1 et, pour n 2, An =P


Bn \ Bn1 . Les

A1 ,A2 , . . . ,An . . . sont alors deux deux disjoints. La srie k=1 P (Ak ) est
donc convergente. Daprs la partie 2) de la proposition prcdente, on a
P (Bn ) = P (A1 An ) =

n
X

P (Ak )

k=1

Passons la limite dans lgalit ci dessus; on obtient


lim P (Bn ) =

n+

P (Ak ).

k=1

S
Or daprs laxiome dadditivit dnombrable,
S le second membre est P ( k1 Ak ),
qui est aussi par dfinition des An gal P ( n1 Bn ).
Dans le cas dcroissant, on se ramne au cas prcdent par passage au complmentaires, laide de la loi de Morgan: le complmentaire dune union est
lintersection des complmentaires:
lim P (Bn ) = 1 lim P (Bnc ) = 1 P (n1 Bnc ) = 1 (1 P (n1 Bn )) =
P (n1 Bn ).
5
www.L es-M athematiques.net

1.4. LA PROBABILIT P

3. La suite dvnements dfinie par Cn = B1 Bn est croissante et on peut


lui appliquer le 2). En utilisant aussi la sous additivit finie on a donc
P(

n1

Bn ) = lim P (Cn ) lim (P (B1 ) + + P (Bn )) =


n+

n+

P (Bk ).

k=1

Exercices sur la section 1.


1. Soit A,B,C trois vnements dun espace de probabilit. Montrer laide du Th.
1.2 ) que
P (A B C) =
P (A) + P (B) + P (C) P (A B) P (B C) P (C A) + P (A B C).
Etablir une formule de ce genre pour une runion de 4 vnements.
2. Soit A une tribu dvnements sur , et soit f une fonction positive sur A ayant
les proprits suivantes: f () = 1, f (A B) = f (A) + f (B) si A et B sont
des vnements disjoints et , si (Bn ) est une suite dcroissante de A telle que
n1 Bn = alors
lim f (Bn ) = 0.
n+

Montrer qualors f est une probabilit. Mthode: si (An ) est une suite dvnements deux deux disjoints, considrer
Bn = kn+1 Ak .

6
www.L es-M athematiques.net

Chapitre

Quatre espaces de probabilit


importants
Par Grard Letac

2.1

Lespace est fini ou dnombrable.

Dans ce cas on suppose habituellement que la tribu des vnements A est P(),
lensemble de toutes les parties de . Par exemple, si est form de 2 lments nots
a et b, alors P() est constitu des 4 sous ensembles suivants: lensemble vide , les
deux singletons {a} et {b} et = {a,b} lui mme. Plus gnralement, on a le fait
suivant:
Proposition 2.1 Si un ensemble a un nombre fini N dlments, alors lensemble des parties de : P() a 2N lments.
Dmonstration On procde par rcurrence sur N . Cest trivial pour N = 1 ou 0.
Si cest vrai pour N , considrons
= {a1 , . . . ,aN ,aN +1 } et 0 = {a1 , . . . ,aN }.
Les parties de se partagent en deux catgories:
Catgorie 1: celles qui ne contiennent pas aN +1 .
Catgorie 2: celles qui contiennent aN +1 .
Il est clair que la catgorie 1 est gale P(0 ) et que la catgorie 2 est en bijection avec P(0 ), la bijection tant obtenue en ajoutant aN +1 aux lments de P(0 ).
Comme daprs lhypothse de rcurrence P(0 ) a 2N lments, on en conclut que
P() a 2N + 2N = 2N +1 lments, et la rcurrence est tendue.
Proposition 2.2 Si est infini dnombrable, alors P() est infini non dnombrable.
Dmonstration La dmonstration est analogue la dmonstration de Cantor. Sans
perte de gnralit on suppose gal lensemble N des entiers positifs ou nuls. Si
7

2.1. LESPACE EST FINI OU DNOMBRABLE.

X N, on lui associe la fonction indicatrice 1X dfinie sur N et valeurs 0 ou 1 par


1X (k) = 1 si k X et 1X (k) = 0 si k
/ X. Remarquons aussi quinversement, si une
fonction f dfinie sur N est valeurs 0 ou 1, alors cest une indicatrice densemble,
cest--dire quil existe X tel que f = 1X : il sagit de X = {k N; f (k) = 1}.
Montrons alors la proposition par labsurde en supposant que P(N) soit dnombrable, cest--dire quil existe une application bijective n 7 Xn de N sur P(N).
Alors la fonction f dfinie sur N et valeurs 0 ou 1 par
f (k) = 1 1Xk (k)
est lindicateur de quelque sous ensemble Xn de N et donc pour tout k de N on a
1Xn (k) = 1 1Xk (k),
ce qui est une contradiction si k = n.
Les probabilits sont alors dcrites par le rsultat suivant
Proposition 2.3 Soit un ensemble fini ou dnombrable. Soit x 7 px une application de dans les rels 0 telle que
X
px = 1.
x

Pour tout A , notons alors


P (A) =

px .

xA

Alors (,P(),P ) est un espace de probabilit. Inversement, toute probabilit P


sur (,P()) est du type prcdent, avec px = P ({x}).
Remarque Si est fini, la proposition est vidente. Si est dnombrable, les
sommes ci dessus quand A est dnombrable ont la signification suivante: puisque A est
dnombrable, on peut numroter ses lments, cest--dire quil existe une application
bijective n P
7 xn de N sur A. P (A) est alors dfini rigoureusement comme la somme

de la srie n=0 pxn . Toutefois, ce nombre ne dpend que de A, et non de la numro au thorme suivant sur les sries,
tation particulire de A choisie par n 7 xn , grCce
que nous admettrons, ainsi que la proposition elle mme:
P
Thorme 2.4 Si la srie n=0 un est absolument
convergente de somme S, et si
P
n 7 (n) est une bijection de N sur lui mme, alors n=0 u(n) est aussi absolument
convergente et de somme S.
Exercices sur 2.1.
1. Soit > 0. Soit P la probabilit dfinie sur (N,P(N)) par
P ({n}) = e

n
.
n!

Soit A lensemble des nombres pairs. Calculer P (A). Soit N un entier, montrer
que
Z
tN
P ({0,1, . . . ,N }) = 1
et dt
N!
0
8
www.L es-M athematiques.net

2.2. LE CAS QUIPROBABLE.

(Mthode: considrer les deux membres comme des fonctions de dont on montrera quelles ont mme valeur pour = 0 et mme drive).
2. Soit P la probabilit dfinie sur (N ,P(N )) par P ({n}) = 2n . Calculer la
probabilit de tirer un nombre n > 3; un nombre n multiple de 3; un nombre
dont le reste est 3 si on le divise par 4.

2.2

Le cas quiprobable.

Considrons le cas particulier de la Proposition 2.3 o a un nombre fini N = ||


dlments et o tous les px sont gaux (et donc gaux 1/N.) Dans ce cas, si A
on a
P (A) =

|A|
nombre de cas favorables
=
.
||
nombre de cas possibles

Pour exploiter cette galit, il est ncessaire de possder quelques principes gnraux de dnombrement densembles et de fonctions contenus dans les deux prochains
thormes. Si E et F sont des ensembles, on note par E F leur produit cartsien,
cest--dire lensemble des couples (x,y) tels que x E et y F. On note par F E
lensemble des fonctions f dfinies sur E et valeurs dans F. Si E est fini et est de
taille n = |E| et si k est un entier avec 0 k n on note par Pk (E) lensemble des
parties de E de taille k.
Thorme 2.5
1. Si E et F sont des ensembles finis, alors |E F | = |E||F |. Plus gnralement,
si F1 , . . . ,Fn sont des ensembles finis: |F1 Fn | = |F1 | |Fn |. Ensuite
|F E | = |F ||E| . Enfin, si p = |F | n = |E|, le nombre de fonctions injectives
de E vers F est p(p 1)(p 2) (p n + 1). En particulier, le nombre de
fonctions bijectives de E vers E, appeles permutations de E, est gal n!
2. Si E est fini et est de taille n = |E| et si k est un entier avec 0 k n alors
|Pk (E)| = Cnk =

n!
n(n 1) (n k + 1)
=
.
k!(n k)!
k!

Dmonstration
1. La premire formule est vidente : si e1 , . . . ,en et f1 , . . . ,fp sont les lments
de E et F , le nombre de couples (ei ,fj ) est np. Lextension n facteurs est
immdiate galement. Cette extension est ensuite applique au cas particulier o
tous les ensembles Fj sont gaux au mme ensemble F. Si |E| = n, il y a alors
bijection entre F E et F F (n fois). Do |F E | = |F | |F | =
|F |n = |F ||E| . Quant au nombre de fonctions injectives, la formule donne se
justifie facilement: on identifie E (1,2, . . . ,n), et limage de 1 peut occuper p
positions, limage de 2 peut occuper une des p 1 positions restantes, limage
de 3 une des p 2 positions restantes, etc. Faire E = F pour le nombre de
permutations de E (on rappelle que si |E| = |F | avec E fini, alors une fonction
f de E vers F est injective si et seulement si elle est surjective).
9
www.L es-M athematiques.net

2.2. LE CAS QUIPROBABLE.

2. Rappelons pour cette partie la formule de Pascal:

Proposition 2.6 Si k est un entier avec 1 k n on a


k
Cnk1 + Cnk = Cn+1
.

Dmonstration
Cnk1 + Cnk =



1
1
(n + 1)!
n!
k
+
=
= Cn+1
.
(k 1)!(n k)! n k + 1 k
k)!(n + 1 k)!

Pour prouver 2) on observe que cest trivial pour k = 0, puis on fixe k > 0 et on
montre 2) par rcurrence sur n. Cest trivial pour n = k. Supposons enfin 2) vrai pour
n et supposons que E ait n + 1 lments, quon prend gaux 1,2, . . . ,n + 1 sans
perte de gnralit. Soit aussi E 0 lensemble des n premiers entiers. On partage alors
les lments de Pk (E) en deux catgories:
Catgorie 1: ceux qui ne contiennent pas n + 1.
Catgorie 2: ceux qui contiennent n + 1.
La catgorie 1 est gale Pk (E 0 ) et a donc Cnk lments par lhypothse de rcurrence. La catgorie 2 est en bijection avec Pk1 (E 0 ) ( enlever n + 1 un membre de la
catgorie 2 pour avoir un lment de Pk1 (E 0 )) et donc par lhypothse de rcurrence
k
a Cnk1 lments. La formule de Pascal montre alors que Pk (E) a Cn+1
lments et la
rcurrence est tendue.
Voici un exemple dapplication du thorme prcdent.
Proposition Anniversaires. n personnes sont runies. Quelle est la probabilit que
au moins deux dentre elles aient le mme anniversaire?
On formalise le problme en le simplifiant un peu: on ignore dabord le problme
du 29 fvrier, et on postule donc que lespace des observablesest = F E o E est
lensemble des personnes et o F est lensemble des p = 365 jours de lanne: on
observe donc la fonction f qui chaque personne associe son anniversaire. On
postule ensuite quon est dans le cas quiprobable, ce qui nest quune approximation:
il y a plus denfants conus au printemps et en t quen novembre sous nos climats.
Finalement, il est plus facile de calculer la probabilit du complmentaire Ac de lvnement A "deux personnes au moins ont le mme anniversaire", car cest la probabilit
que la fonction f soit injective. Daprs le thorme 2.5 1), cest
P (Ac ) =

n1
n1
Y
X
1
k
k
365(3651)

(365n+1)
=
(1
)
=
exp
log(1
).
n
365
365
365
k=1

k=1

Si n nest pas grand, une valuation approximative de cette somme se fait en remplaant
log(1 x) par x et en utilisant la somme dune progression arithmtique tudie en
Terminale
n1
X
1
k = n(n 1) n/2,
2
k=1

10
www.L es-M athematiques.net

2.2. LE CAS QUIPROBABLE.

qui conduit lapproximation P (Ac ) exp(n/730). Pour voir par exemple pour
quel n on a P (Ac ) 1/2 on prend n 730 log 2 23. Pour un calcul plus srieux,
on peut utiliser lencadrement pour 0 < x < 1 :
x
x
< log(1 x) < x ;
2(1 x)
2

La majoration de droite se dduit du dveloppement en srie entire, celle de gauche se


x
+ log(1 x). On a aussi besoin de la somme
montre en tudiant la fonction x + 2(1x)
des premiers carrs:
n1
X

k2 =

k=1

1
n(2n 1)(n 1) n3 /3,
6

qui stablit par rcurrence. Si x (n 1)/365, alors 1/(1 x) 365/(365


n + 1). Do lencadrement :

n(n 1)(2n + 1)
1
365
n(n 1) 1

<
2
2
365
6
2 365 365 n + 1

n(n 1) 1
n(n 1)(2n + 1)
1

.
2
365
6
2 3652
Par exemple, si n = 35 on trouve P (Ac ) = 0,186... Si 35 personnes sont runies,
la probabilit que deux dentre elles au moins aient le mme anniversaire est donc
0,813...
Le prochain thorme sert en particulier rsoudre le problme plus difficile du
calcul du nombre de fonctions surjectives.
log P (Ac ) <

Thorme 2.7 (Principe dinclusion-exclusion) Soit E un ensemble fini et soit f


et g des fonctions relles dfinies sur P(E) satisfaisant pour tout A E :
X
f (A) =
g(B).
BA

Alors pour tout A E :


g(A) =

(1)|A\B| f (B).

BA

Dmonstration Si C A E notons
X
F (A,C) =
(1)|A\B| .
CBA

k
Si
Pn|A \ C| =k n,k puisque il y a Cn parties de A \ nC de taille k on peut crire F (A,C) =
est son tour (1 + (1)) cause de la formule du binme de
k=0 (1) Cn , quiP
n
nk k k
Pascal (a + b)n =
b Cn . Donc si n > 0, cest--dire si C 6= A, on a
k=0 a
F (A,C) = 0. Si n = 0, cest--dire si C = A on a F (A,C) = 1. Calculons alors le
second membre de lgalit dmontrer:
X
X
X
(1)|A\B| f (B) =
(1)|A\B|
g(C) =
BA

BA

CB

11
www.L es-M athematiques.net

2.2. LE CAS QUIPROBABLE.

g(C)

CB

(1)|A\B| =

CBA

g(C)F (A,C) = g(A).

CB

La premire galit exploite le lien entre f et g, la seconde inverse les sommations


par rapport aux indices de sommation B et C, la troisime rsulte de la dfinition de
F (A,C), la quatrime du calcul de F prcdent et fournit le rsultat voulu.
Voici deux applications.
Proposition Nombre de fonctions surjectives. Si |E| = n |F | = p, quel est le
nombre de fonctions surjectives de E vers F ?
Pour rpondre on applique le thorme prcdent aux fonctions f et g dfinies sur
P(F ) ainsi: si A F , f (A) = |A|n est le nombre de fonctions de E vers F dont
limage est contenue dans A (on pourrait donc dire tout aussi bien les fonctions de E
vers A); et g(A) est le nombre de fonctions de E vers F dont limage est exactement
gale A (on pourrait dire les fonctions de E vers A qui sont surjectives). On veut
donc calculer g(F ).
P
Les hypothses du thorme sont remplies, on a bien en effet f (A) = BA g(B).
Par consquent
g(F ) =

(1)|F \B| |B|n =

BF

p
X

Cpk (1)pk k n .

k=0

Proposition Problme des rencontres. Si E a n lments, combien y a-t-il de


permutations de E sans point fixe, cest--dire telles que pour tout j E on ait
(j) 6= j?.
On applique le thorme prcdent aux fonctions f et g dfinies sur P(E) ainsi:
si A E , f (A) = |A|! est le nombre de permutations de E telles que pour tout
j Ac on ait (j) = j, et g(A) est le nombre de permutations de E telles que pour
tout j Ac on ait (j) = j et pour tout j A on ait (j) 6= j. On veut donc calculer
g(E).
P
Les hypothses du thorme sont remplies, on a bien en effet f (A) = BA g(B).
Par consquent
X
g(E) =
(1)|F \B| |B|! =
BE

n
X

Cnk (1)nk k! =

k=0

n!

n
X

(1)nk

k=0

n!

n
X

1
=
(n k)!

(1)k

k=0

1
.
k!

12
www.L es-M athematiques.net

2.3. LE SCHMA SUCCS-ECHEC.

Si est lensemble des permutations de E et si il est muni de la probabilit quiprobable, la probabilit pour quune permutation alatoire soit sans point fixe est donc
n
X

(1)k

k=0

1
,
k!

soit approximativement e1 = 0,367... si n > 6.


Exercices sur 2.2.
1. Soit des entiers tels que 2 a b c. On tire de faon quiprobable une partie
de taille a de lensemble des b + c entiers > 0. Calculer la probabilit pour que
0 dentre eux soient > a; pour que 2 dentre eux exactement soient > a.
2. Deux ds non pips sont marqus sur leurs six faces 1,2,2,3,3,4 et 1,3,4,5,6,8
respectivement. On jette une fois ces deux ds et on note par Ak lvnement "la
somme des points i du premier d et des points j du second est k. Calculer pour
k = 2,3, . . . ,12 le nombre P (Ak ).
3. 12 mchantes fes se penchent sur le berceau des quintupls et attribuent chacune
au hasard un enfant un dfaut. Quel est la probabilit quil y ait au moins un
enfant parfait?

2.3

Le schma Succs-Echec.

Le schma Succs-Echec fini. Si une exprience a deux issues, arbitrairement


notes succs (S) et chec (E) et si on la rpte n fois, ce quon observe est une
suite de longueur n de S et de E. Pour modliser cela, on introduit lespace des
observables = {E,S}n form des 2n suites = (1 , . . . ,n ) o les j sont gaux
E ou S. On munit de la tribu P(). Quant la probabilit, on se fixe un nombre
p tel que 0 < p < 1 qui est la probabilit dun succs si on neffectue quune
fois lexprience. Introduisons alors limportante quantit X(w) dfinie ainsi: si =
(1 , . . . ,n ) alors X(w) dsigne le nombre de succs que comprend la suite .
Par exemple, X(SSES) = 3, X(EEEE) = 0. Pour tel que X() = k on
dfinit alors P ({}) = pk (1 p)nk ; Comme tout vnement A P() est runion
de singletons {} deux deux disjoints, cela suffit dfinir P (A) et donc la probablit
P sur (,P()).
Parmi ces vnements, les plus importants sont les {X = k} ( ceci est une stnographie que nous utiliserons souvent pour crire brivement lvnement {
; X() = k}). Voici leur probabilit:
Proposition 2.9 Pour le schma Succs Echec finiassoci la probabilit p dun
succs, si X est le nombre de succs en n expriences, alors
P (X = k) = Cnk pk (1 p)nk .

Dmonstration Notons A = { ; X() = k}. Dfinissons lapplication de


A dans Pk ({1,2, . . . ,n}) par 7 {j ; j = S}. Il est clair que cest une bijection;
13
www.L es-M athematiques.net

2.3. LE SCHMA SUCCS-ECHEC.

donc daprs le Thorme 2.5 b), |A| = Cnk . Enfin puisque tous les {} contenus dans
A ont la mme probabilit pk (1 p)nk on obtient
X
P (A) =
P ({}) = |A|pk (1 p)nk = Cnk pk (1 p)nk .
A

Le schma Succs-Echec infini. Il sagit ensuite de modliser le cas o on veut


effectuer un nombre arbitraire dexpriences: par exemple on peut vouloir rpter les
essais jusqu ce quapparaisse 4 succs conscutifs. Une telle modlisation est impossible avec le schma fini ci dessus, et on prend alors pour espace des observa
bleslensemble {E,S}N des suites infinies de S et de E, en notant par N lensemble
des entiers > 0. Il est clair que est en bijection avec les parties de N , et donc daprs
la proposition 2.2 nest pas dnombrable. Cela cause une srieuse difficult en ce qui
concerne la construction de lespace de probabilit correspondant. On construit la tribu
A et la probabilit P par un procd dapproximation que nous dcrivons maintenant.
Fixons lentier n et dfinissons 0 = {E,S}{1,...,n} et 00 = {E,S}{n+1,n+2,...} ,
de sorte que = 0 00 , et dfinissons la tribu suivante de parties de :
An = {A 00 ; A P(0 )}.
Intuitivement, les vnements de An sont les vnements ne dpendant que de ce qui
sest pass jusqu linstant n. En particulier, nous avons An An+1 .
Si 0 = (1 , . . . ,n ) 0 comprend k succs, dfinissons la probabilit Pn ({ 0 }
00
) = pk (1 p)nk . Cela permet donc de dfinir la probabilit Pn sur An . Lespace
de probabilit (,An ,Pn ) est presque identique lespace du schma Succs Echec
fini dcrit ci dessus.
Maintenant, notons
A0 = n1 An .
La famille A0 nest pas une tribu, car ce nest pas ferm pour la runion dnombrable. Voici un contre exemple. Soit An lensemble des suites infinies comprenant
au moins un succs linstant n ou avant. Alors An est dans An et donc dans A0 . Pourtant A = n1 An nest pas dans A0 . En effet A est lensemble des suites infinies
comprenant au moins un succs. Mais il nexiste pourtant aucun n tel que A An , et
donc A
/ A0 . Raliser cette chose subtile fait progresser dans la comprhension de la
thorie. On dfinit alors la tribu A sur comme la plus petite tribu contenant A0 .
Pour dfinir enfin la probabilit P sur A, on fait lobservation essentielle suivante:
on a non seulement An An+1 , mais de plus la restriction de Pn+1 au sous ensemble
An de An+1 , qui tait le domaine de dfinition de Pn+1 , coincide avec Pn . Par consquent, il existe une fonction universelle P 0 dfinie sur A0 telle que pour tout A A0 on
ait P 0 (A) = Pn (A) pour tous les n tels que A An . A partir de ce point, les choses
cessent dtre lmentaires, et nous sommes obligs dadmettre le thorme suivant,
dont la dmonstration est donne en troisime anne duniversit:
Thorme 2.10 Il existe une et une seule probabilit P sur A telle que pour tout
A A0 on ait P (A) = P 0 (A).
On peut ainsi dmontrer lide intuitive quun vnement de probabilit strictement
positive, mme petite, finit toujours par arriver. Plus prcisment, si A est lensemble

14
www.L es-M athematiques.net

2.4. LE CAS O = IR.

des comprenant au moins un succs, alors P (A) = 1. En effet, si Bn est lensemble des comprenant au moins un succs avant linstant n ou linstant n,
alors A = n1 Bn et Bn Bn+1 . Par continuit monotone (Th. 1.3, (2)) on a donc
lim P (Bn ) = P (A). Comme P (B c ) = (1 p)n tend vers 0, on a le rsultat. Plus gnralement on peut montrer que toute squence a finie donne lavance ( par exemple
SSEESSEESSEESSEE, ou le codage en binaire dune fable de La Fontaine) finira par
arriver. Plus prcisment:
Thorme 2.11 Soit a = (a1 , . . . ,an ) {E,S}n une suite fixe de longueur n de
succs et dchecs, et soit
A = { ; il existe N 0 avec N +1 = a1 , . . . ,N +n = an }.
Alors P (A) = 1.
Dmonstration Soit k le nombre de S dans la suite a. Notons
AN = { ; N +1 = a1 , . . . ,N +n = an }.
Alors P (AN ) = pk (1 p)nk par dfinition de P. Introduisons Bm = m1
j=0 Ajn .
Alors Bm Bm+1 et
A = N 0 AN B = m0 Bm .
On a de plus
c
c
k
nk m
P (Bm
) = P (m1
) m 0.
j=0 Ajn ) = (1 p (1 p)

Par continuit monotone, on a donc P (B c ) = 0. Do 1 = P (B) P (A) = 1.

2.4

Le cas o = IR.

Ce cas est naturellement le plus important de tous. La tribu mise sur IR est la tribu
de Borel B dfinie la section 1 comme la plus petite tribu contenant les intervalles
(ouverts, ferms, semi ouverts, demi droites) Parmi ses lments, les borliens, les seuls
quon aura concrtement manipuler sont les runions dintervalles.
Pour dcrire les probabilits sur (IR,B), introduisons une dfinition importante:
Dfinition Soit F une fonction de IR dans IR. On dit que F est une fonction de
rpartition si elle satisfait aux trois proprits suivantes:
F est croissante (au sens large);
limx F (x) = 0 et limx+ F (x) = 1;
F est continue droite en tout point x, cest--dire limh&0 F (x + h) = F (x).

On a alors le thorme fondamental suivant:


Thorme 2.12 Soit P une probabilit sur (IR,B). Soit FP la fonction relle dfinie par
FP (x) = P (] ,x]).
15
www.L es-M athematiques.net

2.4. LE CAS O = IR.

Alors FP est une fonction de rpartition. Inversement, si F est une fonction de rpartition, alors il existe une et une seule probabilit sur (IR,B) telle que FP = F.
Dmonstration Si x < y, alors A =] ,x] B =] ,y], et donc FP (x) =
P (A) P (B) = FP (y). Ensuite, si (xn ) tend vers en dcroissant et si An =
] ,xn ], alors An An+1 et n1 An = ; par continuit monotone P (An ) tend
vers 0. Donc limn FP (xn ) = 0. Comme ceci est vrai quelle que soit la suite (xn )
tendant vers en dcroissant, on en dduit limx FP (x) = 0. De mme, si (yn )
tend vers en croissant et si Bn =] ,yn ], alors Bn Bn+1 et n1 Bn = IR; par
continuit monotone P (Bn ) tend vers P (IR) = 1 et on a limy+ FP (y) = 1.
Enfin, si hn & 0, soit Cn =],x + hn ]. Alors Cn Cn+1 et n1 Cn =],x].
Par continuit monotone on a donc limn+ F (x + hn ) = FP (x), do la continuit
droite annonce de la fonction FP .
Nous admettrons la rciproque, qui est la partie difficile.
Commentaires: Ce rsultat est assez rassurant: bien quon connaisse mal la tribu
B, et donc les probabilits dfinies dessus, il y a en fait bijection entre lensemble de
toutes les probabilits sur IR et lensemble moins abstrait de toutes les fonctions de
rpartition. Mais la dmonstration complte est rserve la 3 me anne.
La fonction de rpartition permet de calculer les probabilits de tous les intervalles.
Pour simplifier, adoptons la notation pour la limite gauche en x de la fonction croissante F :
F (x 0) = lim F (x + h).
h%0

Proposition 2.13 Soit F la fonction de rpartition dune probabilit P sur (IR,B).


Alors
P (],x[) = F (x0), P (]x,+[) = 1F (x), P ([x,+[) = 1F (x0).
Pour a b, P (]a,b]) = F (b) F (a), P ([a,b[) = F (b 0) F (a 0).
P (]a,b[) = F (b 0) F (a), P ([a,b]) = F (b) F (a 0) et en particulier
P ({a}) = F (a) F (a 0).

Dmonstration La premire galit sobtient en considrant An =] ,x + hn ],


vers 0. Alors An An+1 et n1 An =] ,x[. Par convero hn est < 0 et croNt
gence monotone lgalit sensuit. Les deux suivantes sobtiennent par passage au complmentaire. La suivante dcoule de lgalit
] ,b] =] ,a]]a,b],
et du fait que au second membre les deux ensembles sont disjoints. De mme
] ,b[=] ,a[[a,b[
fournit lgalit suivante grce la premire galit de la liste. Laissons les dernires
en exercice.
Donnons maintenant des exemples de fonctions de rpartition

16
www.L es-M athematiques.net

2.4. LE CAS O = IR.

Dfinition Fonctions de rpartition densit. Soit f une fonction positive dfinie sur IR qui ait des discontinuits au plus
R aen un nombre fini de points a1 < a2 <
< aN et qui soit telle que les intgrales aii+1 f (x)dx convergent et satisfassent
N Z
X
i=0

ai+1

f (x)dx = 1,

ai

avec la convention a0 = et aN +1 = +. R
x
On dfinit alors la fonction F par F (x) = f (t)dt. Il est clair que F est une
fonction de rpartition. Ici, elle est de plus continue et, daprs le thorme fondamental
du calcul intgral, elle satisfait F 0 (x) = f (x) pour tout x
/ {a1 , . . . ,aN }. La fonction
f sappelle alors la densit de la fonction de rpartition F .
1
Par exemple f1 (x) = 12 e|x| , f2 (x) = 1 1+x
, f3 (x) = 0 si x 0 et f3 (x) =
si x > 0, quil est plus rapide de dfinir par

1 ex
x

1
f3 (x) = ex 1]0,[ (x),
x
o 1E (x) = 1 si x E et 1E (x) = 0 sinon: la fonction 1E sappellera dsormais
lindicateur de lensemble E. Dernier exemple:
f4 (x) = 1[0,1] (x).
Dans ces exemples, N = 0 pour f1 et f2 , N = 1 pour f3 et N = 2 pour f4 .
Il est important de ne pas confondre les deux fonctions F et f . Pour les exemples ci
dessus de densits, les fonctions de rpartition correspondantes seront respectivement
1 x
1
e pour x 0, F1 (x) = 1 ex ,
2
2
1
1
F2 (x) = + arctan x,
2
F4 (x) = 0 pour x 0, F4 (x) = x pour 0 x 1, F4 (x) = 1 pour 1 x,
F1 (x) =

(F3 (x) ne peut sexprimer de faon lmentaire).


Dfinition La probabilit a de Dirac. Si a est un rel, il sagit de la probabilit
sur IR dfinie par a (A) = 0 si a
/ A, et a (A) = 1 si a A. Appliquant ceci
A =] ,x], on obtient la fonction de rpartition
Fa (x) = 0 pour x < a, Fa (x) = 1 pour a x.

Voici son graphe


6

a
17
www.L es-M athematiques.net

2.4. LE CAS O = IR.

Si a = 0, cette fonction sappelle lchelon de Heaviside. Les travaux de 1894 de


cet ingnieur lectricien sont la source de la thorie moderne des distributions. Cette
thorie permet par exemple de donner un sens la drivation de la fonction ci dessus:
cest la probabilit de Dirac a qui jouerait alors le rle de la drive.
Dfinition Probabilit discrte sur un nombre fini de points. Soit N un entier
> 0, soit a1 < a2 < < aN des rels et soit p1 , . . . ,pN des nombres positifs tels
que p1 + + pN = 1. On considre la probabilit sur IR dfinie par
P = p1 a1 + + pN aN .
En dautres termes, si A est un borlien:
P (A) = p1 a1 (A) + + pN aN (A) =

pj .

j;aj A

En particulier, si A =] ,x], on obtient la fonction de rpartition


X
FP (x) =
pj ,
j;aj x

dont le graphe est celui dune fonction en escalier croissante, o le saut en aj est gal
pj . Ce cas revient un peu au cas o navait quun nombre fini de points, puisquici
P est concentre sur {a1 , . . . ,aN }.
Si on remplace la suite finie prcdente par un ensemble dnombrable de IR, lextension est facile.
Dfinition Probabilit discrte. On sintresse lensemble dnombrable form
des points dune P
suite (an ) telle que a1 < a2 < < an < et soit pn des nombres

positifs tels que 1 pn = 1. On formera la probabilit P dfinie pour tout Borlien


A par

X
P (A) =
pn an (A),
1

dont la fonction de rpartition est en escalier croissante vec une infinit de points de
discontinuits.
Dfinition Type mixte. On rencontre un peu rarement des fonctions de rpartition de la forme F = G + (1 )H o G est une fonction de rpartition densit,
comme vu lexemple 1, o H est une fonction de rpartition dune probabilit discrte, comme vu aux exemples 2, 3 ou 4, et o 0 < < 1. Si H a une discontinuit en
a de saut p, alors F a une discontinuit en a de saut (1 )p.
Exercices sur 2.4.
1. Calculer la densit des fonctions de rpartition suivantes:
F1 (x) = 0 si x 0 et F1 (x) = 1 exp(x) si x > 0;
F2 (x) = 0 si x 1 et F2 (x) = 1 x1a si x > 1 (avec a>0).
2. Calculer la fonction de rpartition de la densit suivante:
f (x) = 1/2 si 2 < x < 1, f (x) = 1/2 si 1 < x < 2, et 0 ailleurs.
18
www.L es-M athematiques.net

2.4. LE CAS O = IR.

3. On note par [x] la partie entire du nombre


rel x,cest--dire lentier n tel

que n x < n + 1. Par exemple [ 2] = 1, [ 2] = 2, [3] = 3. On


considre la probabilit discrte de fonction de rpartition F (x) = 0 si x < 0 et
1
F (x) = 1 2[x]+1
si x 0. Tracer le graphe de F . Calculer les probabilits des
vnements suivants:
A1 = {0}, A2 = {1,2}, A3 = {4,5, . . .}.

19
www.L es-M athematiques.net

Chapitre

Probabilits conditionnelles et
indpendance
Par Grard Letac

3.1

Conditionnement

Dfinition Si (,A,P ) est un espace de probabilit, soit B A un vnement tel


que P (B) > 0. On dfinit alors la nouvelle probabilit PB sur A par
PB (A) =

P (A B)
,
P (B)

quon note aussi PB (A) = P (A|B), et qui se lit "probabilit de A conditionne par
B", ou "sachant B", ou "sachant que B est ralis".
(,A,PB ) est un authentique espace de probabilit, puisque PB () = P (
B)/P (B) = 1 et que, si les (An )n1 sont deux deux disjoints et dans A, on a bien
PB (n1 An ) =

X
1
1 X
PB (An ).
P (n1 (An B)) =
P (An B)) =
P (B)
P (B)
n1

n1

Il faut toutefois raliser que la probabilit PB est concentre sur B et ne charge pas
Bc.
Pour noncer le prochain rsultat, il est commode dintroduire un nouveau terme:
+
Dfinition une suite finie (Bn )N
n=1 ou dnombrable (Bn )n=1 dvnements est
appele une partition de si les Bn sont deux deux disjoints et si leur runion est
gale .

Thorme 3.1 Soit (,A,P ) un espace de probabilit, soit (Bn )n1 une partition
de finie ou dnombrable avec P (Bn ) > 0 pour tout n, et soit A A tel que P (A) >
0.
1. Si P (B) > 0, alors P (A B) = P (A|B)P (B) = P (B|A)P (A).
20

3.2. INDPENDANCE DVNEMENTS.

2. (Principe des probabilits totales) P (A) =


3. (Formule de Bayes) Pour tout k:

n1

P (A|Bn )P (Bn ).

P (A|Bk )P (Bk )
.
n1 P (A|Bn )P (Bn )

P (Bk |A) = P

Dmonstration Cet nonc est dcor du titre de thorme plutt par son importance pratique que par la difficult de sa dmonstration: pour le 1), utiliser la dfinition
de P (A|B). Pour le 2) observer que les
P A Bn forment une partition de A et donc
daprs laxiome dadditivit P (A) = n1 P (A Bn ) et terminer en utilisant le 1).
Pour le 3) on a
X
P (A|Bk )P (Bk ) = P (A Bk ) = P (Bk |A)P (A) = P (Bk |A)
P (A|Bn )P (Bn ),
n1

successivement en utilisant deux fois le 1) puis une fois le 2). Le rsultat est quivalent
au 3).
Exemple: Dans une population le nombre de chtains est de 50%, et le nombre de
blonds, de noirs ou dautres couleurs est gal. La gntique nous apprend que les probabilits conditionnelles pour quun enfant soit chtain (vnement A) sachant que
son pre est blond (vnement B) est P (A|B) = 0,2, et que de mme, avec des
notations videntes P (A|C) = 0,7, P (A|N ) = 0,6 et P (A|R) = 0,1. Calculons
P (A) et P (B|A). Les vnements B,C,N,R forment une partition avec P (B) =
P (N ) = P (R) = 1/6 et P (C) = 1/2. Les probabilits totales donnent donc P (A) =
0,2 1/6 + 0,7 1/2 + 0,6 1/6 + 0,1 1/6 = 1/2 et la formule de Bayes donne
P (B|A) = P (A|B)P (B)/P (A) = 1/15.

3.2

Indpendance dvnements.

Parfois A et B sont tels que PB (A) = P (A): savoir que B est ralis ne modifie
pas la probabilit de A. Ainsi dans le schma succs chec fini avec N = 2, a 4 lments SS,SE,ES,EE de probabilits respectives p,p(1 p),(1 p)p,(1 p). Si B =
(SS,SE) est lvnement: "le premier essai est un succs" et A = (SS,ES) est lvnement: "le second essai est un succs" alors AB = (SS) , P (A) = p+(1p)p = p,
P (B) = p + p(1 p) = p, P (A B) = p et donc PB (A) = P (A). Cest le phnomne essentiel pour les probabilits des vnements indpendants (quil ne faut pas
confondre avec les vnements disjoints) et que nous allons dfinir.
Dfinition Soit {A1 , . . . ,AN } une famille finie dvnements dun espace de probabilit (,A,P ). On dit que cest une famille indpendante ( on dit parfois un "systme indpendant dvnements") si pour toute partie non vide I de {1,2, . . . ,N } on
a
Y
P (iI Ai ) =
P (Ai ).
iI

21
www.L es-M athematiques.net

3.3. INDPENDANCE DE SOUS TRIBUS.

Par exemple si N = 2, la famille dvnements {A,B} est indpendante si et seulement si P (A B) = P (A)P (B); dans le cas o P (B) > 0 il serait quivalent de dire
PB (A) = P (A). On a coutume de dire par abus de langage que A et B sont indpendants (abus, car ladjectif qualificatif "indpendant" na de sens que sil sapplique
la paire) ou plus correctement que A est indpendant de B, expression qui ne rend
toutefois pas justice la symtrie de la dfinition d indpendance.
Si N = 3 la famille dvnements {A,B,C} est indpendante si et seulement si
P (A B) = P (A)P (B), P (B C) = P (B)P (C), P (C A) = P (C)P (A),
P (A B C) = P (A)P (B)P (C).
Notez que la deuxime ligne nest pas entrane par la premire. Si a 4 points 1,2,3,4
de probabilit 1/4 chacun, les 3 vnements A = 1,2, B = 1,3 et C = 1,4 satisfont la
premire ligne et pas la deuxime: ils sont seulement deux deux indpendants.
Si N est quelconque, il ny a pour montrer lindpendance que 2N 1 N galits vrifier, puisque lensemble vide pour I est exclu et que les N cas o I est un
singleton sont triviaux. Notez aussi que lensemble vide et lensemble sont indpendants de nimporte quoi et quune sous famille dune famille indpendante est encore
indpendante. Enfin, on convient de dire:
Dfinition Une famille infinie dvnements est indpendante si toute sous famille finie est indpendante.
Comme exemple dindpendance de N vnements, considrons dans le schma
succs chec fini avec N essais un lment particulier a = (a1 , . . . ,an ) de , cest-dire une suite particulire de succs et dchecs. Notons k = X(a) le nombre de
succs que comprend la suite a. Soit
Aj = { = (1 , . . . ,N ) ; j = aj }.
Alors {A1 , . . . ,AN } est une famille indpendante. En effet P (Aj ) = p si aj = S
et 1 p si aj = E. De plus, par dfinition du schma, P ({a}) = pk (1 p)nk
QN
N
Comme N
j=1 Aj = {a} on a bien P (j=1 Aj ) =
j=1 P (Aj ). La dmonstration
pour nimporte quel sous ensemble I est analogue.

3.3

Indpendance de sous tribus.

La notion prcdente dvnements indpendants a lavantage dtre lmentaire,


et les inconvnients de ne pas tre trs maniable et de ne pas reflter la ralit: lintuition nous fait plutt penser que cest un groupe dvnements qui est indpendant dun
autre groupe, plutt que deux vnements isols. Par exemple, il est facile de vrifier
que si A est indpendant de B, alors Ac est aussi indpendant de B. La bonne notion
de "groupe" dvnements est en fait celle de sous tribu. Do la dfinition suivante:
Dfinition Soit {A1 , . . . ,AN } une famille finie de sous tribus dun espace de
probabilit (,A,P ). On dit que cest une famille indpendante si pour tous Bj Aj
on a
P (B1 B2 . . . BN ) = P (B1 ) . . . P (BN ).

22
www.L es-M athematiques.net

3.3. INDPENDANCE DE SOUS TRIBUS.

(Plus la peine donc dexaminer tous les sous ensembles I.) En fait, cest une puissante gnralisation de la notion dvnements indpendants, daprs le thorme suivant:
Thorme 3.2 Soient A1 , . . . ,AN des vnements. Soient les tribus quatre lments engendres par les Aj :
Aj = {,Aj ,Acj ,}.
Alors la famille de sous tribus {A1 , . . . ,AN } est indpendante si et seulement si la
famille dvnements {A1 , . . . ,AN } est indpendante.
Dmonstration Pour , soit I une partie de (1,2, . . . ,N ). Prenons alors Bj = Aj
si j I et Bj = sinon. Alors
Y
P (iI Ai ) = P (B1 B2 . . . BN ) = P (B1 ) . . . P (BN ) =
P (Ai ).
iI

Bien quune dmonstration par rcurrence soit possible immdiatement pour la rciproque, nous attendons la section 5 pour avoir une dmonstration plus simple.
Exercices sur la section 3.
1. Dans le schma Succs Echec fini N essais,on suppose p = 1/2 et on considre
les deux vnements A= que des succs ou que des checs, et B= pas plus dun
succs. Montrer que A et B sont indpendants si et seulement si N = 3.
2. On munit le segment = [0,1] de la probabilit P telle que P ([a,b]) = b a
pour tout intervalle [a,b] [0,1]. On considre les trois vnements A = [0,1/2],
B = [1/4,3/4], C = [3/8,7/8]. Quelles sont les paires dvnements parmi
A,B,C qui sont indpendantes?

23
www.L es-M athematiques.net

Chapitre

Image dune probabilit,


variables alatoires
Par Grard Letac

4.1

Fonctions mesurables

Quand en mathmatiques une nouvelle structure est introduite, comme celle despace vectoriel, ou comme prsentement celle despace de probabilit, une dmarche
fconde est de rechercher les transformations qui prservent cette structure. Pour les
espaces vectoriels, ce sont les applications linaires. Pour les espaces de probabilit, ce
sont les "fonctions mesurables" quon va introduire dans un instant. Le cas particulier
important en sera les "variables alatoires". Auparavant, adoptons la notation suivante:
Dfinition si E et F sont des ensembles quelconques, si f est une fonction dfinie
sur E et valeurs dans F , et si enfin B est un sous ensemble de F , lensemble A des x
de E tels que f (x) soit dans B sera dsormais not par A = f 1 (B). Nous lappellerons limage inverse de B par f .
Insistons sur le fait que f nest pas ncessairement injective ni surjective. On vrifie
facilement que:
Proposition Si B1 et B2 sont des sous ensembles de F alors on a
f 1 (B1 B2 ) = f 1 (B1 ) f 1 (B2 ) et f 1 (B1 B2 ) = f 1 (B1 ) f 1 (B2 ).

La mme proprit est vraie mme avec une famille infinie de B.


Dfinition Soit alors deux espaces et 1 , chacun muni dune tribu A et A1 ,
et soit f une fonction dfinie sur valeurs dans 1 On dit que f est une fonction
mesurable si pour tout B A1 , alors A = f 1 (B) est un lment de A.

24

4.2. IMAGE DUNE PROBABILIT.

Dans ces conditions, on voit facilement que:


Proposition Lensemble des parties A de la tribu qui sont de la forme f 1 (B),
avec B A1 , est une tribu. On la note parfois f 1 (A1 ). Comme f est mesurable, cest
donc une sous tribu de A.
Montrer quune fonction est mesurable est gnralement facile grce au thorme
suivant, dont la dmonstration est hors programme.
Thorme 4.1 Soit F une famille de parties de 1 telle que la tribu A1 soit la
plus petite qui contienne F. Soit f une fonction de valeurs dans 1 . Soit A une
tribu sur . Alors f est mesurable pour ce couple de tribus si et seulement si pour tout
B F alors f 1 (B) A.
Illustrons ceci par un exemple important en lappliquant au cas o (,A) = (1 ,A1 ) =
(IR,B), pour montrer que
Proposition Toute fonction continue f de IR dans IR est mesurable.
Dmonstration Pour cela, on applique le thorme au cas o F est lensemble
de tous les intervalles ouverts: par dfinition de la tribu B de Borel, lhypothse du
thorme est vrifie. Ensuite, on sait daprs le cours danalyse que limage inverse
dun intervalle ouvert par une fonction continue est une runion finie ou dnombrable
dintervalles ouverts, et est donc un borlien.
Dmonstration La partie "seulement si" dcoule des dfinitions. Pour la partie
"si", lart est de considrer la tribu T de parties de engendre par tous les f 1 (B)
lorsque B parcourt F ainsi que
T1 = {B 1 ; f 1 (B) T }.
A son tour, T1 est une tribu de parties de 1 (ce point se vrifie directement facilement),
et elle contient F, et donc elle contient la tribu A1 . Do
f 1 (T1 ) f 1 (A1 ) = A.
Mais comme par dfinition de T1 on a
f 1 (T1 ) T ,
on en tire que T = A, ce qui est lgalit cherche.

4.2

Image dune probabilit.

Dfinition Si (,A) est muni dune probabilit, alors la fonction mesurable f


permet de dfinir de faon naturelle une probabilit P1 sur (1 ,A1 ) ainsi: pour tout
B A1
P1 (B) = P (f 1 (B)).
La probabilit P1 ainsi fabrique est appele limage de la probabilit P par la fonction
mesurable f . On parle aussi de la probabilit P1 transporte de P par f . On la note
25
www.L es-M athematiques.net

4.3. LES VARIABLES ALATOIRES RELLES ET LEURS LOIS.

traditionnellement P1 = f P . Dautres la notent plus correctement P f 1 , mais cest


moins commode.
Cette fonction P1 sur A1 est bien une probabilit. En effet,
P1 (1 ) = P (f 1 (1 )) = P () = 1;
De plus si B1 et B2 sont des parties disjointes de 1 , alors f 1 (B1 ) et f 1 (B2 ) sont
alors des parties disjointes de . Cela permet de vrifier facilement laxiome dadditivit dnombrable pour P1 .

4.3 Les variables alatoires relles et leurs lois.


Nous appliquons les concepts prcdents, qui taient bien abstraits, au cas o lespace darrive (1 ,A1 ) est (IR,B). Dans ce cadre, une fonction mesurable de valeurs dans IR prend le nom de variable alatoire relle, ou de variable alatoire si le
contexte est clair (on pourra ensuite considrer des variables alatoires valeurs dans
IR ou dans IRn quand on aura prcis de quelle tribu quiper IRn ).
Dfinition Une variable alatoire relle est une fonction mesurable dune tribu
(,A) dans la tribu (IR,B) o B est lensemble des borliens de IR.
Plutt que de noter la variable alatoire f , la tradition est de la noter par une lettre
majuscule comme X. En dpit du nom de "variable alatoire," quon garde pour des raisons historiques, X est donc une fonction relle dfinie sur . Lavantage de travailler
dans IR est que grce au Thorme 2.12, on sait comment sont faites les probabilits
sur IR et donc les probabilits transportes par les variables alatoires. On abandonne
dailleurs galement pour P1 = X P ce nom de probabilit transporte de P par la
variable alatoire X, on la note plutt PX et on lappelle la loi de la variable alatoire
X: cest une probabilit sur IR.
Dfinition Si X est une variable alatoire relle dfinie sur un espace probabilis (,A,P ), lapplication PX dfinie de lensemble des borliens de B dans [0,1] par
PX (B) = P (X 1 (B)) est une probabilit sur IR appel loi de la variable alatoire X.
Quant la fonction de rpartition FPX , il est plus simple de la noter FX . Donc on
a
FX (x) = P ({ ; X() x});
ici encore, il est plus simple dcrire FX (x) = P (X x).
Dfinition Si X est une variable alatoire relle, la fonction FX dfinie sur IR par
FX (x) = P ({ ; X() x})
est la fonction de rpartition de la variable alatoire X.
Enfin, v.a. est une abrviation courante pour "variable alatoire".

26
www.L es-M athematiques.net

4.3. LES VARIABLES ALATOIRES RELLES ET LEURS LOIS.

A propos du schma Succs Echec fini dordre N , nous avons dj rencontr la


variable alatoire X qui tait le nombre de succs en N expriences pour laquelle nous
k k
avons vu que P (X = k) = CN
p (1 p)N k . Cest donc dire que la loi de X est la
loi discrte concentre sur les entiers 0,1, . . . ,N et gale
k k
(1 p)N 0 + N (1 p)N 1 p1 + + CN
p (1 p)N k k + + pN N

(Rappelons que k est la probabilit de Dirac concentre en k).


Plus gnralement:
Dfinition Soit (,A,P ) un espace de probabilit. Une variable alatoire X sur
ne prenant quun nombre fini de valeurs a1 < a2 < . . . < aN sera dite tage.
Les parties X 1 ({aj }) = Aj de sont des lments de A, puisque les {aj } sont
des intervalles, dun type un peu particulier, et donc des borliens. Les Aj sont deux
deux disjoints, et si on introduit leurs indicateurs, on peut crire
X = a1 1A1 + + aN 1AN .
Si pj = P (Aj ) on voit que la loi de X est
PX = p1 a1 + + pN aN .
Une autre manire de dire la mme chose est dcrire P (X = aj ) = pj pour tout j.
Il y a un certain nombre de lois de probabilits quon rencontre souvent dans la nature que nous pourrions prsenter maintenant, mais il est prfrable de dfinir quelques
caractristiques des variables alatoires avant pour pouvoir prsenter une carte didentit plus complte de chacune de ces lois classiques.
Exercices sur la section 4.
1. Soit X une variable alatoire de densit axa1 1]0,1[ (x). Calculer limage de sa
loi par x 7 x/(1 x). Mthode: calculer la fonction de rpartition de Y =
X/(1 X) et driver celle ci.
2. Soit X une variable alatoire suivant la loi de Cauchy, cest--dire de densit
1
(1+x) . Calculer limage de sa loi par x 7 1/x.

27
www.L es-M athematiques.net

Chapitre

Lesprance mathmatique
dune variable alatoire
Par Grard Letac

5.1

Les variables alatoires tages.

Dfinition Soit (,A,P ) un espace de probabilit. Dsignons par E lensemble


de toutes les variables alatoires relles tages dfinies sur . A tout lment X de
E nous associons un nombre appel esprance mathmatique de X, not IE(X), et
dfini ainsi: si la loi de X est
PX = p1 a1 + + pN aN ,
alors
IE(X) = p1 a1 + + pN aN .

En fait, E est un espace vectoriel et X 7 IE(X) est une forme linaire positive
dessus, comme le montre le thorme suivant:
Thorme 5.1 (Linarit et positivit de lesprance)
Si X et Y sont des v.a. tages sur alors X + Y , pour des rels et , est encore une v.a. tage. De plus IE(X + Y ) = IE(X) + IE(Y ). Enfin IE(X) IE(Y )
si X Y.
Dmonstration Introduisons les lois de X et Y :
PX = p1 a1 + + pN aN , PY = q1 b1 + + qM bM ,
notons X 1 ({ai }) = Ai , Y 1 ({bj }) = Bj et Cij = Ai Bj et rij = P (Cij ). La
matrice (rij ) a pour somme des lignes le vecteur ligne (q1 , . . . ,qM ) et pour somme des
colonnes le vecteur colonne t (p1 , . . . ,pN ). Les valeurs prises par Z = X + Y sont
28

5.1. LES VARIABLES ALATOIRES TAGES.

les cij = ai + bj et comme Z 1 ({cij }) = Cij A, on en dduit que Z est aussi


une v.a. Sa loi est
X
PZ =
rij cij ,
ij

et est donc desprance


IE(Z) =

rij cij =

ij

ai

rij (ai + bj ) =

ij

rij +

X
j

bj

rij = IE(X) + IE(Y ).

Quant lingalit, il suffit dobserver que IE(X Y ) 0 par dfinition de lesprance et dappliquer ensuite la linarit quon vient de dmontrer.
Dfinition Variable alatoire de Bernoulli. Un exemple particulirement simple
et important de v.a tage est celui o X ne prend que les valeurs 0 et 1, cest dire o
la loi de X est
PX = (1 p)0 + p1 ,
o p [0,1]. Sa loi est appele une loi de Bernoulli. p est appel le paramtre de la
loi de Bernoulli.
Proposition Lesprance dune loi de Bernoulli X de paramtre p est p. Si X est
dfinie sur lespace de probabilit (,A,P ), soit A = { ; X() = 1} alors X = 1A
est lindicateur de A, et on a donc
IE(1A ) = P (A).
Inversement, un indicateur a toujours une loi de Bernoulli.
Nous allons utiliser le thorme prcdent et les indicateurs pour terminer la dmonstration du thorme 3.2. On veut donc montrer que si Bj Aj = {,Aj ,Acj ,}
et si les Aj sont indpendants, alors
P (N
j=1 Bj ) =

N
Y

P (Bj ).

j=1

On le montre en remarquant dabord que dans les 4 cas possibles pour Bj , il existe
deux nombres aj et bj tels que
1Bj = aj + bj 1Aj ;
on prend en effet aj = bj = 0 si Bj est vide, aj = 1, bj = 0 si Bj est plein, aj = 0,
bj = 1 si Bj = Aj , aj = 1, bj = 1 si Bj = Acj . Do le calcul:
P (N
j=1 Bj ) = IE(

N
Y

1Bj ) = IE(

j=1

N
Y

j=1

Y
X Y
(aj + bj 1Aj )) = IE[ (
aj )( bj 1Aj )] =
I

jI c

jI

Y
Y
Y
X Y
X Y
aj )( bj )P (jI Aj ) =
aj )( bj )IE( 1Aj ) =
(
(
I

jI c

jI

jI

jI c

jI

29
www.L es-M athematiques.net

5.2. ESPRANCE DUNE VARIABLE ALATOIRE QUELCONQUE.

N
N
N
X Y
Y
Y
Y
Y
Y
(
aj )( bj )( P (Aj )) =
(aj + bj P (Aj )) =
IE(1Bj ) =
P (Bj ).
jI c

jI

jI

j=1

j=1

j=1

Dans cette chane de 9 galits, la premire, la cinquime et les 2 dernires sappuient sur le fait que lesprance de lindicateur est la probabilit, la deuxime sur la
dfinition des aj et bj , la troisime et la septime sur un dveloppement algbrique;
enfin, surtout, la quatrime sappuie sur le thorme prcdent et la sixime sur lindpendance des Aj .

5.2

Esprance dune variable alatoire quelconque.

Toutes les variables alatoires ne sont pas tages, mais toutes sont approchables
par des v.a. tages, et cela va permettre de dfinir lesprance dune v.a. quelconque.
Plus prcisment, on a le thorme suivant:
Thorme 5.2 Soit (,A,P ) un espace de probabilit, et X : IR une variable
alatoire positive. Alors
1. Il existe une suite croissante de v.a. tages (Xn ) telle X = limn+ Xn .
2. Si la suite (Xn ) ci dessus est telle que IE(Xn ) soit borne, alors le nombre
lim IE(Xn ) = IE(X)

n+

ne dpend que de X et non de la suite particulire (Xn ), dans le sens que si (Xn0 )
a les proprits demandes (Xn ) au 1), alors la suite IE(Xn0 ) a la mme limite.
IE(X) est lesprance de la variable alatoire positive X.
3. Si Y est une autre v.a positive sur (,A,P ) telle que E(Y ) existe, et si et
sont des nombres 0, alors IE(X + Y ) existe et est gale IE(X) + IE(Y ).
4. Si 0 X Y et si IE(Y ) existe, alors IE(X) existe et IE(X) IE(Y ).
5. Si X 0, alors IE(X) = 0 si et seulement si la loi de X est la probabilit de
Dirac en 0.

Nous omettons la dmonstration, bien que celle ci ne soit pas difficile. Il faut insister sur le fait que lesprance de cette v.a. positive nexiste pas toujours.
Ce thorme dfinit donc IE(X) pour des v.a positives. Pour passer au cas dune v.a
de signe quelconque, voici la dmarche suivre:
Dfinition On considre une v.a. X dfinie sur (,A,P ) et on crit cette fonction
de comme diffrence de deux fonctions positives X = X+ X , o a+ signifie
max(a,0) et a = (a)+ (rappelons que cela implique a = a+ a et |a| = a+ +a ).
Donc |X| = X+ X . On dira que IE(X) existe si, au sens du thorme 5.2, lesprance de |X| existe. Dans ces conditions, daprs le 2) du thorme 5.2, IE(X+ ) et
IE(X ) existent, et on dfinit lesprance de X par IE(X) = IE(X+ ) IE(X ).
On a alors limportante extension du thorme de linarit et de positivit:

30
www.L es-M athematiques.net

5.2. ESPRANCE DUNE VARIABLE ALATOIRE QUELCONQUE.

Corollaire 5.3 Soit (,A,P ) un espace de probabilit, soit L1 lensemble des variables alatoires X sur cet espace telles que IE(X) existe (ou, de faon quivalente,
telles que IE(|X|) soit finie). Alors L1 est un espace vectoriel et X 7 IE(X) est une
forme linaire sur L1 , telle que de plus IE(X) IE(Y ) si X Y.
Appliquons cela deux cas particuliers importants, celui o X est discrte et positive et celui o la loi de X a une densit.
Proposition 5.4 Soit X une v.a discrte avec

PX =

pj aj

j=1

P
p = 1. Alors lesprance de X, E(X) existe si et seulement si la srie
o
P j=1 j
p
a
j
j est absolument convergente. Sil en est ainsi, alors
j=1
IE(X) =

pj aj .

j=1

Dmonstration
Montrons le dabord si les an sont positifs ou nuls. Alors puisque
P
X =
a
1
,
j} sont deux deux disjoints
j=1 j Aj o les vnements Aj = {X =P
n
dans , il suffit de considrer la v.a. tage Xn =
j=1 aj 1Aj , qui est nulle sur

j=n+1 Aj , et qui dfinit une suite ayant les proprits requises au thorme 5.2. Le
rsultat est alors clair.
) et les deux sries
PSi les an ne sont
Ppas positifs on crit an = (an )+ (anP

j=1 pj (aj )+ et
j=1 pj (aj ) convergent si et seulement si
j=1 pj aj est absolument convergente. Cela permet de conclure facilement.
Proposition 5.5 Supposons que la loi de la v.a. X ait une densit f avec un nombre
fini de points de discontinuits
a1 < . . . < aN . Alors lesprance de X, E(X) existe
R
si et seulement si xf (x)dx est absolument convergente. Sil en est ainsi, alors
IE(X) =

xf (x)dx.

Dmonstration Contentons nous de donner les ides de la dmonstration quand X


est positive et quand sa densit f est continue. Lextension aux hypothses du thorme
sera alors standard. On dcoupe [0,n] en n2n intervalles gaux par les points xk = 2kn ,
avec k = 0,1, . . . ,n2n , on convient xn2n +1 = + et on dfinit la variable alatoire
tage Xn = xk quand xk X < xk+1 . Ceci est bien une suite croissante et on a
bien lim
n+ Xn = X.
R
Si 0 xf (x)dx converge, notons
Dn =

xf (x)dx IE(Xn ) =

n2 Z
X

k=0

xk+1

xk

31
www.L es-M athematiques.net

(x xk )f (x)dx.

5.3. THORME DU TRANSPORT.

R
Soit  > 0. Il existe un entier A tel que A xf (x)dx . Soit alors K tel que xK = A
et soit F la fonction de rpartition de X. On partage alors Dn en deux sommes An et
Bn , avec
An =

n2n Z
X

k=K

Bn =

K1
X Z xk+1
k=0

xk+1

(x xk )f (x)dx 2

xk

xf (x)dx 2,

(x xk )f (x)dx =

xk

F (x)dx +

K1
X

(xk+1 xk )F (xk+1 ),

k=0

la dernire galit tant obtenue par intgration par parties en posant u = (x xk )


et v 0 = f. Notons que les symboles xK et K sont des fonctions de n. Si n tend vers
linfini, (Bn ) tend vers zro, comme suite des diffrences entre une intgrale et les
sommes
de Riemann de cette intgrale. On voit donc que (Dn ) tend vers 0. Le cas o
R
xf
(x)dx
diverge est similaire.
0
Exercices sur 5.2
1. Calculer lesprance dune variable alatoire de loi

4
n .
n(n + 1)(n + 2)
n=1
2. Pour quelles valeurs de a > 0 la variable alatoire X ayant pour fonction de
1
rpartition FX (x) = 1 (1+x)
a si x>0, et FX (x) = 0 si x 0, possde-t-elle
une esprance?

5.3

Thorme du transport.

Il arrive souvent quon ait besoin de calculer, non lesprance de la variable alatoire X, mais lesprance dune fonction Y = g(X) de celle ci. Si on applique la
dfinition de lesprance, cela suppose quon calcule la loi de Y , ce qui peut tre trs
incommode. Le rsultat suivant simplifie ce problme.
Thorme 5.6 ( du transport ) Soit X une v.a. sur lespace de probabilit (,A,P ).
Soit x 7 y = g(x) une fonction mesurable de IR dans IR. Si X est tage ou discrte
et de loi
X
PX =
pj aj ,
j1

alors lesprance de X, IE(g(X)) existe si et seulement si


X
pj g(aj )
j1

converge absolument et dans ce cas IE(g(X)) est gale cette somme.


32
www.L es-M athematiques.net

5.4. VARIABLES ALATOIRES INDPENDANTES ET ESPRANCE DU PRODUIT.

Si X a une densit f , alors de mme IE(g(X)) existe si et seulement si


Z
g(x)f (x)dx

est absolument convergente, et dans ce cas IE(g(X)) est gale la somme de lintgrale.
Dmonstration On montre dabord le rsultat quand X est tage, puis quand X
est positive en appliquant la dfinition de lesprance dune variable alatoire positive,
et on passe facilement au cas o X est de signe quelconque.
Exercices sur 5.3
1. Soit une variable alatoire X de densit 12 exp(|x|). Soit z un nombre rel et
soit g(x) = exp(zx). Pour quelles valeurs de z Y = g(X) a-t-elle une esprance? La calculer quand elle existe.
2. X une variable alatoire de densit 21 1[1,1] (x) et soit Y = tan( 2 X). Etudier
de deux manires lexistence ventuelle de IE(Y ) : soit laide du thorme du
transport, soit en calculant la densit de Y : pour cela, crire dabord la fonction
de rpartition de Y puis driver.

5.4

Variables alatoires indpendantes et esprance du


produit.

Dfinition Soit (X1 , . . . ,XN ) une suite de v.a. sur (,A,P ). On se rappelle que
si B est la tribu de Borel, alors par dfinition des variables alatoires Xj1 (B) = Aj
est une sous tribu de A.
Nous dirons que cest une suite de variables alatoires indpendantes si la famille
de sous tribus {A1 , . . . ,AN } est une famille indpendante.
Ceci entrane un fait simple et utile: si les Xj sont des v.a. indpendantes, et si fj
est une fonction relle quelconque, alors les Yj = fj (Xj ) sont des v.a. indpendantes
aussi.
Dans le thorme suivant, qui sert caractriser lindpendance pratiquement, contentons nous de N = 2 : la gnralisation N > 2 est vidente.
Thorme 5.7 Soit X et Y deux variables alatoires sur (,A,P ). Alors elles sont
indpendantes si et seulement si pour tous x et y rels on a
P (X x; Y y) = FX (x)FY (y) = P (X x)P (Y y).
En particulier, si elles sont discrtes de lois respectives
X
X
PX =
pi ai , PY =
q j bj ,
i1

j1

alors elles sont indpendantes si et seulement si pour tout couple (i,j) on a


P (X = ai ; Y = bj ) = pi qj = P (X = ai )P (Y = bj ).
33
www.L es-M athematiques.net

5.4. VARIABLES ALATOIRES INDPENDANTES ET ESPRANCE DU PRODUIT.

Dmonstration Partie . Introduisons les vnements A = {X x} X 1 (B)


et B = {Y y} X 1 (B). Par hypothse ils sont indpendants.
Partie . Elle nest pas lmentaire et sera montre en 3 me anne.
Toutefois, dans le cas discret de la seconde partie la dmonstration directe est facile.
Voici enfin un thorme dune importance considrable.
Thorme 5.8 Soit (X1 , . . . ,XN ) une suite de v.a. indpendantes sur (,A,P ).
Alors le produit X1 XN a une esprance si et seulement si chaque Xj a une esprance. Dans ces conditions lesprance du produit est le produit des esprances:
IE(X1 XN ) = IE(X1 ) IE(XN ).

Dmonstration On le dmontre dabord pour N = 2, et une rcurrence permet de


passer au cas de N quelconque. Pour N = 2, notons X = X1 et Y = X2 pour simplifier. On le dmontre dabord dans le cas o X et Y sont tages. Ceci fait, on suppose
ensuite que X et Y sont positives. Il est facile de construire deux suites croissantes
(Xn ) et (Yn ) de v.a. tages qui sont de plus indpendantes. Comme (Xn Yn ) est son
tour une suite de v.a. qui croit vers XY , on arrive au rsultat. Quant au passage au cas
o les X et Y ne sont plus positives, il est standard.
Exercices sur 5.4
1. Soit X et Y deux variables alatoires indpendantes valeurs dans les entiers
0 de lois respectives donnes par P (X = n) = (1 p)n p et P (Y = n) =
(1 q)n q, o p et q sont dans ]0,1[. Montrer laide de la deuxime partie du
Th. 5.7 que U = X Y et V = min(X,Y ) sont indpendantes.
2. Soit une matrice carre dordre 2 dont les coefficients sont des variables alatoires indpendantes et de mme loi 12 1 + 12 1 . Calculer lesprance du carr
du dterminant de cette matrice.

34
www.L es-M athematiques.net

Chapitre

Moments, fonctions
gnratrices, transformes de
Laplace
Par Grard Letac

6.1

Moments et variance

Thorme 6.1 Soit (,A,P ) un espace de probabilit, et soit n un entier > 0. Soit
Ln lensemble des v.a. X sur cet espace telles que lesprance mn = IE(X n ), appele
moment dordre n, existe. Alors Ln est un espace vectoriel, et on a
L1 L2 Ln .

Dmonstration Puisque f (x) = xn dfinit une fonction convexe sur la demidroite positive, on peut crire pour x et y positif que
(

x+y n
1
) (xn + y n ),
2
2

et donc |X + Y |n (|X| + |Y |)n 2n1 (|X|n + |Y |n ). Une autre mthode pour


obtenir cette ingalit est de montrer que g(t) = 2n1 (tn + 1) (t + 1)n atteint son
minimum sur [0, + [ en t = 1 et de considrer g(x/y).
Si maintenant les esprances de |X|n et de |Y |n sont finies, on en dduit daprs la
fin du thorme 5.2 que lesprance de |X + Y |n est finie et que X + Y est dans Ln
quand X et Y y sont. Enfin, pour voir que si lesprance de |X|n est finie il en est de
mme pour |X|n1 , on utilise lingalit
|X|n1 1 + |X|n ,

35

6.1. MOMENTS ET VARIANCE

quon vrifie immdiatement en tudiant les cas |X| 1 et |X| 1. Le fait que
Ln1 Ln sen dduit.
Dfinition Le moment centr dordre n de la variable alatoire X est dfini par
IE[(X m1 )n ] o m1 = IE(X) .
Remarquons au passage que si le moment non centr mn existe, alors le moment
centr existe, puisque cest lesprance dun polynme en X de degr n et quon vient
de voir que les moments de degr infrieur n existaient.
Le cas particulier rellement important est le cas o n = 2.
Dfinition Soit X une variable alatoire relle. On appelle le moment centr
dordre 2 de X la variance de X, et sa racine carre positive lcart type de X, encore
appel dviation standard. On note lcart type (X) et la variance ((X))2 , ou plus
rarement V (X).
Insistons sur le fait que lcart type a la dimension de la variable alatoire: si celle
ci sexprime en centimtres, lcart type sexprime en centimtres et la variance en
centimtres carrs. Il faut connatre les deux formules suivantes:
Proposition 6.2 Si X a un moment dordre 2, alors pour rel
2 (X) = 2 2 (X),
et Formule de Huyghens:
2 (X) = IE(X 2 ) (IE(X))2 .
En particulier, (IE(X))2 IE(X 2 ), avec galit si et seulement si la loi de X est une
probabilit de Dirac.
Dmonstration La premire formule est immdiate. Pour Huyghens:
2 (X) = IE(X 2 2m1 X + m21 ) = IE(X 2 ) 2m1 IE(X) + m21 = IE(X 2 ) (IE(X))2 .
Ici on a utilis le fait que lesprance dune constante est la constante elle mme et
que m1 = IE(X). Quant la dernire ingalit elle vient du fait quune variance est
toujours positive ou nulle. Si la variance est nulle, alors appliquant le 5) du thorme
5.2 la v.a. positive Y = (X m1 )2 , alors la loi de Y est 0 et celle de X est donc m1 .
Il y a galement connatre deux ingalits clbres:
Proposition 6.3 Ingalit de Markov Si Y est une variable alatoire positive ou
nulle dont lesprance existe, alors pour tout y > 0 on a
P (Y y)

1
IE(Y ).
y

Ingalit de Tchebychev Si X est une variable alatoire ayant un second moment,


alors pour tout t > 0 on a
P (|X IE(X)| t)

1 2
(X).
t2

36
www.L es-M athematiques.net

6.1. MOMENTS ET VARIANCE

Dmonstration
IE(Y ) = IE(Y 1Y y + Y 1Y <y ) IE(Y 1Y y )
IE(y1Y y ) yIE(1Y y ) = yP (Y y),
ce qui est quivalent lingalit de Markov en divisant les extrmits par y.
On applique ensuite Markov Y = (X m1 )2 et y = t2 . Comme
P (|X m1 | t) = P ((X m1 )2 t2 )

1
1
IE((X m1 )2 ) = 2 2 (X),
t2
t

lingalit de Tchebychev est aussi dmontre.


Finalement, la variance dune somme de variables alatoires indpendantes est la
somme des variances. Plus prcisment:
Proposition 6.4 Si X1 ,X2 , . . . ,XN sont des variables alatoires indpendantes
ayant un second moment, alors
2 (X1 + + XN ) = 2 (X1 ) + + 2 (XN ).

Dmonstration Procdons par rcurrence sur N . Cest trivial pour N = 1. Montrons le pour N = 2. Notons pour simplifier X = X1 IE(X1 ) et Y = X2 IE(X2 ).
Tous deux sont desprance nulle. Alors
2 (X1 + X2 ) = IE((X + Y )2 ) = IE(X 2 ) + 2IE(XY ) + IE(Y 2 ) = 2 (X1 ) + 2 (X2 ),
car IE(XY ) = IE(X)IE(Y ) = 0 en utilisant lindpendance de X et de Y . Ensuite,
supposons le rsultat vrai lordre N 1. Alors appliquant le rsultat pour N = 2 au
couple X = X1 + + XN 1 et Y = XN , puis lhypothse de rcurrence, on arrive
au rsultat.
En corollaire, on a donc la loi faible des grands nombres qui dit que en un certain
sens, si des variables alatoires sont indpendantes et de mme loi, alors leur moyenne
arithmtique tend vers leur esprance commune. Plus prcisment:
Thorme 6.5 Loi faible des grands nombres Soit X1 ,X2 , . . . une suite infinie
de v.a. indpendantes et de mme loi, et possdant un second moment. Alors, pour tout
nombre  > 0 fix on a


X1 + + Xn
lim P |
IE(X1 )|  = 0.
n
n

Dmonstration Notons Sn = X1 + + Xn . Alors IE(Sn /n) = IE(X1 ) et


2 (Sn /n) = 2 (Sn )/n2 = ( 2 (X1 ) + + 2 (Xn ))/n2 = 2 (X1 )/n.
37
www.L es-M athematiques.net

6.1. MOMENTS ET VARIANCE

Ici on a utilis successivement les propositions 6.2 puis 6.4, puis le fait que les Xj sont
de mme loi et ont donc mme variance. Appliquons alors lingalit de Tchebychev
X = Sn /n et t = ; on obtient


1
X1 + + Xn
IE(X1 )|  2 2 (X1 ),
P |
n
n
qui tend bien vers 0 pour  fix.
Commentaires: limportance philosophique de la loi des grands nombres est non
ngligeable: elle justifie la dmarche que nous avons adopte pour modliser le calcul
des probabilits. Lide dexprience dcrite au dbut de ce cours est la slection dun
point dans un espace dobservables , mais par un procd susceptible dtre rpt
ad libitum et dans les mmes conditions. Soit S une partie de , comptons le nombre
de fois o S est ralis en n essais, divisons ce nombre par n et notons par fn la fraction, ou la frquence, ainsi obtenue. Lide de probabilit est base sur la constatation
physique que la suite des fn converge vers un nombre P (S) quon appellera probabilit de S. Si la thorie est bien faite, cest dire si les axiomes sont bien choisis, on doit
retrouver cette constatation physique quelque part ltat de thorme dans la thorie
dveloppe partir de ces axiomes. Cest leQ
cas. En effet, le initial dcrivant une

exprience est remplac par un produit infini j=1 j o les j sont identiques l
initial, et sont les rsultats possibles de lexprience rpte linstant j. Les points de
ce produit sont donc des suites infinies = (j )
j=1 . Quant la probabilit sur le produit, elle est telle que toutes les fonctions fj () = j soient indpendantes. Ceci fait,
notons Xj () = 1 si j S et Xj () = 0 sinon. On a une suite de v.a. de Bernoulli
indpendantes et de mme loi desprance p = P (S). La loi faible des grands nombres
dit que fn = n1 (X1 + + Xn ) converge vers P (S), dans le sens dcrit au thorme
6.5. Il existe un thorme avec une conclusion plus prcise, appel loi forte des grands
nombres, que nous exposons maintenant.
Thorme 6.6 loi forte des grands nombres Soit X1 , . . . ,Xn , . . . des variables
alatoires de Bernoulli indpendantes et de mme loi q0 + p1 , avec 0 < p = 1 q <
1. Alors
1
Pr( lim (X1 + + Xn ) = p) = 1.
n n
Dmonstration Elle sappuie sur le lemme de Borel:
Lemme de Lebesgue Si (An )n1 est une suite dvnements telle que
converge, alors Pr(k1 nk An ) = 0.

n1

Pr(An )

La dmonstration de ce lemme est peu prs triviale: Puisque la suite (rk )k1 des
restes de la srie convergente tend vers 0 et que pour tout entier k on peut crire
X
Pr(k1 nk An ) Pr(nk An )
Pr(An ) = rk ,
nk

le rsultat sensuit en faisant tendre k vers linfini.


On se fixe ensuite un nombre  > 0 et on note pour simplifier
Un () = Un =

1
(X1 + + Xn ) p ,
n
38

www.L es-M athematiques.net

6.1. MOMENTS ET VARIANCE

An () = An = {Un > 0},


B() = {limn Un > 0}.
Le point dlicat de la dmonstration est de montrer que pour tout  > 0 il existe un
nombre r = r ]0,1[ tel que P (An ) rn . Admettons ce point quelques instants et
achevons la dmonstration. On remarque dabord que
k1 nk An = {k, n k; Un > 0}.
Un point subtil est ensuite linclusion dvnements:
{limn Un > 0} {k, n k; Un > 0}
{k, n k; Un 0} {limn Un 0}.
Il ny a jamais galit dans ces inclusions: il suffit de penser aux cas Un = 1/n et
Un = 1/n pour sen convaincre. Nous nallons utiliser que la premire inclusion.
Ayant admis que Pr(An ) < rn avec r ]0,1[, comme la srie gomtrique de raison r
converge, le lemme de Borel est appliquable et on en dduit que Pr(B()) = 0.
Ensuite on observe que si 0 <  < 0 on a B() B(0 ). Changeons un peu de
notation en crivant pour N entier BN = B(1/N ). La suite dvnements (BN )N 1
est donc croissante. Mais comme tous les BN sont de probabilit nulle, on a encore
Pr(N 1 BN ) = 0. Analysons alors lvnement N 1 BN . On a
1
1
N 1 BN = {N ; limn (X1 + + Xn ) > p + } =
n
N
1
{limn (X1 + + Xn ) > p}.
n
Nous avons donc montr que
1
Pr(limn (X1 + + Xn ) > p) = 0.
n
Appliquons ce rsultat aux variables de Bernoulli Xn0 = 1 Xn . Elles sont de loi
p0 + q1 et donc Pr(limn n1 (X10 + + Xn0 ) > q) = 0. Cependant n1 (X10 + +
Xn0 ) = 1 n1 (X1 + + Xn ) et donc
1
Pr(limn (X1 + + Xn ) < p) = 0.
n
Lunion de deux vnements de probabilit nulle est nulle, le complmentaire de cette
union est de probabilit 1. Cela entrane:


1
1
Pr limn (X1 + + Xn ) p limn (X1 + + Xn ) = 1.
n
n
Donc avec probabilit 1, les limites suprieure et infrieure sont gales p. Cest le
rsultat annonc.
Reste montrer quil existe r = r ]0,1[ tel que
1
Pr(An ) = Pr( (X1 + + Xn ) > p + ) rn .
n

39
www.L es-M athematiques.net

6.2. LES VARIABLES ALATOIRES VALEURS ENTIRES.

A laide dun nombre s > 0 arbitraire, nous donnons dabord une autre prsentation de
cet vnement:
1
An = {( (X1 + + Xn ) > p + } = {es(X1 ++Xn ) > esn(p+ }.
n
On applique alors lingalit de Markov (proposition 6.3) Y = es(X1 ++Xn ) et
y = esn(p+) . On en tire
Pr(An )
=
=
=
=

1
IE(Y )
y
esn(p+) IE(es(X1 ++Xn ) )
(es(p+) IE(esX1 ))n
(es(p+) (q + pes ))n
(qesps + pesqs )n .

Insistons sur le fait que cette ingalit est valable pour tout s > 0. Observons alors
quil existe des valeurs de s telles que s 7 (s) = qesps + pesqs soit < 1. Une
manire de le voir est de calculer (0) = 1 et 0 (0) = . Cela entrane videmment,
puisque  = 0 (0) = lims0 (1 (s))/s, quil existe s0 > 0 proche de 0 tel que
r = (s0 ) < 1. Comme > 0 cela termine la dmonstration.
Exercices sur 6.1
1. Soit X une variable alatoire telles que 0 X 1. Montrer que 2 (X) 14 .
Mthode: si m = IE(X), crire
1
1
(X m)2 = ( m)2 + X(1 X)
4
2
et prendre lesprance de chaque membre.

6.2

Les variables alatoires valeurs entires.

Nous allons nous concentrer pour un moment sur les variables valeurs dans lensemble N des entiers 0. Dans ce cas les moments seront plus faciles calculer grce
lintroduction de la notion de fonction gnratrice de X :
Thorme 6.6 Soit X une v.a. valeurs dans N de loi PX =
dsigne par fX (z) la somme de la srie entire
+
X

P+

n=0

pn n . On

pn z n

n=0

de rayon de convergence R. Alors


1. R 1 et, pour |z| 1 on a fX (z) = IE(z X ).
(n)

1
2. Pour tout n on a pn = n!
fX (0). En particulier, la connaissance de fX donne la
connaissance de la loi de X.

40
www.L es-M athematiques.net

6.2. LES VARIABLES ALATOIRES VALEURS ENTIRES.

3. Pour tout n le moment dordre n IE(X n ) existe si et seulement si la drive


gauche dordre n au point 1 de la fonction z 7 fX (z) dfinie sur [1,1] existe
et est finie. Dans ce cas,

IE(X(X 1) (X n + 1)) =

(n)
fX (1)

k(k 1) (k n + 1)pn ;

k=n
0
00
0
en particulier IE(X) = fX
(1), IE(X 2 ) = fX
(1) + fX
(1).
4. Si X1 ,X2 , . . . ,XN sont des variables alatoires indpendantes valeurs dans N
et si S = X1 + X2 + + XN alors pour |z| 1:

fS (z) = fX1 (z) fXN (z),


cest--dire que la fonction gnratrice dune somme est le produit des fonctions
gnratrices.

Dmonstration Il est clair que la srie entire converge pour z = 1 puisque


P+
n=0 pn = 1 et donc que fX (1) = 1. Donc R 1. Ensuite, si |z| = 1 la srie
est absolument convergente. Pour le 2), cela dcoule du lien entre la formule de Taylor
et la somme dune srie entire.
Le 3) est plus dlicat. Nous le montrons pour n = 1. Le principe pour n quelconque
est le mme.
Supposons dabord que IE(X) existe, cest--dire, daprs la proposition
P+
5.4, que n=0 npn converge. Montrons qualors la drive gauche en 1 de fX existe
et est finie. Celle ci est dfinie comme la limite quand z crot vers 1 de la fonction
+
+
X
1 fX (z) X 1 z n
fX (z) fX (1)
=
=
pn
=
pn (1 + z + + z n1 ).
z1
1z
1

z
n=0
n=0

P+
Or si 0 z 1 on a 1 + z + + z n1 n. Comme n=0 npn converge la srie
prcdente converge normalement et sa limite est pour z tendant vers 1 est IE(X).
0
Inversement, supposons que la drive gauche en 1, note fX
(1) existe. Appliquons le thorme des accroissement finis lintervalle [z,1] et la fonction fX . Il
existe donc c ]z,1[ tel que
+
X
1 fX (z)
0
= fX
(c) =
npn cn1 .
1z
n=1

Ceci tend vers une limite finie si z croit vers 1 par hypothse. Il est clair puisque c tend
vers 1 avec
z, que cette limite est suprieure ou gale toutes les sommes partielles de
P+
la srie n=0 npn , ce qui prouve que cette srie converge. Enfin, trivialement,
+
X

pn cn1

n=1

+
X

npn ,

n=1

0
ce qui montre finalement que fX
(1) = IE(X).
Le 4) est une consquence immdiate du fait que si les Xj sont indpendants, alors
les z Xj sont indpendants, et que lesprance du produit de variables indpendantes est
le produit des esprances:

fS (z) = IE(z X1 ++XN ) = IE(z X1 z XN ) =


41
www.L es-M athematiques.net

6.2. LES VARIABLES ALATOIRES VALEURS ENTIRES.

IE(z X1 ) IE(z XN ) = fX1 (z) fXN (z).

Commentaires: la dmonstration du 3) nest pas facile si R = 1, comme on la vu.


Si R > 1, cest simple et immdiat par le thorme de drivation dune srie entire
lintrieur de lintervalle de convergence.
Nous tudions maintenant 4 exemples fondamentaux de lois sur N.
Dfinition - Proposition La loi de Bernoulli B1,p . Pour 0 < p < 1 cest la loi
B1,p = (1 p)0 + p1 .
Sa fonction gnratrice est f (z) = (1 p) + pz, son esprance est p et sa variance est
(1 p)p.
Dfinition - Proposition La loi binomiale BN,p . Cest la loi du nombre de succs dans le schma Succs Echec fini N essais:
BN,p =

N
X

k
CN
(1 p)N k pk k .

k=0

Sa fonction gnratrice est daprs la formule du binme, f (z) = ((1 p) + pz)N .


Donc en prenant sa drive lordre 1, son esprance est donc N p. Quant sa variance,
cest N (1 p)p.
On remarque que si X et Y sont indpendantes et de lois respectives BN,p et BM,p ,
alors la loi de X + Y est BN +M,p , comme on le voit par la fonction gnratrice.
Un bon moyen de retenir ces rsultats sur la loi binomiale est dobserver que si
X1 , . . . ,XN sont des variables alatoires indpendantes de mme loi de Bernoulli B1,p ,
alors S = X1 + + XN est de loi binomiale BN,p comme on le voit par la fonction
gnratrice fS .
Dfinition - Proposition La loi de Poisson P . Pour > 0, cest la loi dfinie
par
P =

X
n
e n .
n!
n=0

Sa fonction gnratrice est f (z) = exp((z 1)), son esprance et sa variance sont
toutes deux gales .
On remarque que si X et Y sont indpendantes et de lois respectives P et P ,
alors la loi de X + Y est P+ , comme on le voit par la fonction gnratrice.
La manire la plus courante de rencontrer cette loi de Poisson dans la nature est en
tant quapproximation de la loi binomiale. En effet, la suite de lois BN,/N tend vers
P dans le sens suivant: pour tout entier k on a
lim BN,/N ({k}) = P ({k}).

42
www.L es-M athematiques.net

6.2. LES VARIABLES ALATOIRES VALEURS ENTIRES.

Pour le voir, on observe que la suite du premier membre est


k
CN
(1

N (N 1) (N k + 1)

N k k
)
( ) =
(1 )k (1 )N .
k
N
N
N
N
k!
N

Le premier produit tend vers 1, comme quotient de deux polynmes de N de degr


k ayant mme terme de plus haut degr. Il est clair que toute lexpression tend vers
k
x N
si N tend vers linfini, par la formule connue limN (1 + N
) = exp x.
k! e
Dfinition - Proposition La loi de Pascal et la loi ngative binomiale. Dans le
schma Succs Echec infini, intressons nous la loi du temps dattente T1 du premier
succs , soit T1 () = inf {n ; j = S}. La loi de T1 se calcule facilement en remarquant que dire que T1 > n est dire que les n premiers essais ont t des checs, un
vnement de probabilit (1 p)n . Donc, puisque
P (T1 = n) = P (T1 > n 1) P (T1 > n) = (1 p)n1 (1 p)n = (1 p)n1 p,
la loi de T1 , dite loi de Pascal, ou loi gomtrique, est
PT1 = p1 + (1 p)p2 + + (1 p)n1 pn +
pz
Sa fonction gnratrice est la fonction homographique fT1 (z) = 1(1p)z
, sa
2
moyenne est 1/p, un rsultat quil est bon de retenir. Quant sa variance, cest (T1 ) =
(1 p)/p2 .

Si ensuite on sintresse au temps dattente Tk du k ime succs, il est intuitivement clair, bien que pas si facile montrer rigoureusement, que cest la somme de k
variables alatoires indpendantes I1 , . . . ,Ik , de mme loi que T1 : la v.a. Ik reprsente
lintervalle de temps entre les k 1 ime et k ime succs. La fonction gnratrice est
pz
donc fTk (z) = ( 1(1p)z
)k , la moyenne k/p et la variance k(1 p)/p2 . Toutefois,
la loi de Tk est concentre sur les entiers suprieurs ou gaux k, et il y a avantage
en vue dune gnralisation considrer plutt la loi de Tk k, concentre sur N, de
fonction gnratrice
fTk k (z) = (

X
p
1
)k =
k(k + 1) (k + n 1)pk (1 p)n z n ,
1 (1 p)z
n!
n=0

en dveloppant selon la formule du binme de Newton. Cela entrane donc que si n


k:
P (Tk = n) = P (Tk k = n k) =

1
k(k + 1) (n 1)pk (1 p)nk =
(n k)!

k1 k
Cn1
p (1 p)nk ,

une formule difficile retenir.


Maintenant, on peut gnraliser la loi de Tk k en remplaant le paramtre entier
k par le paramtre continu positif . Linterprtation probabiliste disparait, mais les
formules demeurent. On introduit donc la loi dite ngative-binomiale dfinie par:

43
www.L es-M athematiques.net

6.3. TRANSFORME DE LAPLACE DUNE VARIABLE ALATOIRE.

Dfinition - Proposition La loi ngative binomiale est la loi N B,p dfinie


pour > 0 et 0 < p < 1 par
N B,p =

X
1
( + 1) ( + n 1)p (1 p)n n .
n!
n=0

Une variable alatoire X qui suit une telle loi est donc telle que si n N :
P (X = n) =

1
( + 1) ( + n 1)p (1 p)n ,
n!

p
sa fonction gnratrice est fX (z) = ( 1(1p)z
) , sa moyenne est (1 p)/p et sa
variance est (1 p)/p2 .

Exercices sur 6.2


1. Montrer que si deux ds sont marqus sur leurs faces 1,2,3,4,5,6 il est impossible
de les piper de sorte que la somme X +Y de leur points soit telle que P (X +Y =
1
n) = 11
pour n = 2,3, . . . ,12. Mthode: montrer que les fonctions gnratrices
fX (z) et fY (z) sont telles que fX (z)/z et fX (z)/z sont des polynSmes

ayant
au moins un zro rel, et que fX+Y (z)/z 2 na que des zros imaginaires.

2. Une fonction gnratrice fX est telle que fX (z) = (1 1 z)/z. Quelle est
la probabilit pour que X = n? Est ce que IE(X) existe?
3. Soit X et Y deux variables alatoires indpendantes qui suivent des lois de Pascal pas ncessairement identiques. Soit Z = min(X,Y ). Calculer pour n fix
P (X > n, P (Y > n), P (Z > n), P (Z = n). Montrer que Z suit une loi de
Pascal. Exprimer sa moyenne en fonction des moyennes de X et Y .

6.3

Transforme de Laplace dune variable alatoire.

Thorme 6.7 Soit X une variable alatoire. Soit IX lensemble des z rels tels
que LX (z) = IE(ezX ) existe. La fonction z 7 LX (z) dfinie sur IX est appele la
transforme de Laplace de X. Alors
1. Lensemble IX est un intervalle contenant 0.
2. Si 0 est dans lintrieur de IX , la transforme de Laplace est dveloppable en
(n)
srie entire et les coefficients de cette srie sont les LX (0)/n! = IE(X n )/n! :
LX (z) =

X
IE(X n ) n
z .
n!
n=0

3. Si IX est de longueur positive, la loi de X est caractrise par sa transforme de


Laplace. Plus prcisment, si IX IY est de longueur positive et si LX = LY
sur cet intervalle, alors X et Y sont de mme loi.
4. Si X et Y sont indpendantes, alors IX+Y = IX IY et , pour z dans cet
intervalle: LX+Y (z) = LX (z)LY (z).
5. Si a et b sont rels avec a 6= 0 alors IaX+b = a1 IX et LaX+b (z) = exp(bz)LX (az).

44
www.L es-M athematiques.net

6.3. TRANSFORME DE LAPLACE DUNE VARIABLE ALATOIRE.

Dmonstration 1) Il est clair que 0 IX . Si 0 < s < z ou si z < s < 0 et


si z IX , montrons que s IX . Cela vient du fait que exp(sX) 1 + exp(zX),
comme on le voit en examinant les 4 cas X 0 et X < 0, z > 0 et z < 0.
2) Si [a,a] IX avec a > 0, alors comme exp(a|X|) < exp(aX) + exp(aX)
on en dduit que IE(exp(a|X|)) existe, et donc IE(exp |zX|) existe pour tout |z| a.
Do pour un tel z




N

N

X
X
X
(Xz)n
IE(X n ) n
(Xz)n

z = IE(exp(zX)
LX (z)
= IE(



n!
n!
n!
n=0

IE

n=0

X
|Xz|n
n!

= IE exp |zX|

n=N +1

n=N +1

N
X
|Xz|n
n!
n=0

= IE(YN ).

La variable alatoire YN dcroit vers 0: un thorme de 3me anne dit que cela
suffit pour entraner que limN IE(YN ) = 0; ce qui achve la dmonstration du 2).
La partie 3) est beaucoup plus difficile et nous admettrons ce rsultat.
La partie 4) est une consquence du thorme 5.8 appliqu N = 2 et (X1 ,X2 ) =
(exp(zX), exp(zY )). La partie 5) est immdiate.
A cause du 2) on appelle parfois la transforme de Laplace la fonction gnratrice
des moments. Cest viter, pour ne pas confondre avec la fonction gnratrice dune
variable alatoire X valeurs dans N. Dailleurs, pour un tel X, les deux notions sont
relies par fX (exp z) = LX (z) et lintrieur de IX est alors ] , log R[ o R est le
rayon de convergence de la srie entire de somme fX . Les transformes de Laplace
sont surtout utilises pour caractriser des v.a. densit. Nous en donnons 3 exemples
importants.
Dfinition - Proposition La loi normale Nm,2 . Cest la loi la plus importante
du calcul des probabilits. On lappelle aussi une loi gaussienne, une loi de LaplaceGauss, ou encore une seconde loi de Laplace. Si m IR et si > 0, elle est dfinie par
sa densit:
1
(x m)2
exp
.
2 2
2

Le fait que ce soit une densit de probabilit nest pas vident, car il faut vrifier
que lintgrale de cette fonction > 0 est 1. Si on ladmet pour le cas m = 0 et = 1,
on se ramne facilement ce cas particulier en posant x = y + m. Cette remarque
permet alors de montrer que la transforme de Laplace dune variable alatoire Y de
loi N0,1 est
Z +
y2
z2
1
LY (z) = IE(ezY ) =
e 2 +zy dy = e 2 .
2
Pour voir cette dernire galit il suffit dcrire que la densit de Nz,1 est dintgrale 1.
Remarquons que lintervalle dexistence est IY = IR

45
www.L es-M athematiques.net

6.3. TRANSFORME DE LAPLACE DUNE VARIABLE ALATOIRE.

Ensuite, on remarque que si Y est de loi N0,1 , alors X = Y + m est de loi Nm,2 .
Pour le voir, il suffit dcrire la fonction de rpartition de X de la manire suivante:
FX (x) = P (Y + m x) = P (Y

xm
xm
) = FY (
);

on drive alors les deux membres extrmes de la ligne ci dessus: gauche on obtient
la densit cherche de X, droite en utilisant le thorme de drivation des fonctions
y2
composes et le fait que la densit de Y est par hypothse 12 e 2 : ceci fournit pour
X la densit de la loi Nm,2 comme annonc.
Enfin, pour avoir la transforme de Laplace de X partir de Y on utilise le 5) du
thorme 6.7 pour obtenir que si X est de loi Nm,2 , alors
LX (z) = exp(

2 z2
+ mz).
2

On dduit du 2) du thorme 6.7 qualors IE(X) = m et que 2 (X) = 2 . On


dduit aussi des 3) et 4) du thorme 6.7 que si X1 et X2 sont des variables alatoires indpendantes et de lois respectives Nm1 ,12 et Nm1 ,22 , alors X1 + X2 est de loi
Nm1 +m2 ,12 +22 .
A propos de fonction de rpartition, il faut noter que la fonction de rpartition de
la loi N0,1 , soit
Z x
y2
1
e 2 dy,
(x) =
2
nest pas lmentaire. Elle est tabule dans tous les ouvrages.
On rencontre la loi N0,1 dans la nature comme approximation de bien des lois. La
plus ancienne est lapproximation de Moivre Laplace de la loi binomiale:
Thorme Approximation de Moivre Laplace de la loi binomiale Si X est de
loi BN,p , alors la loi de XN p tend vers la loi N0,1 dans le sens suivant: pour tout
N p(1p)

intervalle [a,b] on a
lim P

X Np
a p
b
N p(1 p)

1
=
2

y2
2

dy.

Une autre prsentation de ce thorme de Moivre Laplace est donc


Z b
 p

p
y2
1
lim P a N p(1 p) + N p X b N p(1 p) + N p =
e 2 dy.
N
2 a
 p

p
Cest dire que P a N p(1 p) + N p X b N p(1 p) + N p est approche
par (b) (a). Cette approximation est la base de la statistique.
La dmonstration de ce rsultat nest pas lmentaire. Toutefois, lusage des transformes de Laplace le rend plausible; avec le thorme 6.7, partie 5):
z

L XN p (z) = (1 p + p p
N p(1p)

N p(1 p)

N pz

)N exp p

N p(1 p)

par un calcul de dveloppement limit.

46
www.L es-M athematiques.net

N exp

z2
,
2

6.3. TRANSFORME DE LAPLACE DUNE VARIABLE ALATOIRE.

Dfinition - Proposition Les lois gamma p,q . La loi exponentielle 1,q de


moyenne q est la plus importante des lois densit aprs la loi normale. Elle est
concentre sur la demi droite positive, sa fonction de rpartition est pour x > 0
F (x) = 1 exp(x/q) et en drivant F , sa densit est
1
exp(x/q)1]0,+[ (x).
q

On la rencontre dans la nature car cest une loi sans mmoire: si X suit une loi
exponentielle de moyenne q et si x et y sont > 0, alors
P (X > x+y|X > y) =

P (X > x + y)
1 F (x + y)
=
= exp(x/q) = P (X > x).
P (X > y)
1 F (y)

Par exemple une ampoule lectrique ne suse pas, et le fait que nous sachions quelle a
dj dur un temps y ne nous donne aucune information pour savoir si elle va durer au
moins un temps x partir de maintenant.
La transforme de Laplace dune variable alatoire X de loi exponentielle existe
1
sur IX =] ,1/q[ et est gale LX (z) = 1qz
. Ceci montre avec le thorme 6.7,
2
2
2), que IE(X) = q, IE(X ) = 2q et, par la formule de Huyghens, que 2 (X) = q 2 .
Si p est un nombre entier positif et si X1 , ,Xp sont des v.a. indpendantes et
1
de mme loi 1,q , la transforme de Laplace de X1 + + Xp est donc ( 1qz
)p sur
] ,1/q[. Comme la transforme de Laplace dtermine la loi, il suffit de montrer (par
une intgration par parties qui permet de faire une rcurrence sur p) que
Z +
1
1
exp(zx x/q)q p xp1 dx = (
)p
(p 1)! 0
1 qz
pour en dduire que la densit de X1 + + Xp est
Z +
1
exp(x/q)q p xp1 1]0,+[ (x) :
(p 1)! 0
cest la densit de la loi p,q .
En fait, comme pour la loi ngative binomiale qui a t obtenue par une interpolation des entiers, il est possible dans la loi p,q de remplacer le paramtre entier par le
paramtre p > 0. Pour cela on introduit une importante fonction de p appele fonction
Gamma dEuler et dfinie pour p > 0 par
Z +
(p) =
exp(x)xp1 dx.
0

Une intgration par parties montre que (p + 1) = p(p). Comme (1) = 1 on en tire
que si p est entier (p) = (p 1)!: cette fonction Gamma interpole les factorielles.
On dfinit alors la loi p,q pour p > 0 non ncessairement entier par sa densit :
Z
1 +
exp(x/q)q p xp1 1]0,+[ (x)
0
1
qui a pour transforme de Laplace ( 1qz
)p . On dduit de cette transforme de Laplace
que la moyenne est pq et que la variance est pq 2 . On appelle p le paramtre de forme

47
www.L es-M athematiques.net

6.3. TRANSFORME DE LAPLACE DUNE VARIABLE ALATOIRE.

et q le paramtre dchelon. En effet, on voit facilement, soit avec les fonctions de rpartition, soit avec les transformes de Laplace, que si X est de loi p,1 alors qX est
de loi p,q . Changer q est un simple changement dunits de mesure, changer p change
de faon importante lallure de la densit.
Dfinition - Proposition La loi uniforme sur [a,b]. Cest la loi U[a,b] , de den1
sit ba
1[a,b] (x). Sa fonction de rpartition F (x) est nulle si x < a, gale
x [a,b] et gale 1 si x > b.

xa
ba

si

Il est facile de voir que si X est de loi U[0,1] alors Y = a + (b a)X est de loi
U[a,b] (on dit aussi que Y est uniformment rpartie sur [a,b]). La transforme de Laplace nest pas spcialement remarquable. Pour U[0,1] , cest L(z) = z1 (ez 1) si z 6= 0
et L(0) = 1 Le moment dordre n pour U[0,1] sobtient directement partir de la dfinition : cest 1/(n + 1). Les variables uniformes sont intensment utilises en simulation.

48
www.L es-M athematiques.net

Chapitre

Appendice 1: Grandes
dviations
Par Grard Letac

Si X1 , . . . ,Xn sont des variables alatoires indpendantes et de mme loi, de moyenne


m et telles quil existe > 0 avec IE(e|Xn | ) < , et si on note Sn = X1 + + Xn ,
le thorme suivant calcule pour a > m le nombre limn (Pr(Sn na))1/n .
Thorme Soit une mesure positive sur IRR non concentre en un point et telle

que lintervalle des rels satisfaisant L() = ex (dx) < ait un intrieur
non vide. On considre la fonction strictement convexe sur gale k = log L et
lintervalle ouvert M = k 0 (), et on note par : M la fonction rciproque de
k0 .
Soit m = k 0 () fix dans M et X1 , . . . ,Xn sont des variables alatoires indpendantes et de mme loi exk() (dx). Soit enfin a M avec m < a et les nombres
un
h(m,a)

1
Pr( (X1 + + Xn ) a)
n
Z a
=
(a x) 0 (x)dx = a((m) (a)) + k((a)) k((m)).

Dans ces conditions on a


1/n
1. (Ingalit des grandes dviations) un eh(m,a) .
1/n

2. (Thorme des grandes dviations) limn un

= eh(m,a) .

Commentaires: 1) Une insupportable confusion rgne dans la littrature denseignement concernant ce rsultat, d Cramer (1938), principalement cause de ses gnralisations des hypothses plus faibles (et peu intressantes) dans IR ainsi qu IRd ,
o les rsultats nont pas lharmonie du rsultat ci dessus.
2) Dans sa prsentation, le thorme fait jouer un rle symtrique toute la famille
de lois de probabilits exk() (dx) quand varie dans . Cette famille est appele
49

une famille exponentielle naturelle engendre par . Attention, nest pas unique: 0
engendre la mme famille exponentielle, cest dire le mme ensemble de probabilits, indpendamment du paramtrage, si et seulement si il existe a et b rels tels que
0 (dx) = eax+b (dx). Il est clair que la loi dune variable alatoire relle X telle quil
existe > 0 avec IE(e|X| ) < appartient une famille exponentielle naturelle: il
suffit de prendre pour la loi de X. Toutefois, pour la loi de X donne, souvent avec un
paramtre, il nest pas toujours apparent de relier cette loi avec la famille exponentielle
laquelle elle appartient. Par exemple la loi de Bernoulli (1 p)0 + p1 appartient
e
la famille exponentielle engendre par = 0 + 1 : prendre p = 1+e
.
3) Implicitement, lnonc utilise des rsultats simples comme le fait que soit
un intervalle et comme la convexit de k, qui se dmontrent comme le 1) et le 6) du
thorme 6.7 du cours de Deug. De plus, il est facile de voir que avec les notations du
thorme, lesprance des Xi est m = k 0 () et leur variance est k 00 () = 1/ 0 (m).
4) La partie 2) du thorme est plus difficile. La partie 1) est comme on va le
voir amusante et lmentaire. Elle fournit une dmonstration de poche de la loi forte
des grands nombres qui affirme que si X1 , . . . ,Xn , . . . sont des variables alatoires
indpendantes et de mme loi de moyenne m, alors Pr(limn Sn /n = m) = 1. Si
on fait lhypothse suplmentaire de lexistence de moments exponentiels, cest dire
quil existe > 0 avec IE(e|Xn | ) < , alors lingalit des grandes
dviations et le
P
critre de Cauchy, du fait que h(m,a) < 0, entraine que la srie un converge, et on
procde alors comme au Thorme 6.6 du cours pour conclure avec le lemme de Borel.
5) Travaux pratiques: Voici quelques mesures classiques, et les lois et les fonctions h(m,a) qui vont avec.
Loi de Bernoulli: = 0 + 1 , L() = 1 + e , = IR, k() = log(1 + e ),
e
m
k 0 () = 1+e
, M =]0,1[, (m) = log 1m , k((m)) = log(1 m) et
h(m,a) = a log

a
1a
+ (1 a) log
.
m
1m

P 1
Loi de Poisson: = n=0 n!
n , L() = exp e , = IR, k() = e , k 0 () = e ,
M =]0,[, (m) = log m, k((m)) = m et
h(m,a) = a log

m
+ a m.
a

1
1
Loi gamma: Soit > 0 fix. = ()
x1 1]0,[ (x)dx, L() = ()
si =]

0
,0[, k() = log(), k () = , M =]0,[, (m) = m , k((m)) = log m

et
a
a
h(m,a) = + log .
m
m

Loi normale: Soit > 0 fix. =


k() =

2 2
2 ,

1
2

2 2

x

exp( 2
2 )dx, L() = exp(
2 ), = IR,

k 0 () = 2 , M = IR, (m) =
h(m,a) =

m
2 ,

k((m)) =

m2
2 2

et

(a m)2
.
2 2

Dmonstration de lingalit des grandes dviations : Notons Sn = X1 + +


Xn . Pour tout t > 0 tel que + t lastuce est dobserver que les deux vnements
50
www.L es-M athematiques.net

{Sn /n a} et {etSn enta } sont les mmes (comme la Prop. 6.6). On crit,
laide de lingalit de Markov (voir cours de Deug, Prop. 6.2) applique Y = etSn
et y = enta :
un = Pr(etSn enta ) enta IE(etSn ) = [eta IE(etX1 )]n = [eta

L( + t) n
] .
L()

1/n

Donc un eta+k(+t)k() . Observons ensuite que t 7 ta + k( + t) k() est


convexe sur lintervalle ouvert ( + )]0,[ et que sa drive sy annule au point
t = (a) (m), cest dire tel que k 0 ( + t) = a. La valeur de ta + k( + t) k()
en ce point est exactement h(m,a) et le rsultat est montr.
Dmonstration du thorme des grandes dviations : On pose dsormais =
(a) > . Avec cette notation, on remarque que
h(m,a) = a( ) + k( ) k().
Lastuce de Harald Cramer ici est dintroduire les variables alatoires Y1 , . . . ,Yn indpendantes et de mme loi e xk( ) (dx) Si on a lu le commentaire 2, on remarque
que cette loi appartient la mme famille exponentielle naturelle que la loi des Xi .
Lesprance de Yi est a = k 0 ( ). On pose ensuite Un = Y1 + + Yn , Vn = Un na
et vn = IE[e( )Vn 1Vn 0 ]. Lesprance de Vn est zro. On montre alors lidentit
remarquable
un = enh(m,a) vn .
Pour le voir, on introduit la mesure positive n sur IR gale la n ime puissance de
convolution n , cest dire de transforme de Laplace L()n . La loi de Sn est donc
esnk() n (ds), comme on le vrifie en calculant la transforme de Laplace de cette
loi et en voyant quelle est gale celle de Sn , soit
n

L( + t)
tSn
= enk(+t)nk()
IE(e ) =
L()
pour tout t + . De mme, la loi de Un est e unk( ) n (du). Par consquent
enh(m,a) IE[e( )Vn 1Vn 0 ]
= en[h(m,a)+( )a] IE[e( )Un 1Un na ]
Z
= en[k( )k()]
e( )u e unk( ) n (du)
na
Z
=
eunk() n (du) = Pr(Sn na) = un ,
na

et lidentit annonce un = enh(m,a) vn est montre. On peut remarquer quelle nous


donne au passage une seconde dmonstration, moins lmentaire, de la partie 1, puisque
1/n
trivialement vn < 1. Cette partie algbrique tant faite, pour voir que la limite de un
1/n
est eh(m,a) , il suffit de montrer que limn vn = 1. Cest la partie plus difficile.
Commencons par un lemme classique:
Lemme Si f est une variable alatoire positive alors lensemble des s IR tels que
IE(f s ) < est un intervalle I et s 7 [IE(f s )]1/s est croissante sur ]0,[I.

51
www.L es-M athematiques.net

Dmonstration du lemme: On pourrait utiliser une ingalit classique de Hlder.


Utilisons plutt ici loutil familier de la convexit du logarithme de la transforme de
Laplace. Soit (1p)0 +p(df ) la loi de f avec (df ) probabilit sur ]0,[ et 0 < p
1 (tout est trivial si p = 0). Soit (dx) limage de (df ) par f 7 x = log f. Soit T
la transforme de Laplace de , soit I son domaine de finitude et soit t(s) = log T (s).
Sur I on a IE(f s ) = pet(s) . Enfin si 0 < s < s1 sont dans I, comme t est convexe on a
t(s) = t(

s
s
s
s
s1 + (1 )0) t(s1 ) + (1 )t(0).
s1
s1
s1
s1

Comme t(0) = 0 (car est une probabilit) on obtient que 1s t(s)

1
s1 t(s1 ).

Comme

1
1
1
1
p s = exp( log p) exp( log p) = p s1 ,
s
s1

le lemme est montr.


Achevons alors la dmonstration du thorme. On pose
An = {Vn 0}, Bn = {e( )Vn /n

3/4

1
}.
2

On a alors
vnn

3/4

(1)

IE[e( )Vn /n

3/4

(2)

1Vn 0 ]

(3) 1
1
Pr(An Bn ) (Pr(An ) Pr(Bn )).
2
2

Dans cette chane dingalits, (1) vient du lemme appliqu f = e( )Vn 1Vn 0
et au couple s1 = 1 et s = 1/n3/4 , (2) est lingalit de Markov applique Y =
3/4
fn
et y = 1/2, et (3) vient du fait que si A et B sont deux vnements alors
A (A B) B et donc Pr(A B) Pr(A) Pr(B). Faisons
alors tendre n

vers linfini. Daprs le thorme central limite, la loi de Vn / n tend vers une loi
normale centre. On en dduit que Pr(An ) tend vers 1/2 et, puisque Bn est aussi
2 1/4
Vn
Bn = {
(log
}, on en dduit que Pr(Bn ) tend vers 0. Par consquent,
) n
n
3/4

1
la limite infrieure de vnn
est 1/4. Mais lim inf n3/4
log vn log 4 entraine
1
naturellement que lim inf n log vn 0. Comme log vn 0 la limite de n1 log vn est
bien 0 et le thorme des grandes dviations est dmontr.

52
www.L es-M athematiques.net

Chapitre

Appendice 2: Convergence des


lois binomiales vers la loi de
Poisson
Par Grard Letac

Cet appendice montre une chose peu connue: cest que la suite des lois binomiales
de paramtres convenables converge vers une loi de Poisson, non seulement faiblement, mais aussi au sens de la convergence en norme de mesures. Cet appendice peut
intresser aussi les tudiants dagrgation qui ont traiter du sujet lois binomiales,
lois de Poisson.
Adoptons les notations suivantes: a dsigne la masse de Dirac en a; si m > 0, on
dfinit la loi de Poisson de moyenne m par
pm (dx) =

em

n=0

mn
n (dx)
n!

et si 0 < p < 1 on dfinit la loi de Bernoulli de moyenne p par


b1,p (dx) = (1 p)0 (dx) + p1 (dx).
Si n est un entier > 0, on dfinit la loi binomiale bn,p comme la nime puissance de
convolution de la loi de Bernoulli:
n
X
bn,p (dx) = (b1,p )n (dx) = ((1 p)0 + p1 )n (dx) =
Cnk (1 p)nk pk k (dx).
k=0

Cest un rsultat simple et important que de constater que la suite de probabilits


(bn,m/n )n>m converge faiblement vers pm . En effet si n k, alors

m k  m k
Cnk 1
n
n
est une fraction rationnelle en n et lexamen des termes de plus haut degr au numrateur et au dnominateur montre que

m nk  m k
mk
lim Cnk 1
= em
.
n+
n
n
k!
53

Toutefois, un rsultat plus fort est vrai, puisque en fait (bn,m/n )n>m converge fortement vers pm . Sagissant ici de probabilits concentres sur lensemble N des entiers,
cette convergence forte est une convergence dans l 1 (N) et revient affirmer que

n

k
k
X
X
k
m nk  m k
m m
m m

kbn,m/n pm k =
C
1

e
+
e
n

n
n
k!
k!
k=0

k=n+1

tend vers 0 si n +. Nous allons montrer ce rsultat de deux manires. Celle de


Le Cam(1960) est courte et utilise une ingnieuse ide de couplage. Celle de Prohorov
(1963) donne plus dinformations en montrant que kbn,m/n pm k est quivalente un
(m)/n et calcule explicitement (m).
Thorme 1: (Le Cam) Si n > m > 0 on a
kbn,m/n pm k

4m2
.
n

Dmonstration Posons pour simplifier p = m/n ]0,1[ et considrons des variables alatoires (X1 ,Y1 ), . . . ,(Xn ,Yn ) de N2 indpendantes et de mme loi mp dfinie par
mp (0,0) = ep p + pep
mp (0,1) = p pep
mp (1,1) = pep
pn p
mp (n,0) =
e si n 2,
n!
et mp (a,b) = 0 ailleurs. Alors on constate facilement que Xi suit une loi de Poisson et que Yi suit une loi de Bernoulli, toutes deux de moyenne p. Elles ne sont pas
indpendantes, et satisfont lingalit
Pr(Xi = Yi ) = mp (0,0) + mp (1,1) = ep p + 2pep 1 2p2 ,
hrite du fait que ep 1 p pour tout rel p. Notons pour simplifier X = X1 +
+ Xn , qui est donc de loi de Poisson pm , et Y = Y1 + + Yn , de loi binomiale
bn,p . Donc
Pr(X 6= Y )

Pr(ni=1 (Xi

6= Yi )

n
X

Pr(Xi 6= Yi ) 2np2 .

i=1

Ensuite, si A est une partie de N, on a linclusion dvnements


(X A) = (X = Y A) (Y 6= X A) (Y A) (X 6= Y )
qui entraine Pr(X A) Pr(Y A) P (X Y ). Le raisonnement fait en
changeant les rles de X et Y donne finalement
| Pr(X A) Pr(Y A)| 2np2 =
54
www.L es-M athematiques.net

2m2
.
n

Pour terminer, on applique cette ingalit lensemble E = {k N; pm (k)


bn,p (k)} puis son complmentaire E 0 = N \ E. Comme
kbn,m/n pm k = (Pr(X E 0 )Pr(Y E 0 ))+(Pr(Y E)Pr(X E))

4m2
,
n

le rsultat est montr.


Thorme 2: (Prohorov) Soit X une variable alatoire de loi de Poisson pm . Soit
n (m)
= kbn,m/n pm k.
n
Alors
lim n (m) = (m) =

n+

1
E(|X (X m)|).
2

Dmonstration Notons pk = em mk! pour simplifier les notations. Observons


dabord que le rsultat nest pas si surprenant, car pour k fix, en notant
 

n
m nk  m k
ak (n) =
Cnk 1
pk si 0 k n,
(8.1)
pk
n
n
ak (n) = n si n < k,
alors

1
(k (k m))
(8.2)
2
par un calcul standard et laborieux de dveloppement limit (voir le dtail de ce calcul
dix lignes ci dessous). On est donc fond de penser que
lim ak (n) =

n+

lim

n+

k=0

pk |ak (n)| =

1X
pk |k (k m)|.
2

(8.3)

k=0

Le point dlicat est alors de justifier cette interversion de limites. On va le faire par
convergence domine. Lide pour cela est de considrer pour k fix
1 k
m nk  m k
Cn 1
pk
n
n
comme une fonction fk de 1/n, en introduisant donc
fk (h) = (1 h)(1 2h) . . . (1 (k 1)h)(1 mh)k exp[m +

1
log(1 mh)].
h

Cette fonction fk est dfinie sur h > 1/m, et une reformulation de (2) est daffirmer
que fk0 (0) = 12 (k (k m)); on le voit ainsi:
1
fk (h) = [1(1+2+ +k1)h+o(h)][1+kmh+o(h)] exp[m+ (mhmh/2+o(h))]
h
= [1

k(k 1)
m
1
h+o(h)][1+kmh+o(h)][1 h+o(h)] = 1+ (k(km))h+o(h).
2
2
2
55
www.L es-M athematiques.net

Fixons dsormais k0 > m. Pour k > k0 , soit


Mk = max0h k1 fk (h).
Montrons que M = supk>k0 Mk est fini. Pour cela, notons
1
log(1 mh)],
h
qui existe comme maximum dune fonction continue sur un compact. Ensuite, si 0
1
, alors 0 1 jh 1 si j = 1, . . . ,k 1 et (1 mh)k
h k1 k10 < m
m k
(1 k ) . Donc
m
Mk K(1 )k .
k
k
Or limk+ (1 m
)
=
exp(m)
est
finie.
Donc la suite (Mk )k>k0 est borne et
k
M est fini.
K = max0h k1 exp[m +
0

Soit maintenant
Mk0 = max0h k1 |fk0 (h)|.
Montrons que M 0 = supk>k0 k 3 Mk est fini. Notons G(h) =

et G(0) = m : G est donc continUment


drivable. Soit

1
h

log(1 mh) si h 6= 0

K 0 = max0h k1 |G0 (h)|.


0

Alors

k1
X j
fk0 (h)
km
=
+ G0 (h)
.
fk (h)
1 mh
1 jh
j=1

1
Ensuite, si 0 h k1 k10 < m
, alors


k1
X
X j k1
j




j=1 1 jh j=1 1

et

j
k

k1
X

j=

j=1

k(k 1)
,
2

km
km
km

.
m
1 mh
1 k
k0 m

Donc

0

fk (h)
km
k(k 1)
0


.
fk (h) k0 m + K +
2

Comme dans cet intervalle fk est dans ]0,M ], on en dduit


k 3 M 0 k

M
Mm
M K0
M
Mm
M K0
(1 1/k) +
+

+
+
.
2
k(k0 m)
k3
2
k0 (k0 m)
k03

M 0 est donc fini.


On peut alors terminer la dmonstration du thorme: on a donc par la formule des
accroissements finis pour 0 k n :
|ak (n)| = |n(fk (1/n) fk (0)| = |fk0 (/n)| M 0 k 3
et
k > n |ak (n)| = n k 3 . Soit M 00 le maximum de 1 et M 0 . Observons que
Ppour

00 3
n=0 M k pk converge. On est donc dans les conditions dapplication du thorme
de la convergence domine et donc (3) est dmontr.
56
www.L es-M athematiques.net

Voici quelques raffinements intressants sur la fonction de Prohorov du thorme


prcdent:
k

Proposition 2: Pour m > 0 on note pk = em mk! et p1 = 0. Soit r et R les


racines du trinSme

P (x) = x (x m), avec 0 < r < R, et soient a et A les parties


entires de r et R. Alors
(m) = m(pa pa1 + pA1 pA ).
De plus, les deux fonctions de m dfinies par q(m) = m(pa pa1 ) et Q(m) =
1
linfini.
m(pA1 pA )) sont continues, positives et tendent vers 2e
Dmonstration Remarquons que les racines r et R existent, car le discriminant
simplifi de P est m + 1/4 > 0, et quelles sont > 0 car de somme 2m + 1 > 0 et
de produit m > 0. Si X est une variable alatoire de Poisson de moyenne m, alors
E(X (X m)) = 0. Donc, puisque P (x) est positif si et seulement si r < x < R,
on a
(m) =

A
X
X
1
1
E(|P (X|) = E(|P (X)| + P (X)) =
pk P (k) =
pk P (k)
2
2
r<k<R

=m

A
X

(pk2 + 2pk1 pk ) = m

k=a+1

A2
X

k=a+1

pk + 2

k=a1

A1
X

pk

k=a

A
X

pk

k=a+1

= m(pa pa1 + pA1 pA ).


q
Dfinissons la fonction m 7 r(m) = m + 12 m + 14 sur [0, + ). Elle est
continue, et sa drive r0 (m) > 0. r est une bijection
croissante de [0, + ) sur lui
mme de fonction rciproque m = r1 (x) = x + x. Donc a r < a + 1 implique
que

a + a = r1 (a) m < r1 (a + 1) = a + 1 + a + 1.
Donc sur lintervalle
In = {m; a = n} = [n +

n,n + 1 +

n + 1)

la fonction q prend la valeur


q(m) = em

mn (m n)
.
n!

Elle est donc bien positive. Sa limite lextrmit droite de In est bien q(n + 1 +

n + 1) ce qui montre sa continuit. Quant sa limite linfini, cest vident avec la


formule de Stirling. La dmonstration pour Q est entirement analogue: sur lintervalle

JN = {m; A = N } = [N N ,N + 1 N + 1),
la fonction Q prend la valeur
Q(m) = em

mN (N m)
.
N!

57
www.L es-M athematiques.net

Sur les intervalles In et JN , les fonctions q et Q sont concaves.


Commentaires:
Il y a de nombreuses rfrences sur cette question, (voir la bibliographie ci dessous, qui
conduit dautres rfrences) mais pas trs accessibles un jour de concours dagrgation. Dans Letac (1981), Problme IV 3 4me et 5me, on trouve la dmonstration de
Le Cam (1960).
Rfrences:
LE CAM, L. "An approximation theorem for the Poisson binomial distribution".
Pacific J. Math. 10, 1181-1197.
LETAC, G. (1982), Intgration et Probabilits, Analyse de Fourier, Exercices corrigs. Masson, Paris. (Seconde dition 1997).
PROHOROV, Ju. V. (1953), " Asymptotic behavior of the binomial distribution"
(en russe). Uspehi Matematiceskih Nauk. 8, 135-142.
VERVAAT, W. (1969), " Upper bounds for the distance in total variation between
the binomial and the Poisson distribution". Statistica Neerlandica, 23, 79-86.
JOHNSON, N. J. and SIMMONS, G. (1971), "On the convergence of the binomial
to Poisson distribution". Annals of Math. Statist. 49, 1735-1736.

58
www.L es-M athematiques.net

Chapitre

Appendice 3: Annales des


problmes de probabilits de
Deug et de licence
Par Grard Letac

Mia 03, Universit Paul Sabatier, Devoir 4, remettre au premier TD de la


semaine du 15 au 19 dcembre 1997.
Exercice 1
Soit 0 < p < 1, soit X une v.a. valeurs dans N telle que pour tout x N on ait
P (X = x) > 0 et soit enfin une v.a. Y sur le mme espace de probabilit telle que
pour tout x et pour tout y = 0,1, . . . ,x on ait P (Y = y|X = x) = Cxy (1 p)xy py .
On pose Z = X Y.
1. On suppose dans cette question que X suit une loi de Poisson de moyenne .
Montrer qualors Y suit une loi de Poisson de moyenne p (Mthode: on peut ou
bien calculer P (Y = y) par le principe des probabilits totales, ou bien calculer
la fonction gnratrice fY ). Montrer que Y et Z sont indpendantes (Mthode :
calculer P (Y = y; Z = z)). Montrer que Z suit une loi de Poisson de moyenne
(1 p).
2. Trouver la loi de X si on sait que Y et Z sont indpendantes. Mthode: si 0 <
z < 1 et 0 < s < 1 , montrer que E(sY z Z ) = fX ((1 p)z + ps), et chercher
quelle condition g((1 p)z + ps) = log fX ((1 p)z + ps) est la somme dune
fonction de s seul dune autre fonction de z seul: penser introduire la drive
seconde de g.
Exercice 2
Soit N un entier fix, et soit lensemble des parties de taille N de lensemble
{1,2, . . . ,2N } des 2N premiers entiers. On le munit de la tribu P() et de la probabilit quiprobable. Si n = 1, . . . ,2N, on note pour Xn () = 1 si n et
Xn () = 1 sinon. On note S0 = 0 et Sn = X1 + + Xn .
1. Soit uN le nombre dlments de . Calculer uN . Quelle est la valeur de S2N ?
Les variables alatoires Xn sont elles indpendantes? Sont elles de mme loi?
Quelle est la loi de Xn ?
59

2. Pour k entier entre 0 et N on note Ak lvnement S2k = 0. Calculer P (Ak ).


PN
Soit Y = k=0 1Ak Soit (vn )n0 le terme gnral de la srie qui est le produit
de Cauchy de la srie de terme gnral un par elle mme. Montrer que E(Y ) =
vN
uN .
3. Calculer les sommes
suivantes lintrieur de leur intervalle
P des sries
Pentires

de convergence k=0 un z n , k=0 vn z n (Mthode: donner une prsentation du


dveloppement en srie entire de (1 x2 )1/2 en termes de (un )). En dduire
une approximation de E(Y ) si N est grand laide de la formule de Stirling.
4. Dans un jeu de 52 cartes, je tire une carte; avant de la regarder, je devine sa
couleur: rouge ou noir, et je marque un point si jai devin juste. Je recommence
avec le paquet des 51 cartes restantes, et ainsi de suite jusqu puisement des
52 cartes. Je joue avec la meilleure stratgie, qui choisit la couleur la mieux
reprsente dans le paquet restant et choisit au hasard en cas dgalit. Quelle est
la moyenne des points marqus? (Mthode: observer que cette stratgie garantit
au moins 26 points, et que les points supplmentaires arrivent une fois sur 2
durant les Y26 fois o il y a galit).

60
www.L es-M athematiques.net

Universit Paul Sabatier. Examen blanc de Deug MIA 03, Dec.97


(Dure: 3 heures. Aucun document.)
Exercice 1
Soit X et Y deux variables alatoires indpendantes et de mme loi valeurs dans
les entiers
1 telles que pour |z| 1 leur fonction gnratrice soit gale fX (z) =

1 1 z. Calculer fX+Y , P (X = n) pour n 1 et P (X + Y = n) pour n 2.


IE(X) existe-t-elle?
Exercice 2
Soit X et Y deux variables alatoires indpendantes valeurs dans les entiers 0
tellesque pour |z| 1 leurs fonctions gnratrices soient respectivement fX (z) =
2 2 z et fY (z) = 1/(2 z). Pour n 0 calculer
P (X = n), P (Y = n), P (X + Y = n).
Calculer IE(X), IE(X(X 1)), et le second moment et la variance de X. Calculer de
mme la variance de Y et en dduire la variance de X + Y.
Exercice 3
Soit X et Y deux variables alatoires strictement positives, indpendantes et de mme
loi. Soit Z = X/Y. Montrer que 1 12 (Z + Z1 ). En prenant lesprance des deux
1
membres de cette galit, montrer que 1 IE(X)IE( X
).
On suppose maintenant que la fonction de rpartition F de X est gale (x 1) si
1 x 2. Quelles sont les valeurs de F en dehors de cet intervalle? Calculer IE(X)
1
et IE( X
).

61
www.L es-M athematiques.net

Universit Paul Sabatier. Examen de Deug MIA 03, 6 Janv.98


(Dure: 4 heures. Aucun document. Faites les calculs lentement et au brouillon. Le
correcteur peut dduire des points pour le manque de soin ou les absurdits. Les trois
exercices sont indpendants.) On dsigne par log x le logarithme nprien de x.
Exercice 2 (6,5 points)
1. Soit 0 < p q < 1. Dvelopper en srie entire les fonctions de z suivantes
1
(1 pz)(1 qz)

z2
,
(1 pz)(1 qz)

et prciser leurs rayons de convergence (on distiguera les cas p = q et p < q).
(2,5 points)
2. Soit 0 < p 1/2 et q = 1 p. On considre les variables alatoires indpendantes et valeurs dans les entiers 1 de lois respectives
PX =

q n1 pn , et PY =

n=1

pn1 qn ,

n=1

cest--dire que pour n 1 entier on a P [X = n] = q n1 p et P [Y =


n] = pn1 q. Calculer pour |z| 1 les fonctions gnratrices fX (z) = IE(z X ),
fY (z) et fX+Y (z). Dvelopper fX+Y en srie entire et prciser son rayon de
convergence (on distinguera les cas p = 1/2 et p < 1/2). Dduire du rsultat
P [X + Y = n] pour n 2 entier. Calculer galement la moyenne et la variance
des trois variables alatoires X, Y et X + Y. (3,5 points)
3. Dans le schma Succs Echec o la probabilit dun succs est p, soit Z la variable alatoire qui prend la valeur n si pour la premire fois on a un succs au
rang n 1 suivi dun chec au rang n. Montrer que Z est de mme loi que la
variable alatoire X + Y considre la question prcdente. (0,5 points)
Exercice 3 (5,5 points)
On rappelle que shx = 12 (ex ex ), chx = 12 (ex + ex ), et que pour x 6= 0
chx =

sh(2x)
.
2 shx

1. Soit U une variable alatoire de fonction de rpartition FU (x) = P [U x] telle


que FU (x) = 0 si x 1, FU (x) = 1+x
2 si 1 x 1 et FU (x) = 1
si 1 x. Tracer le graphe de FU ainsi que celui de la densit de U . Calculer
ensuite LU (z) = IE(ezU ) pour z rel non nul. (1 point)
2. Si z est rel non nul, montrer par rcurrence sur n que
n
X

log ch(

k=1

En dduire que la srie


tion de z. (2 points)

k=1

z
sh(z)
.
) = log n
2k
2 sh( 2zn )

log ch( 2zk ) converge, et calculer sa somme en fonc-

62
www.L es-M athematiques.net

3. Soit X1 ,X2 , . . . une suite infinie de variables alatoires indpendantes et de


mme loi 12 1 + 12 1 , cest--dire telles que P [X1 = 1] = P [X1 = 1] = 12 .
On forme la nouvelle variable alatoire
Sn =

n
X
Xk

k=1

2k

Calculer laide du 2) pour z rel non nul LSn (z) = IE(ezSn ). Montrer que

X
Xk

k=1

2k

est convergente. On dsigne par S la somme de cette srie. On admet que LS (z) =
IE(ezS ) = limn LSn (z). A laide du 2) et du 1), comparer LS et LU . (2,5
points)

63
www.L es-M athematiques.net

Corrig de lexamen de Mia 03 du 6 janvier 1998.

de Newton on a (1 pz)2 =
PExercice 2:nSinp = q, daprs la formule du binSme
n=0 (n + 1)p z et donc
z 2 (1 pz)2 =

(n + 1)pn z n+2 =

n=0

(n 1)pn2 z n .

n=2

Ces deux sries entires convergent si et seulement si |pz| < 1 et donc sont de rayon
de convergence R = 1/p.
Si p < q on dcompose la premire fraction rationnelle en lments simples:


1
1
q
p
=

=
(1 pz)(1 qz)
q p 1 qz
1 pz
!

X
X
X
1
q n+1 pn+1 n
n n
n n
q
q z p
p z
=
z .
qp
qp
n=0
n=0
n=0
Daprs le thorme sur le rayon de convergence de la somme de deux sries entires,
le rayon de convergence est ici le plus petit des deux nombres 1/p et 1/q, soit donc
R = 1/q. Quant la deuxime srie, il suffit de tout dcaler de deux:

X
z2
q n1 pn1 n
=
z .
(1 pz)(1 qz) n=2
qp

2) Daprs la dfinition dune fonction gnratrice on a immdiatement pour ces


deux lois de Pascal
fX (z) =

n=1

q n1 pz n =

X
pz
qz
, fY (z) =
pn1 qz n =
.
1 qz
1

pz
n=1

Donc, les variables alatoires X et Y tant indpendantes, daprs le thorme du cours


on a donc
pqz 2
fX+Y (z) = fX (z)fY (z) =
.
(1 pz)(1 qz)
Si p = q = 1/2 daprs la premire partie de 1) on a donc
fX+Y (z) =

X
n1 n
z ,
2n
n=2

avec pour rayon de convergence 2, et P [X + Y = n] = n1


2n si n 2.
Si p < 1/2 < q, daprs la seconde partie de 1) on a donc
fX+Y (z) =

X
pq n qpn n
z ,
qp
n=2
n

qp
avec pour rayon de convergence 1/q, et P [X + Y = n] = pq qp
si n 2.
0
2
00
Enfin, on calcule fX (z) = p/(1 qz) , fX (z) = 2pq/(1 qz)3 , et on en tire,
puisque le rayon de convergence est > 1 :
0
00
IE(X) = fX
(1), IE(X(X 1)) = fX
(1) = 2q/p2 ,

64
www.L es-M athematiques.net

2 (X) = IE(X(X 1)) + IE(X) (IE(X))2 = q/p2 .


Puisque p et q jouent des rSles

symtriques, IE(Y ) = 1/q et 2 (Y ) = p/q 2 . Enfin


IE(X + Y ) = 1/p + 1/q par la linarit de lesprance, et 2 (X + Y ) = q/p2 + p/q 2
par lindpendance de X et Y .
3) Une suite de succs et dchecs telle que Z = n 2 est ncessairement telle
que ses n premiers termes (1 , . . . ,n ) soient de la forme EE...EESS...SSE, cest-dire que il existe un entier 1 x n 1 avec i = E si i < x, wj = S si
x j n 1 et n = E. Si X est le temps dattente du premier succs, si Y est
le temps dattente du premier chec aprs quon ait eu le premier succs, alors X et Y
sont indpendantes et suivent les lois de Pascal ci dessus, et de plus Z = X + Y. Do
le rsultat demand.
Exercice 3: 1) La fonction F est continue et est drivable sauf aux points 1 et 1
et sa drive est 12 1]1,1[ (x). Les graphes sont immdiats. Ensuite
LU (z) =

1
2

ezx dx =

shz
.
z

2) Pour n = 1 la formule est triviale. Supposons la vraie lordre n et montrons


quelle est vraie lordre n + 1. On a donc par cette hypothse de rcurrence, puis par
la formule rappele applique x = z/2n :
n+1
X
k=1

log

log ch(

z
sh(z)
z
) = log n
+ log ch( n+1 ) =
z
k
2
2 sh( 2n )
2

2z
))
sh( 2n+1
sh(z)
sh(z)
= log n+1
,
+
log
z
z
z
2 sh( 2n+1
)
2
sh( 2n+1
)
2n sh( 2n )

et la rcurrence est tendue. Ensuite, on sait que le premier terme du dveloppement


limit de shx est x, donc la limite de 2n sh( 2zn ) quand n tend vers linfini est z. Les
sommes partielles de la srie considre tendent donc vers log sh(z)
z , cest dire que la
sh(z)
srie converge et a pour somme log z .
3) Puisque les v.a. Xk sont indpendantes, il en est de mme pour les v.a. exp(zXk /2k )
et on a donc, laide de la premire partie du 2):
IE(exp zSn ) = IE(

n
Y

exp(zXk /2k )) =

k=1
n
Y

k=1

n
Y

IE(exp(zXk /2k )) =

k=1

ch(

z
sh(z)
.
)= n
2k
2 sh( 2zn )

k
La srie k=1 X
est absolument convergente car |Xn | = 1, que la srie gomtrique
2k
de terme gnral 1/2n est de raison < 1. La deuxime partie du 2) permet daffirmer
que
sh(z)
LS (z) = lim LSn (z) =
= LU (z).
n
z

Daprs un thorme admis du cours, on peut remarquer dailleurs que cela entraNne
que S et U sont de mme loi, cest dire que FU est la fonction de rpartition de S.

65
www.L es-M athematiques.net

Universit Paul Sabatier. Licence de mathmatiques fondamentales, contrle


intermdiaire du 13 avril 2000.
Dure: 2heures. Aucun document. Affichage des rsultats le 5 mai 14:00.
Exercice 1. Soit n 2, et soit U1 ,U2 , . . . ,Un des variables alatoires indpendantes et
de mme loi uniforme sur [0,1].
On note X = min(U1 ,U2 , . . . ,Un ) et Y = max(U1 ,U2 , . . . ,Un ). On fixe a et b tels
que 0 a b 1.
1. Dessiner lensemble du plan
Ea,b = {(x,y); 0 a x y b 1}.
2. Calculer G(a,b) = Pr(0 a X Y b 1).
3. Montrer que Pr(X a ; Y b) = G(0,b) G(a,b), et en dduire la densit
de (X,Y ).
4. Soit D = Y X. Quelle est la densit de la loi jointe de (X,D)?
Exercice 2. Soit a et b fixs dans ]0,1[. Soit X et Y des v.a. indpendantes, valeurs
dans lensemble N des entiers 0 et de lois respectives donnes par Pr(X = x) =
(1 a)ax et Pr(Y = y) = (1 b)by . Soit M = min(X,Y ) et D = X Y. Pour
m N, calculer
Pr(X m), Pr(Y m), Pr(M m), Pr(M = m).
Pour m N et pour d dans lensemble Z des entiers relatifs, calculer Pr(M = m; D =
d). En dduire Pr(D = d). Les v.a. M et D sont elles indpendantes?
Exercice 3. Les tables montrent que
Z

0,5

z2
2

dz

= 0,6914....
2

Soit X une variable alatoire normale de moyenne -1 et dcart-type 2. Calculer les


nombres suivants:
Pr(X 0), Pr(2 X 1), Pr(X
/ [2,0]).

66
www.L es-M athematiques.net

Universit Paul Sabatier. NT 07, Licence de mathmatiques fondamentales,


Examen du 23 juin 2000.
Dure: 2heures. Aucun document. Affichage des rsultats le 27 juin 14:00.
Question de cours. Enoncer sans dmonstration la loi forte des grands nombres pour
une suite de variables alatoires relles indpendantes et de mme loi, avec sa rciproque.
Problme. Dans tout le problme, si W est une variable alatoire (v.a.) relle, on note
par W sa transforme de Fourier, dfinie pour z rel par W (z) = IE(eizW ).
a) Soit U et V deux v.a. indpendantes et de mme loi uniforme sur [0,1], et soit Z =
U V. Montrer que la densit de Z est fZ (z) = (1 |z|)+ (o la notation a+ signifie
a+ = 0 si a 0 et a+ = a si a 0). On pourra pour cela considrer la fonction
z 7 Pr(U V z) et sa drive.
b) Les notations tant celles du a), calculer Z (t) (Mthode: calculer U et en dduire
V = U ). La formule dinversion
Z
1
eitz Z (t)dt
fZ (z) =
2
est elle applicable?
c) On considre une v.a. X relle telle que X (z) = (1 |z|)+ . Donner sa densit
laide du b).
d) On considre des v.a. X1 , . . . ,Xn , . . . indpendantes et de mme loi que X, dfinie
au c), et on pose Sn = X1 + +Xn . Calculer Sn (z), Sn /n (z) et limn Sn /n (z).
En dduire que la suite des lois des Sn /n converge vers une loi limite. A laide de la
formule dinversion de Fourier, donner la densit de cette loi limite.
e) La suite Sn /n du d) converge t-elle presque-srement?
Barme: Q=3, a=3, b=4, c=2, d=6, e=2.

67
www.L es-M athematiques.net

NL 07, corrig de lexamen du 23 juin 2000.


Question de cours. Soit X1 , . . . ,Xn , . . . des v.a. relles indpendantes et de mme
loi. Alors la suite n1 (X1 + + Xn ) converge presque-srement si et seulement si
IE(|X1 |) < . Dans ces conditions,
lim

1
(X1 + + Xn ) = IE(X1 ).
n

Question a). On sait que la fonction de rpartition F = FU est F (u) = u si 0 < u < 1
et est gale 1 pour 1 u et 0 pour u 0. Donc
Z

FZ (z) = Pr(U z + V ) = IE(F (z + V )) =

F (z + v)dv =

z+1

F (u)du,

ce qui donne pour 1 z 0 :


FZ (z) =

z+1

udu =

puis pour 0 z 1 :
FZ (z) =

udu =

1
(z + 1)2 ,
2

1
(1 z 2 ),
2

et naturellement FZ (z) = 0 si z 1 et FZ (z) = 1 si z 1. En drivant on a la


densit FZ0 = fZ annonce.
Question b). U (t) = IE(exp itU ) = 1 si t = 0 et (exp(it) 1)/t sinon. Ensuite
V (t) = U (t) = U (t). Puis que U et V sont indpendantes on en dduit que
si t 6= 0 on a
Z (t) = U (t)V (t) = (exp(it) 1)(exp(it) 1)/t2 = 2(1 cos t)/t2 ,
avec trivialement Z (0) = 1. En appliquant le critre de Riemann pour les intgrales impropres, on voit que la fonction t 7 Z (t) est intgrable linfini, puisque
|Z (t)| = |2(1 cos t)/t2 | 4t2 . On est donc dans les conditions dapplication de
la formule dinversion de Fourier et la formule de lnon est correcte.
Question c). La formule du b) scrit explicitement
Z
1
2(1 cos t)
(1 |z|)+ =
eizt
dt.
2
t2
Faisons y le changement de variable x = t. On obtient
Z
1 izx 1 cos x
(1 |z|)+ =
e
dt.

x2
Cette formule montre que la densit de X est fX (x) =

1cos x
x2 .

Question d). Puisque les v.a. sont indpendantes et de mme loi que X on a Sn (z) =
n
(X (z))n = (1 |z|)n+ , et donc Sn /n (z) = Sn (z/n) = (1 |z|
n )+ , et donc
68
www.L es-M athematiques.net

limn Sn /n (z) = e|z| . On remarque z 7 exp |z| est continue. Daprs le thorme de Paul Lvy, cela garantit la convergence en loi de la suite (Sn /n. On remarque
ensuite que la fonction z 7 exp |z| est intgrable.
Daprs la formule dinversion de
R izx|z|
1
e
dz =
Fourier, la densit de la loi limite est donc 2

1
2

eizx+z dz +

1
2

eizxz dz =

1
1
1
1
(
+
)=
.
2 1 ix 1 + ix
(1 + x2 )

Question e). Si la suite Sn /n convergeait presque-srement, elle convergerait en loi,


1
et la loi limite aurait la densit (1+x
2 ) . Or la loi forte des grands nombres affirme
que si Sn /n converge presque srement, ce ne peut tre que vers une constante, qui
serait dailleurs lesprance de X1 . Il y a donc une contradiction, et donc Sn /n ne
converge pas presque-srement. On vrifie dailleurs directement que X1 ne satisfait
pas IE(|X1 |) < et donc que IE(X1 ) nexiste pas. En effet, on connait la densit de
X1 par la question c) et il est clair que
Z
Z
1 cos x
1 cos x
|x|
dx
=
2
dx = .
2
x
x

69
www.L es-M athematiques.net

Universit Paul Sabatier. NL 12, Licence de mathmatiques pour lenseignement, Examen du 23 juin 2000.
Dure: 2heures. Aucun document. Affichage des rsultats le 27 juin 14:00.
Question de cours. Soit X et Y deux variables alatoires dfinies sur un mme espace
de probabilit et possdant des variances finies non nulles. Donner la dfinition du
coefficient de corrlation r(X,Y ) de (X,Y ). Si (X,Y ) est de loi normale dans IR2 ,
expliquer pourquoi X et Y sont indpendantes lorsque r(X,Y ) = 0.
Problme. On admet la formule suivante: pour p > 0 et t > 0 on a

Z
p2
2 p2t
3/2 2u
tu
()
u
e
du =
e
.
p
0
a) Si p > 0 et > 0, soit U une variable alatoire (v.a) de loi

p2
u
p
(p)
P (du) = u3/2 e 2u 2 +p 1]0,[ (u)du.
2

A laide de (*), montrer que si z < /2 alors

IE(ezU ) = exp(p p 2z).


En dduire IE(U ezU ) par drivation ainsi que IE(U ). Calculer de mme IE(U 2 ezU ),
IE(U 2 ) et la variance de U.
(q)

b) Soit de plus q > 0 et V une v.a. indpendante de U et de loi P . A laide du a),


(p+q)
montrer que U + V est de loi P
.
(1)

c) Soit X1 , . . . Xn des v.a. indpendantes et mme loi P , o est un paramtre


positif inconnu. Donner laide du b) la loi de S = X1 + + Xn .
d) On considre alors (X1 , . . . ,Xn ) comme un chantillon permettant destimer et
on rappelle que, le modle tant exponentiel, S est donc une statistiqueexhaustive.
Montrer laide du a) que S/n est un estimateur non biais de g() = 1/ et donner
son risque quadratique. Connaissant S, calculer lestimateur 0 (S) du maximum de
vraisemblance pour .
e) Les tables montrent que

1
2

approche pour n grand de Pr(S

R1

exp( z2 )dz = 0,8413. En dduire une valeur

n ),
( )3/2

en justifiant votre rponse.

Barme: Q=4, a=2+2+2, b=1, c=1, d=1+1+3, e=3.

70
www.L es-M athematiques.net

NL 12, corrig de lexamen du 23 juin 2000.


Question de cours. Si a = IE(X) et b = IE(Y ) notons cov(X,Y ) = IE((X a)(Y b)),
(X) = (IE((X a)2 ))1/2 et (Y ) = (IE((Y b)2 ))1/2 . Alors le coefficient de
corrlation est
r(X,Y ) =

cov(X,Y )
.
(X)(Y )

Si de plus (X,Y ) est de loi normale N(a,b), , et si r(X,Y ) = 0, alors cov(X,Y ) = 0


et donc
 2

(X) 0
=
.
0
2 (Y )
Cela entrane que X et Y sont indpendantes. Cela peut se voir de deux manires:
Ou bien en considrant la densit de (X,Y ) qui en gnral quand det 6= 0 est


1
1
xa
1

.
fX,Y (x,y) =
exp (x a,y b)
yb
2
2 det
Dans le cas particulier qui nous occupe, on a alors
fX,Y (x,y)

(xa)2
(yb)2
1

e 22 (X) 22 (Y )
2(X)(Y )
(xa)2
(yb)2
1
1

e 22 (X)
e 22 (Y )
2(X)
2(Y )

=
=

La densit fX,Y (x,y) tant le produit dune fonction de x seul et de y seul est
donc la densit dun couple de v.a. indpendantes.
Ou bien en considrant la transforme de Laplace ou de Fourier de (X,Y ). Procdons par exemple avec la transforme de Fourier. Elle est en gnral
 
1
t
X,Y (t,s) = exp(iat + ibs (t,s)
).
s
2
Dans le cas particulier qui nous occupe, on a alors
X,Y (t,s)

=
=

1
exp(iat + ibs + ( 2 (X)t2 + 2 (Y )s2 ))
2
1 2
1
exp(iat (X)t2 ) exp(ibs 2 (Y )s2 )
2
2

La transforme de Fourier X,Y (t,s) tant le produit dune fonction de t seul et


de s seul est donc la transforme de Fourier dun couple de v.a. indpendantes.
R
(p)
Question a). Pour calculer IE(exp(zU ) = ezu P (du), il suffit de prendre t = 2 z
dans la formule (*) pour avoir le rsultat demand. On remarque que en faisant z = 0
(p)
on obtient 1, ce qui prouve que P (du) est bien une loi de probabilit. On remarque
que pour tout t > 0 et pour tout entier n 0 lintgrale
Z
p2
un u3/2 e 2u tu du
0

71
www.L es-M athematiques.net

R
(p)
converge, ce qui entrane que la fonction dfinie par lintgrale z 7 ezu P (du) est

indfiniment drivable sous le signe somme dans lintervalle ] , 2 [. Donc


IE(U exp(zU ))

=
=

d
exp(p p 2z)
dz

exp(p p 2z)
2z

et donc en faisant z = 0 on obtient IE(U ) =

IE(U 2 exp(zU ))

=
=

p .

De la mme manire:

d2
exp(p p 2z)
2
dz

p2
p
(
+
)
exp(p

p
2z).
2z
( 2z)3
2

Donc en faisant z = 0, on obtient IE(U 2 ) = ( p +


dHuyghens on obtient la variance de U :

p )
( )3

et en utilisant la formule

p
2 (U ) = IE(U 2 ) (IE(U ))2 = .
( )3
Questions b) et c). Puisque U et V sont indpendantes, pour z < /2 on a
IE(exp(z(U + V ))

= IE(exp(zU ))IE(exp(zV ))

= exp(p p 2z) exp(q q 2z)

= exp((p + q)( 2z))

Comme la transforme de Laplace caractrise la loi, cela montre que celle de U + V


(p+q)
est P
. Il est clair alors que si n est un entier >0, et que si les (Xi )1in sont
(1)
(n)
indpendantes et de mme loi P alors S = X1 + + Xp est de loi P . Cela peut
se voir trs rigoureusement par une rcurrence facile sur n.

Question d). Daprs


le a) on sait que IE(S) = n/ . Donc IE(S/n) = 1/ . Comme
cet estimateur de 1/ est non biais, son risque
quadratique est gal sa variance.
Or la variance de S a t calcule en a) et est n/( )3 . Comme en gnral 2 (X) =
2 2 (X), le risque quadratique est donc
2 (S/n) =

1
.
n( )3

Pour calculer le maximum de vraisemblance connaissant S, rappelons que la loi de S


est

n2
s
n
(n)
P (ds) = s3/2 e 2s 2 +n 1]0,[ (s)ds.
2
Cest dire que si on prend pour mesure de rfrence la mesure
n2
n
(ds) = s3/2 e 2s 1]0,[ (s)ds,
2

72
www.L es-M athematiques.net

(n)

qui ne dpend pas de , alors P (ds) = e 2 +n (ds). Le calcul du maximum


de vraisemblance 0 (S) pour S connu se rduit la recherche du qui maximise sur
]0, + [ la fonction

S
7 e 2 +n ,
ou encore la fonction
7 lS () =

S
+ n .
2

Ltude des variations de lS sur ]0, + [ est facile: sa drive est lS0 () = 12 ( n S) et
sannule seulement en = n2 /S 2 . Cette drive est >0 avant et <0 aprs. Lestimateur
du maximum de vraisemblance est donc 0 (S) = n2 /S 2 .
Question e). Notons plutt S = Sn . Le thorme central limite affirme que la suite des
lois des v.a.
(Sn n )

n
( )3/2

converge vers N0,1 . Donc la probabilit pour que cette v.a. soit 1 est approximativement 1 0,8413.

73
www.L es-M athematiques.net

Universit Paul Sabatier. NT 07, Licence de mathmatiques fondamentales,


Examen du 13 septembre 2000.
Dure: 2heures. Aucun document. Affichage des rsultats le 20 septembre 14:00.
Problme.
A) Soit Y1 , . . . ,Yk , . . . une suite de variables alatoires (v.a.) relles indpendantes et
de mme loi telle que IE(|Y1 |) < . On pose Sk = Y1 + + Yk . On rappelle que
la loi des grands nombres affirme que limk Sk /k = IE(Y1 ) presque srement. En
dduire que limk Yk /k = 0 presque srement.
B) Dans toute la suite, on considre une suite (An ,Bn )n1 de v.a. de ]0,[2 indpendantes et de mme loi (les v.a. A1 et B1 peuvent tre dpendantes entre elles). On
suppose de plus que
IE(| log A1 |) < , IE(log A1 ) < 0, IE(| log B1 |) < .
En appliquant la loi des grands nombres, montrer que
lim (A1 A2 . . . An )1/n = exp(IE(log A1 )),

et que limn (A1 A2 . . . An ) = 0. En appliquant la question A), montrer que


lim (Bk )1/k = 1.

De ces rsultats, dduire en particulier que la srie termes alatoires


B1 +

A1 A2 . . . Ak1 Bk

k=2
1/n

est convergente (mthode: lui appliquer le critre de Cauchy un


sries termes positifs).

de convergence des

C) Pour n 1, on considre les transformations Fn , Zn et Wn affines alatoires de


IR dfinies par Fn (x) = An x + Bn , par Zn = F1 F2 Fn et par Wn =
Fn Fn1 F1 . Montrer par rcurrence sur n que
Zn (x) = A1 A2 . . . An x + B1 +

n
X

A1 A2 . . . Ak1 Bk .

k=2

Si X est une variable alatoire positive indpendante des (An ,Bn )n1 , dire pourquoi
les v.a. Wn (X) et Zn (X) sont de mme loi.
D) Montrer laide de la question B) que la suite de v.a. (Zn (X))n1 converge presque
srement vers une v.a. quon note Z. Pourquoi la v.a Z est elle la mme quelle que soit
la v.a. X? Pourquoi la suite de v.a. (Zn (X))n1 converge t-elle en loi? A laide de la
question C), montrer que la suite des lois des v.a. (Wn (X))n1 converge vers la loi de
Z.
E) On suppose maintenant de plus que la loi de X est telle que X et F1 (X) = A1 X +
B1 sont de mme loi. En dduire qualors X et Z sont de mme loi (mthode: montrer
74
www.L es-M athematiques.net

par rcurrence sur n que la v.a. Wn (X) est de mme loi que X, et appliquer la question
D)).
F) (Exemple) On rappelle (cours) que si > 0 et > 0 alors
Z
0

()()
t1
dt =
.
+
(1 + t)
( + )

(9.1)

On fixe deux nombres p > 0 et q > 0 et on suppose que la v.a. X a pour loi
(p + q)
xp1
1]0,[ (x)dx,
(p)(q) (1 + x)p+q
que la v.a. A1 a pour loi
ap1
(2p + q)
1]0,[ (a)da,
(p)(p + q) (1 + a)2p+q
et quenfin B1 = A1 . On suppose toujours X et A1 indpendantes. En appliquant (9.1)
des et convenables, montrer que si p < s < q on a
IE(As1 ) =

(p + s)(p + q s)
,
(p)(p + q)

IE((1 + X)s ) =

(p + q)(q s)
,
(p + q s)(q)

IE(As1 (1 + X)s ) = IE(X s ).


En dduire que F1 (X) = A1 (X + 1) et X sont de mme loi. On admet alors sans
dmonstration que IE(log A1 ) existe et est < 0. En appliquant tout ce qui prcde,
donner la loi de

X
Z=
A1 A2 . . . Ak .
k=1

1
En particulier, si q > 0 et si Pr(A1 a) = (1+a)
1+q pour tout a 0, calculer
Pr(Z z) pour tout z 0 (mthode: calculer la densit de A1 , puis celle de Z).

Barme: A=2 points, B=4, C=3, D=3, E=3, F=7.

75
www.L es-M athematiques.net

Universit Paul Sabatier. NT 07, Licence de mathmatiques fondamentales,


Examen du 13 septembre 2000, Corrig.
A)
Yk
Sk
k 1 Sk1
=

k IE(Y1 ) 1.IE(Y1 ) = 0.
k
k
k k1
B) On applique la loi des grands nombres la suite Yk = log Ak et on obtient
1
(A1 . . . An )1/n = exp( (log A1 + + log An )) n exp(IE(log A1 )).
n
De plus, on sait que IE(log A1 ) < 0 et donc que exp(IE(log A1 )) < 1. Si un =
P
1/n
A1 . . . An , puisque limn un < 1 la srie n=1 un converge, son terme gnral
tend donc vers 0 et on a bien limn A1 . . . An = 0 presque srement. De la mme
facon, on applique le A) Yk = log Bk et on en tire que limk k1 log Bk = 0 et donc
limk (Bk )1/k = 1. Considrons enfin uk = A1 A2 . . . Ak1 Bk . Alors, daprs les
rsultats prcdents on a
1/k

= ((A1 A2 . . . Ak1 )1/k1 )(k1)/k (Bk )1/k k exp(IE(log A1 )).1 < 1,


P
et daprs le critre de Cauchy de convergence des sries on a que k=1 uk converge
presque srement, ce quil fallait dmontrer.
uk

C) La formule est vraie trivialement pour n = 1. Supposons la vraie pour n 1. Alors


Zn+1 (x)

(1)

(2)

Zn (Fn+1 (x))
A1 A2 . . . An (An+1 x + Bn+1 ) + B1 +

n
X

A1 A2 . . . Ak1 Bk

k=2
(3)

A1 A2 . . . An An+1 x + B1 +

n+1
X

A1 A2 . . . Ak1 Bk ,

k=2

o (1) vient de la dfinition de Zn+1 (x), (2) de lhypothse de rcurrence et (3) dun
rarrangement. La rcurrence est donc tendue.
Puisque les (An ,Bn ) sont de mme loi, il est clair que les fonctions affines Zn et
Wn sont de mme loi. Leur valuation en une v.a. X indpendante des (An ,Bn ), et
donc indpendante de Zn et Wn sont donc des v.a. de mme loi.
P
D) On a vu au B) que la srie B1 + k=2 A1 A2 . . . Ak1 Bk converge. Notons par Z
sa somme. On a galement vu au B) que limn A1 . . . An = 0 presque srement:
cela entrane que limn Zn (X) = Z presque srement. Par dfinition, Z ne dpend
pas de X. La convergence presque sre entranant la convergence en loi, on en dduit
que la suite des lois de Zn (X) converge vers la loi de Z. On a vu la question C)
que Wn (X) et Zn (X) sont de mme loi. On en dduit que la suite des lois de Wn (X)
converge vers la loi de Z.
E) Montrons par rcurrence sur n que Wn (X) et X sont de mme loi. Cest vrai par
hypothse pour n = 1. Supposons ce rsultat vrai pour n. On sait que Wn+1 (X) =
76
www.L es-M athematiques.net

Fn+1 (Wn (X)). De plus Wn (X) est indpendante de Fn+1 , car Wn (X) est une fonction de X,A1 , . . . ,Bn et Fn+1 dpend de (An+1 ,Bn+1 ). Enfin Fn+1 est de mme loi
que F1 par dfinition, et Wn (X) est de mme loi que X, par hypothse de rcurrence.
Donc Fn+1 (Wn (X)) est de mme loi que F1 (X), qui est de mme loi que X par
hypothse. La rcurrence est donc tendue.
Or on sait daprs D) que la suite des lois de Wn (X) converge vers la loi de Z.
Comme toutes les lois des Wn (X) sont identiques celle de X, on en dduit que X et
Z sont de mme loi.
F) Par dfinition, puis en appliquant (9.1) = s + p > 0 et = 2p + q (s + p) =
p + q s > 0, on a
IE(As1 ) =

(2p + q)
(p)(p + q)

as+p1
(p + s)(p + q s)
da =
.
(1 + a)2p+q
(p)(p + q)

De mme en appliquant (9.1) = p > 0 et = q s > 0, on a


(p + q)
IE((1 + X) ) =
(p)(q)
s

Z
0

xp1
(p + q)(q s)
dx =
.
p+qs
(1 + x)
(p + q s)(q)

Finalement, en appliquant (9.1) = p + s > 0 et = q s > 0, on a


Z
(p + q) xs+p1
(p + s)(q s)
s
IE(X ) =
dx =
.
p+q
(p)(q) 0 (1 + x)
(p)(q)
On voit donc que IE(As1 )IE((1 + X)s ) = IE(X s ). Or A1 et X sont indpendantes, et
donc As1 et (1 + X)s le sont galement. Comme lesprance dun produit de v.a. indpendantes est le produit des esprances, on en dduit que IE(As1 (1 + X)s ) = IE(X s ).
Ce rsultat dit que les v.a. log(A1 (1 + X)) et log X ont la mme transforme de
Laplace. Daprs le cours, elles sont donc de mme loi, et donc leurs exponentielles
F1 (X) = A1 (1 + X) et X sont de mme loi. On est donc dans les conditions de la
question
PE) et on en dduit que Z et X sont de mme loi. Puisquici An = Bn , alors
Z = k=1 A1 A2 . . . Ak .
1
Si Pr(A1 a) = (1+a)
1+q pour tout a 0, alors la fonction de rpartition de
1
A1 est 0 si a < 0 et 1 (1+a)
1+q si a 0. En drivant par rapport a on voit que
1+q
la densit de A1 est (1+a)
2+q 1]0,[ (a), cest dire du type de lexemple avec p = 1.
q
La densit de Z est donc (1+z)
1+q 1]0,[ (z), et donc pour tout z 0 : Pr(Z z) =
R
q
1
dx
=
.
(1+z)q
z (1+x)1+q
Compltons ce corrig en montrant le point admis IE(log A1 ) < 0. Puisque

on a

d
IE(As1 ) = IE(As1 log A1 ),
ds


d
0 (p) 0 (p + q)
s
IE(log A1 ) =
log IE(A1 )
=

.
ds
(p)
(p + q)
s=0
0

(t)
Le problme est donc de montrer que t 7 (t)
est croissante sur ]0,[, ou de montrer
que t 7 log (t) est strictement convexe. Cela vient de
Z
1
0 (t) 2 t1 x
00
(log (t)) =
[log x
] x e dx > 0.
(t) 0
(t)

77
www.L es-M athematiques.net

Universit Paul Sabatier. NT 12, Licence de mathmatiques pour lenseignement, Examen du 13 septembre 2000.
Dure: 2heures. Aucun document. Affichage des rsultats le 20 septembre 14:00.
Question de cours. Soit et (n )n1 des probabilits sur IR. On rappelle que on dit
que la suite (n )n1 converge en loi vers si pour toute fonction continue borne
relle ou complexe sur IR on a
Z
Z
lim
f (x)n (dx) =
f (x)( dx).
n

(1) Donner sans dmonstration, en termes de transformes de Fourier, une condition


ncessaire et suffisante de convergence en loi (thorme de Paul Lvy).
(2) Donner sans dmonstration, en termes de fonctions de rpartition, une condition
ncessaire et suffisante de convergence en loi.
Problme. On rappelle que pour |t| < 1 :
1+

X
( + 1) . . . ( + n 1) n
1
t =
.
n!
(1 t)
n=1

Soit X une variable alatoire (v.a.) qui suit une loi ngative binomiale N B,p , avec
> 0 et 0 < p = 1 q < 1, donc de loi concentre sur lensemble N des entiers 0
dfinie par

X
( + 1) . . . ( + n 1) n
p q n .
p 0 +
n!
n=1
A. Calculer la fonction gnratrice de X, cest dire IE(z X ) avec |z| 1. Dduire du
rsultat IE(X), IE(X 2 X), IE(X 2 ) et la variance 2 (X) de X. Montrer que IE(X) <
2 (X).
B. Soient X1 , . . . ,Xn des v.a. indpendantes et de mme loi que X. On pose X n =
1
n (X1 + + Xn ). Quelle est la loi de nX n ? (mthode: considrer sa fonction gn2

ratrice et utiliser le A). Calculer IE(X n ) et IE(X n ).


C. Avec les hypothses de B) on dfinit la v.a. Sn 0 par
n

Sn2 =

1 X
(Xk X n )2 .
n1
k=1

Pn

n
1
2
Dmontrer que Sn2 = n1
X n + n1
k=1 Xk . En dduire laide du A et du B
que la valeur de IE(Sn2 ) est la variance de X.

D. Avec les hypothses de C) on fait tendre n vers linfini. A laide


Pn de la2 loi des2grands
1
nombres, calculer les limites presque sures de X n , de n1
k=1 Xk , de Sn et de
2
Sn X n et vrifier que la dernire est >0.
D. On suppose maintenant que et p sont des paramtres inconnus, que la suite
(X1 , . . . ,Xn ) est un chantillon partir duquel on veut estimer et p par la mthode
78
www.L es-M athematiques.net

dite des moments. Si X n et Sn2 sont considrs comme des estimateurs de la moyenne
et de la variance de X respectivement, dire si ces estimateurs sont biaiss ou non. On
n et pn = 1 qn par les quations
dfinit les estimateurs
n qn
n q2
n qn

= X n, 2 n +
= Sn2 .
pn
pn
pn
n > 0 et 0 < pn < 1 si et seulement si S 2 X n > 0. Au vu de la question
Montrer
n
D, cette mthode est elle raisonnable?

Barme: QC= 2+2 points, A=1+1+0,5+1+0,5, B=2+1+1, C=1+1, D=1+1+1+0,5+0,5,


E=1+1.

79
www.L es-M athematiques.net

Vous aimerez peut-être aussi