Académique Documents
Professionnel Documents
Culture Documents
DEMI2E
Anne 2013/2014
Cours de Probabilits
Joseph Lehec
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2
2
3
4
5
2 Espaces de probabilit
2.1 Dfinition . . . . . .
2.2 Conditionnement . .
2.3 Indpendance . . . .
2.4 Exercices . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6
6
7
8
9
3 Variables alatoires
3.1 Dfinitions . . . . . . . . . . . . . . . . . . .
3.2 Variables alatoires, fonctions de rpartition
3.3 Loi dune variable alatoire . . . . . . . . .
3.4 Variables alatoires discrtes . . . . . . . . .
3.5 Variables alatoires continues . . . . . . . .
3.6 Exercices . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
11
11
12
13
14
14
15
4 Intgration
4.1 Intgrale dune fonction tage positive .
4.2 Intgrale dune fonction positive . . . .
4.3 Intgrale dune fonction relle . . . . . .
4.4 Exemples . . . . . . . . . . . . . . . . .
4.5 Exercices . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
17
17
19
20
21
23
5 Esprance
5.1 Dfinition, proprits . . . . . . . .
5.2 Moments, variance . . . . . . . . .
5.3 Fonction gnratrice des moments
5.4 Formule fondamentale . . . . . . .
5.5 Retour sur les variables continues .
5.6 Lois classiques . . . . . . . . . . .
5.7 Changement de variable I . . . . .
5.8 Un exemple ni discret ni continu .
5.9 Exercices . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
25
25
26
27
28
29
30
33
35
35
6 Variables indpendantes
6.1 Dfinition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.2 Covariance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.3 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
38
38
39
39
7 Intgrales doubles
7.1 Thorme de Fubini . . .
7.2 Lois jointes . . . . . . . .
7.3 Couples continus . . . . .
7.4 Retour sur lindpendance
7.5 Changement de variable II
7.6 Exercices . . . . . . . . .
.
.
.
.
.
.
41
41
42
42
43
44
46
8 Conditionnement
8.1 Cas discret . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.2 Cas continu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.3 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
48
48
50
51
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Thorie de la mesure
1.1
Dfinitions
Dfinition 1.1. Soit E un ensemble. On appelle tribu sur E un sous-ensemble A des parties de
E vrifiant
(i) A
(ii) si A A alors Ac A
S
(iii) si (An )nN est une suite dlments de A, alors nN An A
Exemple 1.2. Soit E un ensemble
{, E} est une tribu.
Soit A E, alors {, A, Ac , E} est une tribu.
P(E) est une tribu.
Lemme 1.3. Soit E un ensemble et A une tribu sur E. Alors
EA
A est stable par union finie
A est stable par intersection dnombrable (ou finie).
Dmonstration. Comme A et comme A est stable par passage au complmentaire E = c A.
Pour le deuxime point il suffit de remarquer que
A B = A B .
Pour le troisime on crit
\
An =
c
Acn .
Dfinition 1.4. tant donn un ensemble E et une tribu A sur E, on appelle mesure sur (E, A)
une application
: A [0, +]
telle que pour toute suite (An )nN dlments de A deux deux disjoints (An Am = pour tous
n 6= m) on ait
+
[
X
(An )
An =
n=0
nN
Exemple 1.7. Soit a E, on dfinit une mesure de probabilit sur (E, P(E)) en posant a (A) = 1
si a A et a (A) = 0 sinon. Cette mesure est appele masse de Dirac en a.
Exemple 1.8. Pour tout sous-ensemble A de N posons (A) = card(A) si A est fini et (A) = +
si A est infini. Alors dfinit une mesure sur (N, P(N)) appele mesure de comptage.
1.2
La mesure de Lebesgue
Dans cette partie on se place sur lensemble R des nombres rels. Les principaux thormes de
cette partie seront admis, leur dmonstration dpasse le cadre dune introduction la thorie de
la mesure.
Remarquons quune intersection de tribus est encore une tribu, ce qui justifie la dfinition suivante.
Dfinition 1.9. On appelle tribu des Borliens ou tribu Borlienne, note B(R), la tribu engendre
par les intervalles de R ; cest--dire la tribu obtenue en prenant lintersection de toutes les tribus
contenant les intervalles.
Il faut retenir cette dfinition ainsi :
B(R) est une tribu.
Les intervalles de R sont contenus dans B(R).
Si A est une tribu contenant les intervalles, alors B(R) A.
On ne change rien la dfinition prcdente en ne considrant que les intervalles ouverts, ou que
les intervalles ferms : un intervalle ouvert peut toujours scrire comme une union dnombrables
dintervalle ferms. De mme, la tribu B(R) contient les singletons. En effet, soit on considre que
{x} = [x, x] est un intervalle et donc appartient B(R) par dfinition, soit on crit
\
{x} =
[x, x + 1/n].
n1
Par stabilit par union dnombrable la tribu B(R) contient tous les ensembles dnombrables, en
particulier lensemble Q des nombres rationnels. En fait, il est difficile de construire un sousensemble de R qui ne soit pas Borlien.
Thorme 1.10. Soient , deux mesures dfinies sur (R, B(R)), si et concident sur les
intervalles alors et sont gales. Autrement dit si (I) = (I) pour tout intervalle I alors
(B) = (B) pour tout Borlien B.
Thorme 1.11. Il existe une unique mesure L sur (R, B(R)) vrifiant
L([a, b]) = b a
pour tout intervalle [a, b]. Cette mesure est appele mesure de Lebesgue.
On admettra ces deux thormes. Remarquons quand mme que lunicit de la mesure de
Lebesgue est une consquence du Thorme 1.10.
Proposition 1.12. La mesure de Lebesgue est invariante par translation : pour tout x R et pour
tout B B(R) lensemble x + B est aussi Borlien et
L(x + B) = L(B).
Dmonstration. Commenons par montrer que si B B(R) alors x + B B(R). On fixe x R et
on pose
A = {B R, x + B B(R)}.
On vrifie aisment que A est une tribu qui contient les intervalles. Par consquent B(R) A, ce
quil fallait dmonter.
Pour B B(R) on dfinit
M(B) = L(x + B).
Alors M est une mesure sur (R, B(R)) (exercice) et pour tout intervalle [a, b] on a
M([a, b]) = L([x + a, x + b]) = (b + x) (a + x) = b a = L([a, b]).
Les mesures M et L concident donc sur les intervalles. Daprs le Thorme 1.10 on obtient
L = M, ce qui est le rsultat.
3
1.3
Convergence monotone
Dans toute la suite du cours, tant donns une suite relle (un )n0 et l R {+}, on crit
un % l lorsque la suite un est croissante et tend vers l. De mme, si l R {} on crit un & l
si la suite est dcroissante et tend vers l. tant donne une suite (An )n0 densembles, la notation
An % A signifie que la suite est croissante pour linclusion (An An+1 pour tout n N) et que
[
An = A.
n0
Enfin An & A signifie que la suite est dcroissante pour linclusion et que n An = A. Les rsultats
de cette sous-partie trs importants.
Proposition 1.13. Soit (E, A, ) un espace mesur et soient (An )nN , A des lments de A. Si
An % A alors (An ) % (A).
Remarque. Lhypothse de monotonie est fondamentale. Par exemple, considrons la mesure de
comptage sur N et les ensembles An suivants : A0 = {0} et An = {1} pour n 1. On a (An ) = 1
pour tout n mais (n An ) = ({0, 1}) = 2.
Dmonstration. On pose A00 = A0 et A0n = An \An1 pour tout n 1. Les proprits suivantes
sont laisses en exercice (faire un dessin) :
Les A0n sont deux deux disjoints.
An = A00 A01 A0n pour tout n.
0
n=0 An = n=0 An .
Par -additivit, on obtient
(An ) = (A00 ) + + (A0n ) %
(A0k ) =
+
[
k=0
k=0
+
[
Ak .
A0k =
k=0
X
An
(An ).
n=0
n=0
k
[
k
X
An
(An ).
n=0
n=0
Laissons cette partie de la preuve en exercice. Ensuite on pose Bk = kn=0 An . Daprs ce qui
prcde, pour tout k N
k
X
X
(Bk )
(An )
(An ).
(1)
n=0
n=0
1.4
Exercices
Exercice 1.1. Soit (uk )k0 une suite de rels positifs, Montrer que la somme de la srie
ne dpend pas de lordre des termes : si : N N est une fonction bijective alors
X
X
uk =
u(k) .
k0
k0
uk
k0
X
uk = sup
uk , I N, I fini .
kI
Exercice 1.2. Montrer quune intersection quelconque de tribus est une tribu. Est-ce que cela
marche aussi avec lunion ?
Exercice 1.3. Montrer que la mesure de comptage sur N est bien une mesure.
Exercice 1.4. Soit (E, A, ) un espace mesur et soient A1 , . . . , An des ensembles mesurables.
Montrer que
1. Montrer que (A1 A2 ) (A1 ) + (A2 ).
2. Montrer par rcurrence sur n que (A1 An ) (A1 ) + + (An ).
Exercice 1.5. Soit (E, A, ) un espace mesur et soient A1 , . . . , An des ensembles mesurables.
Montrer que
1. Montrer que (A1 A2 ) = (A1 ) + (A2 ) (A1 A2 ).
2. Montrer que
(A1 A2 A3 ) = (A1 ) + (A2 ) + (A3 )
(A1 A2 ) (A1 A3 ) (A2 A3 ) + (A1 A2 A3 ).
3. Donner une formule pour (A1 An ).
Exercice 1.6. Montrer quun intervalle ouvert est runion dnombrable dintervalles ferms. Montrer quun intervalle ferm est intersection dnombrable dintervalles ouverts.
Exercice 1.7. Montrer que presque tous les nombres rels sont irrationnels.
Exercice 1.8. Soit (, A, ) un espace mesur, montrer quune union dnombrable densembles
ngligeables est ngligeable.
Exercice 1.9. Soit f : R R+ telle que L({x : f (x) t}) = 0 pour tout rel t > 0. Montrer que
f (x) = 0 presque partout.
Exercice 1.10. Soit U un sous-ensemble ouvert de R. Pour x U on pose
a(x) = inf a < x, ]a, x] U
b(x) = sup b > x, [x, b[ U
1. Montrer que
[
U=
]a(r), b(r)[
rQU
Espaces de probabilit
2.1
Dfinition
Dfinition 2.1. On appelle espace de probabilit tout triplet (, A, P), o est un ensemble, A
une tribu sur , et P une mesure de probabilit sur (, A).
Cette notion permet de modliser nimporte quelle exprience alatoire.
Exemple 2.2. Le pile ou face est modlis par lespace (, A, P) avec = {P, F }
A = P() = {, {P }, {F }, {P, F }}
et P la probabilit donne par P({P }) = P({F }) = 1/2.
Pour le lancer de d, on a = {1, 2, 3, 4, 6}, A = P() et
P({1}) = P({2}) = = P({6}) = 1/6.
De manire gnrale si un ensemble fini, on dfinit une probabilit sur , P() en posant
P(A) =
card(A)
.
card()
p=1
0, 44.
Exemple 2.4 (aiguille de Buffon). On lance une aiguille et on regarde langle que fait laiguille
avec une direction donne (disons le nord). Supposons (ce qui semble naturel) que la probabilit
que laiguille tombe dans un intervalle dangle donn soit proportionnelle la longueur de cet
intervalle. On peut modliser cette exprience ainsi. On prend = R, A = B(R) et on pose pour
tout B B(R)
L(B [0, 2])
L(B [0, 2])
P(B) =
=
.
L([0, 2])
2
Remarque. De manire gnrale, tant donne a < b on dfinit une probabilit sur (R, B(R)) en
posant
L(B [a, b])
P(B) =
.
ba
Cette mesure de probabilit est appele probabilit uniforme sur lintervalle [a, b].
Un peu de terminologie : lespace est appel espace des observables, cest lensemble des
issues possibles de lexprience alatoire. Les lments de la tribu A sont appels vnements. Un
vnement A vrifiant P(A) = 1 est dit quasi-certain. On dit aussi que A a lieu presque srement.
Un vnement vrifiant P(A) = 0 est dit ngligeable.
Rappelons les proprits de convergence monotone vues prcdemment : si An % A alors P(An ) %
P(A) et si Bn & B alors P(Bn ) & P(B).
Exemple 2.5. Admettons quon puisse construire un espace de probabilit permettant de modliser une suite infinie de jeu de pile ou face. Soit An lvnement les n premiers lancers donnent
face et A lvnement tous les lancers tombent sur face. Dune part P(An ) = 2n et dautre
part An & A. Donc 2n = P(An ) & A. Donc P(A) = 0. Lvnement A est ngligeable, on finit
presque srement par faire pile.
2.2
Conditionnement
P(A)
.
P(B)
P(A | Bi ) P(Bi ),
iI
S
Dmonstration. Comme les Bi recouvrent on a A = iI (A Bi ). Et comme les Bi sont deux
deux disjoints, les A Bi aussi. De plus I est fini ou dnombrable donc
X
P(A) =
P(A Bi ).
iI
Exemple 2.12 (Faux positifs). Une maladie affecte une personne sur 1000. Le test de dpistage
nest pas parfait : le rsultat est toujours positif pour une personne malade et pour une personne
saine il est positif (donc erron) 2 fois sur 100. Quelle est la probabilit quune personne ayant un
rsultat positif au test soit effectivement malade ?
Soit T lvnement le test est positif et M lvnement la personne est malade . On cherche
P(M | T ). On crit
P(M )
.
P(M | T ) = P(T | M )
P(T )
Daprs les donnes du problme P(T | M ) = 1 et P(M ) = 0, 001. De plus
P(T ) = P(T | M ) P(M ) + P(T | M c ) P(M c ) = 1 0, 001 + 0, 02 0, 999.
En regroupant tout on trouve que P(M | T ) est de lordre de 5%. Le test est probablement erron.
2.3
Indpendance
De manire intuitive on dit que A est indpendant de B si savoir B ne change pas la probabilit
de A. Cest--dire si
P(A | B) = P(A).
Pour que cette formule ait un sens on est oblig de supposer que P(B) > 0, ce qui nest pas le cas
dans la dfinition suivante.
Dfinition 2.13. Soit (, A, P) un espace de probabilit. Deux vnements A, B sont dits indpendants si
P(A B) = P(A) P(B).
Plus gnralement soit (Ai )iI une famille dvnements (I est un ensemble quelconque). On dit
que les Ai sont indpendants si
\ Y
P
Aj =
P(Aj )
jJ
jJ
2.4
Exercices
Exercice 2.1. On considre une classe de N tudiants, tous ns en 1990. Quelle est la probabilit
(en fonction de N ) davoir deux tudiants ns le mme jour ? Dterminer numriquement partir
de quelle valeur de N cette probabilit devient suprieure 1/2.
Exercice 2.2. Montrer quune intersection dnombrable dvnements quasi-certains est un vnement quasi-certain.
Exercice 2.3. On effectue une suite infinie de pile ou face.
1. Montrer que presque srement un pile finit par sortir.
2. Montrer que presque srement nimporte squence finie de piles et de faces (par exemple
P F P P F F P P ) finit par sortir.
Exercice 2.4. Montrer quun vnement A est indpendant de lui-mme si et seulement si P(A) =
0 ou P(A) = 1. Si P(A) = 0, montrer que A est indpendant de tout vnement B. Ce rsultat
reste-t-il vrai si P(A) = 1 ?
Exercice 2.5. On suppose que A et B sont indpendants. Montrer que A est indpendant de B c ,
que Ac est indpendant de B c .
Exercice 2.6. On lance deux ds, montrer que lvnement la somme fait 7 est indpendant
du score du premier d. Est-ce que cela marche encore si on remplace 7 par 6 ?
Exercice 2.7. On lance un d n fois. On appelle Aij lvnement : les scores du i-me et du j-me
lancers sont gaux . Montrer que les Aij sont indpendants deux deux mais pas mutuellement.
Exercice 2.8. Roulette russe : un revolver 6 coups contient une seule balle mais on ne sait pas
quel endroit du barillet. Le premier joueur place le revolver sur sa tempe et presse la gchette.
Sil survit le deuxime joueur fait de mme. Vaut-il mieux jouer en premier ou en second ? La taille
du barillet importe-telle ?
Exercice 2.9 (Paradoxe du prisonnier). Trois prisonniers sont condamns mort mais le tyran
dcide den librer un. Le prisonnier A apprend par le garde que le prisonnier B sera bien excut.
Le survivant tant A ou C, on peut dire que A a une chance sur deux dtre libr. Dun autre
ct, entre B et C, il y a au moins une personne qui doit tre excute, a ne change rien pour A
de savoir si cest B ou C, la probabilit quil soit libr est toujours de 1/3. Quen pensez vous ?
Indication : il faut prciser ce quaurait dit le garde si B avait t graci. On propose deux hypothses :
1. Le garde dit B sera excut ou B sera graci .
2. Le garde dit B sera excut ou C sera excut , sils le sont tous les deux, il tire au
sort.
Quelle est, dans chacun des cas, la probabilit que A soit libr sachant que le garde dit que B
sera excut ?
Montrer que pour tout p [0, 1/2], on peut donner au garde un algorithme qui fasse que la
probabilit conditionnelle prcdente soit p.
Exercice
2.10. Soit A1 , A2 , . . . une suite dvnements indpendants. On suppose que la srie
P+
n=1 P(Ak ) diverge.
1. Dterminer la probabilit pn quaucun des n premiers vnements ne se ralise.
2. Montrer que pn tend vers 0 (on pourra utiliser lingalit 1 t et ).
3. En dduire que presque srement au moins un des vnements An se produit.
Exercice 2.11 (Ruine du joueur). On considre une suite de pile ou face avec une pice truque
tombant sur pile avec probabilit p. Au temps 0 le joueur possde une somme n. Il gagne 1
chaque pile et perd 1 chaque face. Le jeu sarrte lorsque le joueur est ruin ou lorsquil a atteint
un montant N donn. On note rn la probabilit que le joueur soit ruin la fin du jeu.
n {1, . . . , N 1}.
2. Que valent r0 et rN ?
3. Dterminer rn (attention au cas p = 1/2).
Exercice 2.12. n passagers montent dans un avion lun aprs lautre. Chacun a un numro de
sige mais le premier passager sassied au hasard. Les passagers suivants sasseyent leur place
lorsquelle est libre et choisissent un sige libre au hasard sinon. On appelle pn la probabilit que
le dernier passager sasseye sa place.
1. En conditionnant par rapport au sige choisi par le premier passager, exprimer pn en fonction
de p2 , . . . , pn1 .
2. Dterminer pn .
10
Variables alatoires
3.1
Dfinitions
On ne sera pas toujours intress par le rsultat complet dune exprience alatoire mais plutt
par une consquence de ce rsultat, cest--dire une fonction de ce rsultat. Une telle fonction est
appele variable alatoire.
Exemple 3.1. On lance deux pices. On appelle X le nombre de piles obtenus. De manire
formelle, on a = {P P, P F, F P, F F } muni de la probabilit uniforme, et X est dfinie par
X(P P ) = 2, X(P F ) = 1, X(F P ) = 1, X(F F ) = 0.
tant donne une fonction X de dans R, on sintresse la rpartition de X dans R. On
voudrait par exemple estimer la probabilit
P { : X() x} ,
pour tout rel x. Celle-ci ne sera dfinie que si lensemble
{ : X() x} A.
Cette remarque motive les dfinitions suivantes.
Dfinition 3.2. Soit E, F des ensembles et soient A, B des tribus de E et F respectivement. Une
fonction f : E F est dite mesurable si limage rciproque (par f ) de tout lment de B est un
lment de A :
f 1 (B) A, B B.
Remarque. Si F = R on prend toujours B = B(R), on dit donc quune fonction f : E R est
mesurable si pour f 1 (B) A pour tout Borlien B.
Exemple 3.3. Soit A A, alors la fonction indicatrice de A,
1A (x) = 0 sinon, est mesurable. En effet on a
A
1
(1A ) (B) = {x E : 1A (x) B} =
A
(i) f
(ii) f + g
(iii) f g
(iv) max(f, g) et min(f, g)
De plus si f (x) 6= 0 pour tout x alors 1/f est mesurable.
Dmonstration. Pour (ii), on montre en utilisant la densit de Q dans R que
[
(f + g)(1) (] , x[) =
f 1 (] , r[) g 1 (] , x r[).
rQ
Il en rsulte que (f + g)(1) (] , x[) est mesurable (comme runion dnombrable densembles
mesurables) pour tout x. Daprs ce qui prcde cela suffit pour dire que f + g est mesurable.
Pour (iv) on remarque que
max(f, g)(1) (] , x[) = f 1 (] , x[) g 1 (] , x[)
et que min(f, g)(1) (] , x[) = f 1 (] , x[) g 1 (] , x[). Les autres points se dmontrent
de manire analogue.
3.2
1
1
) = P(X x + ) & P(X x) = F (x).
n
n
lim
yx,y<x
F (y).
Lemme 3.12. Soit X une variable alatoire et F sa fonction de rpartition. Soient x y des
rels. On a
(i) P(X > x) = 1 F (x)
(ii) P(x < X y) = F (y) F (x)
(iii) P(X < x) = F (x)
(iv) P(X = x) = F (x) F (x)
En particulier F est continue en x si et seulement si P(X = x) = 0.
Dmonstration. Les proprits (i) et (ii) sont faciles. Pour (iii) on remarque que {X x1/n} %
{X < x} donc par convergence monotone
F (x 1/n) = P(X x 1/n) % P(X < x).
On obtient (iv) en crivant P(X = x) = P(X x) P(X < x).
Exemple 3.13. On reprend lexemple 3.1. On a F (1) = 1/4 et F (1) = 3/4 ce qui montre que
P(X = 1) = 3/4 1/4 = 1/2.
3.3
nN
nN
nN
3.4
Dfinition 3.19. Une variable alatoire X est dite discrte sil existe D R tel que D soit fini
ou dnombrable et tel que
P(X D) = 1.
Remarque. Pour que cette dfinition ait un sens il faut que {X D} soit un vnement. Cest bien
le cas puisque quon peut lcrire comme une runion finie ou dnombrable dvnements :
[
{X D} =
{X = x}.
xD
Dfinition 3.20. Soit X une variable discrte, on appelle fonction de masse la fonction
f : x R 7 P(X = x).
La fonction de masse f vrifie donc les proprits suivantes :
(i) {x R : f (x) 6= 0} est fini ou dnombrable.
P
(ii) En appelant x1 , x2 , . . . les points o f est non nulle, on a i f (xi ) = 1.
Exemple 3.21. La variable de lexemple 3.1 est discrte puisquelle ne prend que les valeurs 0, 1, 2.
Sa fonction de masse prend les valeurs 1/4, 1/2, 1/4 en 0, 1, 2 respectivement (et la valeur 0 partout
ailleurs).
La fonction de rpartition F dune variable alatoire discrte est une fonction en escalier avec
ventuellement une infinit de marches . La connaissance de F dtermine f et rciproquement :
les points x1 , x2 , . . . o f est non nulle sont les points o F fait un saut et f (xi ) est la taille du
saut que fait F en xi . Tout ceci se rsume en une quation :
X
F =
f (xi )1[xi ,+) .
i
3.5
Dfinition 3.22. Soit X une variable alatoire et F sa fonction de rpartition. On dira que la
variable X
R est continue sil existe une fonction f continue par morceaux (disons), positive et
vrifiant R f (t) dt = 1 telle que
Z x
F (x) =
f (t) dt
(2)
Remarque. Lhypothse f continue par morceaux sera vrifie dans tous les exemples quon
rencontrera mais elle nest pas vraiment ncessaire. Limportant est de pouvoir donner un sens
lintgrale de f . On verra au chapitre suivant la bonne notion dintgrale considrer.
Lemme 3.23. Soit X une variable continue de densit f . Alors
(i) P(X = x) = 0 pour tout rel x.
Rb
(ii) P(a X b) = a f (t) dt pour tous rels a b.
Dmonstration. Lquation (2) montre que F est continue ce qui implique (i). On a donc
Z
P(a X b) = P(a < X b) = F (b) F (a) =
f (t) dt.
a
F (x) =
f (t) dt,
pour tout x R.
Remarque. La valeur 0 attribue f l o F 0 nest pas dfinie na pas dimportance. De manire
gnrale, changer la valeur de la densit en un nombre fini de points ne change rien la rpartition
de X.
Exemple 3.25. Soit langle que fait laiguille de Buffon avec le nord et F sa fonction de rpartition. Le graphe de F est
2
On remarque que F est continue sur R et C 1 sur R\{0, 2}. On a F 0 (x) = 0 si x < 0 ou si x > 2
et F 0 (x) = 1/(2) si x ]0, 2[. La variable est donc continue et admet 1[0,2] /2 comme densit.
3.6
Exercices
Exercice 3.1. Montrer que si F et G sont des fonctions de rpartition et [0, 1], alors F +
(1 )G est une fonction de rpartition. La fonction F G est-elle une fonction de rpartition ?
Exercice 3.2 (Loi de Poisson). Soit > 0. Soit X une variable alatoire valeurs entires ayant
comme fonction de masse P(X = n) = Cn /n! pour tout entier n.
1. Dterminer C.
2. Calculer P(X > 1).
15
x<0
0
x/60 0 x < 60
P(X x) =
1
60 x
Quelle est la probabilit quil attende le bus moins de deux minutes ?
Exercice 3.4. Les personnes ayant rserv un billet davion manquent de se prsenter lembarquement avec probabilit 1/10 indpendamment les unes des autres. La compagnie A possde un
avion de 9 places mais elle vend 10 tickets. La compagnie B vend 20 tickets pour son avion de 18
places.
1. Dterminer, dans chacun des cas, la fonction de masse du nombre X de passagers se prsentant lembarquement.
2. Avec quelle compagnie risque-ton le plus plus dtre en sur-rservation ?
Exercice 3.5. On considre une suite infinie de lancers de la mme pice truque tombant sur
pile avec probabilit p.
1. Dterminer la fonction de masse du temps dattente du premier pile.
2. Dterminer la fonction de masse du temps dattente du r-ime pile.
3. Dterminer la fonction de masse du nombre de piles obtenus au bout de n-lancers.
Exercice 3.6 (Loi exponentielle). Soit f la fonction
f : x 7 ex 1{x>0} .
1. Montrer que f est une densit de probabilit.
2. Soit X de densit f , dterminer la fonction de rpartition de X.
3. Montrer que pour tous s, t > 0 on a
P(X s + t | X s) = P(X t).
Cette proprit est appele absence de mmoire.
Exercice 3.7. Soit X uniforme sur [0, 1] (i.e. admettant 1[0,1] comme densit). Montrer que
Y = ln(1 X) est continue et dterminer sa densit.
Exercice 3.8 (loi normale, loi du Chi-2). On admet que
Z
2
ex /2 dx = 2.
R
x1/2 ex dx.
16
Intgration
On se donne dans toute cette partie un espace mesur (E, A, ). Dans cette partie nous allons
dfinir lintgrale de Lebesgue des fonctions mesurables f : E R par rapport . Lintgrale de
f par rapport sera note
Z
Z
f d ou
f (x) (dx).
4.1
Dfinition 4.1. Une fonction h : E R est dite tage positive si elle est mesurable et si elle ne
prend quun nombre fini de valeurs, toutes positives. De manire quivalente, il existe une suite
finie (a1 , A1 ), . . . , (an , An ) o les ai sont des rels positifs et les Ai des ensembles mesurables telle
que
n
X
h=
ai 1Ai .
(3)
i=1
ai 1Ai
i=1
n
X
ai (Ai ) [0, +]
i=1
Remarque. Nous ne supposons pas que la mesure est finie, il est donc possible que (A1 ) = +
par exemple. La somme prcdente est comprendre avec les conventions suivantes :
a + = +
+ = +
a (+) = +
0 (+) = 0.
a 0
a > 0.
bj 1Bj
j=1
m
X
j=1
17
bj (Bj ).
Exemple 4.4. On a vu
1[0,1] + 21]1,2] = 1[0,2] + 1]1,2] .
On a bien
L([0, 1]) + 2L(]1, 2]) = 1 + 2 1 = 3
L([0, 2]) + L(]1, 2]) = 2 + 1 = 3.
P
Dmonstration. On va transformer la reprsentation h = j bj Bj en reprsentation canonique, en
gardant la quantit
X
bj (Bj )
j
Bj ) (
jJ
aJ =
Bjc ),
j J
/
bj .
jJ
Alors on vrifie facilement que les (AJ )J{1,...,m} sont deux deux disjoints et que
[
Bj =
AJ ,
J3j
bj 1AJ
J{1,...,m} jJ
J{1,...,m}
m
X
bj
j=1
n
X
1AJ
J3j
bj 1Bj .
j=1
aJ (aJ ) =
m
X
bj (Bj ).
j=1
J{1,...,m}
Monotonie : si h1 h2 alors
R
E
h1 d
R
E
h2 d.
Et comme
R
E
h3 d 0 le rsultat suit.
18
4.2
Proposition 4.7. Soient f1 , f2 des fonctions mesurables positives et > 0. On a les proprits
suivantes
R
R
Linarit : E (f1 ) d = E f1 d et
Z
Z
Z
(f1 + f2 ) d =
f1 d +
f2 d.
E
Monotonie : si f1 f2 alors
R
E
f1 d
R
E
f2 d.
Remarque. Soit (An )n0 , A des ensembles mesurables et supposons que An % A. On peut alors
appliquer le thorme aux fonctions 1An , 1A et on obtient (An ) % (A). Autrement dit on
retrouve la Proposition 1.13.
R
Dmonstration. Daprs la proprit
de monotonie de lintgrale on sait dj que la suite ( E fn d)n0
R
est croissante et majore par E f d. Donc il existe L tel que
Z
Z
fn d % L
f d.
E
Soit h =
bi 1Bi une fonction tage positive telle que h f et soit > 0. On pose
An = {fn (1 )h}
(4)
De plus
hn =
et donc
Z
hn d =
bi 1Bi An
bi (Bi An )
puis en sommant
Z
Z
hn d %
h d.
E
n
4X
1
k 2n 1{k2n f <(k+1)2n } .
k=0
Clairement hn est une fonction tage. Si x < 2n alors hn (x) f (x) < hn (x) + 2n ce qui montre
que hn (x) f (x). On vrifie de mme que hn (x) hn+1 (x) pour tout x et pour tout n.
R
R
Dmonstration de la linarit de lintgrale. Lgalit E (f1 ) d = E f1 d est immdiate.
Pour ladditivit on utilise le lemme prcdent : il existe (hn,1 )n0 et (hn,2 )n0 des suites de
fonctions tages positives telles que hn,1 % f1 et hn,2 % f2 . Alors
hn,1 + hn,2 % f1 + f2 .
Daprs la linarit de lintgrale pour les fonctions tages on a
Z
Z
Z
(hn,1 + hn,2 ) d =
hn,1 d +
hn,2 d
E
pour tout n. En passant la limite dans cette galit (en utilisant le thorme de convergence
monotone trois fois) on obtient le rsultat.
Lingalit suivante est trs importante.
Proposition 4.10 (Ingalit de Markov). Soit f une fonction positive et a > 0
Z
1
{x E : f (x) a}
f d.
a E
Dmonstration. Comme f 0 on a f a1{f a} . Donc par monotonie
Z
Z
f d
a1{f a} d = a({f a}).
E
4.3
Rappelons que si x est un nombre rel on appelle partie positive de x la quantit x+ = max(x, 0)
et partie ngative x = min(x, 0). Les nombres x+ et x sont positifs et on a
x = x+ x
|x| = x+ + x .
20
Dfinition 4.11. Soit f : E R une fonction mesurable. On dit que f est intgrable si
Z
|f | d < +.
E
R
R
Comme f+ |f | et f |f |, les quantits E f+ d et E f d sont galement finies. On pose
alors
Z
Z
Z
f d =
f+ d
f d.
E
Proposition 4.12.
intgrables et > 0. On a les proprits suivantes
R fonctions
R Soient f, g des
Linarit : E (f ) d = E f d et
Z
Z
Z
(f + g) d =
f d +
g d2 .
E
Monotonie : si f g alors E f d E g d.
R
R
Dmonstration. Lgalit E (f ) d = E f d est immdiate. Pour ladditivit on crit
f + g = (f + g)+ (f + g) = f+ f + g+ g ,
et donc
(f + g)+ + f + g = (f + g) + f+ + g+ .
En utilisant la linarit pour les fonctions positives on obtient
Z
Z
Z
Z
Z
Z
(f + g)+ d +
f d +
g d =
(f + g) d +
f+ d +
g+ d.
E
4.4
Exemples
k=0
Lintgrale par rapport une mesure sur les entiers est donc la somme dune srie.
Dmonstration. Posons
fn (k) =
f (k) si k n
0
sinon.
n
X
f (k)1{k} ,
k=0
et donc
Z
fn d =
N
n
X
f (k)({k}).
k=0
Dautre part, on a clairement fn (k) % f (k) pour tout k et donc par convergence monotone
Z
Z
fn d %
f d,
N
Le rsultat est galement vrai si la fonction f change de signe, pourvu quelle soit intgrable.
P
Proposition 4.14. Si f : N R est intgrable (pour ) alors la srie
f (k)({k}) est convergente et
Z
n
X
f d = lim
f (k)({k}).
n+
k=0
au lieu de
Z
f (x) L(dx).
R
Soit I = [a, b] un intervalle de R et f : I R une fonction telle que f 1I soit intgrable. On pose
Z
f (x) dx =
a
f (x) dx =
[a,b]
Rb
La notation a f (x) dx peut paratre ambige, faut-il intgrer sur [a, b] ou ]a, b[ ? En fait a ne
change rien au rsultat. On a par exemple
Z
Z
Z
f (x)1[a,b] dx
f (x)1[a,b[ (x)dx =
f (b)1{b} (x)dx = f (b)L({b}) = 0.
R
Proposition 4.15. Soit f : [a, b] R une fonction continue et posons pour x ]a, b[
Z x
F (x) =
f (t) dt.
a
0
Alors F est de classe C sur ]a, b[ et F (x) = f (x) pour tout x ]a, b[.
Autrement dit F est la primitive de f nulle en a.
Dmonstration. Remarquons que f est borne sur [a, b] : il existe M > 0 tel que |f | M sur [a, b],
et donc
Z
b
|f (x)| dx M (b a) < +.
a
ce qui montre que f est intgrable sur [a, b]. Comme f est continue on a f (x) f (y) f (x) +
pour y suffisamment proche de x. Donc par croissance de lintgrale
Z
x+h
x+h
(f (x) ) dy
x
x+h
f (y) dy
x
(f (x) ) dy
x
22
f 0 (t) dt.
f 0 (x)g(x) dx.
4.5
Exercices
Exercice 4.1. Soit (E, A, ) un espace mesur, quelle condition les fonctions constantes sontelles intgrables ?
Exercice 4.2 (Masse de Dirac). Soit a R, on rappelle que la masse de Dirac en a est la mesure
dfinie par a (A) = 1 si a A et a (A) = 0 sinon. Soit f : R R, montrer (en revenant la
dfinition de lintgrale) que
Z
f (x) a (dx) = f (a).
R
Exercice 4.3. Soit (E, A, ) un espace mesur, et soit f : E R une fonction mesurable et
positive.
1. On suppose que f est nulle presque partout. Montrer (en revenant la dfinition de lintgrale) que
Z
f d = 0.
E
2. Rciproquement, on suppose que f est dintgrale nulle. Montrer que ({f }) = 0 pour
tout > 0. En dduire que f est nulle presque partout.
Exercice 4.4. Soit (E, A, ) un espace mesur, soient f, g : E R des fonctions intgrables.
Montrer que max(f, g) est intgrable et que
Z
Z
Z
max
f d,
g d
max(f, g) d.
E
Exercice 4.5. quelle condition (sur r) la fonction x 7 xr est-elle intgrable sur [1, +) ? sur
[0, +) ?
Exercice 4.6 (Ingalit de Cauchy-Schwarz). Soit (E, A, ) un espace mesur, soient f et g des
2
2
fonctions de carr
R intgrable (cest--dire que f et g sont intgrables). On supposera dans un
premier temps E g 2 d > 0.
1. Montrer que f g est intgrable.
R
2. On pose P () = E (f + g)2 d. Montrer que P est un polynme du second degr en .
3. Calculer le discriminant de P .
23
4. Montrer que
f g d
s Z
f2
d
g 2 d
R
E
g 2 d = 0.
6. crire ce que devient cette ingalit dans le cas particulier o est la mesure de comptage
sur N.
Exercice 4.7 (Ingalit de Hlder). Soient f, g des fonctions positives et intgrables et soit
[0, 1].
1. Montrer que pour tous a, b > 0 on a a b1 a + (1 )b.
2. En dduire que
Z
f g
E
Z
d
Z
f d + (1 )
g d.
E
24
Esprance
Dans toute cette partie on se donne un espace de probabilit (, A, P).
5.1
Dfinition, proprits
Dfinition 5.1. Soit X : R une variable alatoire (i.e. une fonction mesurable). Si X est
positive ou intgrable pour la mesure P, lintgrale
Z
X() P(d)
n
X
k 1{X=k}
k=0
Donc
E(X) =
n
X
k P(X = k)
i=0
On a
n n
P(X = k) =
2 ,
k
Donc
E(X) =
k = 0, . . . , n.
n
n
X
n n X
n 1 n
n
k
2 =
n
2 = n2n1 2n = .
2
k
k1
k=1
k=1
Lesprance est une intgrale, elle vrifie donc les mmes proprits que lintgrale :
Linarit : E(X + Y ) = E(X) + E(Y ).
Monotonie : si X Y alors E(X) E(Y ).
Exemple 5.4. On peut calculer lesprance du nombre X de piles au bout de n lancers ainsi : on
pose Yi = 1 si le i-me rsultat est pile et Yi = 0 si cest face. Alors
E(Yi ) = E 1{Yi =1} = P(Yi = 1) = 1/2.
De plus X = Y1 + + Yn . Par consquent
E(X) = E(Y1 ) + + E(Yn ) =
n
.
2
E(X)
.
a
Remarque. Lingalit de Markov est valable pour tout a > 0 mais elle nest intressante que pour
a > E(X).
25
5.2
Moments, variance
Dfinition 5.5. Soit k un entier naturel, la quantit E(X k ) est appele moment dordre k. Le
moment dordre k de X est dfini si X 0 (dans ce cas il peut prendre la valeur +) ou si |X|k
est intgrable (dans ce cas il est forcment fini). La variance de X est la quantit
var(X) = E (X E X)2 = E(X 2 ) (E X)2
Remarque. Soit X ayant un moment dordre 2. Alors la variable |X|2 + 1 est intgrable. Comme
|X| |X|2 + 1, la variable X est aussi intgrable par comparaison. De mme on a
|X|p |X|q + 1,
ds que p q. Donc si le moment dordre q est dfini, alors le moment dordre p est dfini pour
tout p q.
Exemple 5.6. On considre toujours le nombre X de piles au bout de n lancers. Calculons var(X).
Commenons par remarquer que pour toute fonction f , on a
f (X) =
n
X
f (k)1{X=k} ,
k=0
et donc
E f (X) =
n
X
k=0
k=2
On en dduit
var(X) = E[X(X 1)] + E(X) (E X)2 =
n
n(n 1) n n2
+
= .
4
2
4
4
var(X)
a2
Donc X = E(X) presque srement. Autrement dit X est une variable alatoire constante.
26
Xn
1
1
| 2
n
2
4 n
En particulier, la probabilit que Xn /n dvie de sa moyenne dau moins tend vers 0 quand n
tend vers linfini. On dit que Xn /n converge vers 1/2 en probabilit.
5.3
E(X k ) = X (0),
(k)
dk
E(etX )
dtk
dk
= E k etX
dt
= E X k etX .
X (t) =
En prenant t = 0 on obtient le rsultat. Pour avoir une vraie preuve il faudrait justifier que la
drivation sous le signe E est licite.
Thorme 5.14. Soit X, Y deux variables alatoires. On suppose quil existe > 0 tel que X et
Y concident sur lintervalle ] , [. Alors X et Y ont la mme loi.
Autrement dit, la fonction gnratrice des moments caractrise la loi. Nous admettrons ce
rsultat et nous en verrons des applications un peu plus loin.
27
5.4
Formule fondamentale
On a vu au chapitre prcdent que si X est une variable est valeurs dans {0, . . . , n} alors on
peut crire
n
X
X=
k1{X=k}
k=0
et donc
E(X) =
n
X
k P(X = k).
k=0
n
X
f (k) P(X = k) =
k=0
n
X
f (k) PX ({k}),
k=0
f (x) PX (dx).
R
1B d PX ,
R
hn d PX
R
pour tout n. Par convergence monotone, on obtient lgalit cherche en passant la limite.
Enfin si f est un fonction qui change de signe on obtient le rsultat en crivant f = f+ f .
On retrouvera ce schma de dmonstration plusieurs reprise dans la suite du cours.
Exemple 5.16. Si X est valeurs dans N alors PX est une mesure sur (R, B(R)) qui ne charge
que les entiers. Daprs ce quon a vu prcdemment on a donc
E f (X) =
f (n) PX ({n}) =
n=0
n=0
Calculer lesprance dune fonction dune variable discrte revient donc calculer la somme dune
srie.
28
5.5
tant donne une densit f on dfinit une mesure de probabilit sur (R, B(R)) en posant
Z
(B) =
f (x) dx,
B
pour tout Borlien B. On dit que est une mesure densit, ou que est absolument continue.
On dit galement que f est la densit de .
Remarque. La densit dune mesure est dfinie un ensemble de mesure nulle prs : si f est une
densit de et que g = f presque partout, alors g est aussi une densit de .
Exemple 5.18. Soient a < b des rels. La fonction f = 1[a,b] /(ba) est une densit de probabilit.
La mesure ayant pour densit f est appele probabilit uniforme sur [a, b].
Proposition 5.19. Si possde une densit f , on a pour toute fonction g positive ou -intgrable
Z
Z
g(x) (dx) =
g(x)f (x) dx.
R
Dmonstration. Par dfinition lgalit est vraie si g est une indicatrice. Elle est donc vraie si g est
tage positive par linarit. Par convergence monotone on obtient lgalit pour g positive. Enfin,
si g change de signe on a le rsultat en crivant g = g+ g .
Dfinition 5.20. Une variable alatoire X est dite continue si sa loi PX est absolument continue.
Autrement dit sil existe une fonction f mesurable, positive, dintgrale 1 vrifiant
Z
P(X B) =
f (x) dx
B
1
ba
x dx =
a
b2 a2
a+b
=
.
2(b a)
2
Remarque. Une variable ne peut pas tre la fois discrte et continue. Si X est une variable
continue (de densit f ) alors
Z
P(X = x) =
f (t) dt = f (x)L({x}) = 0
{x}
pour tout x R. Par consquent P(X D) = 0 pour tout ensemble dnombrable. Donc X ne peut
pas tre une variable discrte.
En revanche il existe des variables qui ne soient ni discrtes ni continues.
29
pour tout x R. En particulier F est continue sur R. Attention la rciproque nest pas vraie,
ce nest pas parce que la fonction de rpartition de X est continue que la variable X lest. On a
cependant le rsultat suivant.
Proposition 5.22. Soit X une variable alatoire et F sa fonction de rpartition. Si F est continue
sur R et de classe C 1 sur R priv ventuellement dun nombre fini de points, alors X est une
variable continue. Une densit associe est donne par la fonction f donne par f (x) = F 0 (x) si F
est drivable en x et f (x) = 0 sinon.
Dmonstration. Sous ces hypothses on a
Z
P(X ]a, b]) = F (b) F (a) =
f (t) dt,
a
5.6
Lois classiques
Loi de Bernoulli
P(X = 1) = p,
pour un paramtre p [0, 1]. On dit que X suit une loi de Bernoulli de paramtre p. On calcule
facilement
E(X) = p, var(X) = p(1 p),
ainsi que la fonction gnratrice des moments
MX (t) = P(X = 0) + et P(X = 1) = (1 p) + pet ,
t R.
Loi binomiale On jette n fois une pice truque qui retombe sur pile avec probabilit p. Soit X
le nombre de pile obtenus. Alors X {0, . . . , n} et
n k
P(X = k) =
p (1 p)nk , k {0, . . . , n}.
k
On dit que X suit la loi binomiale de paramtres n et p. Des calculs similaires ceux effectus
dans la section prcdente donnent
E(X) = np,
n
X
n tk k
e p (1 p)nk = (pet + 1 p)n ,
k
k=0
pour tout t R.
30
Loi gomtrique On jette la mme pice truque de manire rpte. Le temps dattente X du
premier pile est valeur dans les entiers non nuls et
k N .
On dit que X suit la loi gomtrique de paramtre p. Calculons dabord la fonction gnratrice des
moments
+
X
k1
tX
t
MX (t) = E e = pe
et (1 p)
.
k=1
pet
,
1 (1 p)et
t ] , ln(1 p)[.
1
,
p
var(X) =
1p
.
p2
Loi de Poisson Soit > 0, on dit que X suit une loi de Poisson de paramtre si X est
valeurs dans N et
n
P(X = n) =
e , n N.
n!
On obtient facilement
E(X) =
+
+
X
X
n
n1
n e =
e = .
n!
(n 1)!
n=1
n=1
+
X
ent
n=0
n
e = exp (et 1) ,
n!
t R.
2
1
e(xm) /(2) ,
2
x R.
On dmontrera que ceci dfinit bien une densit plus tard. On dit aussi que X suit une loi normale
de paramtres m et (souvent abrge en N (m, )). La loi N (0, 1) est appele loi normale centre
rduite. Faisons les calculs desprance et de variance dans ce cas particulier. On a
Z
2
1
tet /2 dt.
E(X) =
2 R
2
Cette intgrale est convergente : on peut par exemple dire que tet et pour t assez grand. De
plus comme on intgre une fonction impaire sur R le rsultat est nul. Une autre manire de faire
2
2
est de remarquer que tet /2 est la drive de et . En intgrant par partie, vrifie que
Z
Z
2
2
1
1
E(X 2 ) =
t2 et /2 dt =
et /2 dt = 1.
2 R
2 R
On a donc E(X) = 0 et var(X) = 1. Pour la fonction gnratrice :
Z
Z
2
2
1
1 s2 /2
stt2 /2
MX (s) =
e
dt = e
e(ts) /2 dt = es /2 ,
2 R
2
R
31
pour tout s R.
Il nexiste pas de formule explicite pour la fonction de rpartition Gaussienne
Z x
2
1
(x) =
et /2 dt.
2
Nanmoins, on a les proprits suivantes.
(x) = 1 (x) pour tout x R.
2
Pour a > 0 on a 1 (a) ea /2 /2. En effet
Z
ex
/2
e(a+x)
dt
dx ea
/2
/2
ex
/2
dx.
Loi exponentielle Soit > 0. On dit que X suit une loi exponentielle de paramtre si X
a pour fonction de rpartition F (x) = (1 ex )1R+ (x). La variable X est alors continue de
densit f (x) = ex 1R+ (x). Cest une loi qui sert souvent modliser des temps dattente (temps
dattente un guichet, dure de vie dune ampoule. . .). En intgrant par partie on trouve
+
tet dt =
E(X) =
0
2
2 t
E(X ) =
t e
2tet dt =
1
2 .
1
,
dt =
et dt =
0
+
2
.
2
MX (s) =
,
s
s < .
dfinie pour tout > 0. On a clairement (1) = 1 et, en intgrant par partie () = (1)(1).
On en dduit que (n) = (n 1)! pour tout entier n non nul.
Soit > 0 et > 0 on dit que X suit la loi gamma de paramtres et (souvent abrge en
(, )) si X a pour densit
1 t
t
e 1{t>0} ,
()
f (t) =
On a
E(X) =
()
2
E(e
t t1 et dt =
(+1)
2
sX
puis var(X) =
)=
()
2 .
t R.
( + 1)
=
()
t1 e(s)t dt.
,
s
s < .
Remarquons enfin que la loi (1, ) nest autre que la loi exponentielle de paramtre .
32
Loi uniforme On dit que X suit la loi uniforme sur le segment [a, b] si X a pour densit la
fonction 1[a,b] /(b a). On calcule facilement
E(X) =
a+b
,
2
var(X) =
(a b)2
.
12
esb esa
,
s(b a)
s 6= 0.
Loi de Cauchy On dit que X suit une loi de Cauchy si X admet f (x) = 1/(1 + x2 ) comme
densit (on montre que f est une densit en remarquant que 1/(1 + x2 ) est la drive de arctan(x).
La variable X ne possde aucun moment puisque lintgrale
Z
t
dt
2
R 1+t
est divergente.
5.7
Changement de variable I
On a vu prcdemment que quand X est une variable discrte et une fonction quelconque
(X) est une variable discrte. Ceci ne marche pas pour les variables continues. En effet si est la
fonction nulle, alors (X) est la variable constante gale 0 qui nest videmment pas une variable
continue (sa fonction de rpartition fait un saut en 0). Pour que (X) soit une variable continue il
faut imposer des conditions .
Rappelons que si X est une variable continue de densit f et h une fonction positive on a
Z
E h(X) =
h(t)f (t) dt.
R
Rciproquement, supposons cette galit vraie pour toute fonction positive h. En lappliquant
h = 1B on obtient
Z
P(X B) =
f (t) dt.
B
On peut faire ceci pour tout Borlien B, ce qui montre que X est continue de densit f .
Nous admettrons le rsultat suivant (formule de changement de variable).
Thorme 5.23. Soit U un ouvert de R et soit : U V une fonction bijective de classe C 1 .
Alors
Z
Z
f (t) dt =
f (t)|0 (t)| dt
(U )
Plus que le rsultat, il est important de retenir la mthode permettant de dterminer la densit
de (X). La fonction h est souvent appele fonction test, on parle de mthode de la fonction test.
Exemple 5.25. Un cas simple est quand la fonction est affine : (x) = ax + b. Si X est une
variable alatoire de densit f , on a
Z
yb 1
E h(aX + b) =
) dy
h(y)f (
a a
R
pour toute fonction test h, ce qui montre que la variable aX + b admet t 7 a1 f (a1 (t b))
comme densit.
Par exemple si X suit la loi N (0, 1) on trouve que aX + b suit la loi N (b, a2 ). On peut dduire
facilement lesprance et la variance de la loi N (b, a2 ) :
E(aX + b) = a E(X) + b = b,
var(aX + b) = a2 var(X) = a2 .
a /2 b
e .
Dans le mme ordre dide, on peut voir que si Y suit une loi exponentielle de paramtre 1 alors
Y suit une loi exponentielle de paramtre 1/.
Exemple 5.26 (loi log-normale). Soit X suivant une loi normale centre rduite. La loi de Y = eX
est appel log-normale. On cherche sa densit. La fonction exp ralise une bijection entre R et
]0, +[. Sa rciproque log(x) admet comme drive 1/x. Soit h une fonction test, en utilisant la
formule de changement de variable on a
Z
2
X
E h(Y ) = E h(e ) =
h(ex )ex /2 dx
R
Z +
2
1
1
h(y)e ln(y) /2 dy.
=
y
2 0
On en dduit que Y admet comme densit la fonction
g(y) = 1]0,+[ (y) e ln(y)
/2
1
.
y 2
Il nest pas obligtoire de suivre cette mthode. On sait que Y 0 et que pour x 0
P(Y x) = P(X ln(x)) = (log(x))
o est la rpartition Gaussienne :
1
(x) = P(X x) =
2
et
/2
dt.
2
1
1
= e ln(x) /2 .
x
x 2
si x 0 et F 0 (x) = 0 si x < 0.
34
5.8
On a vu quune variable alatoire ne pouvait tre la fois discrte est continue. En revanche il
existe des variables qui ne soient ni lun ni lautre.
Exemple 5.27. Soit langle donn par laiguille de Buffon et soit X = max(, ). On a P(X
x) = 0 pour tout x < . Pour x on a P(X x) = P( x). La fonction de rpartition de X
a donc le graphe suivant
La variable X nest pas continue puisque P(X = ) = 1/2. La variable nest pas non plus discrte
puisque sa fonction de rpartition nest pas en escalier. Plus prcisment on voit sur le graphe que
P(X = x) = 0P
pour tout x 6= . Par consquent, si D = {x1 , x2 , . . . } est un ensemble dnombrable
P(X D) = i P(X = xi ) vaut 0 ou 1/2 selon que appartienne ou pas D. Dans tous les cas
P(X D) < 1.
On peut nanmoins calculer lesprance de X : remarquons que max(, ) = 1{<} + 1{} .
Par linarit de lesprance
E(X) = E(1{<} ) + E(1{} ).
Comme est une variable uniforme sur [0, 2]
1
E(1{<} ) = P( ) = .
2
Z 2
1
3
E(1{} ) =
.
t dt =
2
4
Donc E(X) = /2 + 3/4 = 5/4.
5.9
Exercices
n=0
35
Exercice 5.4 (loi binomiale ngative). Une urne contient des boules blanches et des boules rouges,
les boules blanches tant en proportion p. On tire les boules une une avec remise et on note Xn
le rang dapparition de la n-ime boule blanche.
1. Donner la loi de X1 et calculer son esprance.
2. Dterminer la loi de Xn . En dduire que
+
X
pn (1 p)kn
k=n
k1
n1
=n
k
n
k1
= 1.
n1
4. On note Yn le nombre de boules rouges apparues avant la n-ime boule blanche. crire Yn
en fonction de Xn .
5. En dduire la loi de Yn , puis son esprance.
Exercice 5.5. On considre une urne contenant b boules bleues et r boules rouges. On effectue
des tirages successifs sans remise et on sintresse au rang X dapparition de la premire boule
bleue.
1. Calculer P(X > n) pour tout entier n.
2. Montrer que E(X) = (b + r + 1)/(b + 1) .
Indication : Montrer par rcurrence sur q que pour tout entier p
q
X
p+i
p+q+1
=
.
p
p+1
i=0
Exercice 5.6. On suppose que var(X) = 0. Que peut-on dire de X ?
Exercice 5.7. Soit X une variable alatoire. On dit quun nombre m est une mdiane pour X si
P(X m) 1/2 et P(X m) 1/2.
1. Soit F la fonction de rpartition de X. On pose
m = inf x R : F (x) 1/2 .
Montrer que m est bien dfini puis que m est une mdiane.
2. Montrer par un exemple que X peut avoir plusieurs mdianes.
3. On suppose que X est de carr intgrable, montrer que toute mdiane m vrifie
p
|m E(X)| 2 var(X).
Exercice 5.8. Soit X une variable alatoire et soit Y = aX + b.
1. Montrer que MY (t) = etb MX (at).
2. Calculer la fonction gnratrice des moments de la loi N (0, 1) et en dduire celle de la loi
N (m, 2 ).
Exercice 5.9. Soit Xn une variable de loi Gamma de paramtres n, .
1. Calculer la fonction gnratrice des moments de Xn . Prciser son domaine de dfinition.
2. En dduire la fonction gnratrice des moments MYn de Yn = Xn /n. Calculer la limite de
MYn (t) en tout point t R o cela a un sens.
3. La fonction limite obtenue est la fonction gnratrice des moments dune variable relle.
Laquelle ?
Exercice 5.10 (Ingalit de Jensen). Soit X une variable alatoire et une fonction convexe de
classe C 1 . On suppose que X et (X) sont intgrables. On pose m = E(X). En utilisant le fait que
est au-dessus de sa tangente en m, montrer que
E X E (X).
36
Exercice 5.11. Soit X une variable de densit f (x) = k(x x2 )1[0,1] (x).
1. Montrer que f est une bien une densit de probabilit.
2. Calculer la fonction de rpartition de X, son esprance et sa variance.
3. On pose Y = 1 2X. Dterminer la loi de Y et calculer son esprance et sa variance.
Exercice 5.12. Soit X de loi N (0, 1) et Y une variable dfinie par
X()
si X() > 0,
Y () =
2X() si X() 0.
Dterminer la loi de Y , son esprance et sa variance.
Exercice 5.13. Soit X une v.a. suivant la loi exponentielle de paramtre > 0. On pose Y = [X],
o [X] dsigne la partie entire de X.
1. Trouver la loi de Y , calculer son esprance et sa variance.
2. Montrer que Z = X [X] est une v.a. continue et calculer sa densit et son esprance.
Exercice 5.14. Dans un repre orthonorm, soient O = (0, 0), I = (1, 0) et J = (1, 0). On
considre un demi-cercle pos sur le segment [I, J] et un point M alatoire sur le demi-cercle.
Quelle est lordonne moyenne de M si
1. Langle (OI, OM ) est uniforme sur [0, ] ?
2. Labscisse de M est uniforme sur [1, 1] ?
37
6
6.1
Variables indpendantes
Dfinition
Dfinition 6.1. Soient X, Y des variables alatoires. On dit que X et Y sont indpendantes si
pour tous A, B B(R)
P(X A, Y B) = P(X A) P(X B).
Proposition 6.2. Soient X et Y des variables discrtes, X et Y sont indpendantes si et seulement
si
P(X = x, Y = y) = P(X = x) P(Y = y), x, y R.
(5)
Remarque. Attention ceci ne marche que pour les variables discrtes. Par exemple si X et Y sont
continues, on a toujours
P(X = x, Y = y) = 0 = P(X = x) P(Y = y).
Dmonstration. On suppose quon a (5) et que X et Y sont valeurs dans N (par exemple). Soient
A, B des Borliens de R, on a
X
P(X A, Y B) =
P(X = i, Y = j)
iA,jB
P(X = i) P(Y = j)
iA,jB
P(X = i)
iA
P(Y = j)
jB
Dfinition 6.7. On dit que (Xn )nN est une suite de variables alatoires indpendantes si pour
toute suite finie dindices 0 i1 < i2 < < in et de Borliens B1 , . . . , Bn on a
P(Xi1 B1 , . . . , Xin Bn ) = P(Xi1 B1 ) P(Xin Bn ).
Si on a seulement
P(Xi A, Xj B) = P(Xi A) P(Xj B)
pour tout i 6= j on dit que les variables (Xi )i1 sont deux deux indpendantes.
6.2
Covariance
n
X
i=1
n
X
Xi =
var(Xi ) + 2
i=1
cov(Xi , Xj )
1i<jn
6.3
Exercices
Exercice 6.1. On considre une main de poker, le nombre das est-il indpendant du nombre de
rois ? du nombre de trfles ?
Exercice 6.2. Soit X et Y des variables alatoires indpendantes, prenant toutes les deux les
valeurs 1 et 1 avec probabilit 1/2. Montrer que X, Y et XY sont deux deux indpendantes.
Sont-elles mutuellement indpendantes ?
39
Exercice 6.3 (loi faible des grands nombres). Soit (Xi )i1 une suite de variables i.i.d. de carr
intgrable. On pose m = E(X1 ) et = var(X1 ).
1. Exprimer la variance de (X1 + + Xn )/n en fonction de n et .
2. Montrer que pour tout > 0 on a
X1 + + Xn
lim P
m = 0.
n+
n
On dit que (X1 + + Xn )/n converge vers m en probabilit.
Exercice 6.4. Soient X, Y des variables indpendantes.
1. Exprimer la fonction de rpartition de max(X, Y ) en fonction des rpartitions de X et Y .
Mme question avec min(X, Y ).
2. On suppose maintenant que X et Y sont uniformes sur [0, 1], dterminer la loi de max(X, Y ).
Exercice 6.5. Soient n, m des entiers, et p [0, 1]. Soient X et Y des variables indpendantes et
binomiales de paramtres n, p et m, p, respectivement.
1. Calculer les fonctions gnratrices des moments de X et Y .
2. Dterminer la fonction gnratrice des moments de X + Y .
3. En dduire la loi de X + Y .
Exercice 6.6. Soient X1 , X2 des variables indpendantes de lois respectives (n1 , ) et (n2 , ).
1. Calculer la fonction gnratrice des moments de X1 + X2 et en dduire sa loi.
2. Quelle est la loi de Y1 + + Yn si les Yi sont i.i.d de loi exponentielle ?
Exercice 6.7. On considre n lancers de ds successifs. On appelle Aij lvnement les rsultats
des i-me et j-me lancers sont gaux et on pose
X
X=
1Aij .
1i<jn
1. Calculer lesprance de X.
2. Montrer que les vnements (Aij )1i<jn sont deux deux indpendants. Sont-ils mutuellement indpendants ?
3. Dterminer la variance de X.
40
7
7.1
Intgrales doubles
Thorme de Fubini
Dans ce chapitre on va intgrer des fonctions sur R R. Pour ce faire on doit dabord dfinir
une tribu.
Dfinition 7.1. On note B(R2 ) la plus petite tribu contenant
{A B, A B(R), B B(R)}.
Cest la tribu des Borliens de R2 .
Thorme 7.2. Soient et deux mesures sur (R2 , B(R2 )) vrifiant (A B) = (A B) pour
tous A, B B(R). Alors = .
Thorme 7.3. Il existe une unique mesure L2 sur (R2 , B(R2 )) vrifiant
L2 (A B) = L(A)L(B),
pour tous Borliens A, B de R. Cette mesure est appele mesure de Lebesgue sur R2 .
Encore une fois nous admettrons ces deux thormes, mais nous pouvons remarquer que lunicit
dans le deuxime thorme est une consquence du premier. La mesure L2 est donc lunique mesure
sur R2 vrifiant
L2 ([a, b] [c, d]) = (b a)(d c),
pour tous rels a, b, c, d (vrifiant a b et c d).
Thorme 7.4 (Thorme de Fubini). Soit f : R2 R une fonction mesurable. Lgalit
Z
Z Z
2
f (x, y) dx) dy
f dL =
R2
ZR ZR
=
f (x, y) dy dx,
R
I
1
Bien sr son aire est 1/2. Mais on peut la calculer de la manire suivante : on remarque que (x, y)
appartient au triangle si et seulement si x 0, y 0 et x + y 1. Laire du triangle vaut donc
Z
Z 1 Z 1y
Z 1
1
1{x0,y0,x+y1} dxdy =
dx dy =
(1 y) dy = .
2
R2
0
0
0
41
7.2
Lois jointes
+ X
+
X
i=0 j=0
7.3
Couples continus
Dfinition 7.9. Une densit de probabilit sur R2 est une fonction f : R2 R mesurable, positive
et vrifiant
Z
f (x, y) dxdy = 1.
R2
Dfinition 7.10. On dit quune mesure de probabilit sur R2 , B(R2 ) est absolument continue
sil existe une densit de probabilit f : R2 R telle que
Z
(B) =
f (x, y) dxdy
B
R2
Dfinition 7.12. On dit quun couple (X, Y ) de variables alatoires est continu si leur loi jointe
PX,Y possde une densit f . On dit aussi que f est la densit de (X, Y ).
De manire informelle f (x, y)dxdy reprsente la probabilit que le couple (X, Y ) appartienne
au rectangle [x, x + dx] [y, y + dy].
Proposition 7.13. Soit (X, Y ) un couple continu de densit fX,Y . Alors X et Y sont des variables
continues de densits respectives
Z
fX (x) =
fX,Y (x, y) dy
ZR
fY (y) =
fX,Y (x, y) dx.
R
R
R
Remarque. La rciproque nest pas vraie : ce nest pas parce que les variables X et Y sont continues
que le couple (X, Y ) est continu. Par exemple, le couple (X, X) ne peut pas tre continu. En effet,
sil possdait une densit f , on aurait la contradiction suivante
Z
1 = P(X = X) =
1{x=y} f (x, y) dxdy = 0.
R2
Donc f et g ont les mmes marginales. Cet exemple montre que la connaissance des densits
marginales ne dtermine pas la densit jointe.
7.4
43
f (x)g(y) dxdy
C
7.5
Changement de variable II
pour toute fonction h (pourvu que la premire intgrale soit bien dfinie).
Exemple 7.18 (Intgration en coordonnes polaires). La fonction (r, ) = (r cos(), r sin())
ralise une bijection entre ]0, +[]0, 2[ et R2 \D en appelant D la demi-droite {(x, 0), x > 0}.
On a
cos() r sin()
D()(r, ) =
,
sin() r sin()
et donc J()(r, ) = r cos2 () + r sin2 () = r. La formule de changement de variable donne donc
Z + Z 2
Z
Z
f r cos(), r sin() r drd =
f (x, y) dxdy =
f (x, y) dxdy.
0
R2 \D
R2
R
R
ex
/2
dx =
2.
44
Rappelons quun couple (X, Y ) de variables alatoires possde une densit f si pour tout Borlien C de R2
Z
P((X, Y ) C) =
f (x, y) dxdy.
C
Rappelons quun C 1 -diffomorphisme est une fonction bijective de classe C 1 et telle que sa rciproque soit aussi C 1 .
Proposition 7.19. Soit (X, Y ) un couple continu valeurs dans un ouvert U . Soit : U V un
C 1 -diffomorphisme. Alors le couple (X, Y ) est continu.
Dmonstration. Soit h une fonction positive (fonction test). En appliquant la formule de changement de variables 1 on obtient
Z
E h (X, Y ) =
h (x, y)f (x, y) dxdy
U
Z
=
h(s, t)f 1 (s, t)|J(1 )(s, t)| dsdt.
V
x = uv
u=x+y
v = x/(x + y)
y = u(1 v)
x > 0, y > 0
u > 0, 0 < v < 1
On a montr que : (x, y) 7 (x + y, x/(x + y)) ralise une bijection de ]0, +[2 sur ]0, +[]0, 1[
et que 1 (u, v) = (uv, u(1 v)). On calcule le Jacobien J(1 )(u, v) = u. Daprs la formule de
changement de variables on obtient
Z
a+b
E h(U, V ) =
h(x + y, x/(x + y))xa1 y b1 ex ey dxdy
(a)(b) R2+
Z + Z 1
a+b
=
h(u, v)(uv)a1 (u(1 v))b1 eu u dudv.
(a)(b) 0
0
Ceci montre que (U, V ) a pour densit
(u, v) 7
a+b
1{u>0} ua+b1 eu 1{0<v<1} v a1 (1 v)b1 .
(a)(b)
On voit donc que U et V sont indpendants, que U suit la loi (a + b, ) et que V admet la densit
suivante
(a + b) a1
v 7
v
(1 v)b1 1{0<v<1} .
(a)(b)
Au passage nous avons montr que la fonction prcdente est une densit, et donc que
Z 1
(a)(b)
v a1 (1 v)b1 dv =
.
(a + b)
0
Ce nombre est appel (a, b). On dit aussi que V suit la loi (a, b). On peut calculer lesprance
de V :
Z 1
1
(a + 1, b)
E(V ) =
vv a1 (1 v)b1 dv =
.
(a, b) 0
(a, b)
En utiliant la proprit (x + 1) = x(x) on obtient E(V ) = a/(a + b).
45
Dfinition 7.21. Soit f et g des densits (sur R). On appelle convolution de f et g la fonction
Z
Z
f g(x) =
f (x y)g(y) dy =
f (y)g(x y) dy.
R
Une application simple de Fubini montre que f g est encore une densit. En fait on a le rsultat
suivant.
Proposition 7.22. Soit X et Y des variables indpendantes de densits respectives f et g, alors
X + Y admet f g comme densit.
Dmonstration. La densit jointe du couple (X, Y ) est la fonction (x, y) 7 f (x)g(y). Soit h : R
R+ une fonction test. On a
Z
E h(X + Y ) =
h(x + y)f (x)g(y) dxdy.
R2
La fonction (x, y) = (x, x + y) ralise une bijection de R2 dans R2 . Sa rciproque est 1 (u, v) =
(u, v u) est de classe C 1 et son Jacobien est constant (gal 1). Par changement de variable et
Fubini on a
Z
E h(X + Y ) =
h(x + y)f (x)g(y) dxdy
2
ZR
Z
Z
=
h(v)f (u)g(v u) dudv =
h(v)
f (u)g(v u) du dv.
R2
ey
/2 (xy)2 /2
dy =
1
2
2
2
ex /4
e(yx/2) dy ex /4 = .
2
R
Ceci montre que la somme de deux N (0, 1) indpendantes est une N (0, 2).
7.6
Exercices
Exercice 7.1. On lance une infinit de fois une pice truque tombant sur pile avec probabilit
p (paramtre compris entre 0 et 1 strictement). On appelle srie une succession de piles (ou de
faces) interrompue par le rsultat contraire. Par exemple, pour lvnement P P F F F P F F F . . . ,
la premire srie est une srie de piles et a pour longueur 2, la deuxime a pour longueur 3, etc. . .
Soit X la longueur de la premire srie et Y la longueur de la deuxime srie.
1. Dterminer la loi de X.
2. Dterminer la loi du couple (X, Y ). En dduire la loi de Y .
Exercice 7.2. Soit n un entier non nul. On dispose dune urne contenant 2 boules blanches et n
noires. On retire les boules une par une (jusqu ce que lurne soit vide) en notant X le rang de
tirage de la premire boule blanche et Y le rang de la deuxime.
1. Dterminer la loi du couple (X, Y ).
2. En dduire la loi de Y .
3. Montrer que
E(Y ) =
2(n + 3)
.
3
Exercice 7.3. Soit (X, Y ) un couple alatoire valeurs dans {0, 1} N , dont la loi est dfinie
par :
2k 1
1
P(X = 0, Y = k) =
, P(X = 1, Y = k) = k , k N .
4k
4
1. Dterminer les lois de X et Y , donner leurs esprances et leurs variances.
46
XY et V =
Y /X.
47
Conditionnement
On a vu que que la connaissance des lois de X et Y ne suffisait pas dterminer la loi du couple
(X, Y ). Pour connatre la loi de (X, Y ) il faut connatre la loi de Y et la loi de X conditionnellement
Y.
8.1
Cas discret
Dfinition 8.1. Soit (X, Y ) un couple de variable alatoires et on suppose que Y est discrte.
Pour y R vrifiant P(Y = y) > 0 on dfinit la loi conditionnelle de X sachant Y = y ainsi
PX|Y =y (A) = P(X A | Y = y).
Si on se donne un vnement A et une variable alatoire discrte Y , la quantit u(y) = P(A |
Y = y) est dfinie pour sur lensemble y1 , y2 , . . . des valeurs prises par Y . Par consquent la
variable alatoire u(Y ) est bien dfinie. On notera P(A | Y ) cette variable. Il faut bien retenir que
P(A | Y = y) est un nombre rel, tandis que P(A | Y ) est une variable alatoire.
Exemple 8.2. Une poule pond un nombre alatoire N dufs qui suit une loi de Poisson de
paramtre . Les ufs closent avec probabilit p indpendamment les uns des autres. Quelle est
la loi du nombre X de poussins ?
Conditionnellement N = n le nombre X suit une loi de binomiale de paramtres n et p. Cest-dire
n k
P(X = k | N = n) =
p (1 p)1k , k = 0, . . . , n.
k
Par consquent
P(X = k, N = n) = P(X = k | N = n) P(N = n) =
Puis
P(X = k) =
+
X
P(X = k, N = n) =
n k
n
p (1 p)nk e .
n!
k
+ n k
X
e p (1 p)nk
.
k!(n k)!
n=k
n=k
(p)k
.
k!
Cette quantit est dfinie si X est positive, ou si x 7 x est intgrable pour PX|Y =y .
Proposition 8.4. Lesprance conditionnelle vrifie les mmes proprits que lesprance.
Linarit : E(a1 X1 + a2 X2 | Y = y) = a1 E(X1 | Y = y) + a2 E(X2 | Y = y).
Croissance : si X1 X2 alors E(X1 | Y = y) E(X2 | Y = y).
On a aussi la formule suivante.
48
Si la fonction u : y 7 E(X | Y = y) est bien dfinie pour tout y tel que P(Y = y) > 0, alors la
variable u(Y ) est bien dfinie. Cette variable est note E(X | Y ). Encore une fois il faut retenir que
E(X | Y = y) est un nombre tandis que E(X | Y ) est une variable alatoire. On a alors rsultat
suivant.
Proposition 8.6.
E(E(X | Y )) = E(X).
Dmonstration. La variable Y est discrte. Supposons par exemple quelle est valeurs dans N. Il
sagit de montrer que
+ Z
X
x PX|Y =n (dx) P(Y = n) = E(X).
n=0
f (x) PX|Y =n (dx) P(Y = n) = E(f (X)).
pour toute fonction f (telle que f (X) soit bien dfinie). Si f est une indicatrice le rsultat est vrai
puisque
+ Z
X
n=0
+
X
n=0
+
X
n=0
= P(X B) = E 1B (X).
On obtient ensuit le rsultat pour les fonctions tages par linarit, puis pour les fonctions positives
par convergence monotone, puis pour les fonctions intgrables en crivant f = f+ f .
Exemple 8.7. Si N suit une loi de Poisson de paramtre et si X sachant N est binomiale
(N, p), alors on vu que X suit une loi de Poisson de paramtre p. En particulier E(X) = p. On
peut retrouver ce rsultat en utilisant la proposition prcdente : sachant N = n la variable X est
binomiale (n, p) donc
E(X | N = n) = np.
Par consquent E(X | N ) = N p. Et donc
E(X) = E(E(X | N )) = E(N p) = E(N )p = p.
On peut aussi retrouver la loi de X de la manire suivante : comme X sachant N = n est binomiale
n, p, on a
E(etX | N = n) = (pet + 1 p)n .
Donc E(etX | N ) = (pet + 1 p)N . Donc
E(etX ) = E[E(etX | N )] = E[(pet + 1 p)N ] = exp[(pet + 1 p 1)] = exp[p(et 1)]
On reconnat la fonction gnratrice des moments dune variable de Poisson de paramtre p.
49
8.2
Cas continu
Dfinition 8.8. Soit X, Y un couple continu, de densit fX,Y . On appelle densit conditionnelle
de X sachant Y = y la fonction
fX,Y (x, y)
fX|Y =y (x) =
,
fY (y)
dfinie pour tout y telle que fY (y) > 0.
Dfinition 8.9. On appelle esprance conditionnelle de X sachant Y = y la quantit
Z
E(X | Y = y) =
xfX|Y =y (x) dx
R
pour toute fonction g. La fonction u : y 7 E(X | Y = y) est dfinie pour les y tels que fY (y) > 0.
Comme fY (Y ) > 0 presque surement on peut poser
E(X | Y ) = u(Y ).
Encore une fois E(X | Y = y) est un nombre tandis que E(X | Y ) est une variable alatoire. On a
toujours lgalit fondamentale
E(E(X | Y )) = E(X).
En effet par Fubini
E E(X | Y ) =
50
Exemple 8.11. Soit Y de loi uniforme sur [0, 1] et soit X suivant, conditionnellement Y , une
loi binomiale de paramtres (n, Y ). On cherche la loi de X.
On sait que pour k {0, . . . , n}
n
P(Y = k | X) =
X k (1 X)nk .
k
Par consquent
P(Y = k) = E P(Y = k | X) =
Z 1
n
n
xk (1 x)nk dx.
E X k (1 X)nk =
k
k
0
De plus
Z
xk (1 x)nk dx = (k + 1, n k + 1) =
k!(n k)!
.
(n + 1)!
On en dduit que P(X = k) = 1/(n + 1) pour tout k {0, . . . , n}. Autrement dit X est uniforme
sur {0, . . . , n}.
8.3
Exercices
Exercice 8.1. On tire un nombre N suivant une loi de Poisson et on lance la mme pice N fois
successivement. Montrer que le nombre de piles obtenus est indpendant du nombre de faces.
Exercice 8.2. On effectue une suite infinie de lancers de ds. Pour n N on note Xn le temps
dattente de la premire srie de n six conscutifs : X1 est le temps auquel le six sort pour la premire
fois, X2 le temps auquel deux six daffile sortent pour la premire fois et ainsi de suite. Par exemple,
pour la suite 23644155366613 les variables X1 , X2 , X3 valent respectivement 3, 11, 12.
1. Dterminer E X1 .
2. Soit n 2, montrer que
E(Xn | Xn1 ) =
5
1
(Xn1 + 1) + Xn1 + 1 + E(Xn ) .
6
6
51