Vous êtes sur la page 1sur 37

Probabilités

UFR Sciences et Techniques


Université du Havre

Licence de Mathématiques
6ème Semestre
Probabilités ii
Table des matières

1 Généralités sur les variables aléatoires 1


1 Définitions générales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
2 Convergence des variables aléatoires réelles . . . . . . . . . . . . . . . . . . . . . . . . . . 1
3 Intégration des variables aléatoires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
4 Loi de probabilité d’une variable aléatoire . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2 Indépendance et conditionnement 9
1 Tribus indépendantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2 Variables aléatoires indépendantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
3 Somme de variables aléatoires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
4 Probabilités conditionnelles, espérance conditionnelle . . . . . . . . . . . . . . . . . . . . . 13

3 Fonctions caractéristiques et convergence en loi 21


1 Fonction caractéristique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2 Convergence en loi de v.a.r. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

4 Théorèmes limites 29
1 Résultats préliminaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2 Lois des grands nombres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3 Théorèmes central limit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

iii
Probabilités iv
Chapitre 1

Généralités sur les variables aléatoires

1 Définitions générales
Soit pΩ, Aq un espace mesurable.
— Ω est l’ensemble des résultats d’une épreuve aléatoire E.
— A est l’ensemble des événements associés à E.
Soit pE, Bq un autre espace mesurable.
Définition 1.1. 1. On dit que X : pΩ, Aq Ñ pE, Bq est une variable aléatoire (v.a.) si X est une
application mesurable de pΩ, Aq dans pE, Bq, i.e. pour tout B P B, X ´1 pBq P A.
On note X ´1 pBq “ tω P Ω{XpΩq P Bu par X P B ou tX P Bu.
2. On dit que X est une variable aléatoire réelle (v.a.r.) si pE, Bq “ pR, BpRqq.
3. On dit que X est un vecteur aléatoire réel de dimension k ě 2 si pE, Bq “ pRk , BpRk qq.
4. On appelle tribu engendrée par la variable aléatoire X la sous-tribu de A : X ´1 pBq “ tX ´1 pBq{B P
Bu, on la note aussi par σpXq.
Définition 1.2. On dit que P est une probabilité sur pΩ, Aq si P est une mesure positive bornée sur
pΩ, Aq de masse totale 1, i.e. P pΩq “ 1. On dit que pΩ, A, P q est un espace probabilisé.
Remarque.
1. Sauf mention contraire, l’espace probabilisé de base est toujours pΩ, A, P q.
2. Une probabilité est une mesure positive bornée, par conséquent la majorité des propriétés (propo-
sitions, théorèmes, . . .) du cours de Mesure & Intégration sont valides.
µp¨q
3. Si µ est une mesure positive bornée sur pΩ, Aq telle que µpΩq ‰ 0. Alors P p¨q “ est une
µpΩq
probabilité sur pΩ, Aq.
4. Un événement A est P -presque sûr (P -p.s.) si AC “ Ω\A est P -négligeable. Une propriété P
dépendant de ω P Ω est vraie P -presque sûrement si tω P Ω{Ppωq est fausse u est P -négligeable.
Proposition 1.1 (Continuité d’une mesure).
1. Soit pAn qnPN une suite croissante d’éléments de A alors
˜ ¸
ď
P An “ lim P pAn q
nPN

2. Soit pAn qnPN une suite décroissante d’éléments de A alors


˜ ¸
č
P An “ lim P pAn q
nPN

Démonstration. Voir cours de Mesure & Intégration.

2 Convergence des variables aléatoires réelles


On suppose que pE, Bq “ pR, BpRqq.
Définition 2.1 (Convergence presque sûr). Soient pXn qnPN une suite de v.a.r. et X une v.a.r. On dit
que pXn qnPN converge P -presque sûrement si P ptω P Ω{ lim Xn pωq “ Xpωquq “ 1.
On note Xn Ñ X P -p.s.

1
Probabilités 2

Remarque. La définition 2.1 est équivalente à : il existe un N pĂ Ωq P -négligeable tel que pour tout
ω P N C , lim Xn pωq “ Xpωq.
re
ÿ 2.1 (Lemme de Borel-Cantelli, 1 partie). Soit pAn qnPN une suite d’événements tels que
Proposition
la série P pAn q est convergente. Alors P plim sup An q “ 0.
nPN

Démonstration. On a
˜ ¸
č ď
P plim sup An q “ P Ak
nPN kěn
˜ ¸
ď
ď P An pour tout n P N
kěn
ÿ
ď P pAk q (sous-additivité)
kěn

qui est le reste d’ordre n d’une série convergente, tend vers 0 lorsque n tend vers l’infini. D’où P plim sup An q “
0.
č ď
Remarque. Soit ε ą 0. Posons En pεq “ p|Xn ´ X| ą εq et Epεq “ lim sup En pεq “ Ek pεq.
nPN kěn
L’ensemble de convergence de Xn Ñ X s’écrit
č ď č
C“ p|Xk ´ X| ď εq
εą0 nPN kěn

Ainsi
č ď č
D “ CC “ p|Xk ´ X| ą εq
εą0 nPN kěn
ď
“ Epεq
εą0

Si 0 ă ε ă ε1 , on aˆ: Epε 1
˙ q Ă Epεq, i.e. Epεq croit lorsque ε décroit vers 0.
ď 1
D’où D “ E . En particulier C est mesurable.
n
nPN˚
D’où Xn Ñ X P -p.s. si et seulement si P pDq “ 0.

Proposition 2.2. Avec les notations de la remarque précédente, on a P pDq “ 0 si et seulement si pour
tout ε ą 0 on a P pEpεqq “ 0.

Démonstration.
ď
1. Supposons que P pDq “ 0. Comme D “ Epεq, on a pour tout ε ą 0, P pEpεqq ď P pDq.
εą0
D’où P pEpεqq “ 0 pour tout ε ą 0.
ˆ ˙
ď 1
2. Supposons que pour tout ε ą 0, P pEpεqq “ 0. Comme D “ E , alors d’après la proposi-
˚
n
ˆ ˆ ˙˙ nPN
1
tion 1.1, on a P pDq “ lim P E “ 0.
n

Définition 2.2 (Convergence en probabilité). Soient pXn qnPN une suite de v.a.r. et X une v.a.r. On dit
que pXn qnPN converge en probabilité vers X si pour tout ε ą 0,

lim P ptω P Ω{Xn pωq ´ Xpωq| ą εuq “ 0

Proposition 2.3. Soient pXn qnPN une suite de v.a.r. et X une v.a.r. Soit Yn “ sup |Xk ´ X|. Alors
kďn
P
Xn Ñ X P -p.s. si et seulement si Yn Ñ 0.

Remarque. Il en résulte que la convergence presque sûre implique la convergence en probabilité.


Probabilités 3

Démonstration. Avec les notations de la remarque avant la proposition 2.2, soit n P N, soit ε ą 0, et soit
Fn “ p|Yn | ą εq. Alors
ˆ ˙
Fn “ sup |Xk ´ X| ą ε
kěn
ď
“ p|Xk ´ X| ą εq
kěn
ď
“ Ek pεq
kěn

Donc č
Fn “ Epεq
nPN

Or pFn qnPN est une suite décroissante.


On a d’après la proposition 1.1 (continuité d’une mesure).

P pEpεqq “ lim P pFn q


“ lim P p|Yn | ą εq

Il suffit d’appliquer ensuite la proposition 2.2.

P
Proposition 2.4. Soit Xn Ñ X. Alors il existe une sous-suite pXnk qkPN extraite de pXn qnPN telle que
Xnk Ñ X P -p.s.
ř
Démonstration. Soit ε ą 0 et soit pηk qkPN une suite de réels strictement positifs tels que kPN ηk ă 8
(par exemple ηk “ 21k , k P N).
Par hypothèse, pour tout k P N, il existe ηk P N, tel que P p|Xnk ´ X| ą εq ă ηk .
D’où
ˆ ˙ ˜ ¸
ď
P sup |Xnk ´ X| ą ε “ P p|Xnk ´ X| ą εq
kěn kěn
ÿ
ď P p|Xnk ´ X| ą εq
kěn
ÿ
ď ηk
kěn

ř
kěn ηk est le reste d’ordre n d’une série convergente et donc tend vers 0. Le résultat en découle par la
proposition 2.3.

3 Intégration des variables aléatoires


Définition 3.1 (Espérance mathématiques d’une v.a.r.).
ş
1. Soit X P L1 pΩ, A, P q. L’intégrale Ω XpωqdP pωq est appelée l’espérance mathématique de X ou
moyenne de X. On note EpXq.
2. Si X “ pX1 , ¨ ¨ ¨ , Xk q est à valeurs dans Rk , k ě 2, X est intégrable si ses composante le sont, et
on a : EpXq “ pEpX1 q, ¨ ¨ ¨ , EpXk qq.
3. X est dite centrée si EpXq “ 0.
ş
4. Soit p P r1, `8r et X P Lp pΩ, A, P q. EpX p q “ Ω
X p pωqdP pωq est appelé le moment d’ordre p de
X. Ponsons m “ EpXq.
(a) ErpX ´ mqp s est appelé le moment centré d’ordre p de X.
(b) Le moment centré d’ordre 2 s’appelle la variance de X. On note varpXq.
a
(c) varpXq s’appelle l’écart-type de X. On note σpXq.
(d) Si varpXq “ 1, on dit que X est réduite.

Proposition 3.1 (Inégalité de Tchebytvhev généralisée). Soit p P r1, `8r et soit X P Lp pΩ, A, P q. Alors
pour tout ε ą 0,
Ep|X|p q
P p|X| ě εq ď
εp
Probabilités 4

Démonstration. Soit ε ą 0. Posons Apεq “ tω P Ω{|Xpωq| ě εu. On a


ż
Ep|X|p q “ |Xpωq|p dP pωq
żΩ
ě |Xpωq|p dP pωq
Apεq
ż
ě εp dP pωq “ εp P pApεqq
Apεq

Remarque.
1. Inégalité de Markov : p “ 1, X ě 0.
Pour tout ε ą 0,
EpXq
P pX ě εq ď
εp
2. Inégalité de Tchebytchev : p “ 2, m “ EpXq.
Pour tout ε ą 0,
Ep|X ´ m|2 q varpXq
P p|X ´ m| ě εq ď “
ε2 ε2
3. Inégalité de Hölder : Soient p, q P r1, `8r, p1 ` 1q “ 1. Soient X P Lp pΩ, A, P q et Y P Lq pΩ, A, P q.
Alors,
||XY ||1 ď ||X||p ||Y ||q
1 1
Ep|XY |q ď pEp|X|p qq p ` pEp|Y |p qq p

Définition 3.2 (Convergence en moyenne d’ordre p). Soit p P r1, `8r. Soient X, Xn P Lp pΩ, A, P q. On a
dit que pXn qnPN converge vers vers X en moyenne d’ordre p si pXn qnPN converge vers X dans Lp pΩ, A, P q.
Lp
Autrement dit, lim ||Xn ´ X||p “ 0 ou lim Ep|Xn ´ X|p q “ 0. On note Xn Ñ X.

Remarque. La convergence en moyenne d’ordre p entraîne la convergence en probabilité. En effet pour


tout ε ă 0,

P p|Xn ´ X| ą εq ď P p|Xn ´ X| ă εq
Ep|Xn ´ X|p q
ď
εp
Par l’inégalité de Tchebytchev (3.1).

Définition 3.3 (Caractéristiques liées à un couple pY, Xq). Soient X, Y P L2 pΩ, A, P q.


1. On appelle covariance de X et Y , le réel

covpX, Y q “ ErpX ´ EpXqqpY ´ EpY qqs


“ EpXY q ´ EpXqEpY q

2. On appelle coefficient de corrélation de X et Y le réel

covpX, Y q
ρpX, Y q “
σpXqσpY q

Remarque.
1. Si ρpX, Y q “ 0, on dit que X et Y sont non corrélées.
2. D’après l’inégalité de Hölder (p “ q “ 2), on a

|covpX, Y q| ď Ep|X ´ EpXq| ˆ |Y ´ EpY q|q


1 1
ď pEp|X ´ EpXq|2 qq 2 pEp|Y ´ EpY q|2 qq 2
“ σpXqσpY q

D’où |ρpX, Y q| ď 1.
3. Si X “ pX1 , ¨ ¨ ¨ Xk q est a valeurs dans Rk , k ě 2, on lui associe sa matrice de covariance Γ “
pΓij q 1ďiďk , où Γij “ covpXi , Xj q. Notons que Γ est une matrice symétrique dont la diagonale est
1ďjďk
composée des variances des Xi , 1 ď i ď k.
Probabilités 5

4 Loi de probabilité d’une variable aléatoire


Soit pΩ, A, P q un espace probabilisé.

Définition 4.1 (Loi d’une variable aléatoire X). Soit X une variable aléatoire a valeurs dans pE, Bq. La
probabilité PX définie sur pE, Bq par :

PX pBq “ P pX ´1 pBqq “ P pX P Bq

pour tout B P B, s’appelle la loi de probabilité de X. Autrement dit PX est la mesure image de P par X.

Proposition 4.1 (Théorème de transfert). Soient X : Ω Ñ R une v.a.r. et h : R Ñ R une application


borélienne. Alors h est PX -intégrable si et seulement si h ˝ X est P -intégrable (i.e. h P L1 pR, BpRq, PX q
si et seulement si h ˝ X P L1 pΩ, A, P q) et on a
ż ż
hpxqdPX pxq “ h ˝ XpωqdP pωq
R Ω

L’égalité ci-dessus a toujours lieu si h est positive.

Démonstration. Soit B P BpRq. Supposons que h “ 1B . On a


ż ż
RhpxqdPX pxq “ 1pxqdPX pxq “ PX pBq
B R
ż
´1
“ P pX pBqq “ 1X ´1 pωqdP pωq

ż ż
“ 1B pXpωqqdP pωq “ h ˝ XpωqdP pωq
Ω Ω

car 1X ´1 pBq “ 1B ˝ X (puisque ω P X ´1 pBq si et seulement si Xpωq P B).


L’égalité s’étend par linéarité aux fonctions simples positives sur pR, BpRqq par le théorème de la conver-
gence monotone et aux fonctions boréliennes que R, BpRqq PX -intégrables par la décomposition classique
ph “ h` ´ h´ q.

Définition 4.2 (Egalité en loi). Soit X une variable léatoire (de pΩ, A, P q dans pE, Bq). Soit pΩ1 , A1 , P 1 q
un autre espace probabilisé. Soit Y une variable aléatoire de pΩ1 , A1 , P 1 q dans pE, Bq.
On dit que X et Y ont la même loi de probabilité si PX “ PY1 sur B (i.e. pour tout B P B, PX pBq “
L D
PY1 pBq). On note X “ Y ou X “ Y .

Proposition 4.2. Soient Q et Q1 deux probabilité sur pΩ, Aq.


Soit C une classe de A telle que
1. La classe C est stable par intersection finie.
2. La tribu A est engendrée par C.
3. Les probabilités Q et Q1 coïncident sur C.
Alors Q et Q1 coïncident sur A.

Démonstration. Voir cours de Mesure & Intégration (extension d’une mesure).


Soit σ0 pCq l’algèbre engendré par C. D’après le théorème du prolongement d’une mesure (Théorème de
Carathéodory-Hahn, 3.2, Chap. 6, Mesure & Intégration), il suffit de montrer que Q “ Q1 sur σ0 pCq. Soit
D la plus petite tribu de A vérifiant
1. C Ă D
2. Ω P D
3. A, B P D, B Ă A ñ A\B P D
Alors D “ σ0 pCq.
En effet, soit U “ tA P D{A X C P D, @C P Cu. Alors U vérifie 1q, 2q et 3q, donc U “ D. D’où A X C P D
pour tout A P D et pour tout C P C.
Soit E “ tA P D{A X B P D, @B P Du. Alors E satisfait 1q, 2q et 3q donc E “ D. D’où A X B P D pour
tout A, B P D.
Ainsi D est stable par intersection finie.
Finalement 2q et 3q entraînent que D est stable par complémentation. Donc D est une algèbre et D “
σ0 pCq.
Soit F “ tA P A{QpAq “ Q1 pAqu. Alors F satisfait 1q, 2q et 3q donc D “ σ0 pCq Ă F, i.e. , Q et Q1
coïncident sur σ0 pCq.s
Probabilités 6

Exemple (Contre-exemple). Soient les probabilités Q et Q1 définies sur A par

1 1
Qptauq “ Qptduq “ Qptbuq “ Qptcuq “ 3
6
1 1
Q1 ptauq “ Q1 ptduq “ Q1 ptbuq “ Q1 ptcuq “ 6
3
Alors Q et Q1 coïncident sur C, mais pas sur A , pQptauq ‰ Q1 ptauqq.

Définition 4.3 (Fonction de répartition). Soit X une v.a.r. (i.e. Bq “ pR, DpRq), la fonction de répartition
de X (f.r.) est définie par

F pxq “ PX ps ´ 8, xsq
“ P pX ď xq, xPR

Proposition 4.3 (Propriétés de la fonction de répartition). Soit X une variable aléatoire réelle de
fonction de répartition F .
Alors on a
1. 0 ď F pxq ď 1, pour tout x P R
2. F est croissante sur R
3. F est continue à droite sur R
4. limxÑ´8 F pxq “ 0, limxÑ`8 F pxq “ 1

Démonstration. 1. 0 ď P pX ď xq ď 1, donc 0 ď F pxq ď 1, pour tout x P R.


2. Soient x, y P R tels que x ď y. On a pX ď xq Ă pX ď yq et donc F pxq “ P pX ď xq ď P pX ď yq “
F pyq.

Ş suite réelle décroissante, telleŞque lim xn “ x. Posons An “ pX ď xn q et A “


3. Soit pxn qnPN une
pX ď xq. Alors nPN An “ A. D’où P pAq “ P p nPN An q “ lim P pAn q, en vertu de 1.1.
Donc F pxq “ lim F pxnq, i.e. F pxq “ F px` q.

Ş suite réelle décroissante vers ´8.ŞPosons An “ pX ď xn q. Comme X est a valeurs


4. Soit pxn qnPN une
dans R, on a nPN An “ H. D’après 1.1, 0 “ P p nPN An q “ lim P pAn q, i.e. lim F pxn q “ 0. D’où
limxÑ`8 F pxq “ 0. On obtient de même limxÑ`8 F pxq “ 1.

Proposition 4.4. Soient X et Y deux variables aléatoires réelles de fonctions de répartition FX et FY .


Supposons que FX “ FY .
Alors PX “ PY .

Démonstration. Soit C “ ts ´ 8; xs{x P Ru. Alors la classe C est stable par intersection finie et engendre
la tribu BpRq. Comme l’égalité FX “ FY est équivalente à PX ps ´ 8; xsq “ PY ps ´ 8; xsq pour tout x P R,
i.e. PX et PY coïncident sur C. D’après 4.2, PX “ PY (sur BpRq).

Remarque. La fonction de répartition d’une variable aléatoire réelle caractérise d’une manière unique sa
loi.

Définition 4.4 (Loi d’un vecteur aléatoire réel X). Soit X un vecteur aléatoire à valeurs dans Rk . La
probabilité PX définie sur pRk , BpRk qq par :

PX pBq “ P pX ´1 pBqq “ P pX P Bq

pour tout B P BpRk q, s’appelle la loi de probabilité de X. Autrement dit PX est la mesure image de P
par X.

Définition 4.5. Soit X “ pX1 , ¨ ¨ ¨ , Xk q, k ď 2, un vecteur aléatoire à valeurs dans Rk . La fonction de


répartition de X est définie pour tout x “ px1 , ¨ ¨ ¨ , xk q P Rk par
˜ ¸
źn
F pxq “ PX s ´ 8; xi s
i“1
“ P pX1 ď x1 , ¨ ¨ ¨ , Xk ď xk q

Définition 4.6 (Lois marginales). Soit X “ pX1 , ¨ ¨ ¨ , Xk q, k ď 2, un vecteur aléatoire a valeurs dans
Rk . On appelle lois marginales de X (resp. fonctions de répartition marginales de X), les lois PX (resp.
les fonctions de répartition) des Xi , 1 ď i ď k.
Probabilités 7

Exam
Remarque. 1. Soit X “ pX1 , ¨ ¨ ¨ , Xk q, un vecteur aléatoire à valeurs dans Rk . Soit pi1 , ¨ ¨ ¨ , ik q une
permutation de t1, ¨ ¨ ¨ , ku. Soit 1 ď m ă k. On appelle aussi la loi PpXi1 ,¨¨¨Xim de pXi1 , ¨ ¨ ¨ , Xim q
une loi marginale de X.
śm
2. Soit B “ j“1 Bij P BpRm q et Bij “ R pour m ` 1 ď j ď k.
Alors
˜ ¸
źk
PpXi1 ,¨¨¨Xim pBq “ PX Bj
j“1

3. Soit x “ pxim , ¨ ¨ ¨ , xim q P Rm . On a

FpXi1 ,¨¨¨ ,XIm q pxq “ lim FX px1 , ¨ ¨ ¨ , xk q


xim`1 , ¨¨¨ ,xik Ñ`8

Définition 4.7 (Densité de probabilité). Soit X “ pX1 , ¨ ¨ ¨ , Xk q, k ď 2, un vecteur aléatoire a valeurs


dans Rk , dont la loi PX est absolument continue par rapport à la mesure de Lebesgue λ sur Rk . La
densité de probabilité fX de X étant définie comme la dérivée de Radon-Nikodym de PX par rapport à
dPX
λ, i.e. fX “ .

Remarque.
1. La densité de probabilité fX de X es définie λ-presque partout sur Rk .
şx PX ! λ, alorskla fonction de répartition FX est absolument continue de densité fX et FX “
2. Si
´8 X
f pyq, x P R .
3. On définit comme ci-desus les densités (de probabilité) marginales correspondant aux lois margi-
nales associés.
4. Donner la loi de probabilité d’un(e) v.a. X revient à déterminer soit :
— La loi PX (la seule possibilité si X n’est pas un(e) v.a.r.).
— La fonction de répartition FX , lorsque X est une v.a.r.
— La densité de probabilité fX , lorsqu’elle existe.
5. Soit X un(e) v.a.r. Soit h : R Ñ R une application borélienne intégrable (ou positive). On a
ż
EphpXqq “ hpXpωqqdP pωq (Par définition)
żΩ
“ hpxqdPX pωq (Théorème de transfert)
R
ż
“ hpxqdFX pxq (Intégrale de Riemann-Stieljes)
żR
“ hpxqfX pxqdλpxq (Si fX existe)
R

Proposition 4.5 (Théorème de changement de variable intégrale). Soient U et V deux ouverts de Rk


et ϕ : U Ñ V un C 1 -difféomorphisme de U dans V . Si h P M` pU, BpU qq (resp. L1 pU, BpU q, λq), alors
l’application x ÞÑ hpψpxqq| det Jψ pxq| de U dans R` (resp. de U dans R) appartient à M` pU, BpU qq (resp.
L1 pU, BpU q, λq) et l’on a ż ż
hpyqdλpyq “ hpψpxqq| det Jψ pxq|dλpxq
V U
où ¨ ˛
Bψ1 pxq Bψ1 pxq
Bx1 ¨¨¨ Bxk
ψ “ pψ1 , ¨ ¨ ¨ , ψk q,
˚
Jψ pxq “ ˚ .. .. .. ‹
. . .

˝ ‚
Bψk pxq Bψk pxq
Bx1 ¨¨¨ Bxk

Démonstration. Voir le cours de Mesure & Intégration.

Application Considérons maintenant un(e) v.a.r. X de densité fX et qui est P -p.s. à valeurs dans un
ouvert D de Rk . Soit ψ un C 1 -difféomorphisme de l’ouvert D dans l’ouvert ∆. Soit Y “ ψpXq.
Soit h : R Ñ R une application borélienne intégrable (ou positive).
On a d’un part :
ż
EphpY qq “ hpY pωqqdP pωq
żΩ
“ hpyqdPY pyq (X à valeurs dans D)

Probabilités 8

D’autre part,

EphpY qq “ EphpψpXqqq
ż
“ hpψpXpωqqqdP pωq
żΩ
“ hpψpxqqdPX pxq (X à valeurs dans D)
żD
“ hpψpxqqfX pxqdλpxq
D
ż
“ hpyqfX pψ ´1 pyqq| det Jψ´1 pyq|dλpyq

Il s’ensuit que dPY pyq “ fX pψ ´1 pyqq| det Jψ´1 pyq|1∆ dλpyq, i.e. la densité de Y est égale à

fY pyq “ fX pψ ´1 pyqq| det Jψ´1 pyq|1∆ pyq

λ-presque partout sur Rk .


Chapitre 2

Indépendance et conditionnement

1 Tribus indépendantes
Soit pΩ, A, P q un espace probabilisé.

Définition 1.1 (tribus indépendantes). Soient A1 , ¨ ¨ ¨ , An n sous-tribus de A (n ě 2). On dit que


A1 , ¨ ¨ ¨ , An sont indépendantes si :
˜ ¸
n
č n
ź
@A1 P A1 , ¨ ¨ ¨ , An P Ak P Ai “ P pAi q
i“1 i“1

Définition 1.2 (Evenements indépendants). — Soient A1 , ¨, An P A. On dit que A1 , ¨ ¨ ¨ , An sont


indépendants si : σptA1 uq, ¨ ¨ ¨ , σptAn uq sont indépendantes.
— Une famille pAi qiPI est dite fermée d’événements indépendants si pour tout J Ă I, J fini, les Aj ,
j P J, sont indépendants.
Wesh
Remarque. — Soient A et B P A. σptAuq “ tH, A, AC , Ωu, σptBuq “ tH, B, B C , Ωu. Alors A et B
sont indépendants si et seulement si P pA X Bq “ P pAqP pBq.
— A1 , ¨ ¨ ¨ , An sont indépendantes si et seulement si AC C
1 , ¨ ¨ ¨ , An sont indépendants (par exemple)

2 Variables aléatoires indépendantes


Soit pΩ, A, P q un espace probabilisé.

Définition 2.1 (V.a. indépendantes). — Soient X1 , ¨ ¨ ¨ , Xn n v.a. à valeurs dans pE1 , B1 q, ¨ ¨ ¨ , pEN , Bn q.
— On dit que X1 , ¨ ¨ ¨ , Xn sont indépendantes si σpX1 q, ¨ ¨ ¨ , σpXn q sont indépendantes (σpX1 q “
tX1´1 pBq{B P B1 u).
— Une famille pXi qiPI est formée de v.a. indépendantes si pour tout J Ă I, J fini, les v.a. Xj , j P J,
sont indépendantes.

Proposition 2.1. Soit X “ pX1 , ¨ ¨ ¨ , Xn q un vecteur aléatoire. Les Xi sont à valeurs dans pEi , Bi qiPJ1,nK .
Les X1 , ¨ ¨ ¨ , Xn sont indépendantes si et seulement si PX “ PX1 b ¨ ¨ ¨ b PXn sur B1 b ¨ ¨ ¨ b Bn .

Démonstration.

PX “ PX1 b ¨ ¨ ¨ b PXn ô @B1 P B1 , ¨ ¨ ¨ , Bn P Bn , PX pB1 ˆ ¨ ¨ ¨ ˆ Bn q “ PXn pB1 q ˆ ¨ ¨ ¨ ˆ PXn pBn q


ô P pX P B1 ˆ ¨ ¨ ¨ ˆ Bn q “ Pp X1 P B1 q ˆ ¨ ¨ ¨ ˆ Pp Xn P Bn q
ô P rX1´1 pB1 q X ¨ ¨ ¨ X Xn´1 pBn qs “ P rX1´1 pB1 qs ˆ ¨ ¨ ¨ ˆ P rXn´1 pBn qs
ô σpX1 q, ¨ ¨ ¨ , σpXn q sont indépendants
ô X1 , ¨ ¨ ¨ , Xn sont indépendantes

Remarque. Si X1 , ¨ ¨ ¨ , Xn sont n v.a. indépendantes, alors Y “ pX1 , ¨ ¨ ¨ , Xk q et Z “ pXk`1 , ¨ ¨ ¨ , Xn q,


(1 ď k ď n), sont indépendantes (porposition 2.1 et associativité des produits de mesures).

Proposition 2.2. Soient Xi : pΩ, Aq Ñ pEi , Bi q, 1 ď i ď n, n v.a. indépendantes


1. Soient hi : pEi , Bi q Ñ pFi , Fi q, 1 ď i ď n, n applications mesurables.
Alors les v.a. h1 pX1 q, ¨ ¨ ¨ , hn pXn q sont indépendantes.

9
Probabilités 10

2. Soit hi : pEi , Bi q Ñ pR, BpRqq, 1 ď i ď n, n appications positives mesurables (ou les hi pXi q
intégrables, 1 ď i ď n), alors
« ff
n
ź n
ź
E hi pXi q “ Ephi pXi qq
i“1 i“1

3.
n
ź
FpX1 ,¨¨¨ ,Xn q “ FXi pEi “ R, 1 ď i ď nq ô 4
i“1

4.
n
ź
fpX1 ,¨¨¨ ,Xn q “ fXi (si elles existent) ô 3
i“1

Démonstration.
1. Comme σphi pXi qq Ă σpXi q, 1 ď i ď n, l’indépendance des Xi , 1 ď i ď n, entraîne l’indépendance
des hi pXi q, 1 ď i ď n.
2.
« ff
n
ź n
ż ź
E hi pXi q “ hi pXi qdP
i“1 Ω i“1
ż ź n
“ hi pXi qdPpX1 ,¨¨¨ ,Xn q px1 , ¨ ¨ ¨ , xn q
Rn i“1
ż ź n
“ thi pxi qdPXi pxi qu
Rn i“1
n
ź „ż 
“ hi pxi qdPXi pxi q
i“1 Rn
źn „ ż 
“ hi pXi qdP
i“1 Ω
źn
“ Erhi pXi qs
i“1

3. Soit
n
ź
C“t s ´ 8; xi s{x1 , ¨ ¨ ¨ , xn P Ru Ă B1 b ¨ ¨ ¨ b Bn
i“1

D’après la proposition 2.1,


n
ź
@x1 , ¨ ¨ ¨ , xn P R : PpX1 ,¨¨¨ ,Xn q p s ´ 8; xi sq “ PX1 ps ´ 8; x1 sq ˆ ¨ ¨ ¨ ˆ PXn ps ´ 8; xn sq
i“1

i.e.
FpX1 ,¨¨¨ ,Xn q px1 , ¨ ¨ ¨ , xn q “ FX1 px1 q ˆ ¨ ¨ ¨ ˆ FXn pxn q @x1 , ¨ ¨ ¨ , xn P B
D’après la proposition 2.1,

dPpX1 ,¨¨¨ ,Xn q px1 , ¨ ¨ ¨ , xn q “ dPX1 px1 q ˆ ¨ ¨ ¨ ˆ dPXn pxn q @x1 , ¨ ¨ ¨ , xn P B

fpX1 ,¨¨¨ ,Xn q px1 , ¨ ¨ ¨ , xn qdx1 ˆ ¨ ¨ ¨ ˆ dxn “ fX1 px1 q ˆ ¨ ¨ ¨ ˆ fXn pxn qdx1 ˆ ¨ ¨ ¨ ˆ dxn

fpX1 ,¨¨¨ ,Xn q “ fX1 ˆ ¨ ¨ ¨ ˆ fXn λ-p.p.

Proposition
ř 2.3 (Lemme de Borel-Cantelli 2èmz partie). Soit pAn qnPN P AN indépendants tels que
nPN P pAn q “ `8.
Alors,
P plim sup An q “ 1
n
Probabilités 11

Démonstration. Posons ď
Bn “ Ak n P N˚
kěn
č
lim sup An “ Bn
n n

On a
˜ ¸
ď
P pBn q “ P Ak
kěn
˜ ¸
č
“ 1´P ě nAck
k
˜ ¸
m
č
“ 1 ´ lim P Ack
mÑ`8
k“n
m
ź
“ 1 ´ lim P pAck q
mÑ`8
k“n
źm
“ 1 ´ lim r1 ´ P pAk qs
mÑ`8
k“n
« ff
m
ÿ
ě 1 ´ lim exp ´ P pAk q (car e´x ě 1 ´ x, 1 ě x ě 0q
mÑ`8
k“n
˜ ¸
m
ÿ
ě 1´0 P pAk q Ñ `8, n Ñ `8
k“n

D’où P pBn q “ 1 pour tout n P N.


Il s’ensuit que
P plim sup An q “ lim P pBn q “ 1
n nÑ`8

(continuité d’une mesure).

3 Somme de variables aléatoires


Soit pΩ, A, P q un espace probabilisé.

3.1 Somme de deux variables discrètes


Soient X et Y deux v.a. à valeurs dans E (Ă R) dénombrable (on prend B “ PpEq). On suppose de
plus que la v.a. Z “ X ` Y est à valeurs dans E (sinon, en général, on prend E Ą XpΩq Y Y pΩq Y ZpΩq).
Remarquons que (par exemple X) la loi d’une v.a. discrète (l’ensemble image est dénombrable) peut être
donnée de deux manières équivalentes :
— P pX “řxq “ PX ptxuq “ px , pour tout x P E
— PX “ xPE px δx Ť
En effet, pour tout B P B “ PpEq, B “ xPB txu,
ÿ ÿ
px δx pBq “ px
xPE xPB
ÿ
“ P pX “ xq
xPB
ÿ
“ PX ptxuq
xPB
“ PX pBq

Proposition 3.1. La loi de Z “ X ` Y est donnée par


ÿ
P pZ “ xq “ P pX “ x, Y “ x ´ xq
xPE
ÿ
“ P pX “ z ´ y, Y “ yqq px P Eq
yPE
Probabilités 12

Ť
Démonstration. Y est une application de Ω Ñ E, donc Ω “ yPE (dénombrable et disjointe). Le fait que
X est une v.a. assure la mesurabilité des ensembles
Ť pY “ yq “ tω P Ω{Y pωq “ yu “ Y ´1 ptyuq, y P E. On
décompose l’événement pX ` Y “ Zq sur yPE pY “ yq “ Ω.
ď
pX ` Y “ zq “ rpX ` Y “ zq X pY “ yqs (disjointe)
yPE
ď
“ pX ` Y “ z, Y “ yq (notation)
yPE
ď
“ pX “ z ´ y, Y “ yq
yPE

D’où ÿ
P pZ “ zq “ P pX “ z ´ y, Y “ yq
yPE

Remarque. 1. Si de plus X et Y dont indépendantes, alors


ÿ
P pZ “ zq “ P px ´ y, Y “ yq
yPE
ÿ
“ P pX “ z ´ yqP pY “ yq
yPE

Dans ce cas la loi de Z “ X ` Y correspond au produit de convolution des lois de X et de Y , i.e.


PZ “ PX ˚ P Y “ PY ˚ PX
ż
PZ ptzuq “ PX pz ´ yqdP pyq
żE
“ PY ptz ´ xuqdPX pxq
E

2. Si X1 , ¨ ¨ ¨ , Xn , n v.a. discrètes indépendantes, alors la loi de Z “ X1 ` ¨ ¨ ¨ ` Xn est PZ “


PX1 ˚ ¨ ¨ ¨ ˚ PXn .

3.2 Somme de deux variables aléatoires réelles absolument continues


Soit pX, Y q un vecteur aléatoire réel de densité fpX,Y q .
Proposition 3.2. La densité de Z “ X ` Y est donnée par
ż
fZ pzq “ fpX,Y q ps, z ´ sqds
żR
“ fpX,Y q px ´ y, yqdy
R
şz
Démonstration. D’une part Epzq “ ´8
fZ ptqdt. D’autre part,
fZ pzq “ P pZ ď zq z P R
“ P pX ` Y ď zq
ż
“ 1pX`Y ďzq pωqdP pωq
żΩ
“ 1pX`Y qqďz px, yqdPpX,Y q px, yq
R2
ż
“ 1px`yďzq px, yqfpX,Y q px, yqdxdy
R2

Faisons le changement de variable u “ x, v “ x ` y, detpJϕ q “ 1.


ż
“ 1vďz pu, v ´ uqfpX,Y q pu, v ´ uqdudv
R2
ż `8 „ż z 
“ fpX,Y q pu, v ´ uqdv du
´8 ´8
ż z „ż `8 
“ fpX,Y q pu, v ´ uqdu dv
´8 loooooooooooooooomoooooooooooooooon
´8
ż `8
fZ pzq “ fpX,Y q px, z ´ xqdx
´8
Probabilités 13

Remarque.
— Si X et Y sont indépendantes, alors :
ż `8 ż `8
fZ pzq “ fpX,Y q px, z ´ xqdx “ fX pxqfY pz ´ xqdx
´8 ´8
ż `8 ż `8
“ fpX,Y q pz ´ y, yqdy “ fX pz ´ yqfY pyqdy
´8 ´8

i.e.
fZ “ fX ˚ fY “ fY ˚ fX
— D’une manière générale : si X1 , ¨ ¨ ¨ , Xn sont des v.a.r. indépendantes absolument continues, alors
la densité de Z “ X1 ` ¨ ¨ ¨ ` Xn : fZ “ fX1 ˚ ¨ ¨ ¨ ˚ fXn .

4 Probabilités conditionnelles, espérance conditionnelle


4.1 Inroduction
Soit pΩ, A, P q un espace probabilisé.
Définition 4.1. Soit A, B P A tels que P pBq ‰ 0.
La probabilité conditionnelle de A sachant B est définie par :
´ L ¯ P pA X Bq
P A B “
P pBq

Remarque. Qp¨q “ P ¨ B est une probabilité sur pΩ, Aq, concentré sur B.
`L ˘

Définition 4.2. Soit X une v.a.r. discrète à valeurs dans E “ txj P R{j P J Ă Nu. La probabilité
conditionnelle de A P A sachant X “ xj est définie par :
#
P pAXrX“xj sq
si P pX “ xj q ‰ 0
´ L ¯
P A P pX“xj q
X “ xj “ 0 si P pX “ xj q “ 0

Remarque. ´L ¯
— Qp¨q “ P ¨ X “ x est une probabilité sur pΩ, Aq et la définition naturelle de l’espérence condi-
j
tionnelle d’une v.a.r. Y sachant X “ xj est
´ L ¯ ż ´ L ¯
E Y X“x “ Y pωqdP ω X “ x
j j
Ω looooooooomooooooooon
dQpωq

(si cette intégrale existe).


— Si X est une v.a.r. continue (i.e. P pX “ xq “ 0 pour tout x P R, i.e. sa f.d.r. est une fonction
continue sur R), alors la probabilité conditionnelle ne peut pas être définie comme dans la définition
4.2.

Soit X une v.a. à valeurs dans pE, Fq. Soit a P A. Notons par :

QpF q “ P pA, X P F q @F P F
PX pF q “ P pX P F q la loi de X

Alors,
0 ď QpF q ď PX pF q @F P F
Donc la mesure bornée (alors σ-finie) Q est absolument continue par rapport à la probabilité PX (i.e.
QdoublechevronsPX ). D’après le théorème de Radon-Nikodym, il existe une classe d’équivalence modulo
PX , de fonctions F-mesurable telles que pour tout ϕ appartenant à cette classe
ż
QpF q “ ϕpxqdPX pxq @F P F
F
Probabilités 14

´ L ¯
Définition 4.3. Soit A P A. La probabilité conditionnelle de A sachant que X “ x, notée P A X “ x ,
est définie comme étant toute fonction F-mesurable vérifient :
ż ´ L ¯
P pA, X P F q
loooooomoooooon “ P A X “ x dPX pxq @F P F
F
loooooooomoooooooon
QpF q
ϕpxq

Remarque. ´ L ¯
— La notation P A X “ x peut désigner à la fois la classe de fonctions F-mesurables (modulo R)
vérifiant la déf. 4.3
´ ou\et un¯élément de cette classe.
— Posons ϕpxq “ P A L
X “ x , x P E. Alors

pE, Fq Ñ pR, BpRqq


ϕ: est F-mesurable
x ÞÑ ϕpxq

Une manière naturelle pour définir la probabilité conditionnelle sur l’espace pΩ, Aq est de poser
´ L ¯
P A Xpωq “ ϕpXpωqq @ω P Ω

Comme´ ϕ : pE, Fq Ñ pR, BpRqq est F-mesurable, ϕpXq : pΩ, Aq Ñ pR, BpRqq est σpXq-mesurable
L ¯
(car P A X “ ϕpXq).

Définition 4.4. Soit A P A. La probabilité conditionnelle de A sachant X est toute variable aléatoire
sur pΩ, A, P q σpXq-mesurable, satisfaisant :
ż ´ L ¯
A
P pA, X P F q “ P Xpωq dP pωq @F P F (2.1)
P F q looooooomooooooon
loooooomoooooon
pX
QpF q
looomooon
PσpXq
ϕpXq

Remarque. ´ L ¯
— La notation P A X peut désigner à la fois la classe de fonctions σpXq-mesurables (modulo P )
vérifiant 2.1 ou\et ces éléments de cette classe.
— Une autre manière d’écrire la relation 2.1 est
ż ´ L ¯
P pA X Dq “ P A Xpωq dP pωq @D P σpXq
D

— Si Y est une autre variable aléatoire telle que σpY q “ σpXq, alors
´ L ¯ ´ L ¯
P A Y “P A X P -p.s.
´ L ¯
L’idée ici est que la probabilité conditionnelle P A X ne dépend pas directement des valeurs
prises par la v.a. X mais des éléments de la tribu σpXq.

Pour définir l’espérence conditionnelle d’une v.a. Y par rapport à un arbre v.a. X, on fait la même
démarche que dans la définition de la probabilité conditionnelle.
Soit Y une v.a.r. (i.e. Y : pΩ, Aq Ñ pR, BpRqq) intégrable (i.e. E|Y | ă 8). Soit X une v.a. à valeurs
dans pE, Fq. Notons par
ż
νpF q “ Y pωqdP pωq @F P F
pXPF q
PX pF q “ P pX P F q la loi de X

ν est une mesure (signée) sur l’espace pE, Fq. En effet :


— νpHq “ 0
— pFn qn Ă F deux à deux disjoints. Alors
˜ ¸ ż
ď ÿż
ν Fn “ Ť
Y pωqdP pωq “ Y pωqdP pωq
n XP n Fn n XPFn
ÿ
“ νpFn q
n
Probabilités 15

De plus ν est absolument continue par rapport à PX (par def de ν) et ν est bornée :
ż ż
|νpF q| ď |Y pωq|dP pωq ď |Y pωq|dP pωq “ E|Y | ă 8 @F P F
XPF Ω

(en particulier ν est σ-finie). D’après le théorème de Radon-Nikodym (mesures signées), il existe
une classe d’équivalence modulo PX , de fonction F-mesurable telles que pour tout ψ appartenant
à cette classe, ż
νpF q “ ψpxqdPX pxq @F P F
F

Définition
´ L ¯ Soit Y une v.a.r. intégrable. Alors l’espérance conditionnelle de Y sachant X “ x, notée
4.5.
Y
E X “ x est définie comme étant toute fonction F-mesurable satisfaisant :
ż ´ L ¯ ż
E Y X “ x dPX pxq “ Y pωqdP pωq @F P F
F loooooooomoooooooon pXPF q
loooooooooomoooooooooon
ψpxq
νpF q

Remarque. ´ L ¯
— La notation E Y X “ x peut désigner aussi bien la classe de fonctions F-mesurables (modulo
PX ) vérifiant la def
´ 4.3 qu’un¯ élément de cette classe.
— Posons ϕpxq “ E Y X “ x , x P E. Alors ψ : pE, Fq Ñ pR, BpRqq, F-mesurable.
L
´ L ¯
Comme dans la rem 4.1, l’espérence conditionnelle E Y X sur pΩ, Aq est définie par :
´ L ¯
E Y Xpωq “ ψpXpωqq
´ L ¯
de plus E Y X est σpXq-mesurable.

´ L ¯ 4.6. Soit Y une v.a.r. intégrable. Alors l’espérance conditionnelle de Y sachant X, notée
Définition
E Y X , est toute v.a. sur pΩ, Aq, σpXq-mesurable, telle que :
ż ´ L ¯ ż
E Y X dP “ Y dP @D P σpXq (2.2)
D looooomooooon D
looomooon
ψpXq νpX ´1 pDqq

Définition 4.7. Soit D une ´ sous-tribu de A. Soit Y une v.a. sur pΩ, Aq telle que E|Y | ă 8.
Y L ¯
L’espérence conditionnelle E D est toute v.a. sur pΩ, Aq D-mesurable telle que
ż ´ L ¯ ż
E Y @D P D
D dP “ Y dP
D D

Remarque.
— La def. 4.6 est un cas particulier de la def. 4.7
´ L ¯ ´ L ¯
E Y X “ E Y D
def
où D “ σpXq

si pXn q est une suite de v.a. à valeurs dans rpEn , Fn qsn


´ L ¯ ´ L ¯
E Y X ,X ,¨¨¨ “ E Y D où D “ σpX1 , ¨ ¨ ¨ q
1 2

— La def 4.7 sert essentiellement à obtenir des résultats théoriques. Pour les calculs, on utilise la def
4.7 et la rem 4.1, i.e. ´ L ¯
— on calcule d’abord ϕpxq “ E Y X “ x PX -p.s.
´ L ¯
— en suite, on pose E Y X “ ϕpXq P -p.s.

Proposition 4.1 (Propriétés de l’espérance conditionnelle).


1. si E|Y | ă 8, E|Z| ă 8 ; α, β P R :
´ L ¯ ´ L ¯ ´ L ¯
E αY ` βZ D “ αE Y D ` βE Z D P -p.s.
Probabilités 16

2. si Y ě 0, EpY q ă 8 : ´ L ¯
E Y D ě0 P -p.s.

3. si E|Y | ă 8, D Ă F (F une sous-tribu de A)


« ´ L ¯ ff
E Y F L ´ L ¯
Y
E D “ E D P -p.s.

4. si E|Y | ă 8, σpY q est indépendante de D :


´ L ¯
E Y D “ EpY q

5. si E|Y | ă 8, E|Z| ă 8, et Y est D-mesurable :


´ L ¯ ´ L ¯
E YZ D “YE Z D P -p.s.

6. Yn ě 0, Yn croît vers Y P -p.s., telle que E|Y | ă 8 :


´ L ¯ ´ L ¯
E Yn D croissant E Y D P -p.s.
” ´ L ¯ı
7. E E Y D “ EpY q, si E|Y | ă 8

Démonstration. On démontre seulement les propriétés spécifiques à l’espérance conditionnelle (i.e. 3, 4,


5 et 7) ´ L ¯
3 Par définition de E Y F , (def 4.7)
ż ż ´ L ¯
@F P F Y dP “ E Y F dP
F F loooomoooon
F ´mes.

en particulier (car D Ă F) :
ż ż ´ L ¯
@D P D Y dP “ E Y F dP p1q
D D loooomoooon
F ´mes.
´ L ¯
Par définition de E Y D :
ż ż ´ L ¯
@D P D Y dP “ E Y D dP p2q
D D loooomoooon
D´mes.
« ´ L ¯ ff
E Y F L
Par définition de E D
« ´ L ¯ ff
E Y F L
ż ´ L ¯ ż
@D P D E Y dP “ E
F D dP p3q
D loooomoooon D
loooooooooomoooooooooon
F ´mes.
D´mes

Nous avons donc avec p1q et p3q


« ´ L ¯ ff
E Y F L
ż ż
@D P D Y dP “ E D dP p4q
D D
loooooooooomoooooooooon
D´mes

p2q et p4q donnent


« ´ L ¯ ff
E Y F L
ż ´ L ¯ ż
@D P D E Y D dP “ E D dP
D loooomoooon D
loooooooooomoooooooooon
D´mes.
D´mes

D’où « ´ L ¯ ff
´ L ¯
Y E Y F L
E D “E D P -p.s.
Probabilités 17

4 Par définition 4.7, on doit montrer que


ż
@D P D Y dP “ intD EpY
omooqn
lo dP
D
D-mes (car cste)

On a
ż ż
@D P D Y dP “ 1D Y dP “ Ep1D Y q
D Ω
“ Ep1D qEpY q
“ P pDqEpY q
ż
“ EpY q dP
D
ż
“ EpY qdP
D
´ L ¯
D’où pE Y D “ EpY q, P -p.s.
´ L ¯
5 Soit A P D. Par définition (def 4.7) de E Z D :
ż ż ´ L ¯
@D P D ZdP “ E Z D dP
D loooomoooon D
D-mes.

En particulier ż ż ´ L ¯
@D P D ZdP “ E Z D dP
AXD AXD loooomoooon
D-mes.
ż ż ´ L ¯
@D P D 1A ZdP “ 1A E Z D dP
D D loooooomoooooon
D-mes.

D’où (définition 4.7) ´ L ¯ ´ L ¯


E YZ D “YE Z D P -p.s.

pour Y “ 1A , A P D.
On utilise ensuite la méthode habituelle (i.e. la propriété est vraie pour les fonctions simples
D-mesurables pour 1), les
´ fonctions positives D-mesurable pour 6)
L ¯
7 Par définition 4.7 de E Y D
ż ż ´ L ¯
@D P D Y dP “ E Y D
D D loooomoooon
D-mes.

En particulier pour D “ Ω.
ż ż ´ L ¯
Y dP “ E Y D dP
Ω Ω
” ´ L ¯ı
EpY q “ E E Y CD

Définition 4.8.´ Soit D une sous-tribu de A. Soit A P A. La probabilité conditionnelle de A sachant D


L ¯
est toute v.a. P A D sur pΩ, Aq D-mesurable telle que :
ż ´ L ¯
P A D dP “ P pA X Dq @D P D
D

Remarque.
— La def 4.8est un cas particulier de la def 4.7.
En effet, il suffit de prendre Y “ 1A , i.e.
´ L ¯ ´ L ¯
P A D “ E 1A D P -p.s.
Probabilités 18

— La probabilité conditionnelle P ¨ D est P -p.s. une probabilité. En effet (d’après la def 4.8)
`L ˘

— ż ´ L ¯
@D P D P A D dP “ P pA X Dq ě 0
D loooomoooon
D-mes.
´ L ¯
ñ P A D ě0
— ż ´ L ¯
@D P D P Ω D dP “ P pΩ X Dq “ P pDq
D loooomoooon
D-mes.
´ L ¯
D’où P Ω D “ 1 P -p.s.
— pAn q Ă A 2 à 2 disjoints.
´Ť ¯ ´ Ť ¯
An L 1 n An L
P n
D “ E D
ÿ
“ Ep1{Dq
n
ÿ
“ P pAn {Dq
n

Définition 4.9. Soit G et D 2 sous-tribus de A. On dit que P ˚ ¨ D est une version régulière sur S de
`L ˘
`¨ L ˘
la probabilité conditionnelle P D si
´ L ¯ ´ L ¯
1. @A P G, P ˚ A D est une version de P A D
2. @ω P Ω, P ˚ ¨ D pωq est une probabilité sur G.
`L ˘

Remarque.
´ L ¯
1. de la définition signifie que, lorsque l’on fixe A P S, P ˚ A D est un élément de la classe de v.a.
´ L ¯
P A D .
2. de la définition signifie que, lorsque l’on fixe ω0 P Ω, Qω0 p¨q “ P ˚ ¨ D pω0 q est une probabilité
`L ˘

sur pΩ, Sq.


Proposition 4.2. Soit P ˚ ¨ D une version régulière sur S de la probabilité conditionnelle P ¨ D .
`L ˘ `L ˘

Soit Y une v.a. sur pΩ, Sq telle que E|Y | ă 8. Alors


´ L ¯ ż
E Y D “ Y pωqdP ˚ ω D
` L ˘
P -p.s.

Démonstration. Soit A P S. Posons Y ““ 1A . D’après la remarque précédente,


´ L ¯ ´ L ¯
E 1A D “ P A D P -p.s.

D’autre part, ż ´ L ¯
1A pωqdP ˚ ω D “ P ˚ A D
` L ˘

D’où par la def. 4.9,
´ L ¯ ż
E 1A D “ 1A pωqdP ˚ ω D
` L ˘
P -p.s.

Soit Y ě 0 et pYn qq une suite de fonctions simples positives sur pΩ, Sq telles que Yn croît vers Y .
D’après ma prop. 4.1 ´ 4, le théorème de la convergence monotone, on a
´ L ¯ ´ L ¯ ż ż
E Y D “ lim E Yn D “ lim Yn pωqdP ˚ ω D “ Y pωqdP ˚ ω D
` L ˘ ` L ˘
n n Ω Ω

` ´
Pour Y générale : Y “ Y ´ Y . Nous concluons.
Remarque.` L ˘
— P ˚ ¨ D n’existe pas en général. Une manière de s’en sortir est de calculer l’espérance condition-
nelle d’une v.a. à l’aide de la loi conditionnelle de Y .
Définition 4.10. Soit Y une v.a. de pΩ, Aq dans pR, BpRqq. On dit que P ˚ ¨ D , définie sur pR, BpRqq,
`L ˘
`¨ L ˘
est une version régulière de la loi conditionnelle, PY D , de Y sachant D si
Probabilités 19

´ L ¯
1. Pour tout B P BpRq, PY˚ B D est une version de
´ L ¯ ´ ´1 L ¯ ´ L ¯
PY B D “ P Y pBq D “ P Y P B D

2. Pour tout ω P Ω, PY˚ ¨ D pωq est une probabilité sur pR, BpRqq.
`L ˘

Remarque. ` L ˘
— Si PY˚ ¨ D existe, alors
´ L ¯ ż
E Y D “ ydPY˚ y D
` L ˘
R
˚ ¨
`L ˘ `¨ L ˘
— Si de plus, PY D admet une densité fY D , à la mesure de Lebesgue, alors
´ L ¯ż
E Y D yfY y D dy
` L ˘
R

Théorème 4.1 (admis). Soit Y une v.a. de pΩ, Aq dans pR, BpRqq. Alors PY˚ ¨ D existe.
`L ˘

Proposition 4.3. Soit X et Y deux v.a.r. de densité jointe fpX,Y q . Alors la loi conditionnelle de Y
sachant X “ x, admet pour densité
˘ fpX,Y q px, yq
Fy y X “ x “
` L
x P tt P R{fX ptq ‰ 0u
FX pxq
Probabilités 20
Chapitre 3

Fonctions caractéristiques et
convergence en loi

1 Fonction caractéristique
1.1 Définitions et propriétés
Soit z “ x ` iy P C. <pzq “ x est la partie réelle de z. Impzq “ y est la partie imaginaire de z.
z “ x ´ iy est le conjugué de z. a
z est réel si et seulement si z “ z. |z| “ x2 ` y 2 . |z|2 “ zz.
La formule d’Euler : eit “ cos t ` i sin t, t P R.
Soit pΩ, A, P q un espace probabilisé.
Définition 1.1. Soit X une v.a.r. La fonction caractéristique de X est la fonction ϕX : R Ñ C définie
par
ż
ϕX ptq “ EpeitX q “ eitXpωq dP pωq

ż
itz
“ e dPX pzq
R

Remarque.
— Comme cosptXq et sinptXq sont intégrables, car
ˇż ˇ ˇż ˇ ż
ˇ ˇ ˇ ˇ
ˇ cosptXqdP ˇ “ ˇ cosptxqdP pxqˇ ď dPX pxq “ 1
ˇ ˇ ˇ ˇ
Ω R R

(de même pour sinptXq), eitX est intégrable (i.e. ϕX est bien définie).
— Si X est une v.a. discrète : ÿ
PX “ pi δxi pI Ă Nq
iPI
ÿ
ϕX ptq “ pi eitxi
iPI
— Si X est absolument continue par rapport à la mesure de Lebesgue (i.e. admet une densité fX ),
alors ż
ϕX ptq “ eitx fX pxqdx
R
Exemple.
— X ãÑ Bppq.
P pX “ 1q “ 1 ´ P pX “ 0q “ p, 0 ă p ă 1.

` ˘
ϕX ptq “ E eitX
“ peitx1 ` p1 ´ pqeitx0 “ peit ` p1 ´ pq
— X ãÑ N pµ, σ 2 q.
` ˘
ϕX ptq “ E eitX
ż
1 px´µq2
“ eitx ? e´ 2σ2 dx
R σ 2π
σ 2 t2
“ eitµ´ 2

21
Probabilités 22

Définition 1.2. Soit X “ pX1 , ¨ ¨ ¨ , Xk q un vecteur aléatoire à valeurs dans Rk .


Soit t “ pt1 , ¨ ¨ ¨ , tk q P Rk . La fonction caractéristique de X est définie par
` ˘
ϕX ptq “ E eiăt,xą
´ řk ¯
“ E ei i“1 ti xi

Remarque.
— Soit z “ pz1 , ¨ ¨ ¨ , zk q, y “ py1 , ¨ ¨ ¨ , yk q P Rk .
řk
ă x, y ą“ i“1 xi yi est le produit scalaire usuel sur Rk .
— Si X “ pX1 , ¨ ¨ ¨ , Xk q, t “ pt1 , ¨ ¨ ¨ , tk q P Rk , x “ px1 , ¨ ¨ ¨ , xk q P Rk .

` ˘
ϕX ptq “ E eiăt,Xą
ż
“ eiăt,Xpωqą dP pωq

ż
“ eiăt,xą dPX pxq
k
żR řk
“ ei i“1 ti xi dPX px1 , ¨ ¨ ¨ , xk q
Rk

Proposition 1.1 (Propriétés élémentaires). Soit X une v.a.r. Alors


1. |ϕX ptq| ď 1, @t P R.
2. ϕX p0q “ 1
3. ϕX p´tq “ ϕX ptq, @t P R.
4. ϕX est uniformément continue sur R.
5. Si Y “ aX ` b, pa, bq P R2 , alors

ϕY ptq “ ϕX patqeibt @t P R

6. Si X et Y sont indépendantes, alors

ϕX`Y ptq “ ϕX ptqϕY ptq (la réciproque est fausse en général)

Démonstration.
1. ˇż ˇ ˇż ˇ ż
ˇ itXpωq
ˇ ˇ itx
ˇ
|ϕX ptq| “ ˇ e
ˇ dP pωqˇ “ ˇ e dPX pxqˇˇ ď dPX pxq “ 1
ˇ ˇ
Ω R R

2. ż
ϕX p0q “ ΩdP pωq “ 1
loomoon
P pΩq

3.
` ˘
ϕX p´tq “ E e´itX
“ E pcosptXq ´ i sinptXqq
“ E pcos tXq ´ iE psinptXqq
“ E peitX q “ ϕX ptq @t P R

4. Soit h P R, soit t P R.
ˇ ` itX ` ihX ˘˘ˇ
|ϕX pt ` hq ´ ϕX ptq| “ ˇE e e ´1 ˇ
` ˘
ď E |eitX | ¨ |eihX ´ 1|
ď E|eihX ´ 1|

uniformément en t P R.
Comme E|eihX ´ 1| Ñ 0 quand h Ñ 0.
D’après le théorème de convergence dominée, on a le résultat.
(|eihX ´ 1| ď 2, @h P R, et E|eihX ´ 1| Ñ 0).
hÑ0
Probabilités 23

5.
` ˘
ϕY ptq “ EpeitY q “ E eiatX eitb
” ı
“ E eipatqX eitb
ϕX patqeitb @t P R

6.
” ı
ϕX`Y ptq “ E eitpX`Y q
` ˘
“ E eitX eitY
“ EpeitX qEpeitY q X et Y sont indépendants
“ ϕX ptqϕY ptq @t P R

Remarque. Les propriétés ci-dessus peuvent se généraliser à des vecteurs X “ pX1 , ¨, Xk q à valeurs dans
Rk en remplaçant le produit par la produit scalaire.
Par exemple 5 devient :
5’ Soit A une matrice carrée d’ordre k, B “ pb1 , ¨ ¨ ¨ , bk q P Rk .
Soit Y “ AX ` B. Alors
ϕY ptq “ ϕX pAtqeiăt,Bą @t P Rk

Proposition 1.2 (Formule d’inversion). Soit X une v.a. de f.d.r. FX . Soit a ă b P BR des points de
continuité de FX . Alors
żT
1 e´ita ´ e´itb
FX pbq ´ FX paq “ P pa ă X ă bq “ lim ϕX ptqdt
T Ñ`8 2π ´T it

Démonstration. On sait que $ π


ż `8 & ´2 si αă0
sin αt
dt “ 0 si α“0
0 t % π
2 si αą0
Soit a ă b, T P R.
żT
1 T e´ita ´ e´itb
„ż `8 
e´ita ´ e´itb
ż
1
ϕX ptqdt “ ϕX ptq eitx dPX pxq dt
2π ´T it 2π ´T it ´8
ż `8 « ż T ´ita ´itb
ff
1 e ´e
“ ϕX ptqdt eitx dPX pxq (Fubini)
´8 2π ´T it
ż `8 « ż T ff
1 T sinptpx ´ bqq
ż
1 sinptpx ´ aqq
“ dt ´ dt
´8 π 0 t π 0 t
ż `8 „ ż `8
1 `8 sinptpx ´ bqq
ż 
1 sinptpx ´ aqq
Ñ dt ´ dt dPX pxq
T Ñ8 ´8 π 0 t π 0 t
ż ˆ ˙ ż ˆ ˙
1 ´π 1 ´π 1 ´π
“ ˆ ´ ˆ dPX pxq ` 0´ ˆ dPX pxq `
s´8;ar π 2 π 2 tau π 2
ż ˆ ˙ ż ˆ ˙
1 π 1 ´π 1 π
ˆ ´ ˆ dPX pxq ` ˆ ´ 0 dPX pxq `
sa;br π 2 π 2 tbu π 2
ż ˆ ˙
1 π 1 π
ˆ ´ ˆ dPX pxq
sb;`8r π 2 π 2
ż ˆ ˙
1 π 1 ´π
“ ˆ ´ ˆ dPX pxq
sa;br π 2 π 2
“ PX psa; brq “ P pa ă X ă bq

Proposition 1.3.
L
X “ Y ô ϕX “ ϕY

Démonstration.
Probabilités 24

ñ
ż
L
X “ Y ñ ϕX ptq “ EpeitX q “ eitx dPX pxq
R
ż
“ eitx dPY pxq
R
“ EpeitY q “ ϕY ptq @t P R

ð Comme ϕX “ ϕY , d’après la proposition 1.2, pour tout a ă b P R, des points de continuités de


FX ,
FX pbq ´ FX paq “ FY pbq ´ FY paq
Si a Ñ ´8, on a
FX pbq “ FY pbq @b P R
point de continuité de FX et FY . Mais comme toute fonction de répartition admet au plus un
nombre dénombrable de points de discontinuités (car monotone), il s’ensuit que

P X “ PY

Proposition 1.4 (Théorème d’inversion de Fourier). Soit X une v.a.r. tel que ϕX P L1 pR, BpRq, λq (i.e.
ş`8
´8
|ϕX ptq|dt ă `8) alors X est absolument continue par rapport à la mesure de Lebesgue) et de densité
ż `8
1
fX pxq “ e´itx ϕX ptqdt λp.p; x P R
2π ´8

Démonstration. D’après la proposition 1.2 et le théorème de la convergence dominée


żT
1 e´ita ´ e´itb
FX pbq ´ FX paq “ lim ϕX ptqdt
T Ñ`8 2π ´T it
żT «ż ff
b
1
“ lim e´itx dx ϕX ptqdt
T Ñ`8 2π ´T a
ż « b
ff
1 T ´itx
ż
“ lim e ϕX ptqdt dx
a T Ñ`8 2π ´T
żb„
1 `8 ´itx
ż 
“ e ϕX ptqdt dx (Fubini et convergence dominée)
a 2π ´8

1
ş`8
D’où fX pxq “ 2π ´8
e´itX ϕX ptqdt λp.p.

Remarque.
— En utilisant les mêmes arguments que dans la proposition 1.2, on a
żT
1
P pX “ xq “ lim e´itx ϕX ptqdt
T Ñ`8 2π ´T

X discrète.

— Soit X une v.a. à valeurs dans N, alors d’après le résultat ci-dessus et le fait que ϕX est périodique
et de prériode 2π, on a :

1 π ´int
ż
1
P pX “ nq “ “ e ϕX ptqdt n P N
2π 2π ´π

Proposition 1.5. Si E|X|k ă 8, k P N˚ . Alors ϕX est dérivable jusqu’a l’ordre k et


“ ‰
ϕX pkq “ ik E X k eitX

Démonstration. Comme X P Lk pΩ, A, P q, le théorème de la convergence dominée nous permet de dériver


sous le signe somme ż
ϕX ptq “ EreitX s “ eitXpωq dP pωq

Probabilités 25

— Pour k “ 1, on a

ϕX pt ` hq ´ ϕX ptq
ϕ1X ptq “ lim
hÑ0 h
1 ” ipt`hqX ı
“ lim E e ´ eitX
hÑ0 h

` ˘
Posons zh “ h1 eipt`hqX ´ eitX . Alors zh Ñ z “ iXeitX .
(i.e. zh pωq Ñ zpωq, pour tout ω P Ω).
Comme |eity ´ eitx | ď |y ´ x||t|, on a

|eipt`hqX ´ eitX | |h||X|


|zh | “ ď “ |X|
|h| |h|

Donc zh est dominée par X P L1 pΩ, A, P q. En vertu du théorème de la convergence dominée,


ˆ ˙
` ˘
lim Epzh q “ E lim zh “ E iXeitX
hÑ0 hÑ0

Le reste de la démonstration se fait par récurrence sur k.

Corollaire. Si X P Lk pΩ, A, P q. On a :
prq
1. ϕX p0q “ ir EpX r q, 0 ă r ď k
k
ÿ pitqr
2. ϕX ptq “ EpX r q ` op|t|k q, t Ñ 0
r“0
r!

Démonstration. Application de la proposition 1.5 et le développement de Taylor.

Remarque. La réciproque de la proposition 1.5 n’est pas vraie en générale, mais on a :


Soit k un entier naturel pair :
— Si ϕpkq p0q existe, alors E|X|k ă `8 (i.e. X P Lk pΩ, A, P q).

2 Convergence en loi de v.a.r.


Soit pΩ, A, P q un espace probabilisé.

Définition 2.1. Soit pXn qn une suite de v.a.r. de fonctions de répartition pFn qn et X une v.a.r. de
L
fonction de répartition F . On dit que pXn qn converge en loi vers X, on note Xn Ñ , si
nÑ`8

lim Fn pxq “ F pxq


nÑ`8

Pour tout x P CF “ tx P R{x est un point de continuité de F u.

Remarque.
— L’application de la définition 2.1est difficile car il faut connaître CF .
— La définition de la convergence en loi la plus générale :

PXn pBq Ñ PX pBq @B P BpRq


nÑ`8

qui est équivalente à la définition 2.1dans le cadre des v.a.r.

Théorème 2.1.
L
Xn Ñ X ô ϕXn ptq Ñ ϕX ptq @t P R
L
Démonstration. ñq Supposons que Xn Ñ X. Comme cosptxq et sinptxq sont des fonctions bornées,
d’après le théorème de la convergence dominée :

ϕXn ptq “ EpcosptXn qq ` iEpsinptXn qq Ñ EpcosptXqq ` iEpsinptXqq


“ ϕX ptq
Probabilités 26

ðq Supposons que ϕXn ptq Ñ ϕX ptq pour tout t P R.


D’après la proposition 1.2, il suffit de montrer que FXn pbq ´ FXn paq Ñ FX pbq ´ FX paq pour a ă b
points de continuité de pFXn qn et FX . On a
1 T e´ita ´ e´itb
ż
FX pbq ´ FX paq “ lim ϕX ptqdt
T Ñ`8 2π ´T it
1 T e´ita ´ e´itb
ż „ 
“ lim lim ϕXn ptq dt
T Ñ`8 2π ´T it nÑ`8
« ż T ´ita ff
1 e ´ e´itb
“ lim lim ϕXn ptqdt
nÑ`8 T Ñ`8 2π ´T it
“ lim rFXn pbq ´ FXn paqs
nÑ`8

Théorème 2.2 (de Lévy). Soit pXn qn une suite de v.a. de fonctions caractéristiques pϕXn qn telles que :
ϕXn ptq Ñ ϕptq @t P R
où ϕ est une fonction continue en 0. Alors :
1. ϕ est la fonction caractéristique d’une v.a.r. X
L
2. Xn Ñ X
Remarque. La preuve du théorème 2.2 utilise des techniques classiques d’analyse (théorème de Helly, ¨ ¨ ¨ ).
On utilise en générale le théorème 2.1, mais si on ne connaît pas la limite X on utilise le théorème 2.2
Proposition 2.1.
P L
Xn Ñ X ñ Xn Ñ X
Démonstration. D’après le théorème 2.1, il suffit de montrer que ϕXn ptq Ñ ϕX ptq pour tout t P R. On a,
soit t P R et ε ą 0,
ż
` itX ˘
ϕXn ptq ´ ϕX ptq “ e n ´ eitX dP
żΩ ´ ¯ ż
` itX ˘
“ eitXn pωq ´ eitXpωq dP pωq ` e n ´ eitX dP
p|Xn ´ X| ą εq
loooooooomoooooooon p|X n ´ X| ă εq
loooooooomoooooooon
AC A

Donc,
ż ż
ˇ itX ˇ ˇ itX ˇ
|ϕXn ptq ´ ϕX ptq| ď ˇe n ´ eitX ˇ dP ` ˇe n ´ eitX ˇ dP
C
żA żA
ď |t||Xn ´ X|dP ` 2 dP
A AC
C
ď |tlεP pAq ` 2P pA q
ď |t|ε ` 2P p|Xn ´ X| ă εq
Ó Ó
0 0

Remarque. Si X “ a P -p.s., alors


P L
Xn Ñ X ð Xn Ñ X
En effet, par définition de la convergence en loi de Xn vers X,
FXn pxq Ñ FX pxq @x ‰ a
(car FX pxq “ 1ra;`8s pxq).
Soit ε ą 0.
Comme Ω “ pX “ aq Y pX ‰ aq.
P p|Xn ´ X| ą εq “ P p|Xn ´ X| ą εq “ P p|Xn ´ X| ą ε, X “ aq ` P p|Xn ´ X| ą ε, X ‰ aq
ď P p|Xn ´ X| ą ε, X “ aq ` P pX ‰ aq
ď P p|Xn ´ a| ą εq
ď P pXn ă a ´ εq ` P pXn ą a ` εq
ď P pXn ď a ´ εq ` P pXn ą a ` εq
ď Fn pa ´§εq ` p1 ´ Fn pa `§εqq
nÑ`8đ nÑ`8đ
F pa´εq“0 F pa`εq“1
Probabilités 27

car a ` ε et a ´ ε sont des points de continuité de F .


D’où
lim P p|Xn ´ X| ą εq “ 0
nÑ`8

C’est-à-dire
P
Xn Ñ X
Probabilités 28
Chapitre 4

Théorèmes limites

1 Résultats préliminaires
Soit pΩ, A, P q un espace probabilisé.

Proposition 1.1 (Critère de convergence de Cauchy). Soit pXn qně1 une suite de variable aléatoires.
Alors pXn qně1 converge P -p.s. si et seulement si

P
sup |Xn`k ´ Xn | ÝÑ 0 pn Ñ 8q
kě1

i.e. , @ε ą 0, limnÑ`8 P psupkě1 |Xn`k ´ Xn | ą εq ÝÑ 0.

Démonstration. Voir Prop. 2.3, Chap. 1.

Proposition 1.2 (Inégalité de Kolmogorov). Soient X1 , ¨ ¨ ¨ , Xn des variables aléatoires indépendantes


et centrées de L2 pΩ, A, P q. Posons Sn “ X1 ` ¨ ¨ ¨ ` Xn , (S0 “ 0). Alors
ˆ ˙ n
1 ÿ
P max |Sk | ą ε ď V arpXi q
1ďkďn ε2 i“1

Şk´1
Démonstration. Soit ε ą 0. Posons A “ pmax1ďkďn |Sk | ą εq et Ak “ i“1 p|Si | ď εq X p|Sk | ą εq,
k “ 1, ¨ ¨ ¨ , n. Soit ω P Ω.

ωPA ô max |Sk pωq| ą ε


1ďkďn
ô il existe une plus petite valeur de k telle que
|Sk pωq| ą ε p1 ď k ď nq
ô il existe un k P J1, nK unique tel que
|Si pωq| ď ε, i “ 1, ¨ ¨ ¨ , k ´ 1, et |Sk pωq| ą ε
ô il existe un k P J1, nK unique tel que ω P Ak

D’où
n
ď
A“ Ak
k“1

Ťn A1 , ¨ ¨ ¨ , An sont deux à deux disjoints par la dernière équivalence. Remarquons aussi que A “

k“1 p|Sk | ą εq par la première équivalence, mais les éléments de cette réunion ne sont pas deux à
deux disjoints.
Comme les variables aléatoires X1 , ¨ ¨ ¨ , Xn sont indépendantes et centrées, on a
n
ÿ
V arpXi q “ V arpSn q (indépendance)
i“1
“ EpSn2 q “ EpSn2 1Ω q pEpSn q “ 0q
ě EpSn2 1A q
ÿn
“ EpSn2 1Ak q (par notre union de A)
k“1

29
Probabilités 30

En écrivant Sn “ Sk ` pSn ´ Sk q, on a pour 1 ď k ď n,

EpSn2 1Ak q “ EpSk2 1Ak q ` EppSn ´ Sk q2 1Ak q ` 2EpSk pSn ´ Sk q1Ak q


ě EpSk2 1Ak q ` 2EpSk pSn ´ Sk q1Ak q
“ EpSk2 1Ak q
ě ε2 Ep1Ak q pω P Ak ñ |Sk pωq| ě εq
2
“ ε P pAk q

En conséquence,
n
ÿ n
ÿ
V arpXi q ě ε2 P pAk q
i“1 k“1
“ ε2 P pAq
ˆ ˙
“ ε2 P max |Sk | ą ε
1ďkďn

Théorème 1.1 (Kolmogorov-Kintchine).


ř`8 Soit pXn qně1 une suite de v.a. indépendante et centré de
L2 pΩ, A, P q telle que k“1 EpXn2 q ă 8.
Alors pSn qně1 converge P .s.
Démonstration. On s’appuie sue les proposition 1.1 et 1.2 Soit ε ą 0 et n P N. On a
ˆ ˙ ˆ ˙
P sup |Sn`k ´ Sn | ą ε “ lim P max |Sn`k ´ Sn | ą ε
kě1 mÑ`8 1ďkďm
n`m
1 ÿ
ď lim EpXk2 q
mÑ`8 ε2
k“n`1
`8
1 ÿ
“ EpXk2 q
ε2 k“n`1

Le dernier terme tend vers 0, quand n Ñ `8, par hypothèse. D’où


ˆ ˙
lim P sup |Sn`k ´ Sn | ą ε “ 0
nÑ`8 kě1

Par conséquent Sn converge P -p.s. (Prop. 1.1).

2 Lois des grands nombres


Théorème 2.1 (Loi faible). Soit pXn qně1 une suite de v.a. indépendantes telles que, lorsque n Ñ 8,
n n
1 ÿ 1 ÿ
EpXi q Ñ µ et V arpXi q Ñ 0
n i“1 n i“1

Alors,
n
1 ÿ P
Xn “ Xi Ñ µ
n i“1
řn
Démonstration. Soit ε ą 0. Posons Xn “ n1 i“1 Xi . Comme |Xn ´ µ| ď |Xn ´ EpXn q| ` |EpXn q ´ µ|,
on a
P p|Xn ´ µ| ą εq ď P p|Xn ´ EpXn q| ą ε{2q ` P p|EpXn q ´ µ| ą ε{2q
D’après l’inégalité de Tchebytchev à l’ordre 2, on a

4V arpXn q
P p|Xn ´ EpXn q| ą ε{2q ď
ε2
n
4 ÿ
“ V arpXi q
ε2 n2 i“1

D’où lorsque n Ñ 8,
P p|Xn ´ EpXn q| ą ε{2q Ñ 0
Probabilités 31

1
řn
Comme EpXn q “ n i“1 EpXi q Ñ µ (n Ñ 8), on a

P p|EpXn q ´ µ| ą ε{2q Ñ 0 pn Ñ 8q

D’où
P p|Xn ´ µ| ą εq Ñ 0 pn Ñ 8q
P
Par conséquent Xn Ñ µ.
Théorème 2.2 (Loi forte). Soit pXn qně1 une suite de variables aléatoires indépendantes telles que,
lorsque n Ñ 8, EpXn q “ µn Ñ µ et n“1 V arpX
ř`8 nq
n2 ă 8. Alors,
n
1 ÿ
Xn “ Xi Ñ µ P ´ p.s.
n i“1

Lemme (de Kronecker). Soit pun qně1 une suite de R.


řn
1. Si limnÑ8 un “ u, alors limnÑ8 n1 i“1 ui “ u.
ř8 řn
2. Si n“1 uni est convergente, alors limnÑ`8 n1 i“1 ui “ 0.
du théorème. Posons Yn “ Xn ´ µn , n ě 1. Alors
`8 „ˆ ˙ `8 ˆ ˙
ÿ Yn ÿ Yn
E “ V ar
n“1
n n“1
n
`8
ÿ V arpYn q

n“1
n2
`8
ÿ V arpXn q
“ ă8
n“1
n2

D’après la proposition 1.3,


`8
Yn
ÿ
ă 8 P ´ p.s.
n“1
n
En vertu du 2) Lemme 2.1,
n
1 ÿ
Yi Ñ 0 P ´ p.s.
n i“1
D’où,
n n
1 ÿ 1 ÿ
Xi ´ µi Ñ P ´ p.s.
n i“1 n i“1
řn
Il s’ensuit par 1) Lemme 2.1 que n1 i“1 Xi ´ µ Ñ 0 P -p.s., i.e.
n
1 ÿ
Xi Ñ 0 P ´ p.s.
n i“1

Remarque.
1. La loi forte des grands nombres entraîne la loi faible des grands nombres.
2. Dans le cas des variables aléatoires i.i.d., on a même l’équivalence suivante :
n
1 ÿ
EpXi q “ µ ô Xi Ñ µ P ´ p.s.
n i“1

3 Théorèmes central limit


Notons par Sn “ X1 ` ¨ ¨ ¨ ` Xn , n ě 1 les sommes partielles associées à la suite pXn qně1 .
Théorème 3.1 (Cas i.i.d.). Soit pXn qnPN une suite de variables aléatoires indépendantes et de même loi
de moyenne µ et de variance σ 2 . Alors,
Sn ´ nµ L
? ÑZ
σ n
où Z suit une loi normale N p0, 1q.
Probabilités 32

Démonstration. On peut supposer, s.p.g., que µ “ 0 et σ “ 1, sinon on centre et réduit les variables Xn .
D’après le Théorème 1.1 Chapitre 3, il suffit de montrer que
ˆ 2˙
t
Sn ptq Ñ ϕZ ptq “ exp
ϕ? ´ tPR
n 2

Comme pXn qně1 Ă L2 pΩ, A, P q, d’après le corollaire 1.2, Chapitre 3, on a


„ ˆ ˙n
t
ϕ?
Sn ptq “ ϕXi ?
n n
ˆ ˙n
t2

it 1
“ 1 ` ? EpXi q ´ EpXi2 q ` o pn Ñ 8q
n 2n n
ˆ ˙n
t2

1
“ 1´ `o pn Ñ 8q
2n n

D’où
ˆ 2˙
t
ϕ?
Sn ptq Ñ ϕZ ptq “ exp ´ tPR
n 2

Remarque.
1. La relation du théorème peut s’écrire sous la forme

Xn ´ µ L
? Ñ N p0, 1q
σ{ n

2. Soit pXn qně1 et pYnˇ qně1ˇ q deux suites de variables aléatoires.


ˇ Yn ˇ P
— Yn “ op pXn q si ˇˇ ˇÑ0
Xn ˇ ˆˇ ˇ ˙
Yn ˇ Yn ˇ
— Yn “ Op pXn q si est bornée en probabilité, i.e. , il existe M ą 0 tel que P ˇˇ ˇąM Ñ0
Xn Xn ˇ
Le théorème central limit entraîne que

Sn ´ nµ
? “ Op p1q
σ n

ou bien
?
Sn “ nµ ` Op p nq

ou bien ˆ ˙
1
Xn “ µ ` Op ?
n
řn
Posons s2n “ V arpXn q et σn2 “ 2
i“1 si , n ě 1.

Définition 3.1 (Condition de Lyapounov). On dit que la suite pXn qně1 satisfait la condition de Lya-
pounov si
1. pXn qně1 Ă L3 pΩ, A, P q
řn
2. limnÑ`8 σ13 i“1 E|Xi |3 “ 0
n

Théorème 3.2 (Cas non i.i.d.). Soit pXn qně1 une suite de variable aléatoires indépendantes et centrées
(i.e. EpXi q “ 0, i ě 1) satisfait la condition de Lyapounov. Alors

Sn L
Ñ Z ãÑ N p0, 1q
σn

Démonstration. D’après le théorème 2.1 Chapitre 3, il suffit de montrer que

2
ϕ?
Sn ptq Ñ expp´t {2q @t P R
n
Probabilités 33

Soit t P R, n P N˚ . On a
ˇ ˆ 2 2 ˙ˇˇ
n ˆ ˙ ź n
ˇ
2
ˇ ˇź t t s ˇ
Sn ptq ´ expp´t {2qˇ ϕXk exp ´ 2k ˇ
ˇ ˇ ˇ
ˇϕ ? “ ˇ ´
n ˇ
k“1
σn 2σn ˇ
k“1
n
ÿ s2k
(indépendance des Xi et “ 1)
k“1 n
σ2
n ˇ ˆ ˙ ˆ 2 2 ˙ˇ
ÿ ˇ t t s ˇ
ď ˇϕX
ˇ k σn ´ exp ´ 2k ˇˇ
k“1
2σn
ˇ ˇ
ˇźn źn ˇ ÿ n
alors ˇ ai ´ bi ˇ ď pai ´ bi q
ˇ ˇ
ˇi“1 i“1
ˇ i“1
n ˇ
t2 s2k i3 t3 EpXk3 q t2 s2k t4 σk4 ˇˇ
ÿ ˆ ˙ˇ
ˇ
— ˇ1 ´ 2σ 2 ` ´ 1´ `
ˇ
i“1 n 6σn3 2σn2 8σn4 ˇ
(Corollaire 1.1 Chapitre 3, expp´u2 q — 1 ´ u2 ` u4 {2)
n n
|t|3 ÿ 3 t4 ÿ 4
ď Ep|X k | q ` s
6σn3 k“1 8σn4 k“1 k
n n
|t|3 ÿ 3 t4 s2k 1 ÿ 2
ď Ep|Xk | q ` max s
6σn3 k“1 8 1ďkďn σn2 σn2 k“1 k
n
|t|3 ÿ 3 t4 s2k
“ Ep|Xk | q ` max
6σn3 k“1 8 1ďkďn σn2

Alors
s2k s2jn
max 2
“ , ně1
1ďkďn σn σn2
Et
˜ ¸3{2 # «ˆ ˙2 ff+3{2 ˇˇ
s2jn ˇˇ Xj ˇˇ3
ˇˇ
Xjn
“ E “ ˇˇˇˇ n ˇˇˇˇ
σn2 σn σn L 2
˜ˇ ˇ3 ¸ ˇˇ ˇˇ3
ˇ Xj ˇ ˇˇ Xj ˇˇ
ď E ˇˇ n ˇˇ “ ˇˇˇˇ n ˇˇˇˇ (par l’inégalité de Lyapounov)
σn σn L 3
1 ` ˘
“ 3
E |Xjn |3
σn
n
1 ÿ ` ˘
ď 3
E |Xk |3
σn k“1

tends vers 0 par la condition de Lyapounov.


D’où le résultat.

Vous aimerez peut-être aussi