Zazaazz

Cours de thorie des
probabilits
avec exercices corrigs et devoirs
Licence de mathmatiques, 3i`eme anne

Bruno Saussereau
Anne universitaire 2013-2014

1 Bruno
Saussereau, Laboratoire de Mathmatiques de Besanon, UFR Sciences & Techniques, 16,

route de Gray, 25030 Besanon cedex, France. Courriel : bruno.saussereau@univ-fcomte.fr
Prsentation du cours
Ce cours correspond lunit denseignement de thorie des probabilits dispense dans le cadre
du semestre 5 de lenseignement distance de la Licence de Mathmatiques.
La diffusion de ce cours est strictement limite aux tudiants rgulirement inscrits lunit
denseignement correspondante du Centre de Tl-enseignement Universitaire.
Public vis
Cet enseignement par correspondance sadresse en priorit aux tudiants dsireux de poursuivre
des tudes de Master en vue de la recherche, de passer le concours de lagrgation externe de
mathmatiques ou ceux qui se destinent des tudes de mathmatiques appliques en vue
de devenir ingnieurs-mathmaticiens.
Pr-requis et rvisions
Ce cours ne suppose aucun pr-requis sur le formalisme des probabilits. Tout le formalisme et
le vocabulaire des probabilits est dfini et introduit au fur et mesure des besoins. Il suppose
juste une sensibilisation aux phnomnes alatoires et leur tude lmentaire telle quelle est
enseigne depuis quelques annes au lyce et dans le semestre 4 de la Licence. Pour une rapide
mise niveau sur lapproche lmentaire des probabilits on peut se reporter aux deux ouvrages
classiques [11] et [12]. Certains des exercices proposs dans cette unit sont inspirs de ces
deux ouvrages moyennant quelques adaptations de vocabulaire dues au formalisme introduit
dans le cours.
En revanche ce cours suppose connus les concepts classiques de la thorie de la mesure et
de lintgration, dite intgrale de Lebesgue. Ces concepts seront souvent rappels dans ce
cours de faon rendre sa lecture autonome. Ces rsultats seront noncs sous leur version la
plus utile pour les applications en probabilits, ils seront admis et ne feront donc pas lobjet
dune dmonstration sauf cas particuliers. Pour leur version gnrale et leurs dmonstrations,
on pourra se reporter louvrage [8].
Outre ces rsultats spcifiques, le cours ncessitera la connaissance de rsultats et de techniques
classiques de mathmatiques gnrales. Cest donc loccasion, ds maintenant, de rviser
galement ces notions mathmatiques indispensables qui seront supposes connues. A cet
effet, on pourra se reporter un cours classique de mathmatiques gnrales, par exemple
[1], largement suffisant pour revoir ces notions. Il sagit en particulier de bien connatre
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
ii
Thorie des probabilits, Bruno Saussereau, 2013-2014, version 10/01/2014

1. les notions et rsultats lmentaires de la thorie des ensembles : ensembles, parties dun
ensemble, inclusion, appartenance, partition dun ensemble, intersection et runion de
plusieurs sous-ensembles, diffrence de deux sous-ensembles, complmentaire dun sousensemble, applications, bijections, image-rciproque dune application, oprations sur les
applications, composition de deux applications,...
2. les lments de thorie de la mesure et de lintgrale de Lebesgue
3. le calcul des sommes de sries : srie gomtrique, srie exponentielle, drivation des
sries entires, ...
4. quelques lments dalgbre gnrale et multilinaire en dimension finie : binme de
Newton, nombre de combinaisons, espaces vectoriels, produit scalaire euclidien, norme
euclidienne, calcul matriciel, transpos dune matrice, oprations lmentaires sur les
matrices, diagonalisation dune matrice symtrique, ...
Conseils de travail
Le cours proprement dit comprendra des dfinitions, des propositions (thormes, lemmes,
formules, ...), des dmonstrations, des exemples et des exercices corrigs. Les dmonstrations
doivent tre connues, elles sont exigibles lors des preuves dvaluation.
Les dmonstrations dveloppes dans le cours sont choisies en fonction de lintrt pdagogique du raisonnement quelles mettent en oeuvre. Il faut les tudier, crayon en main, essayer
de les refaire en mettant en vidence les deux ou trois axes de la dmonstration quil convient
de retenir pour tre capable de la restituer sans document. Cest ce critre que vous pourrez
mesurer si vous avez compris quelque chose. Il est conseill aussi de bien mettre en vidence
dans ces dmonstrations, en les nonant compltement et en vrifiant que leurs hypothses
de validit sont satisfaites, les rsultats antrieurs sur lesquels elles prennent appui. Certaines
dmonstration seront dtailles, dautres seront volontairement plus succinctes afin de vous
entraner dtailler par vous-mme les passages rapides de la dmonstration.
Les exemples du cours servent illustrer une dfinition sur un cas particulier ou montrer
une application concrte dune proposition. Leur rdaction est aussi parfois volontairement succincte. Il convient alors den dtailler les calculs, de vrifier les rsultats annoncs, et dessayer
de noter les astuces ou techniques utilises et transposables dans dautres situations, ventuellement moyennant certaines adaptations. Ce qui est dit pour les exemples est aussi valable pour
tous les exercices proposs en auto-correction et leurs corrigs.
Les exercices sont diviss en deux catgories :
1. Les exercices de la premire catgorie sont les exercices insrs dans le texte du cours
proprement dit. Ils sont assez simples et sont conus comme des applications directes du
cours et de ce qui vient dtre vu.
2. Les exercices de la seconde catgorie, dits de rvision, sont placs en fin de chaque
chapitre partir du chapitre III. Ils sont, quant eux, de difficults variables et font appel
aux diverses notions mises en place dans les chapitres antrieurs y compris le chapitre
tudi.
CT U
Besancon
iii
Vous devez essayer de chercher rsoudre le maximum dexercices, en vous aidant du cours.
Pour les exercices que vous ne savez pas rsoudre ou que vous navez pas pu chercher, par
exemple par manque de temps, il faut au moins tudier leurs solutions en vous reportant au
chapitre VIII.
Ce qui a t dit, plus haut, pour ltude des dmonstrations sapplique galement pour tudier
la correction dun exercice. Encore une fois, aprs avoir tudi une dmonstration ou la
solution dun exercice, vous devez tre capable de refaire cette dmonstration ou cet exercice,
sans regarder le cours, trois ou quatre jours plus tard. Cest l un bon test pour savoir si vous
avez compris la dmonstration ou la solution de lexercice. Il ne faut pas hsiter rviser les
chapitres dj travaills cest--dire revenir plusieurs fois, aprs de longs intervalles de temps,
sur les dmonstrations ou exercices tudis auparavant.
Trois devoirs rdiger et retourner la correction sont proposs dans le cadre de cet
enseignement afin de vous permettre de tester vos connaissances et de vous inciter un travail
rgulier. Ces devoirs permettent aussi de montrer au correcteur que vous avez compris le cours,
que vous connaissez les rsultats vus en cours et les hypothses qui les commandent, et que
vous savez les mobiliser pour rpondre une question ou dmontrer un rsultat nouveau. Il est
donc recommander de tout mettre en uvre pour atteindre cet objectif.
Il est bon de porter son attention, en particulier, sur les conseils suivants :
Un devoir de mathmatiques est un devoir de franais qui traite de mathmatiques, cest donc
avant tout un texte de franais. Il doit donc tre rdige de faon correcte en franais. Les
hypothses spcifiques justifiant lutilisation de chaque thorme doivent tre correctement explicites et le rsultat du cours utilis doit tre clairement identifi voire explicitement nonc.
Les rsultats intermdiaires et les conclusions obtenues doivent tre mis en vidence. Les notations utilises ou introduites, surtout si elles sont nouvelles par rapport au cours, doivent tre
clairement annonces. La rdaction du cours peut tre considre comme un guide de rdaction
dun texte mathmatique.
Les preuves dexamen comporteront des exercices et des questions portant sur lensemble
du cours. Elles peuvent galement comprendre des questions de cours proprement dites : noncer un ou plusieurs rsultats du cours, refaire une ou plusieurs dmonstrations vues en cours,
traiter un exemple ou un exercice corrig proposs dans les documents fournis dans le cadre de
cette unit denseignement. La table de la loi normale standard de lannexe B (sans les explications sur son utilisation), ainsi que le formulaire de lannexe A, seront disponibles avec les sujets
lors des preuves dvaluation. Lors de ces preuves, lutilisation dune calculatrice est autorise.
Certaines propositions du cours concernent des rsultats mentionns "hors programme". Ils
sont simplement donns dans un but de culture mathmatique, mais ne feront donc pas lobjet
dvaluation et leur connaissance nest pas exigible dans les valuations. Souvent ils apportent
des complments ou des prcisions sur un rsultat ou une remarque qui viennent dtre faits.
Enfin, il est vident que lapprciation dune copie par le correcteur, que ce soit celle dun
devoir ou dune preuve dexamen, accordera une place importante la rdaction, la clart
des justifications et de largumentation ainsi qu la prsentation globale de la copie. Une copie
illisible ou mal rdige pourra ne pas tre corrige et sera sanctionne en consquence.
CT U
Besancon
iv
Annexes
Ce document comprend cinq annexes :
1. Lannexe A, page 205, est un rappel des principales relations mathmatiques utilises
dans les calculs de probabilits et des lois de probabilits classiques connatre. Ce
formulaire sera disponible lors des preuves de contrles ou dexamens.
2. Lannexe B, page 211, explique lusage de la table statistique de la loi normale centrerduite reproduite en fin de lannexe. La table de la loi normale standard, sans les
explications qui laccompagnent, sera disponible lors des preuves dexamen.
3. Lannexe C, page 215, comprend les sujets des trois devoirs qui devront tre envoys
la correction et prcise les dates de ces trois envois. Les corrigs de ces devoirs seront
retourns avec la copie corrige.
Bibliographie
Pour le cours, et surtout pour apporter des complments ce cours, on pourra utiliser avec
profit le livre de [4]. Pour les exercices on pourra se reporter [2] pour ceux relevant de la
thorie de la mesure de de lintgration, et [3] o on trouvera des exercices supplmentaires
concernant la thorie des probabilits.
Pour une justification du choix du formalisme et de sa signification en tant que modle de la
"ralit", on pourra consulter avec profit en premire lecture le chapitre I de [5] et [7] puis, en
seconde lecture, [4] pages 93 et 132, et [13] page 56.
Une approche historique et pistmologique en liaison avec les questions denseignement des
concepts probabilistes peut tre trouve dans [6].
Calendrier de travail
Le cours lui-mme est divis en sept chapitres auxquels sajoute un huitime chapitre regroupant
les corrections des exercices proposs dans les chapitres prcdents.
Les trois premiers chapitres sont principalement destins mettre en place le formalisme des
probabilits en transcrivant dans le langage des probabilits les notions de thorie de la mesure
et de lintgration vues dans lunit correspondante : tribu, application mesurable, mesure,
image dune mesure, rgles dintgration, thormes de Lebesgue, ... etc. Normalement ces
notions ont t vues dans lunit dintgration qui est conseille pour suivre cet enseignement
de probabilit. Elles doivent tre tudies assez rapidement de faon faire porter votre travail
sur les autres chapitres. Dans ces trois premiers chapitres la notion de loi de probabilit, le
thorme du transfert, la notion de fonction caractristique et les critres didentification des
lois, doivent tre bien assimils et matriss.
Les concepts vraiment nouveaux et propres la thorie des probabilits : indpendance, vecteurs
gaussiens, convergences, thormes-limites, ... etc, sont vues dans les quatre derniers chapitres
et constituent le noyau de lunit de probabilits.
CT U
Besancon
Il faut consacrer en gros un tiers du temps de travail de lunit ltude des chapitres 1, 2 et
3. Un tiers du temps aux chapitres 4 et 5, et un tiers du temps aux chapitres 6 et 7.
Vous avez rdiger trois devoirs envoyer pour correction ladresse suivante :
Bruno Saussereau, Laboratoire de Mathmatiques de Besanon, UFR des Sciences
et Techniques, 16, route de Gray, 25030 Besanon cedex, France.
1. Le devoir 1, dont le texte se trouve en annexe C, page 216, porte sur les chapitres I, II
et III. Il doit tre envoy au plus tard pour le 21 fvrier 2014.
2. Le devoir 2, dont le texte se trouve en annexe C, page 218, porte principalement sur le
chapitre IV et V mais pourra bien sr faire appel des rsultats des chapitres prcdents.
Il doit tre envoy au plus tard pour le 28 mars 2014.
3. Le devoir 3, dont le texte se trouve en annexe C, page 220, porte principalement sur
les chapitres VI et VII, mais pourra bien sr faire appel des rsultats des chapitres
prcdents. Il doit tre envoy au plus tard pour le 18 avril 2014.
Le calendrier ci-dessus est donn titre indicatif. Bien entendu, jaccepterai de corriger
vos devoirs nimporte quel moment. Cependant je vous conseille dessayer de travailler
rgulirement et de suivre ce calendrier.
Remarque finale
Comme pour tout document, des erreurs ou des coquilles peuvent stre glisses lors de sa
rdaction, merci de me signaler celles que vous pourriez relever. Plus gnralement, si vous
avez des remarques sur le document, nhsitez pas men faire part.
Besanon, le 10 janvier 2014,

Bruno Saussereau
CT U
Besancon
vi
CT U
Besancon
Table des matires.

Notations
xi
1 Modles probabilistes
1.1 Prliminaires . . . . . . . . . . . . . . . . . .
1.2 Tribu sur un ensemble . . . . . . . . . . . . .
1.3 Mesures et probabilits . . . . . . . . . . . . .
1.3.1 Mesure . . . . . . . . . . . . . . . . .
1.3.2 Probabilits et vnements . . . . . .
1.3.3 Proprits lmentaires des probabilits
1.4 Fonctions de rpartition . . . . . . . . . . . .
.
.
.
.
.
.
.
1
1
3
6
6
7
11
13
.
.
.
.
.
.
.
.
19
19
19
20
20
21
23
23
24
.
.
.
.
.
.
.
.
.
.
.
29
29
29
33
36
37
38
40
40
45
49
59
2 Loi dun vecteur alatoire

2.1 Remarques sur la modlisation de lalatoire
2.1.1 Cas discret . . . . . . . . . . . . . .
2.1.2 Cas continu . . . . . . . . . . . . .
2.1.3 Principe de modlisation . . . . . . .
2.2 Applications mesurables . . . . . . . . . . .
2.3 Loi dune variable alatoire . . . . . . . . .
2.3.1 Variables alatoires . . . . . . . . . .
2.3.2 Loi dune variable alatoire . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3 Moments dun vecteur alatoire

3.1 Rappels sur lintgration des applications mesurables .
3.1.1 Intgration des fonctions positives . . . . . . .
3.1.2 Intgration des fonctions numriques . . . . .
3.1.3 Intgration des fonctions vectorielles . . . . .
3.1.4 Proprits de lintgrale . . . . . . . . . . . .
3.1.5 Espaces de Lebesgue dordre p . . . . . . . .
3.2 Thorme du transfert et moments dune v.a. . . . . .
3.2.1 Thorme du transfert et identification de lois
3.2.2 Moments dune variable alatoire . . . . . . .
3.3 Fonction caractristique et loi dune v.a. . . . . . . .
3.4 Exercices de rvision sur les chapitres I III . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
viii

4 Indpendance stochastique
4.1 Intgration sur Rn+p . . . . . . . . . . . . . . . . . . . . . .
4.2 Indpendance de vecteurs alatoires, dvnements, de tribus .
4.2.1 Indpendance de vecteurs alatoires . . . . . . . . . .
4.2.2 Critres dindpendance de vecteurs alatoires . . . .
4.2.3 Indpendance dvnements, de tribus . . . . . . . . .
4.3 Tribu et vnements asymptotiques . . . . . . . . . . . . . .
4.4 Somme de v.a.r. indpendantes . . . . . . . . . . . . . . . .
4.5 Exercices de rvision sur les chapitres I IV . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
61
61
66
66
68
77
80
84
90
5 Vecteurs alatoires gaussiens

95
5.1 Vecteur gaussien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
5.2 Loi dun vecteur gaussien . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
5.3 Exercices de rvision sur les chapitres I V . . . . . . . . . . . . . . . . . . . 103
6 Lois des grands nombres et convergences de v.a.r.
6.1 Convergence en probabilit dune suite de v.a.r. . . .
6.1.1 Loi faible des grands nombres . . . . . . . .
6.1.2 Convergence en probabilit . . . . . . . . .
6.2 Convergence presque-sre dune suite de v.a.r. . . .
6.2.1 Loi forte des grands nombres . . . . . . . .
6.2.2 Convergence presque-sre . . . . . . . . . .
6.3 Convergence dans Lp (, F, P) o p [1, +] . . .
6.4 Comparaison des convergences dans L0 (, F, P) . .
6.5 Exercices de rvision sur les chapitres I VI . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
105
105
105
109
112
112
113
118
119
121
7 Thorme-limite central et convergence de lois

7.1 Thorme-limite central (TLC) . . . . . . . . . . . . . . .
7.1.1 nonc du thorme-limite central (TLC) . . . . . .
7.1.2 Cas particuliers du thorme-limite central (TLC) . .
7.1.3 Correction de continuit . . . . . . . . . . . . . . .
7.2 Convergence dune suite de probabilits, convergence en loi
7.3 Exercices de rvision sur les chapitres I VII . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
123
123
123
126
128
129
141
8 Corrigs des exercices

8.1 Corrigs des exercices
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
145
145
152
155
165
183
190
196
.
.
.
.
205
205
205
207
208
du
du
du
du
du
du
du
chapitre
chapitre
chapitre
chapitre
chapitre
chapitre
chapitre
A Formulaire
A.1 Rappels de notations . . . . .
A.2 Quelques relations connatre
A.3 Probabilits usuelles discrtes
A.4 Probabilits usuelles densit
CT U
Besancon
I .
II .
III
IV
V.
VI
VII
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. . . . . . . .
en probabilits
. . . . . . . .
. . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Table des matires.
ix
B Table de la loi normale standard

211
B.1 Calculs avec des v.a.r. normales centres-rduites . . . . . . . . . . . . . . . . 211
B.2 Calculs avec des v.a.r. normales de paramtres quelconques . . . . . . . . . . 212
C Devoirs envoyer la correction
C.1 Devoir 1 renvoyer le 21 fvrier 2014 au plus tard . . . . . . . . . . . . . . .
C.2 Devoir 2 renvoyer le 28 mars 2014 au plus tard . . . . . . . . . . . . . . . .
C.3 Devoir 3 renvoyer le 18 avril 2014 au plus tard . . . . . . . . . . . . . . . .
215
216
218
220
Bibliographie.
221
CT U
Besancon
CT U
Besancon
Notations
xi
Notations
Nous rpertorions ici quelques notations gnrales qui seront utilises dans lensemble du cours.
On note de faon classique respectivement par les lettres, N, Z, Q, R, C, les ensembles des
nombres entiers naturels, relatifs, rationnels, rels, complexes.
Les lettres P et E seront introduites dans le cours mais ne devront pas tre confondues avec
les notations densembles de nombres.
On pose R := R {+, }. On tend lordre usuel de R R en posant, pour tout x R,
< x < +. On prolonge les oprations classiques sur R de la faon suivante : pour
tout x R {+}, x + (+) = +, x () = +; pour tout x R {},
x + () = , x (+) = . On remarquera que (+) + () et (+) (+)
ne sont pas dfinis.
On suppose connues les notations classiques de la thorie lmentaire des ensembles : intersection , runion , diffrence de deux ensembles \, ensemble vide , passage au complmentaire
{ ou plus frquemment c , inclusion (au sens large) .
Le symbole de Halmos, 2, dsignera la fin dune dmonstration.
Le symbole := signifie "est gal par dfinition". Il indique que le membre de gauche de := est
une notation pour le membre de droite.
Chaque proposition, exemple, exercice, est numrote par deux nombres spars par un point.
Par exemple "proposition 5.12" dsigne la proposition 12 du chapitre 5.
CT U
Besancon
xii
CT U
Besancon
Chapitre 1. Modles probabilistes
Chapitre 1
Modles probabilistes
Le formalisme de la thorie des probabilits utilise les outils de la thorie de la mesure en
adoptant un vocabulaire spcifique aux probabilits.
1.1
Prliminaires
Certaines dfinitions et notations de la thorie lmentaire des ensembles seront constamment

utilises dans la suite. Afin dviter toute ambigut nous les rappelons rapidement dans ce
paragraphe.
Dfinition 1.1.
Dans ce cours un ensemble sera dit dnombrable sil est en bijection avec une partie (finie ou
infinie) de N.
(Attention : dans certains ouvrages, un tel ensemble est dit au-plus-dnombrable, le qualificatif dnombrable dsignant alors les ensembles possdant un nombre fini dlments.)
Si A et B sont deux parties dun ensemble E , on note Ac := {x E / x 6 A}, ou aussi {E A
si on souhaite prciser lensemble de rfrence E , le complmentaire de A dans E et
A \ B := A B c = {x A / x 6 B}.
Dfinition 1.2.
Soit f une application dun ensemble E dans un ensemble F . Si A est une partie de F ,
limage-rciproque de A par f est lensemble, not par les probabilistes {f A}, dfini par
{f A} := {x E / f (x) A}.
Lensemble {f A} est donc une partie de E .
Exemples 1.1.
Si f et g sont deux applications de E dans R et a un rel,
{f = g } := {x E / f (x) = g (x)}, {f g } := {x E / f (x) g (x)},
{f = a} := {x E / f (x) = a}.
CT U
Besancon

En vue de la proposition
suivante, rappelons que si (Ai )I est une famille quelconque de parties
[
dun ensemble F ,
Ai dsigne la partie de F constitue des lments x de F tels quil existe
iI
au moins un indice k I , x Ak . De mme,

big capiI Ai dsigne la partie de F constitue des lments x de F tels que, pour tout indice
k I , x Ak .
Voici quelques proprits classiques de limage-rciproque :
Proposition 1.1.
Avec les notations introduites ci-dessus,
1. {f } := {x E / f (x) } = .
2. Si A et B sont des parties de F avec A B alors, {f A} {f B}.
3. Si (Ai )I est une famille quelconque de parties de F ,
(
)
(
)
[
[
\
\
f
Ai =
{f Ai } et f
Ai =
{f Ai } .
iI
iI
iI
iI
4. {f A}c = E \ {f A} = {f F \ A} = {f Ac }.
On fera attention lambigut de la notation c pour le complmentaire dun ensemble dans
lassertion 4 de cette proposition : {f A}c signifie {E {f A} et {f Ac } signifie {f {F A}.
Exercice 1.1. (Corrig de lexercice : page 145)
Dmontrer la proposition prcdente.
Dfinition 1.3.
Lindicatrice dune partie A de E est lapplication, note 1lA , de E dans R dfinie, pour
tout x E , par 1lA (x) := 0 si x 6 A et 1lA (x) := 1 si x A.
Soient A, B et C trois parties dun ensemble .
1. crire 1lAB et 1lAB en fonction de 1lA et 1lB lorsque :
(a) A et B sont disjoints ( i.e. A B = ).
(b) A et B sont quelconques.
2. Exprimer, en fonction des indicatrices de A, B et C , les indicatrices des ensembles
suivants : Ac , A \ B, A B C .

Reprsenter
X graphiquement les fonctions dfinies sur R :
1.
1l[n,+[ .
n0
2.
1l[0,n] .
n0
CT U
Besancon

3.
(n + 1)1l[n,n+1[ .
n0
Enfin, rappelons que, si f et g sont deux applications dun ensemble E dans R, la notation
f g signifie que, pour tout x E , f (x) g (x).
1.2
Tribu sur un ensemble
Dfinition 1.4.
Une famille A de parties dun ensemble E est appele une tribu sur E , (ou dans certains
ouvrages une -algbre sur E ), si elle vrifie les trois axiomes suivants :
1. E A,
2. Si A A, alors Ac A,
[
3. Si (An )N est une suite dlments de A, alors
An A.
nN
Dfinition 1.5.
Le couple (E , A) sappelle un espace mesurable et les lments de A sont appels les
parties mesurables de E relativement la tribu A ou parties A-mesurables de E
On notera bien que A est un ensemble constitu de parties de E et donc une partie de P(E ),
lensemble de toutes les parties de E .
Exemples 1.2.
les familles de parties de E , {, E } et P(E ), sont des tribus sur E appeles tribus triviales
de E . On peut donc dfinir au moins une tribu sur tout ensemble E .
Soient n un entier strictement positif et (A1 , A2 , , An ) une partition de E , i.e. une suite
de parties non vides de E , deux deux disjointes, dont la runion est gale E . Soit A
la famille des runions quon peut fabriquer partir de toutes les sous-familles
de la suite
[
(A1 , A2 , , An ), cest--dire la famille des parties de E de la forme
Ai o K parcourt
iK
lensemble des parties de {1, 2, , n}. Montrer que la famille A est une tribu sur E .
Pour une gnralisation de ce rsultat, on pourra consulter [2] exercice I-7 question 2.

Montrer que lintersection dune famille quelconque de tribus est une tribu. En est-il de
mme pour la runion ?
La proposition suivante donne un procd de construction de parties mesurables partir dautres
lments de la tribu :
CT U
Besancon

Proposition 1.2.
Soit A une tribu sur E .
1. A.
2. Si (Ai )iI , o I N, est une suite (finie ou infinie) dlments de A, alors
\
[
Ai A et
Ai A.
iI
iI
Dmonstration : = E c , on conclut par les axiomes 1 et 2 de la dfinition des tribus.

On pose A0i := Ai pour tout entier i I et A0i := pour tout entier
I . On applique le
S i N\S
0
rsultat prcdent
et
laxiome
3
de
la
dfinition
pour
montrer
que
A
=
iI i
nN An A.
T
Pour montrer iI Ai A, on remarque que
!c
\
iI
Ai =
Aci
iI
On utilise alors le rsultat prcdent et laxiome 2. 2

Montrer que si A et B sont deux parties mesurables de E relativement la tribu A, alors
A \ B A.
Pour des raisons techniques qui seront prcises plus loin, lorsquon travaille sur E := R ou
plus gnralement E := Rd avec d N , il nest pas possible dutiliser la tribu P(R) ou
P(Rd ) car elle est trop "grosse". Pour des explications plus dtailles consulter lannexe ??,
page ??. On doit donc dfinir une tribu plus "petite" (au sens de linclusion des ensembles)
mais suffisamment riche en lments pour contenir au moins les ensembles utiliss dans les
applications pratiques de la thorie des probabilits, comme les intervalles de R ou les pavs de
Rd , et leurs runions ou intersections dnombrables.
Pour cela on dfinit la tribu borlienne ou tribu de Borel de R note B(R). Cest la plus
petite des tribus sur R contenant tous les intervalles de la forme ]a, b], o a et b sont des rels
tels que a < b. Cette dernire phrase signifie que si A est une tribu sur R contenant tous les
intervalles de la forme ]a, b], o a et b sont des rels tels que a < b, alors tout lment de la
tribu B(R) est un lment de la tribu A.
Plus gnralement,
Dfinition 1.6.
La tribu borlienne ou tribu de Borel de Rd ,, note B(Rd ), est la plus petite des tribus sur
Rd contenant tous les pavs de Rd i.e. les parties de la forme ]a1 , b1 ]]a2 , b2 ] ]ad , bd ]
o, pour tout entier 1 i d, ai et bi sont des rels tels que ai < bi .
On peut de mme dfinir la tribu borlienne sur B(R) :
CT U
Besancon
Dfinition 1.7.
La tribu borlienne sur R, note B(R), est la plus petite des tribus sur R contenant tous les
intervalles de la forme ]a, b], o a et b sont des rels tels que a < b, et les intervalles ]a, +]
o a R.
Dfinition 1.8.
Les lments des tribus B(R), resp. B(Rd ), sont appels borliens de R, resp. Rd .
Prouver lexistence de la tribu de Borel de R. Pour cela, montrer que B(R) est lintersection
de la famille (non vide car la tribu P(R) en fait partie) des tribus contenant tous les intervalles de la forme ]a, b] o a et b sont des rels tels que a < b.
Plus gnralement :
Dfinition 1.9.
Soit C une famille de partie dun ensemble E . On appelle tribu engendre par C sur E , et
on note ( C), la plus petite tribu (au sens de linclusion) dfinie sur E contenant la famille C.
On vrifiera aisment que la tribu ( C) est lintersection de toutes les tribus sur E qui contiennent C.
Exemples 1.3.
On montre en thorie de la mesure que la tribu borlienne de Rd est engendre par la
famille constitue des parties ouvertes de Rd .
Soient n un entier strictement positif et (A1 , A2 , , An ) une partition de E . Montrer
que la tribu construite dans lexercice 1.4 est la tribu sur E engendre par la famille
(A1 , A2 , , An ).
Dans la suite du cours les ensembles R et Rd seront toujours supposs munis de leurs tribus
borliennes.
La proposition suivante donne des exemples de borliens de R. Pratiquement ceux-ci correspondent la plupart des ensembles qui seront manipuls dans la suite :
Proposition 1.3.
1. Tout singleton de R est un borlien.
2. Toute partie dnombrable de R est un borlien.
3. Tous les intervalles de R, quelle que soit leur forme, sont des borliens de R.
4. Toutes les runions dnombrables ou intersections dnombrables dintervalles de R, ou
plus gnralement de borliens, sont des borliens.
Dmonstration : Pour le singleton, on remarque que si a R, on peut crire

+
\
1
{a} =
a ,a .
k
k=1
CT U
Besancon

On conclut alors avec la proposition 1.2 de la page 4. Pour lassertion 2, on utilise laxiome
3 de la dfinition des tribus. Pour dmontrer 3, on montre que tout intervalle peut tre crit
comme runion ou intersection dnombrable dintervalles de la forme ]a, b] ou de singletons.
Par exemple [a, b] =]a, b] {a} ce qui prouve que tout intervalle ferm born est borlien.
Autres exemples : ]a, b[=]a, b] \ {b} ou encore
]a, b[=

+
[
1
, ] , b] =
] k, b].2
a, b
k
k>b
+
[
k=1
On notera que si toute runion dnombrable ou intersection dnombrable dintervalles de R est

un borlien, cela ne signifie pas pour autant que tous les borliens de R sont de cette forme.
De plus on montre que B(Rd ) est strictement incluse dans lensemble des parties de Rd . Il
existe donc des parties de Rd qui ne sont pas mesurables pour la tribu de Borel. Mais dans
la pratique, tous les ensembles que nous serons amens utiliser dans Rd seront en fait des
borliens.
1.3
1.3.1
Mesures et probabilits
Mesure
Dfinition 1.10.
Soit (E , A) un espace mesurable. Une mesure sur (E , A) est une application de A dans
[0, +] vrifiant les axiomes :
1. () = 0,
2. -additivit : pour toute suite (An )N dlments de A deux deux disjoints
! +
+
[
X
Ak =
(Ak ).
k=0
k=0
Le triplet (E , A, ) sappelle un espace mesur.

La -additivit entrane la simple-additivit
! + i.e. pour toute suite finie A1 , , An dlments
+
[
X
de A deux deux disjoints
Ak =
(Ak ). Mais la rciproque est fausse, cest--dire
k=0
k=0
quil ne suffit pas que le deuxime axiome de la dfinition prcdente soit vrai pour les suites
finies deux deux disjointes pour quil le soit pour les suites infinies deux deux disjointes. Un
contre-exemple est propos dans lexercice suivant.
On considre lapplication de P(N) dans [0, +] dfinie, pour tout A N, par
X 1
1
(avec
la
convention
= +) si A est fini, (A) = + si A est infini,
(A) :=
2
n
0
nA
et () = 0. Montrer que
CT U
Besancon
1. est simplement-additive sur N, i.e.!pour toute suite finie A1 , , An de parties de

n
n
[
X
N, deux deux disjointes,
Ak =
(Ak ).
k=1
k=1
2. nest pas -additive sur N.

On admettra quil existe une unique mesure sur (Rd , B(Rd )), note (d) et appele mesure
de Lebesgue sur Rd , telle que, pour tout pav de la forme ]a1 , b1 ]]a2 , b2 ] ]ad , bd ]
o pour tout entier 1 i d, les rels ai et bi vrifient ai < bi ,
(d) (]a1 , b1 ]]a2 , b2 ] ]ad , bd ]) = (b1 a1 )(b2 a2 ) (bd ad ).
La mesure de Lebesgue tend donc les notions de mesure de longueur (cas d = 1), mesure
daire (cas d = 2), mesure de volume (cas d = 3) toutes les parties de Rd qui sont des
borliens. Dans le cas d = 1 on notera, pour simplifier, := (1) .

On montre que (d) Rd = +. On dit que la mesure de Lebesgue est une mesure non finie
contrairement aux probabilits que nous allons dfinir ci-dessous et qui sont des cas particuliers
de mesures finies.
Exercice 1.10. (Corrig
de lexercice : page 149)
[
Vrifier que R =
]k, k + 1] et en dduire que (R) = + en appliquant laxiome de
kZ
-additivit de la mesure de Lebesgue.
1.3.2
Probabilits et vnements
Dfinition 1.11.
Une probabilit sur (E , A) est une mesure sur (E , A) telle que (E ) = 1. Le triplet
(E , A, ) sappelle alors un espace de probabilit, les parties mesurables sappellent les
vnements relatifs . E est lvnement certain, est lvnement impossible. Deux
vnements disjoints sont dits incompatibles.
Dornavant, sauf indication contraire, (E , A, ) dsignera un espace de probabilit.
Dfinition 1.12.
Une partie A de E est dite ngligeable pour , sil existe un vnement B tel que A B avec
(B) = 0. Une proprit P(x), dpendant de llment x E , est dite -presque-sre (en
abrg -p.s.) si lensemble des x E pour lesquels la proprit P(x) nest pas vrifie est
ngligeable pour .
Dfinition 1.13.
Deux vnements A et B sont dits -presque-srement gaux si lvnement (A\B)(B \A)
est ngligeable pour .
Un vnement ngligeable pour est -presque-srement vide, cest--dire -presque-srement
impossible.
CT U
Besancon

Exemples 1.4.
1) Donnons un premier exemple de probabilit sur E := Rd . Comme convenu on sousentend A := B(Rd ). Soit a Rd fix, on note a lapplication de B(Rd ) dans {0, 1}
dfinie, pour tout borlien A, par a (A) = 1lA (a) c--d a (A) = 1 si a A et a (A) = 0
sinon.

a est une probabilit sur Rd , B(Rd ) appele probabilit de Dirac au point a sur Rd .
On vrifie aisment que toute partie de Rd ne contenant pas a est ngligeable pour a . Le
singleton {a} est un vnement a -presque-srement gal lvnement certain Rd .
2) Daprs le rsultat de lexercice 1.10, la mesure de Lebesgue nest pas une probabilit
sur Rd .
Vrifier que a , o a est un rel, est bien une probabilit sur R.
Donnons sous forme de proposition un exemple gnrateur de mesures et en particulier de
probabilits :
Proposition 1.4.
Soient (k )N une suite de mesures sur (E , A) et (k )N une suite de rels positifs. Alors
lapplication
+
X
: A A 7 (A) :=
k k (A)
k=0
est une mesure sur (E , A) note

:=
+
X
k k .
k=0
Dmonstration : On vrifie aisment que () = 0. La -additivit de dcoule immdiatement

du lemme suivant sur linterversion des indices, souvent utile dans les calculs : Si (ai,j )(i,j)N2
est une suite-double de rels positifs, alors
+ X
+
X
ai,j =
+ X
+
X
i=0 j=0
ai,j .
j=0 i=0
Cette somme peut tre ventuellement infinie. Pour une dmonstration du lemme se reporter
[1] tome 2, p. 306. 2
On notera que si les mesures k sont des probabilits sur (E , A) et si
+
X
k = 1, alors la
k=0
mesure
+
X
k k est une probabilit sur (E , A).
k=0
Exemples 1.5.
Appliqu au cas particulier o les probabilits k sont les probabilits sur R de Dirac au
point k N, le procd prcdent permet de construire dautres exemples classiques de
probabilits. Si n N , ]0, +[, p ]0, 1[ et q := 1 p, on dfinit :
CT U
Besancon
1. la probabilit binomiale de paramtres n et p :

B(n, p) :=
n
X
Cnk p k q nk k .
k=0
2. la probabilit de Poisson de paramtre :

P() :=
k=0
k
k .
k!
3. la probabilit gomtrique de paramtre p :

G(p) :=
+
X
pq k1 k .
k=1
4. la probabilit uniforme-discrte de paramtre n ou quiprobabilit sur {1, 2, , n}

:
n
1X
U(n) :=
k .
n k=1
La probabilit B(1, p) est appele probabilit de Bernoulli de paramtre p et se note
simplement B(p).
Vrifier que les probabilits introduites dans lexemple prcdent sont bien des probabilits
construites suivant le procd de la proposition 1.4.

1) Expliciter les expressions analytiques, pour tout i N, de B(n, p)({i}) et P() ({i}) .
2) Expliciter et calculer P(
1
3
) ({1, 3, 5, 7}) et B(7, ) ({0, 3, 5}) .
10
10
Dfinition 1.14.
d
Une probabilit sur
XR est dite discrte et porte par lensemble F si elle peut scrire
sous la forme =
pn an o (pn )N est une suite de rels positifs ou nuls, (an )N est une suite
nN
de vecteurs de Rd et F dsigne lensemble des an Rd pour lesquels pn > 0.

Exemples 1.6.
Les probabilits binomiale B(n, p), de Poisson P(), de Dirac a sont discrtes et portes
respectivement par les ensembles {0, 1, , n}, N, {a}.
Il ne faut pas croire que toutes les probabilits soient discrtes. Par exemple on admettra quil
existe une unique probabilit sur R, note N 1 (0, 1) et appele probabilit de Gauss-Laplace
standard, ou probabilit normale standard, telle que pour tout x R,
Z x
1 2
1
N 1 (0, 1) (] , x]) =
e 2 t dt.
2
CT U
Besancon
10

On verra un peu plus loin que cette probabilit ne peut pas scrire sous la forme dune combinaison linaire de probabilits de Dirac et nest donc pas discrte.
Remarquons que le nombre rel N 1 (0, 1) (] , x]) reprsente la mesure de laire dlimite
1 2
1
par laxe des abscisses t, la courbe dquation y = e 2 t , et la droite dquation t = x. On
2
1 2
1
dira pour simplifier quil sagit de la mesure de laire sous la courbe dquation y = e 2 t ,
2
comprise entre et x.
On peut gnraliser un peu la construction prcdente.
Dfinition 1.15.
Nous appellerons densit de probabilit sur R toute application positive de R dans
[0, +], continue sur R, Zsauf ventuellement en un nombre fini de points o la courbe prsente
+
des sauts finis, telle que
(t)dt = 1.
On montre alors quil existe une unique probabilit sur R telle que, pour tout x R,
Z x
(] , x]) =
(t)dt.
On dit que est une probabilit densit sur R. On crit = pour exprimer que
admet pour densit. Nous gnraliserons de faon dfinitive la dfinition de densit dune
probabilit sur Rd au chapitre III par la dfinition 3.2, page 35.
Comme prcdemment, le rel (] , x]) reprsente la mesure de laire sous la courbe
dquation y = (t), comprise entre et x.
On peut de faon plus gnrale dfinir des mesures densit, qui ne sont plus ncessairement
des probabilits, en remplaant dans laZ dfinition de la densit ci-dessus, la condition
Z
+
(t)dt = 1 par la condition plus faible
(t)dt < +.
Lexistence des mesures densit rsulte dun thorme de prolongement assez technique que
nous nnoncerons pas. Nous nous contenterons dadmettre lexistence de telles mesures.
Exemples 1.7.
1. La probabilit de Gauss-Laplace standard vue plus haut admet la densit dfinie
1 2
1
sur R par (t) := e 2 t .
2
1
2. Lapplication :=
1l[a,b] , avec a < b, est la densit dune probabilit sur R
ba
appele probabilit uniforme-continue sur [a, b] et note U([a, b]).
3. Lapplication , dfinie sur R par (t) := e t 1l]0,+[ (t), est la densit dune probabilit sur R appele probabilit exponentielle de paramtre > 0 et note E().
CT U
Besancon
11
On pourrait se demander pourquoi on ne dfinit pas les mesures comme des applications
-additives de lensemble des parties de E dans [0, +] avec () = 0. Cela reviendrait
prendre toujours A := P(E ) et viterait le recours la notion de tribu. En fait, on montre que
certaines probabilits, comme celle de Gauss dfinie plus haut, ne peuvent pas tre dfinies pour
toutes les parties de R. Plus prcisment, on montre que, toujours dans le cas de E := R, les
seules probabilits qui satisferaient cette nouvelle dfinition seraient les probabilits discrtes.
Malheureusement cette famille nest pas assez riche pour permettre de modliser grand nombre
des situations alatoires qui se prsentent dans les applications concrtes de la thorie. Pour
plus de dveloppements se reporter lannexe ??, page ??, de ce cours.
1.3.3
Proprits lmentaires des probabilits
(E , A, ) dsigne un espace de probabilit.

Proposition 1.5.
1. Pour tout A, B A tel que A B, (A) (B). En particulier pour tout A A,
(A) 1.
2. Pour tout A, B A, (B \ A) = (B) (A B). En particulier si A B,
(B \ A) = (B) (A).
3. Pour tout A, B A, (A B) = (A) + (B) (A B).
4. Pour tout A A, (Ac ) = 1 (A).
Dmonstration : 1) On remarque que B = (B \ A) A car A B. De plus (B \ A) A = .
Do (B) = (A) + (B \ A) (A) lgalit rsultant de ce que lunion est disjointe. On
conclut par laxiome 2 des mesures. Pour la deuxime partie prendre B = E .
2) rsulte de lgalit ensembliste (B \ A) (A B) = B avec (B \ A) (A B) = . Pour la
deuxime partie remarquer que si A B, A B = A.
3) rsulte de A B = (A \ B) B o lunion est disjointe.
4) rsulte de Ac = E \ A avec A E . 2
Pour dmontrer lingalit de Bonferroni nous aurons besoin du rsultat ensembliste suivant
laiss en exercice :
Proposition 1.6.
Soit (An )N une suite de parties dun ensemble E . Posons B0 := A0 et, pour tout entier k 1,
Bk := Ak \ (A0 A1 Ak1 ) . Alors, pour tout entier n 0, Bn An et la suite (Bn )N est
n
n
[
[
forme de parties deux deux disjointes vrifiant, pour tout entier naturel n,
Bk =
Ak ,
k=0
et
+
[
k=0
Bk =
+
[
k=0
Ak .
k=0

Dmontrer la proposition 1.6.
Ce rsultat est souvent utile pour se ramener des familles de parties deux deux disjointes
car, du fait de laxiome de -additivit, il est beaucoup plus facile de manipuler des runions
CT U
Besancon
12

de parties de E deux deux disjointes. Voici une illustration de cette remarque dans la
dmonstration ci-dessous de lingalit de Bonferroni.
Proposition 1.7.
Ingalit de Bonferroni ou proprit de sous-additivit
Pour toute suite (An )N dlments de A,
! +
+
[
X
Ak
(Ak ).
k=0
k=0
En consquence, une runion dnombrable dvnements ngligeables pour est ngligeable.

Dmonstration : On applique la -additivit des mesures la suite (Bn )N de la proposition 1.6
et on utilise les proprits lmentaires des probabilits nonces dans la proposition 1.5. 2
La formule de Poincar ci-dessous, quon admettra , gnralise au cas de n vnements la
relation 3) de la proposition 1.5, page 11, tablie pour deux vnements (la dmonstration
peut se faire par rcurrence sur lentier n, une autre dmonstration utilisant les proprit de
lintgrale sera propose au chapitre III dans lexemple 3.9, page 37).
Proposition 1.8.
Formule de Poincar
Pour toute suite (A1 , A2 , , An ) dlments de A,
! k=n
!
k=n
X
X
[
(1)k+1
Ak =
(Ai1 Ai2 Aik ) .
k=1
1i1 <i2 <<ik n
k=1
Proposition 1.9.
Thorme de continuit monotone
1. Pour toute suite (An )N dlments de A, croissante au!sens de linclusion, ((An ))N est
+
[
une suite relle croissante convergeant vers
Ak c--d
k=0
+
[
!
Ak
= lim (An ).
n+
k=0
2. Pour toute suite (An )N dlments de A, dcroissante au sens de linclusion,

la suite
!
+
\
((An ))N est une suite relle dcroissante convergeant vers
Ak c--d
k=0
+
\
k=0
!
Ak
= lim (An ).
n+
Dmonstration : 1) Soit (An )N suite croissante dlments de A. Utilisons la suite construite

dans la proposition 1.6. Comme la suite (An )N est croissante, pour tout entier n 1,
CT U
Besancon
13
Bn = An \ An1 et B0 = A0 . (Bn )N est une suite dlments de A deux deux disjoints

+
+
[
[
avec
Ak =
Bk . Il vient
k=0
k=0
+
[
!
Ak
k=0
+
[
!
Bk
k=0
= (A0 ) + lim
n
+
X
(Bk ) = (A0 ) +
k=0
k=n
X
+
X
((Ak ) (Ak1 ))
k=1
((Ak ) (Ak1 )) = lim (An ).

n
k=1
Do la premire partie.
2) Comme est une probabilit,
+
\
!
=1
Ak
k=0
+
[
!
Ack
k=0
Or (Acn )N est une suite

! croissante dlments de A. Daprs la premire partie de la dmon+
[
stration,
Ack = lim (Acn ). Par suite
k=0
+
\
k=0
!
Ak
= lim (1 (Acn )) = lim (An ).

n
Do la deuxime partie. 2
1.4
Fonctions de rpartition
La possibilit de dfinir une probabilit sur une tribu partir de la connaissance des valeurs
de cette mesure sur une sous-famille de la tribu, rsulte dun thorme de prolongement assez
technique que nous nnoncerons pas. En revanche, il est souvent utile de montrer quil existe
une unique probabilit sur la tribu qui prend des valeurs seulement connues sur une sous-famille
de la tribu.
Lunicit dans le cas des probabilits rsulte dun thorme, appel thorme dunicit, qui
dcoule lui-mme du thorme des classes monotones quon admettra, dont il est utile de
connatre lnonc. Commenons tout dabord par donner deux dfinitions :
Dfinition 1.16.
Une famille M de parties de E est appele une classe monotone sur E si elle vrifie les trois
axiomes suivants :
1. E M.
2. Si A M et B M avec B A, alors A \ B M.
3. Si (An )N est une suite croissante au sens de linclusion dlments de la famille M, alors
+
[
An M.
n=0
CT U
Besancon
14

De faon analogue la dfinition correspondante pour les tribus, si J est une famille de parties
de E , on appellera classe monotone engendre par J la plus petite classe monotone sur
E contenant tous les lments de la famille J . On vrifie aisment que la classe monotone
engendre par J est lintersection de toutes les classes monotones sur E contenant tous les
lments de la famille J .
Moyennant ces deux dfinitions le thorme des classes monotones snonce :
Proposition 1.10.
Thorme des classes monotones (admis)
Soit J une famille, stable par intersections finies, de parties dun ensemble E , alors la classe
monotone engendre par J concide avec la tribu engendre par J .
Une application importante de ce thorme est le thorme dunicit sur les probabilits :
Proposition 1.11.
Thorme dunicit pour les probabilits
Soit C une famille, stable par intersections finies, de parties dun ensemble E . Soit A la tribu
engendre par C, i.e. A = ( C). Si et sont deux probabilits dfinies sur lespace (E , A)
telles que, pour tout A C, (A) = (A), alors, pour tout A A, (A) = (A), i.e. = .
Dmonstration : Notons H la famille des vnements A A tels que (A) = (A). Daprs
litem 1 de la proposition 1.9, on vrifie aisment que H est une classe monotone qui contient la
famille C. Donc H contient la classe monotone engendre par C. Comme, par hypothse C est
stable par intersections finies, daprs le thorme des classes monotones, la classe monotone
engendre par C concide avec la tribu engendre par C, cest--dire A. Finalement, pour tout
A A H, (A) = (A). 2
Ce rsultat montre que pour prouver que deux probabilits sont gales, il suffit de mettre en
vidence quelles concident sur une famille engendrant la tribu, stable par intersections finies.
Cette remarque justifie la dfinition suivante :
Dfinition 1.17.
Une famille de parties dun ensemble non vide E stable par intersections finies est appele un
-systme de parties de E .
Par exemple, si nous prenons E = R, la famille C de tous les intervalles de R de la forme
] , x] o x parcourt R, est un -systme de parties de R. De plus C engendre la tribu
borlienne de R car, pour tout rel a et b avec a < b, ]a, b] =] , b]\] , a]. Le thorme
dunicit 1.11 appliqu C et R muni de la tribu de Borel devient alors :
Proposition 1.12.
Lemme dunicit pour les probabilits sur R
Soient et deux probabilits sur R.
Si pour tout x R (] , x]) = (] , x]), alors = .
Ce rsultat a pour consquence que pour identifier une probabilit sur R, il suffit didentifier
lapplication F de R dans [0, 1], dfinie, pour tout x R, par F (x) := (] , x]).
CT U
Besancon
15
Dfinition 1.18.
On dit que F est la fonction de rpartition de la probabilit , en abrg f.r. .
Avec ces notations on peut noncer autrement le lemme dunicit pour les probabilits sur R :
Proposition 1.13.
Deux probabilits sur R sont identiques si, et seulement si, elles ont la mme fonction de
rpartition.
Exemples 1.8.
1) La f.r. de a , o a R, est 1l[a,+[ .
2) La f.r. de B(p) est p1l[1,+[ + (1 p)1l[0,+[ .
3
1
3
1
3) La f.r. de 0 + N 1 (0, 1) est 1l[0,+[ + F o F dsigne la f.r. de la probabilit N 1 (0, 1).
4
4
4
4
Les valeurs de la fonction de rpartition de la probabilit N 1 (0, 1) sont "tabules". On trouvera la tables des valeurs de la fonction de rpartition de la probabilit normale standard,
appele communment table de la loi normale centre-rduite, avec un mode demploi
dans lannexe B, page 211, de ce cours.
A titre dentranement, on pourra galement chercher exprimer les fonctions de rpartition
des probabilits E() et U([a, b]) (On trouvera leur expression dans le formulaire reproduit en
annexe A, page 205.

1
Soit F lapplication de R dans R dfinie, pour tout rel x, par F (x) := 1 e x si x 0,
2
1 x
et F (x) := e si x 0. Montrer que F est la fonction de rpartition dune probabilit
2
densit quon dterminera.
Proposition 1.14.
Soit une probabilit sur R de fonction de rpartition F . Alors
1. F est croissante sur R et admet des limites droite en tout point de R {} et
gauche en tout point de R {+}. De plus F est continue--droite sur R,
lim F (x) = 0 et
lim F (x) = 1.
x+
2. Pour tous rels a, b avec a < b :

(a) (]a, b]) = F (b) F (a) et (] , a[) = F (a) o F (a) dsigne la limite-gauche de F au point a.
(b) ({a}) = F (a) F (a).
(c) F est continue en a si, et seulement si, ({a}) = 0.
Dmonstration : 1) Soient x, y des rels vrifiant x y . Comme ] , x] ] , y ] il vient
F (x) = (] , x]) (] , y ]) = F (y ). Donc F est croissante sur R.
CT U
Besancon
16

Pour montrer que F admet une limite--gauche, considrons un point a de R{+} et posons
l := sup F (x). l est dans R puisque F est borne par 1. Soit > 0, il existe x0 < a tel que
x<a
l F (x0 ) > l . Donc, pour tout x ]x0 , a[, l F (x) F (x0 ) > l c--d |F (x) l| < ,
ce qui donne lexistence de la limite--gauche en a pour F .
On montre de mme lexistence dune limite--droite F (a+) := inf F (x).
x>a

+
\
1
1
est dcroissante et
La suite dintervalles ] , a + ]
] , a + ] =] , a], donc
n N
n
k=0
par le thorme de continuit monotone 1.9 de la page 12

1
(] , a]) = lim ] , a + ]
n
n

1
c--d F (a) = lim F a +
= F (a+) car la limite--droite existe au point a. F est donc
n
n
continue--droite en tout point de R.
+
\
La suite dintervalles (] , n])N est dcroissante et
], n] = . La suite (] , n])N
n=0
est croissante et
+
[
] , n] = R. Par application du thorme de continuit monotone ces
n=0
deux dernires suites, on obtient les valeurs des limites de F en et +.

2-a) (]a, b]) = (] , b]) (] , a]) car ]a, b] =] , b]\] , a]. Do le premier
rsultat.
[
1
Comme ] , a[=
] , a ] et que F admet une limite--gauche en a daprs la
n
n1
premire partie,

1
1
(] , a[) = lim (] , a ]) = lim F a
= lim F (x) = F (a).
n+
n+
xa,x<a
n
n
ce qui donne le second rsultat.
2-b) On peut crire {a} =], a]\], a[. Par suite, ({a}) = (], a])(], a[) =
F (a) F (a).
2-c) F est continue en a si, et seulement si, F (a) = F (a) c--d ({a}) = 0, daprs 2-b. 2

Montrer que, pour tout rel x, N 1 (0, 1) ({x}) = 0 et en dduire que la probabilit N 1 (0, 1)
ne peut pas scrire comme combinaison linaire de probabilits de Dirac.
1. Montrer que si est une probabilit admettant une densit sur R, alors pour tout
rel a, ({a}) = 0, cest--dire tout singleton est ngligeable pour . On dit dans ce
cas que la probabilit est diffuse sur R.
2. Avec les notations de la proposition prcdente, montrer que pour tous rels a, b
vrifiant a < b, (]a, b[) = F (b) F (a) et ([a, b[) = F (b) F (a).
CT U
Besancon
17
Exercice 1.18. (Corrig

de lexercice : page 151)

1 4
9
Calculer U([0, 1]) [ , ] , U([0, 1]) (Q) , E(2) {} [ , 7] .
6 3
2
On admettra le rsultat suivant, rciproque de litem 1 de la proposition 1.14, qui prouve quil y
a bijection entre lensemble des probabilits sur R et lensemble des fonctions sur R, croissantes,
continues--droite sur R, telles que lim F (x) = 0 et lim F (x) = 1 (cf. [3] exercice I-16) :
x
x+
Proposition 1.15.
Si F est une application croissante de R dans [0, 1], continue--droite sur R avec
lim F (x) = 0 et
lim F (x) = 1,
x+
alors il existe une unique probabilit sur R dont F est la fonction de rpartition.
Donner une reprsentation graphique de lapplication
3
1
F : t R 7 F (t) = (t + 2)1l[1,0[]1,2[ (t) + 1l[0,1] (t) + 1l[2,+[ (t),
4
4
et montrer que F est la fonction de rpartition dune probabilit densit quon prcisera.
CT U
Besancon
18
CT U
Besancon
Chapitre 2. Loi dun vecteur alatoire
19
Chapitre 2
Loi dun vecteur alatoire

2.1
Remarques sur la modlisation de lalatoire
Le but de ce premier paragraphe est de fournir quelques lments de rflexion sur la modlisation mathmatique de phnomnes alatoires. Pour une analyse plus approfondie sur lintrt
dintroduire la notion de variable alatoire et de loi de probabilit, on pourra consulter lannexe
??, page ??.
Considrons les deux situations suivantes :
2.1.1
Cas discret
Une personne sintresse la somme des valeurs obtenues dans le lancer simultan de deux ds
quilibrs. On modlisera lensemble des issues possibles de cette exprience alatoire par
:= {(i, j) N2 /1 i, j 6}.
Les vnements peuvent tre modliss par des parties de . On peut prendre comme tribu
des vnements lensemble P() de toutes les parties de . Les ds tant quilibrs, on
choisira pour probabilit P sur (, P()) lquiprobabilit sur i.e. pour tout (i, j) ,
1 X
1
ou encore P =
(i,j) .
P({(i, j)}) =
36
36 1i,j6
Le triplet (, P(), P) reprsente le modle mathmatique permettant de traiter la situation.
Cependant comme on sintresse plutt la somme des valeurs obtenues, lvnement "La
somme des valeurs obtenues appartient A", o A est un borlien de R, se modlise par la
partie eA de forme des couples (i, j) tels que i + j A. On peut aussi crire lvnement eA
grce au langage des applications en notant X lapplication de dans R qui, tout = (i, j),
associe X () = i + j et en remarquant que eA = { /X () A} = {X A} c--d que
eA est limage-rciproque de A par lapplication X . On remarque enfin que ce qui est important
pour notre tude du phnomne cest de connatre la valeur de P(eA ) = P(X A) pour tout
borlien A de R.
CT U
Besancon
20
2.1.2
Cas continu
Envisageons maintenant le cas dun ingnieur hydraulicien qui sintresse aux risques dinondation
par un fleuve dans lintention de construire une digue protectrice. Pour cela il va considrer
lvolution de la hauteur du niveau de leau sur lanne. Cela revient considrer la hauteur sur
une anne comme une application continue de [0, 1] dans R+ . Lensemble des issues possibles
de ce phnomne alatoire peut tre modlis par := C([0, 1], R+ ) ensemble des applications
continues de [0, 1] dans R+ . Comme pour R, et contrairement ce quon a fait pour le cas
prcdent, il nest pas possible de prendre P() comme tribu sur . On considrera une tribu
F plus petite quon ne prcise pas pour linstant. De mme on ne prcisera pas la probabilit P
dfinie sur F. On verra plus loin quau fond ce nest pas ncessaire, seule lexistence du triplet
(, F, P) devant tre assure.
En fait lingnieur sintressera surtout aux vnements de la forme "La hauteur maximale
du niveau du fleuve sur une anne appartient A" o A est un intervalle de R. Cet vnement se modlise par la partie eA de forme des fonctions C([0, 1], R+ ) telles que
sup0t1 (t) A. On peut aussi crire lvnement eA grce au langage des applications en
notant X lapplication de dans R qui tout associe X () = sup0t1 (t) et en remarquant que eA = { /X () A} = {X A} c--d que eA est limage-rciproque de A par
lapplication X .
Pour que lexpression P(X A) ait un sens, il faudra sassurer (ou imposer) plus gnralement
que, pour tout borlien A de R, limage-rciproque de A par lapplication X soit un lment
de F. Car, comme dans la situation prcdente, cest la valeur de P(X A) qui intressera
lingnieur, c--d lapplication PX : A F 7 P(X A). PX est une probabilit sur R donc
un objet mathmatique beaucoup plus facile manipuler quune probabilit sur une tribu de
C([0, 1], R+ ).
2.1.3
Principe de modlisation
En conclusion de ces deux exemples on notera que, en pratique, modliser mathmatiquement

un phnomne alatoire revient introduire :
1. un triplet (, F, P), sans en prciser davantage les termes, comme un espace de
probabilit abstrait,
2. une application X : 7 Rd telle que, pour tout borlien A de Rd , limage-rciproque
de A par lapplication X soit un lment de F.
Cest alors lapplication PX : A F 7 P(X A) qui sera lobjet important du modle, celui
qui traduira mathmatiquement le problme particulier qui intresse lingnieur au sein de la
situation alatoire globale.
Dans la suite de louvrage le triplet (, F, P) dsignera un espace de probabilit pris comme
rfrence et quelquefois appel espace de base . Les ensembles mesurables relativement F
seront appels vnements de .
CT U
Besancon
2.2
21
Applications mesurables
Dfinition 2.1.
Soient (E , A) et (F , B) deux espaces mesurables, une application f de E dans F est dite
( A, B)-mesurable si, pour tout B B, {f B} A.
Dans les cas o (E , A) est quelconque et (F , B) := (Rk , B(Rk )), on dit simplement
A-mesurable au lieu de ( A, B(Rk ))-mesurable.
Une application A-mesurable valeurs dans R est une application ( A, B(R))-mesurable.
La proposition suivante donne un premier exemple dapplications mesurables :
Proposition 2.1.
Soit A une partie de E . Alors 1lA est A-mesurable si, et seulement si, A A.
Dmonstration : On remarque que si B est un borlien de R, limage rciproque de B par 1lA
est lun des ensembles , A, Ac , ou E . Ce qui prouve par dfinition de la mesurabilit que 1lA
est A-mesurable si, et seulement si, A est A-mesurable. 2
Dfinition 2.2.
Dans les cas o (E , A) := (Rn , B(Rn )) et (F , B) := (Rk , B(Rk )) on dit que f est borlienne
pour exprimer quelle est ( B(Rn ), B(Rk ))-mesurable.
La proposition suivante donne des classes importantes de fonctions borliennes qui correspondent la plupart des cas quon considrera par la suite. Pour une dmonstration dune partie
de la proposition on pourra consulter [2] exercice I-10.
Proposition 2.2.
(admis)
Toute application continue de Rn dans Rk est borlienne. Toute application monotone de R
dans R est borlienne. Toute drive dune application drivable de R dans R est borlienne.
Soit f une application borlienne de Rk dans Rd et une application A-mesurable de E
dans Rk . Montrer que lapplication f est une application A-mesurable de E dans Rd .
Comme pour la notion densemble mesurable, les applications mesurables correspondent aux
applications sur lesquelles la thorie de la mesure permet de dire quelque chose dintressant.
On doit sattendre ce que toutes les applications quon est amen manipuler dans la pratique
soient mesurables.
Introduisons la notation suivante qui est utile pour tendre une proprit, vraie pour la classe
des fonctions positives, la classe des fonctions de signe quelconque :
Dfinition 2.3.
Si f est une application dun ensemble E dans R notons f + := sup(f , 0) et f := sup(f , 0).
Les applications f + et f sont appeles respectivement la partie positive et la partie
ngative de f .
CT U
Besancon
22

On vrifie aisment que ce sont des applications valeurs dans [0, +] telles que |f | = f + +f
et f = f + f .
Exemples 2.1.
Supposons E := R, si f (x) = x, f + (x) = x1l[0,+[ (x) et f (x) = x1l],0] (x).
Grosso modo les oprations classiques sur les applications mesurables conservent la mesurabilit.
Plus prcisment, on admettra :
Proposition 2.3.
1. Si f et g sont des applications A-mesurables dun ensemble E dans Rd et un rel,
alors f , hf , g i, f + g , |f | sont des applications A-mesurables, o h, i et | | dsignent
respectivement les produit scalaire et norme usuels de Rd .
2. Si f et g sont des applications A-mesurables dun ensemble E dans R, alors f + , f sont
des applications A-mesurables.
3. Si (fn )N est une suite dapplications A-mesurables dun ensemble E dans R, Alors
supnN (fn ), inf nN (fn ) sont des applications A-mesurables.
4. Si (fn )N est une suite dapplications A-mesurables dun ensemble E dans Rd convergeant
simplement vers une application f , alors sa limite f est A-mesurable.
Dfinition 2.4.
Une application A-mesurable f est dite tage sur E si elle est valeurs dans R et si elle
ne prend quun nombre fini de valeurs distinctes.
Si on note 1 , 2 , , n les valeurs deux deux distinctes dune application tage f et si on
pose, pour tout entier k vrifiant 1 k n, Ak := {x E / f (x) = k }, alors f scrit sous
la forme
n
X
k 1lAk .
f =
k=1
Cette criture sappelle la dcomposition canonique de f . On vrifie aisment que la dcomposition canonique dune application tage est unique.
Lintrt de cette dfinition rside dans la proposition suivante. Pour la dmonstration on pourra
consulter [2] exercice I-13.
Proposition 2.4.
Lemme fondamental (admis)
Toute application A-mesurable de E dans [0, +] est la limite dune suite croissante
dapplications A-mesurables tages et positives.
Ce lemme est la base dune technique de dmonstration utilise en probabilits lorsquon veut
montrer que les applications A-mesurables possdent une certaine proprit P. Pour cela, on
montre que les indicatrices 1lA , o A A, vrifient P, puis on montre quil en est de mme
n
X
pour les applications A-mesurables de la forme
i 1lAi o i R+ et Ai A, 1 i n.
i=1
CT U
Besancon
23
On montre ensuite, en utilisant le lemme fondamental, que la proprit P est encore vrifie par
les applications A-mesurables positives, puis par les applications A-mesurables quelconques f
en remarquant que f = f + f o f + := sup(f , 0) et f := sup(f , 0) sont des applications
A-mesurables positives. Cette technique de dmonstration est souvent appele "technique
des fonctions tages" .
2.3
2.3.1
Loi dune variable alatoire

Variables alatoires
Paralllement aux dfinitions introduites ci-dessus, une terminologie diffrente est utilise en
probabilit pour les applications mesurables dans le cas o (E , A) est lespace mesurable de
base (, F).
Dfinition 2.5.
Si (E , A) := (, F) et (F , B) = (Rd , B(Rd )), une application ( F, B(Rd ))-mesurable
sappelle un vecteur alatoire , ou variable alatoire vectorielle, de dimension d.
Un vecteur alatoire de dimension d = 1 sappelle aussi une variable alatoire relle en
abrg v.a.r. .
On peut tre quelquefois amen considrer des variables alatoires valeurs dans R, ce sont
les applications ( F, B(R))-mesurables de dans R.
Les variables alatoires sont traditionnellement notes par des lettres majuscules X , Y , . . .
La proposition suivante est lnonc avec un vocabulaire diffrent du rsultat de lexercice 2.1
de la page 21 sur la composition des applications mesurables.
Proposition 2.5.
Si f est une application borlienne de Rk dans Rd et X un vecteur alatoire de dimension k,
alors lapplication f X est un vecteur alatoire de dimension d.
Dmonstration : Il suffit pour cela de remarquer que si B est un borlien de Rd , alors limagerciproque de B par f X est (f X )1 (B) = X 1 [(f 1 (B)] et dappliquer ensuite la dfinition
de la mesurabilit de f et X . 2
On notera dans la suite par abus f (X ) au lieu de f X . Par exemple, on crira e X pour exprimer
lapplication compose de lapplication exponentielle et de la variable alatoire relle X .
Proposition 2.6.
X = (X1 , X2 , , Xd ) un vecteur alatoire de dimension k si, et seulement si, pour tout
i = 1, 2, , d, Xi est une variable alatoire relle.
Dmonstration : La dmonstration est une consquence directe de la proposition 2.5 o on
prend pour f les projections de Rd sur R. 2
CT U
Besancon
24

Deux vecteurs alatoires X et Y de dimension d sont gaux presque-srement si, et seulement
si, P(X 6= Y ) = 0. Lgalit presque-sre est une relation dquivalence sur lensemble des
vecteurs alatoires de dimension d.
2.3.2
Loi dune variable alatoire
Proposition 2.7.
Soit X un vecteur alatoire de dimension d. Lapplication
PX : B B(Rd ) 7 PX (B) := P ({X B}) [0, 1]
est une probabilit sur Rd .
Dmonstration : On rappelle la notation {X B} := { / X () B} et on notera que
{X B} F, ce qui donne bien un sens P({X B}).
Soit B B(Rd ), PX (B) = P({X B}) [0, 1]. De plus, comme {X Rd } = ,
PX (Rd ) = P({X Rd }) = P() = 1. Soit (An )N une suite deux deux disjointe de borliens
de Rd , alors
(
)
[
[
X
Ak =
{X Ak }
kN
kN
lunion du second membre tant deux deux disjointe. Par suite

!
!
!
[
[
[
PX
Ak
= P X
Ak = P
{X Ak }
kN
kN
X
kN
P(X Ak ) =
kN
PX (Ak )
kN
do la -additivit de PX . 2
Dfinition 2.6.
La probabilit PX est appele la loi de probabilit relativement P du vecteur alatoire
X ou plus simplement la loi de X .
On notera que cette loi dpend de X mais aussi de la probabilit P de lespace de probabilit
de base.
On admettra le rsultat thorique suivant dmontr dans [3] exercice I-16 :
Proposition 2.8.
Si est une probabilit sur R, alors il existe un espace de probabilit de base (, F, P) et une
variable alatoire relle X sur cet espace telle que PX = .
Exemples 2.2.
Soit X une variable alatoire relle de loi N 1 (0, 1) (on notera quune telle affirmation a un
sens daprs la proposition prcdente). Dterminons la loi de la variable alatoire relle
Y := X 2 .
CT U
Besancon
25
Pour cela il suffit didentifier la fonction de rpartition FY de la variable alatoire relle Y

i.e. la f.r. de la probabilit PY . Soit y R,
FY (y ) = PY (] , y ]) = P(Y ] , y ]) = P(Y y ).
Remarquons que, si y < 0, {Y y } = {X 2 y } = et, si y 0,
{Y y } = {X 2 y } = { y X y }.
Par suite si y < 0, FY (y ) = 0, et si y 0,
FY (y ) = P( y X y ) = PX ([ y , y ]) = FX ( y ) FX ( y )
Z y
Z y
1
1 1 t2
x2
e 2 dt =
dx.
=
e
2
2x
0
y
On notera quon a utilis dans la troisime galit la continuit ( gauche) de FX . Le
rsultat prcdent montre que la f.r. de PY peut scrire
Z y
x
1
(x)dx avec (x) :=
FY (y ) = PY (] , y ]) =
e 2 1l]0,+[ (x).
2x
La loi de Y , PY , est la probabilit sur R admettant pour densit. Elle appartient la

famille des lois gamma , voir la dfinition dans le formulaire de lannexe A, page 205. On
la note ( 21 , 12 ). 2
Soit X une variable alatoire relle de loi N 1 (0, 1). En utilisant une dmarche analogue
celle adopte dans lexemple prcdent, montrer que la loi de la variable alatoire relle
Y := e X admet pour densit la fonction dfinie sur R par

1
1
2
(x) := exp (ln x) 1l]0,+[ (x).
2
x 2
On dit que Y suit la loi Log-normale standard .
On considre une variable alatoire relle X dont la fonction de rpartition est donne par
FX (t) :=

1 t
e 1l],0] (t) + (2 e t )1l]0,+[ (t) .
2
Dterminer la loi de la variable alatoire relle Y = |X |.

Dfinition 2.7.
Soient m R et > 0. Nous appellerons loi de Gauss-Laplace de paramtres m et 2 ,
et noterons N 1 (m, 2 ), la probabilit sur R admettant pour densit la fonction dfinie sur
R, pour tout rel x, par

1
(x m)2
(x) := exp
.
2 2
2
CT U
Besancon
26

Le rsultat suivant est souvent utile dans les calculs pratiques en permettant de se ramener
des variables de loi de Gauss-Laplace standard :
Proposition 2.9.
Procd de standardisation
Avec les notations prcdentes, une variable alatoire relle X suit la loi N 1 (m, 2 ) si, et
X m
suit la loi N 1 (0, 1).
seulement si, la variable alatoire relle Z :=

Dmontrer le rsultat prcdent.
Dfinition 2.8.
Une v.a. X valeurs dans Rd est dite discrte si sa loi est discrte.
Les variables alatoires relles discrtes constituent une famille de v.a.r importante dans les
applications des probabilits, une autre classe de v.a.r. trs importante aussi est celle des v.a.r.
densit.
Dfinition 2.9.
Une variable alatoire relle est dite densit (ou absolument continue) sur R si sa loi est
densit sur R.
Exemples 2.3.
1) Les variables alatoires relles de Poisson, de Bernoulli, binomiale, hypergomtrique,
gomtrique, uniforme-discrte sont des exemples de v.a.r. discrtes.
2) Les v.a.r. de Gauss-Laplace, exponentielle, uniforme sur un intervalle de R sont des
exemples de v.a.r. densit sur R.
Pour les dfinitions des lois usuelles (discrtes ou densit), on pourra se reporter au formulaire
de lannexe A, page 205, de ce cours.
Montrer que si X est une variable alatoire relle de loi
X
PX :=
pn n
nN
o (pn )N est une suite de rels positifs ou nuls, alors pn = P(X = n) pour tout n N.
On notera quon peut avoir affaire des probabilits qui ne sont ni discrtes ni densit. Par
exemple, on peut avoir des probabilits dfinies sur R, telles = 1 +2 o 1 est une mesure
densit (mais pas une probabilit) et 2 une mesure discrte (mais pas une probabilit), cest-dire quil existe une application f (par exemple positive et continue sur R), et une suite de
Z +
+
X
rels positifs (n )N , avec
f (t) dt +
n = 1, telle que, pour tout intervalle ]a, b[ de R,
n=0
Z
(]a, b[) =
f (t) dt +
a
CT U
Besancon
+
X
n n (]a, b[).
n=0

Z
f (t) dt et 2 (]a, b[) =
Dans ce cas 1 (]a, b[) =

a
f (t) dt = 1 et
n n (]a, b[). Comme on na pas nces-
n=0
sairement
+
X
27
+
X
n = 1, les mesures 1 et 2 ne sont pas des probabilits.
n=0
Les variables alatoires relles discrtes sont les variables alatoires relles valeurs presquesrement dans un ensemble dnombrable. De faon prcise :
Proposition 2.10.
Un vecteur alatoire X de dimension d est discret si, et seulement si, il existe une partie
D := {ek , k K N} de Rd telle que P(X D) = 1. Dans ce cas la loi du vecteur alatoire
X scrit
X
PX =
P (X = ek ) ek .
kK
Dmonstration : Soit X une v.a. telle quil existe une partie dnombrable D de Rd avec
X D := {ek , k K N} presque-srement i.e. P(X D) = 1.
Soit A un borlien de Rd , on a PX (A) = PX (A D) = P(X A D). Comme
[
{X = x}
{X A D} =
xAD
et que lunion est mutuellement disjointe, on peut crire

X
X
X
X
PX (A) =
P(X = x) =
P(X = x)1lA (x) =
P(X = x)x (A) =
P (X = ek ) ek (A).
xAD
xD
xD
La v.a. X est donc discrte et sa loi est PX =
kK
P (X = ek ) ek .
XkK
Rciproquement soit X une v.a. de loi =
pn en o (pn )K est une suite (finie ou infinie) de
nK
rels strictement positifs avec K N, et (en )K une suite (finie ou infinie) dlments de Rd .
Prenant D := {en /n K }, on a P(X D) = 1 et, pour tout n K , P(X = en ) = pn . 2
On dit aussi dans ce cas que la loi de X est porte par D, ou encore que X a ses valeurs
presque-srement dans D, pour exprimer P(X D) = 1. On notera que D est une partie
dnombrable (finie ou infinie) de Rd .
Ce rsultat ramne alors la dtermination de la loi dune variable alatoire relle discrte au
calcul des coefficients P(X = ak ) qui interviennent dans son criture. Il explique aussi le choix
de certains auteurs de manuels scolaires de dfinir la loi dune variable alatoire relle valeurs
dans N comme tant lapplication n N 7 P(X = n). En fait cette dfinition nest pas judicieuse car elle ne se gnralise pas au cas des variable alatoire relle densit. En effet, pour
une variable alatoire relle densit, pour tout rel x, P(X = x) = PX ({x}) = 0 daprs ce qui
a t vu au premier chapitre. Par suite lapplication x R 7 P(X = x) est lapplication-nulle
pour toute variable alatoire relle X admettant un densit, ce qui ne prsente plus dintrt.
La proposition prcdente sera notamment applique dans le cas o les variable alatoire relle
sont entires i.e. prennent leurs valeurs dans N ou Z.
CT U
Besancon
28

Proposition 2.11.
Toute variable alatoire relle X valeurs dans N, resp. Z, est discrte. Sa loi scrit alors
X
X
PX =
P(X = k)k , resp. PX =
P(X = k)k .
kN
kZ
Dmonstration : Prendre D = N (resp. D = Z).2

Soit X une variable alatoire dont la fonction de rpartition F est dfinie pour tout nombre
1
o n est lunique entier
rel x, par F (x) = 0 si x < 1 et, si x 1, par F (x) = 1
n(n + 1)
strictement positif (dpendant de x) tel que n x < n + 1.
1. Donner une reprsentation graphique de la fonction F et expliquer brivement
pourquoi cest bien une fonction de rpartition.
2. Calculer, pour tout entier naturel n, P(X = n).
3. Calculer lesprance de la variable alatoire X .
4. Que peut-on dire de la variance de la variable alatoire X ?
Travail conseill : tudier dans [11], pages 147 171, linterprtation probabiliste laide de
tirages dans une urne, des variable alatoire relle de lois de Bernoulli, binomiale, gomtrique,
de Pascal, binomiale-ngative, hypergomtrique.
CT U
Besancon
Chapitre 3. Moments dun vecteur alatoire
29
Chapitre 3
Moments dun vecteur

alatoire
3.1
Rappels sur lintgration des applications mesurables
(E , A, ) dsigne un espace mesur quelconque.
3.1.1
Intgration des fonctions positives
Notons M+ (E , A) lensemble des applications A-mesurables (positives) dun ensemble E dans

[0, +].
La premire proposition de ce chapitre est fondamentale pour la suite. Elle affirme lexistence
et lunicit dun oprateur dintgration, quon notera E , dfini sur M+ (E , A).
Cet oprateur est construit daprs le procd suivant :
Dans un premier temps, on dfinit cet oprateur sur lensemble E + des applications Amesurables tages et positives de E dans R+ . Pour cela, si E + on considre sa
n
X
k 1lAk o 1 0, 2 0, , n 0 sont les valeurs deux
dcomposition canonique =
k=1
deux distinctes de et, pour tout entier k vrifiant 1 k n, Ak := {x E / f (x) = k }.

Remarquons que Ak A. On pose alors, avec la convention 0(+) := 0,
E () :=
n
X
k (Ak ).
k=1
On remarquera que, par sa dfinition, E () est un nombre positif ventuellement infini

(par exemple si un des (Ak ) est infini avec k > 0) c--d E () [0, +]. Dans un
deuxime temps, on prolonge cet oprateur aux applications de M+ (E , A) en posant, pour
tout f M+ (E , A),

E (f ) := sup E () / E + et f .
Pour une dmonstration dtaille, on se reportera [8], pages 79 85. On remarquera encore
que, par sa dfinition, E (f ) est un nombre positif ventuellement infini c--d E (f ) [0, +].
CT U
Besancon
30

Exemples 3.1.
Considrons E = R et A = B(R) et la mesure de Lebesgue sur R i.e. = . Soit
n
X
=
k 1l]ak1 ,ak ] o a0 < a1 < a2 < < an est un suite strictement croissante de n + 1
k=1
rels, les rels 1 , 2 , , n ntant pas ncessairement deux deux distincts. On dit que
est une fonction en escalier sur R. Alors
E () :=
n
X
k (]ak1 , ak ]) =
k=1
n
X
k (ak ak1 ).
k=1
Dans ce cas, E () reprsente la mesure de laire situe sous la courbe reprsentative de

. 2
On notera quune fonction en escalier est borlienne et tage sur R mais que, par exemple,
1lQ est borlienne et tage sur R sans tre en escalier.
La proposition suivante caractrise loprateur E par trois proprits fondamentales (pour la
dmonstration voir [8], page 84).
Proposition 3.1.
Thorme fondamental de lintgration par rapport une mesure (admis)
1. Si est une mesure sur (E , A), il existe une application note E , et une seule, de
M+ (E , A) dans [0, +] possdant les trois proprits suivantes :
(a) Pour tout A A, E (1lA ) = (A).
(b) Pour tous f et g appartenant M+ (E , A) et tout rel 0.
E (f + g ) = E (f ) + E (g ) et E (f ) = E (f ),
avec la convention 0(+) := 0.
(c) Proprit de convergence monotone de Beppo-Lvi
Pour toute suite croissante (fn )N dlments de M+ (E , A),

lim E (fn ) = E lim fn .
n+
n+
2. Soient f et g deux lments de M+ (E , A). Si f g , alors E (f ) E (g ).

On notera bien quon peut avoir E (f ) = + et quon ne parle dans cette proposition que
dapplications mesurables et positives. Celles de signe quelconque seront considres plus loin.
On trouve, suivant les ouvrages ou les usages, diffrentes notations pour E (f ) :
Z
Z
Z
E (f ) =
f d =
f (x)d(x) =
f (x)(dx).
E
E sappelle loprateur dintgration sur E suivant . E (f ) sappelle lintgrale de f

sur E suivant .
CT U
Besancon
31
La proposition prcdente est un thorme dexistence et dunicit mais ne permet pas

dexpliciter directement le nombre E (f ) si ce nest dans des cas simples. Par exemple :
Exemples 3.2.
1) Si f est lapplication f =
n
X
ai 1lAi , o (A1 , A2 , , An ) est une famille finie dlments
i=1
de A et (a1 , a2 , , an ) une famille de rels positifs, alors

E (f ) =
n
X
ai (Ai ).
i=1
2) Si := 0 + 5 + et f := 1l[0, 1 ] + 1l[6,10] + 31l{5} , alors

3
R
R
f d = 34 + 7. 2

Vrifier les affirmations de lexemple prcdent.
Les propositions admises suivantes donnent quelques "rgles dintgration" suivant la mesure
considre. Ces rgles seront suffisantes pour la suite et seront constamment utilises. Elles
diffrent bien sr en fonction des mesures utilises. Commenons par le cas de la mesure de
Lebesgue sur R. Le cas de la mesure de Lebesgue sur Rd avec d 2 sera trait au chapitre
suivant.
Proposition 3.2.
Cas de la mesure de Lebesgue sur R pour les fonctions positives (admis)
On suppose E := R, A := B(R), := o dsigne la mesure de Lebesgue sur R.
Si f est une application borlienne de R dans [0, +] intgrable au sens de Riemann sur
tout intervalle ferm born de R, alors son intgrale sur R suivant est gale son intgrale
gnralise au sens de Riemann c--d
Z +
Z
f (t)dt.
E (f ) =
f (t) d(t) =
Exemples 3.3.
Z
e
R
Z
1l[0,+[ (x)d(x) =
Z
dx = 1 et
x 2 1l[0,+[ (x)d(x) = +.
Proposition 3.3.
Cas de la mesure de Dirac sur Rd (admis)
On suppose E := Rd , A := B(Rd ), := a o a Rd .
Si f est une application borlienne de Rd dans [0, +], alors
Z
f (t) d(t) = f (a).
E (f ) =
Rd
La proposition qui suit gnralise la prcdente :

CT U
Besancon
32

Proposition 3.4.
Cas des mesures discrtes sur Rd (admis)
+
X
d
d
On suppose E := R , A := B(R ), :=
i ai o (ak )N est une suite de vecteurs de Rd
i=0
et (k )N une suite de rels positifs ou nuls.

Si f est une application borlienne de Rd dans [0, +], alors
Z
E (f ) =
f (t) d(t) =
+
X
Rd
i f (ai ).
i=0
Exemples 3.4.
Soient = P() :=
+
X
k=0
k
k la probabilit de Poisson sur R o > 0.
k!
i) Si f est une application borlienne de R dans [0, +], alors
E (f ) =
+
X
k=0
k
f (k)
k!
ii)
Z
x(x 1)1l[1,+[ (x)d(x) =
R
+
X
k=2
k
k(k 1) = 2 .
k!
Exemples 3.5.
Soit (un )N une suite de rels positifs ou nuls.
+
+
X
X
Considrons lapplication f :=
uk 1l{k} et la mesure :=
i . On vrifie aisment que
i=0
k=0
E (f ) =
+
X
uk .2
k=0
Ce dernier exemple montre que la thorie des sries termes rels positifs peut tre considre comme une thorie de lintgration suivant la mesure sur R dite de dnombrement
+
X
:=
i . La thorie de lintgration permet ainsi dunifier dans un mme formalisme ltude
i=0
des probabilits discrtes, qui font intervenir des sries dans les calculs, et celle des probabilits
densit o pratiquement interviennent des intgrales de Riemann classiques.
La proposition suivante ramne le calcul dintgrales suivant les mesures densit au calcul
dune intgrale de Lebesgue sur R quon effectue alors par application de la proposition 3.2.
CT U
Besancon
33
Proposition 3.5.
Cas des mesures densit sur R (admis)
On suppose E := R, A := B(R), une mesure admettant une densit sur R.
Si f est une application borlienne de R dans [0, +], alors,
Z
Z
E (f ) =
f (t) d(t) =
f (t)(t) d(t) = E (f ).
R
Exemples 3.6.
Z
1 2
1
x 2 e 2 x d(x). On est ramen au calcul dune
2
R
R
intgrale suivant la mesure de Lebesgue. Do
Z
Z +
1 2
1
21 x 2
2 1
x 2 e 2 x dx = 1,
x e
d(x) =
2
2
R
Z
x 2 d(x) = 1. 2
c--d
Soit := N 1 (0, 1),
x d(x) =

1. Soient et deux mesures sur (E , A). A laide du thorme fondamental de
lintgration montrer que, pour tout f M+ (E , A), E+ (f ) = E (f ) + E (f ).
x
2. Soient > 0, la mesure
1l[0,1] (x) et
Z sur R de densit dfinie par (x) := e
:= e 1 . Montrer que
e x d( + )(x) = + 1.
R
3. Soient > 0, la mesure sur R de densit dfinie par (x) := e x 1l[1,1] (x) et
Z
Z
+ k
X
x
k . Calculer
e d( + )(x) et
1lR d( + ).
:=
k!
R
R
k=0
La mesure + est-elle une probabilit ?
3.1.2
Intgration des fonctions numriques
Soit f une application A-mesurable de E dans [, +]. Les applications f + := sup(f , 0)

et f := sup(f , 0) sont des applications A-mesurables de E dans [0, +]. Daprs ce qui
prcde les quantits E (f + ) et E (f ) sont des lments de [0, +] ventuellement infinies.
La diffrence E (f + ) E (f ) aura un sens si E (f + ) et E (f ) sont toutes les deux finies.
On pourra alors poser E (f ) := E (f + ) E (f ), do les dfinitions :
Dfinition 3.1.
Une application f de E dans [, +] est dite intgrable sur E suivant ou plus
simplement -intgrable si elle est A-mesurable et si les quantits E (f + ) et E (f ) sont
toutes les deux finies. Dans ce cas on appelle intgrale de f sur E suivant le rel
E (f ) := E (f + ) E (f ).
CT U
Besancon
34

On remarquera que E (f ) R.
On utilise aussi les mmes notations que celles dj vues dans le cas des fonctions positives
pour E (f ).
Proposition 3.6.
Soit f une application A-mesurable de E dans [, +]. Alors f est intgrable si, et seulement
si, E (|f |) est fini.
Dmonstration : |f | = f + + f est une application A-mesurable positive et, daprs litem
1 de la proposition 3.1, E (|f |) = E (f + ) + E (f ). Par suite, f est intgrable si, et seulement si, E (f + ) et E (f ) sont toutes les deux finies c--d si, et seulement si, E (|f |) =
E (f + ) + E (f ) est fini.2
Exemples 3.7.
Z
1) Soit := N 1 (0, 1),
xd(x) = 0.
R
En effet, f + (x) = x1l[0,+[ (x) et f (x) = x1l],0] (x). On vrifie les deux suites dgalits
Z +
1 2
1
te 2 t dt < +
f (x)d(x) =
x1l[0,+[ (x)d(x) =
2 0
R
R
Z 0
Z
Z
1 2
1
te 2 t dt
et
f (x)d(x) =
x1l],0] (x)d(x) =
2
R
R
Z +
1 2
1
=
te 2 t dt < +,
2 0
Z
en vertu de la convergence de la Zdernire intgrale

(gnraliseZau sens de Riemann).
Z
Daprs la dfinition de lintgrale
xd(x) :=
f + (x)d(x) f (x)d(x) = 0.
R
2) Soit := a o a R. Les applications borliennes de R dans [, +] intgrables

suivant a sont celles qui prennent une valeur finie au point a.
En effet, f est a -intgrable si, et seulement si, Ea (|f |) = |f (a)| < + c--d si, et seulement
si, f (a) R. 2
+
X
Soit :=
i ai o, pour tout i N, ai Rd et (k )N est une suite de rels positifs.
i=0
Montrer que les applications borliennes f de Rd dans [, +] intgrables suivant

+
X
sont celles pour lesquelles la srie numrique
i f (ai ) est absolument convergente.
i=0
Les rgles dintgration des fonctions de signe quelconque intgrables sont les mmes que
celles pour les fonctions positives vues dans le cas des mesures discrtes ou densit. On
peut dmontrer cela en crivant les fonctions comme diffrence de leur partie positive et de
leur partie ngative. Par contre dans le cas de la mesure de Lebesgue sur R la proposition 3.2
devient fausse pour les fonctions qui ne sont pas de signe constant. Dans ce cas on utilise si
possible la proposition suivante :
CT U
Besancon
35
Proposition 3.7.
Cas de la mesure de Lebesgue sur R pour les fonctions relles (admis)
On suppose E := R, A := B(R), := o dsigne la mesure de Lebesgue sur R.
1. Si f est une application borlienne de R dans R nulle en dehors dun intervalle ferm
born [a, b] et intgrable au sens de Riemann sur [a, b], alors son intgrale sur R suivant
est gale son intgrale au sens de Riemann sur [a, b], c--d
Z
E (f ) =
f (t) d(t) =
f (t)dt.
a
2. Si f est une application borlienne de R Zdans R intgrable au sens de Riemann sur tout
+
intervalle ferm born de R et telle que
|f (t)|dt < +, alors son intgrale sur R
suivant est gale son intgrale gnralise au sens de Riemann c--d

Z
Z +
E (f ) =
f (t) d(t) =
f (t)dt.
Le thorme prcdent sapplique en particulier lorsque f est continue ou monotone sur un

nombre fini dintervalles de R et nulle en dehors de la runion de ces intervalles.
Nous sommes en mesure maintenant dtendre la dfinition des probabilits densit, considres jusqu prsent uniquement sur R, au cas des probabilits sur les espaces Rd avec d 1.
Cette dfinition sera en particulier utile dans les chapitres IV et V.
Dfinition 3.2.
On appelle densit de probabilit sur Rd toute application borlienne positive de Rd dans
[0, +] vrifiant
Z
d(d) = 1.
Rd
La proposition suivante (admise) montre que la rgle dintgration suivant une mesure de probabilit densit est tout fait analogue celle dj vue pour les fonctions positives.
Proposition 3.8.
Soit une densit de probabilit sur Rd .
1. Lapplication
d
: A B(R ) 7 (A) :=
1lA d(d) [0, 1]
Rd
est une probabilit sur Rd .

On dit que admet pour densit sur Rd et on note = (d) .
2. Si f est une application de Rd dans R borlienne positive, resp. intgrable suivant ,
alors lapplication f est borlienne positive, resp. intgrable suivant (d) , et
Z
Z
E (f ) =
f (t) d(t) =
f (t)(t)d(d) (t).
Rd
Rd
CT U
Besancon
36

Dmontrer la premire partie de la proposition prcdente.
On remarquera que les dfinitions 1.15, page 10, de densit et de probabilit densit introduites
au chapitre I sont bien des cas particuliers de la dfinition donne ci-dessus.
3.1.3
Intgration des fonctions vectorielles
Soit f une application A-mesurable de E dans Rd . Dans la base canonique de Rd , f admet les
composantes f1 , f2 , , fd , o, pour tout entier k d, fk est une application A-mesurable de
E dans R. On crira f := (f1 , f2 , , fd ).
Dfinition 3.3.
On dit que f est intgrable sur E suivant si toutes les applications-composantes
f1 , f2 , , fd sont intgrables sur E suivant . Dans ce cas on appelle intgrale de f sur E
suivant le vecteur de Rd de composantes dans la base canonique E (f1 ), E (f2 ), , E (fd ),
et on note E (f ) := (E (f1 ), E (f2 ), , E (fd )) .

Montrer que f := (f1 , f2 , , fd ) est intgrable suivant si, et seulement si, E (|f |) < +
o | | dsigne la norme usuelle de Rd .
Un cas particulier intressant pour la suite est le cas o f est valeurs dans le plan complexe C quon identifie R2 . On crit alors f := f1 + if2 identifi f := (f1 , f2 ) et on pose
E (f ) := E (f1 ) + iE (f2 ).
A titre dexemple, dveloppons une application de la notion de fonction vectorielle -intgrable.
Soient E := Rn , une probabilit sur Rn et f lapplication dfinie sur Rn valeurs dans C, par
f (x) := exp (ihx, ui) o u est un vecteur fix de Rn , h, i et | | les produit scalaire et norme
usuels de Rn .
Alors f1 (x) := coshx, ui et f2 (x) := sinhx, ui. Do, pour k = 1 ou 2,
Z
Z
E (|fk |) =
|fk |d
1lRn d = (Rn ) = 1.
Rn
Rn
f1 et f2 sont donc -intgrables, par dfinition il en est de mme de f . On peut donc dfinir
E (f ) C pour tout vecteur u de Rn .
Dfinition 3.4.
Lapplication
n
: u R 7 (u) :=
exp (ihx, ui) d(x)

Rn
sappelle la fonction caractristique de , en abrg f.c. . Si X est un vecteur alatoire,

on appelle fonction caractristique de X , et on note X , la f.c. de la loi de X .
CT U
Besancon
37
Exemples 3.8.
Si est la
Z probabilit de Bernoulli de paramtres p.
(t) =
e itx d(p1 + (1 p)0 )(x) = pe it + (1 p) daprs les rgles dintgration par
R
rapport une mesure de Dirac.

Expliciter les fonctions caractristiques des probabilits de Dirac, binomiale, de Poisson.
On montrera dans lexercice 3.20, page 60, que la fonction caractristique de la probabilit
1
normale N 1 (m, 2 ) est dfinie sur R, pour tout rel t, par (t) := exp(imt t 2 2 ).
2
Plus gnralement, on trouvera la liste des fonctions caractristiques des probabilits usuelles
sur R dans le formulaire donn dans lannexe A, page 205, de ce cours.
3.1.4
Proprits de lintgrale
Lintgrale dune fonction suivant une mesure possde toutes les proprits des intgrales
classiques vues en premier cycle universitaire, on admettra :
Proposition 3.9.
Soient f et g deux applications de E dans Rd intgrables suivant , a et b deux rels, alors
1. E (af + bg ) = aE (f ) + bE (g ).
2. |E (f )| E (|f |) o | | est la norme euclidienne sur Rd .
3. Si de plus d = 1 et f g , alors E (f ) E (g ).
Exemples 3.9.
Comme lindicatrice de A1 A2 An , o A1 , A2 , , An , sont des parties de E , est
donne par
1lA1 A2 An = 1 (1 1lA1 )(1 1lA2 ) (1 1lAn ),
en dveloppant le second membre de cette galit et en utilisant les proprits 1)a du
thorme fondamental de lintgration et 1) de la proposition prcdente, on obtient aisment une autre dmonstration de la formule de Poincar 1.8, page 12, nonce dans le
premier chapitre.
Les noncs de thormes permettant dintervertir les symboles E et lim sont particuliren+
ment simples dans cette thorie de lintgration. Commenons par rappeler (cf. [8], page 82) :
Proposition 3.10.
Thorme de convergence monotone de Beppo-Lvi (admis)
Pour toute suite croissante (fn )N dapplications A-mesurables positives,

E lim fn = lim E (fn ).
n+
n+
CT U
Besancon
38

Ce rsultat a pour corollaire :
Proposition 3.11.
Thorme dinterversion de E et
X
0
Pour toute suite (fn )N dapplications A-mesurables positives,

!
X
X
E
fn =
E (fn ).
n=0
n=0
Dmonstration : Posons, pour tout entier n, gn :=
n
X
fk . On applique alors le thorme de
k=0
Beppo-Lvi la suite croissante dapplications A-mesurables positives (gn )N . 2

On en dduit aussi la proposition suivante (cf.[8], page 83) :
Proposition 3.12.
Lemme de Fatou
Si (fn )N est une suite dapplications A-mesurables positives, alors

E lim inf fn lim inf E (fn ).
n+
n+
Notons que ces trois rsultats prcdents sont faux si les fonctions fn ne sont plus supposes
positives.
Terminons par un thorme valable pour les fonctions ( valeurs relles) de signe quelconque
la condition dtre intgrables (cf. [8], page 102). Ce thorme ainsi que celui de Beppo-Lvi
sont des thormes fondamentaux de la thorie de lintgration. Ce sont principalement ces
rsultats qui font la supriorit de la thorie de Lebesgue sur celle de Riemann vue en premier
cycle universitaire.
Proposition 3.13.
Thorme de convergence domine de Lebesgue (admis)
Si (fn )N est une suite dapplications A-mesurables convergeant presque-partout vers une
application A-mesurable f et sil existe une application intgrable telle que, pour tout k N,
|fk | , alors f est intgrable et E (f ) = lim E (fn ).
n+
3.1.5
Espaces de Lebesgue dordre p
Pour les dmonstrations et noncs plus gnraux de ce paragraphe, on pourra se reporter

[8], pages 149 156.
Soit (E , A, ) un espace de probabilit. Soit 1 p < , si f est une application de E dans R,
1
A-mesurable, dfinie et finie -presque srement, on posera ||f ||p = [E (|f |p )] p si lapplication
CT U
Besancon
39
|f |p est intgrable pour , et ||f ||p = + sinon.

On note Lp (E , A, ) lensemble des applications f de E dans R, A-mesurables, dfinies
et finies -presque srement, telles que ||f ||p < +. Lp (E , A, ) est un espace vectoriel,
et ||f ||p est une semi-norme sur cet espace. On note alors Lp (E , A, ) lespace des classes
dquivalence des applications A-mesurables de Lp (E , A, ) pour lgalit -presque-sre. En
particulier, lespace L1 (E , A, ) est constitu des classes dquivalence des applications de E
dans R, A-mesurables, dfinies et finies -presque srement, intgrables pour , gales presque srement.
On dfinit galement ||f || = sup { R / [|f | ] > 0}, et L (E , A, ) comme lensemble
des classes dquivalence, pour lgalit -presque-sre, des applications de E dans R, Amesurables, dfinies et finies -presque srement, telles que ||f || < +.
Dfinition 3.5.
Les espaces Lp (E , A, ) pour tout rel p tel que 1 p sont appels les espaces de
Lebesgue dordre p.
Moyennant ces dfinitions, on rappelle le rsultat suivant sur les espaces de Lebesgue :
Proposition 3.14.
Soit (E , A, ) un espace de probabilit,
1. Pour tout rel p tel que 1 p , la semi-norme || ||p induit une norme sur lespace
de Lebesgue Lp (E , A, ), encore note || ||p .
2. Pour tout rel p tel que 1 p , lespace de Lebesgue Lp (E , A, ) muni de la norme
|| ||p est un espace de Banach.
3. Pour tout p et q tels que 1 p < q , on a la suite des ingalits
|| ||1 || ||p < || ||q || || ,
et la suite dinclusions
L (E , A, ) Lq (E , A, ) Lp (E , A, ) L1 (E , A, ).
1 1
+ = 1, alors, pour tout f Lp (E , A, )
p q
et g Lq (E , A, ), lapplication f g L1 (E , A, ) et on a ||f g ||1 ||f ||p ||g ||q .
4. Si p et q sont tels que 1 p, q avec
Remarque : Lingalit de litem 4 sappelle lingalit de Hlder. Pour le cas particulier,

p = q = 2, cette ingalit se ramne lingalit de Schwarz car lespace L2 (E , A, ), muni
du produit scalaire < f , g >= E(f g ) est un espace de Hilbert.
Litem 3 de la proposition prcdente nest plus vrai ds que nest plus une mesure finie.
Dsormais dans la suite du cours, les fonctions utilises seront souvent dfinies seulement
presque-partout. Nous crirons par abus, f Lq (E , A, ) pour exprimer que f est une
application de E dans R, A-mesurable, dfinie et finie -presque srement, et que sa classe
dquivalence pour lgalit presque-partout est dans Lq (E , A, ).
CT U
Besancon
40
3.2
Thorme du transfert et moments dune v.a.
(, F, P) dsigne lespace de probabilit de base.

Les variables alatoires utilises seront souvent dfinies seulement presque-srement. En appliquant aux variables alatoires la convention dcriture de la fin du paragraphe prcdent, nous
crirons par abus, X Lp (, F, P) pour exprimer que X est une variable alatoire dfinie et
finie presque-srement sur et que sa classe dquivalence pour lgalit presque-sre est dans
Lp (, F, P).
Suivant lusage on notera dornavant, sauf cas exceptionnels, loprateur dintgration (sur
lespace de probabilit de base) E au lieu de EP . On appelle E lesprance mathmatique
suivant P ou, plus simplement sil ny a pas de risque de confusion, esprance. Ainsi si X
est une variable alatoire
positive, resp.
Z
Z vectorielle intgrable, on utilisera indiffremment les
notations E(X ) ou
X ()dP() ou
X dP pour dsigner EP (X ).
Si h est une application de Rd dans Rn et X un vecteur alatoire de dimension d, on rappelle

la notation abusive dj introduite h(X ) := h X .
3.2.1
Thorme du transfert et identification de lois
Le thorme du transfert est dun usage constant en probabilit. Donnons-en deux versions, une
pour les fonctions positives (cest la plus utile), lautre pour les fonctions vectorielles intgrables.
Proposition 3.15.
Thorme du transfert (cas positif)
Soient h une application borlienne positive de Rd dans [0, +] et X un vecteur alatoire de
dimension d, alors
Z
E[h(X )] =
hdPX = EPX (h)
Rd
quon crit galement sous la forme :

Z
Z
h()dPX () =
h(x)dPX (x).
Rd
Dmonstration : Cette proposition se dmontre laide de la technique des fonctions tages. 2
CT U
Besancon
41
Proposition 3.16.
Thorme du transfert (cas vectoriel) (admis)
Soient h une application borlienne de Rd dans Rn et X un vecteur alatoire de dimension d.
Alors h est intgrable sur Rd suivant PX si, et seulement si, h(X ) est intgrable sur suivant
P, et dans ce cas
Z
E[h(X )] =
hdPX = EPX (h)
Rd
quon crit galement sous la forme :

Z
Z
h()dPX () =
h(x)dPX (x).
Rd
Exemples 3.10.
Soient X un vecteur alatoire de dimension d et X sa fonction caractristique. Par
application du thorme du transfert (cas vectoriel) on obtient, pour tout lment u de Rd ,
Z
X (u) :=
exp (ihx, ui) dPX (x) = E [exp (ihX , ui)] .2
Rd
Exemples 3.11.
Soit X une variable alatoire relle de loi N 1 (0, 1) i.e. PX = N 1 (0, 1). Calculons E(X 2 ).
Donnons deux mthodes.
Premire mthode : E(X 2 ) est de la forme E[h(X )] avec h(t) := t 2 . On applique le
thorme du transfert (cas positif), on remarque que h est continue donc borlienne. On
doit donc calculer laide dune intgration par parties,
Z
1
t dPX (t) =
E(X ) =
2
R
2
1 2
t 2 e 2 t dt = 1.
Deuxime mthode : On a vu au chapitre II dans lexemple 2.2, page 24, que la variable
alatoire relle Y := X 2 suit la loi ( 21 , 12 ) de densit
(x) :=
x
1
e 2 1l]0,+[ (x).
2x
On cherche calculer
Z
x
1
E(X ) = E(Y ) =
tdPY (t) =
x
e 2 1l]0,+[ (x)d(x)
2x
R
R
Z +
Z +
1 x
x
x
e 2 dx = 1.
=
x e 2 1l]0,+[ (x)dx =
2
2
Dans ces calculs nous avons utilis les rgles dintgration suivant une mesure densit et
une mesure de Lebesgue, puis effectu un changement de variable pour calculer lintgrale
gnralise finale. 2
CT U
Besancon
42

Soit X une variable alatoire relle de loi N 1 (0, 1).
a) Calculer de deux faons diffrentes E(e X ).
b) Montrer que X 3 est intgrable (suivant la mesure P) et calculer E(X 3 ).
Le thorme du transfert permet dtablir un critre didentification des lois utilisant les
fonctions borliennes positives :
Proposition 3.17.
Critre des fonctions borliennes positives
Soient X un vecteur alatoire de dimension d et une probabilit sur Rd . Alors le vecteur
alatoire X a pour loi si, et seulement si, pour toute application borlienne positive h de Rd
dans [0, +],
Z
E[h(X )] =
hd,
Rd
qui peut aussi scrire

Z
Z
h(X )dP =
h(x)d(x).
Rd
Dmonstration : C.N. - Si PX = , daprs le thorme

Z du transfert,
Z pour toute application
d
borlienne positive h de R dans [0, +], E[h(X )] =
hdPX =
hd.
Rd
Rd
C.S. - Supposons
que, pour toute application borlienne positive h de Rd dans [0, +],
Z
E[h(X )] =
hd. Alors, comme pour tout B B(Rd ) h := 1lB est une application borlienne
Rd
positive de Rd dans [0, +], par hypothse dune part

E[h(X )] = E[1lB (X )] = E (1lB ) = (B),
et par le thorme de transfert dautre part
Z
E[h(X )] = E[1lB (X )] =
1lB dPX = PX (B).

Rd
Do, pour tout B B(Rd ), PX (B) = (B) ce qui signifie que PX = . 2

Exemples 3.12.
Soit X un vecteur alatoire de dimension 2 de loi PX :=
X
k1,l1
(k,l) .
2k+l
On note X1 , X2
les composantes de X dans la base canonique de R2 . Dterminons la loi de la variable

alatoire relle Y := sup(X1 , X2 ). Pour cela notons A := {(x, y ) R2 / x < y }. Soit h
une application borlienne de R dans [0, +]. En remarquant que, pour tout (x, y ) R2 ,
h(sup(x, y )) = h(y )1lA (x, y ) + h(x)1lAc (x, y ), il vient
CT U
Besancon

Z
h(sup(x, y ))dPX (x, y )
E[h(Y )] = E[h(sup(X1 , X2 ))] =
Z
Z
R2
h(y )1lA (x, y )dPX (x, y ) +
h(x)1lAc (x, y )dPX (x, y )
=
R2
43
R2
+ X
+
+ X
+
X
X
1
1
=
h(j)1
l
(i,
j)
+
h(i)1lAc (i, j)
A
i+j
i+j
2
2
i=1 j=1
i=1 j=1
j1
+ X
i
+ X
X
X
1
1
=
h(j) +
h(i)
i+j
i+j
2
2
j=1 i=1
i=1 j=1

+
+
+
X
X
X
1
1
1
1
3
1
1 j1 h(j) +
1 i h(i) =
2 i h(i)
=
j
i
i
2
2
2
2
2
2
i=1
i=1
j=1

Z
+
X
1
3
=
2 i
h(z)di (z).
2i
2
R
i=1
On notera que, pour obtenir le premier X
terme X
de la quatrime galit, il a t fait usage
du lemme de permutation des symboles
et
pour une suite-double de rels positifs.
Z
hd avec :=
On a donc E[h(Y )] =
i
+
X
i=1

3
1
2 i i , ce qui prouve que est la loi
2i
2
de la variable alatoire relle Y .

On pourra se reporter [3] exercice I-4 question 2 pour trouver une autre dmonstration
utilisant la remarque suivant la proposition 2.10, page 27, sur le calcul de lois de variable
alatoire relle discrtes. 2
Un autre critre fait intervenir plus particulirement les fonctions continues positives support
compact (qui forment une sous-classe des fonctions borliennes positives).
Proposition 3.18.
Critre des fonctions support compact
alatoire X a pour loi si, et seulement si, pour toute application positive h de Rd dans
[0, +], continue et support compact,
Z
E[h(X )] =
hd.
Rd
Ce qui peut aussi scrire avec la notation des oprateurs dintgration

EP [h(X )] = E (h).
Dmonstration : - C.N. Supposons que PX = . Si f est une fonction continue positive
support compact, elle est en particulier une fonction positive borlienne.ZDonc daprs le critre
des fonctions positives borliennes vu prcdemment, on a E[f (X )] =
f d.
Rd
d
- C.S. Rciproquement, supposons que, pour
Z toute application positive h de R dans [0, +],
hd. Soit A une partie ouverte de Rd . Daprs
continue et support compact, E[h(X )] =

Rd
une rsultat danalyse fonctionnelle, il existe une suite croissante (fn )N de fonctions positives,
CT U
Besancon
44

continues et Rsupport compact sur Rd qui converge vers la fonction indicatrice de A. On a dune
part (A) = Rd 1A d et PX (A) = E(1lZA ), et dautreZpart, par le thorme de convergence
Z
monotone de Beppo-Lvi, on obtient :
1A d =
( lim fn ) d = lim
fn d =
n+ Rd
Rd n+
Z Rd
Z
Z
fn dPX =
( lim fn ) dPX =
1lA dPX . Par suite, pour tout
lim E(fn (X )) = lim
n+
n+
Rd
Rd n+
Rd
ouvert A de R , (A) = PX (A). Les probabilits et PX concident sur une famille de parties
de Rd stable par intersection finie (-systme) qui engendre la tribu borlienne de Rd , donc
elles sont gales en vertu du thorme dunicit 1.11 de la page 14.2
Les deux critres des fonctions positives expriment quun vecteur alatoire X , de dimension d,
a pour loi la probabilit si, et seulement si, la relation EP [h(X )] = E (h) est vrifie pour
tout fonction h de la famille C des applications borliennes positives dfinies sur Rd (ou de de
la famille C des applications continues positives support compact sur Rd ).
Le critre didentification de lois utilisant les fonctions de rpartition (lemme dunicit) peut
aussi snoncer sous cette forme. Ainsi, ces trois critres peuvent se formuler en un seul nonc :
Proposition 3.19.
Critres didentification de lois
alatoire X a pour loi si, et seulement si, la relation EP [h(X )] = E (h) est vrifie pour tous
les lments h dun des ensembles C suivants :
1. Si d 1, C est lensemble des applications borliennes de Rd dans [0, +].
2. Si d 1, C est lensemble des applications positives continues et support compact de
Rd dans [0, +].
3. Si d = 1, C est lensemble des indicatrices 1l],u] lorsque u parcourt R.
Dmonstration : 1) A dj t vu dans la proposition 3.17.
2) A dj t vu dans la proposition 3.18.
3) On se limite au cas d = 1. On remarque que, pour tout u R,
PX (] , u]) = E 1l],u] (X )
et (] , u]) = E (1l],u] ).
On conclut par le lemme dunicit 1.12, page 14. 2

Avec les notations de lexemple prcdent 3.12, montrer que E(X ) = (2, 2) et que la loi de
la variable alatoire relle Z := X1 + X2 est
+
X
i 1
i .
PZ =
i
2
i=1
CT U
Besancon
3.2.2
45
Moments dune variable alatoire
Dfinition 3.6.
Soit X est une v.a.r. sur (, F, P). On appelle esprance mathmatique de X suivant
P ou quelquefois
moyenne de X , et on note E(X ), la quantit (si elle est dfinie)
Z
E(X ) =
X dP.
Plus gnralement si p N , on appelle moment dordre p de X , resp. moment centr

dordre p de X , le nombre rel (sil est dfini) mp := E(X p ), resp. mp0 := E [(X m1 )p ] .
Dfinition 3.7.
Le moment centr dordre 2 sappelle aussi la variance de X et se note Var(X ). Sa racine
carre positive sappelle lcart-type de X et se note X .
Si X et Y sont deux v.a.r. on appelle covariance de X et Y , le rel (sil est dfini)
Cov(X , Y ) := E([X E(X )][Y E(Y )]).
La proposition suivante donne une condition suffisante dexistence des moments dune v.a.r. .
Proposition 3.20.
Existence des moments de v.a.r.
1. Soit X une v.a.r. telle quil existe un entier naturel non nul p vrifiant E(|X |p ) < +,
i.e. X Lp (, F, P). Alors, pour
tout entier
k vrifiant 1 k p, les moments dordre

k
0
k
k, mk := E(X ) et mk := E (X m1 ) , existent dans R.
2. Si X et Y sont deux variables alatoires relles vrifiant E(X 2 ) < + et E(Y 2 ) < +,
i.e. X et Y sont dans L2 (, F, P), alors la covariance de X et Y , Cov(X , Y ), existe
dans R.
Dmonstration : 1) Pour tout k p, |X k | 1 + |X |p . Do

E(|X k |) 1 + E(|X p |) < +,
ce qui prouve que la variable alatoire relle X k est intgrable et donc que E(X k ) est bien dfini
dans R.
De mme, |X m1 |k (|m1 | + |X |)k . En dveloppant le second membre, en prenant
lesprance de lexpression et en utilisant le rsultat dmontr juste avant, on obtient que
E(|X m1 |k ) < +. Par suite E (X m1 )k est bien dfini dans R.
2) Si X et Y sont de carr intgrable, daprs lingalit |X Y | X 2 +Y 2 dduite du dveloppement de (|X | |Y |)2 0, on obtient E(|X Y |) E(X 2 ) + E(Y 2 ) < +. La variable alatoire
relle X Y est donc intgrable ainsi que la variable alatoire relle Z := [X E(X )][Y E(Y )],
ce qui donne bien un sens la covariance de X et de Y . 2
Par application du thorme de transfert il vient aisment :
CT U
Besancon
46

Proposition 3.21.
Sous les conditions dexistence des diffrents moments,
Z
Z
X ()dP() =
xdPX (x).
m1 := E(X ) =
R
Z
Z
2
2
(X () m1 ) dP() = (x m1 )2 dPX (x).
X :=
R
Z
Z
mp :=
X p ()dP() =
x p dPX (x).
R
Z
Z
p
0
(X () m1 ) dP() = (x m1 )p dPX (x).
mp :=
Par commodit on pose la dfinition suivante :
Dfinition 3.8.
Une variable alatoire relle X est dite de carr intgrable
X L2 (, F, P).
si E(X 2 ) < +, i.e.
Exemples 3.13.
Soit X une variable alatoire normale standard. Le calcul dvelopp dans lexemple 3.7
, page 34, prouve que E(X ) = 0 et celui dvelopp dans lexemple 3.6, page 33, que
V ar (X ) = 1. Plus gnralement, on vrifie aisment par un calcul lmentaire que, si X est
une variable de loi normale N (m, 2 ), alors E(X ) = m et Var(X ) = 2 . 2
Proposition 3.22.
Formules de Knig-Huygens
Soient X et Y deux variable alatoire relle de carr intgrable. Alors
1. Var(X ) = Cov(X , X ) = E(X 2 ) [E(X )]2 .
2. Cov(X , Y ) = E(X Y ) E(X )E(Y ).

Vrifier les formules de Knig-Huygens.
On vrifie aisment quon retrouve les dfinitions classiques de lesprance pour les v.a.r.
discrtes ou densit comme lindique le rsultat suivant :
CT U
Besancon
47
Proposition 3.23.
1. Si X est une variable alatoire relle intgrable discrte de loi
+
X
PX :=
P(X = ak )ak , alors
k=0
E(X ) =
+
X
ak P(X = ak ).
k=0
2. Si X est une variable alatoire relle intgrable densit continue sur R, alors
Z +
t(t)dt.
E(X ) =
On trouvera la liste des valeurs de lesprance et de la variance des v.a.r. de lois usuelles dans
le formulaire de lannexe A, page 205, de ce cours.

Soit X une variable alatoire relle suivant la loi de Rayleigh de densit dfinie sur R par
x2
(x) := xe 2 1lR+ (x). Montrer que, pour tout entier k 1,

E X
2k1
(2k)!
= k
2 k!
et E X 2k = 2k k!.
2
Expliciter lesprance et la variance de la variable alatoire relle X .

Dfinition 3.9.
Soit X un vecteur alatoire de dimension d de composantes X1 , X2 , ..., Xd intgrables suivant
P. On appelle esprance de X suivant P, et on note E(X ), le vecteur de Rd ,
E(X ) := (E(X1 ), E(X2 ), ..., E(Xd )) .
Si X est une v.a. valeurs matricielles, on appelle esprance de X , et on note E(X ), la
matrice dont les coefficients sont les esprances de ceux de X .
Dfinition 3.10.
Une variable alatoire vectorielle ou matricielle desprance nulle est dite centre. Une variable
alatoire relle de carr intgrable et de variance gale 1 est dite rduite.

Montrer que les variable alatoire relle X1 , X2 , , Xd sont de carr intgrable si, et
seulement si, E(|X |2 ) < + o X := (X1 , X2 , , Xd ).
CT U
Besancon
48

Dfinition 3.11.
Soit X un vecteur alatoire de dimension d de composantes X1 , X2 , ..., Xd de carr intgrable
sur . On appelle matrice de dispersion de X ou matrice des covariances de X , et on
la note DX , lesprance de la matrice carre alatoire [X E(X )][X E(X )] dordre d o
dsigne lopration de transposition des matrices, cest--dire
DX = E ([X E(X )][X E(X )] ) .
La terminologie est justifie par la troisime assertion de la proposition suivante :

Proposition 3.24.
Si X est un vecteur alatoire de dimension d tel que E(|X |2 ) < + et M une matrice
(dterministe) coefficients rels c lignes et d colonnes, alors
1. Le coefficient dindice (i, j) de DX est la covariance Cov(Xi , Xj ) des v.a.r. Xi et Xj . Les
lments diagonaux de DX sont les variances des composantes de X .
2.
D[X E(X )] = DX , E(MX ) = ME(X ), DMX = MDX M .
3. DX est une matrice symtrique. DX est de type positif i.e., pour tout u Rd ,
u DX u 0. En particulier, DX est une matrice diagonalisable sur R dont les valeurs
propres sont des rels positifs ou nuls.
Exemples 3.14.
Soit X un vecteur alatoire de dimension 2 de loi
PX :=
X
k1,l1
(k,l) .
2k+l
Notons X1 , X2 les composantes de X dans la base canonique de R2 . Par dfinition

E(X ) = (E(X1 ), E(X2 )) et daprs la proposition prcdente,

Var(X1 )
Cov(X1 , X2 )
DX =
.
Cov(X1 , X2 )
Var(X2 )
En calculant E(X1 ) = E(X2 ) = 2 puis E(X12 ) = E(X22 ) = 6 et Cov(X1 , X2 ) = 0 on obtient,
par application de la formule de Knig-Huygens,

2 0
E(X ) = (2, 2) et DX =
.2
0 2

Dmontrer la proposition 3.24, page 48.

Soient X et Y deux variables alatoires relles telles que E(X 2 ) < + et E(Y 2 ) < +.
CT U
Besancon
49
1. Montrer que |Y X | X 2 + Y 2 . En dduire que les variables alatoires relles X , Y et

X Y sont intgrables suivant P.
2. En tudiant le signe de lexpression E [(X + Yp)2 ] pour
p tout R, prouver
2
lingalit de Cauchy-Schwarz : |E(X Y )|
E(X ) E(Y 2 ). En donner une
interprtation gomtrique.

Soit X := (X1 , X2 , , Xn ) un vecteur alatoire tel que E(|X |2 ) < +.
n
X
1. Montrer que la variable alatoire relle Y :=
Xk est de carr intgrable.
k=1
2. Dmontrer la relation
Var
n
X
!
Xk
k=1
3.3
n
X
Var(Xk ) + 2
Cov(Xi , Xj ).
1i<jn
k=1
Fonction caractristique et loi dune v.a.
Dans le sous-paragraphe 3 du paragraphe 1, nous avons introduit la notion de fonction

caractristique.
On rappelle que :
Dfinition 3.12.
Si est une probabilit sur Rd , lapplication
Z
d
: u R 7 (u) :=
exp (ihx, ui) d(x) C,
Rd
sappelle la fonction caractristique de , (en abrg f.c.).

Si X est un vecteur alatoire de dimension d, la fonction caractristique de X est
lapplication de Rd dans C dfinie, pour tout vecteur u de Rd , par
Z
X (u) :=
exp (ihx, ui) dPX (x) = E (exp (ihX , ui)) .
Rd
Donnons quelques proprits classiques des fonctions caractristiques :

Proposition 3.25.
1. (0) = 1
2. Pour tout u Rd , (u) = (u) et |(u)| 1. Une fonction caractristique est donc
une application borne sur Rd .
3. La fonction caractristique dun vecteur alatoire X de dimension d est une fonction
uniformment continue sur Rd . En particulier, une fonction caractristique est continue
en 0.
4. Z
Si et sontZ deux probabilits sur Rd , alors
d =
Rd
d.
Rd
CT U
Besancon
50

Dmonstration : (0) = 1 est immdiat vrifier.
d
Pour toutZu Rd , (u) = (u)
est
Z immdiat vrifier. Pour Ztout vecteur u de R ,

|X (u)| =
exp (ihx, ui) dPX (x)
|exp (ihx, ui)| dPX (x)
dPX (x) = 1, donc
d
d
d
R
X est borne sur Rd .
Pour tous vecteurs u et v de R , |X (u)X (v )|

|exp (ihx, ui) exp (ihx, v i)| dPX (x).
d
R
Z t
it
ie ix dx, do |e it 1| inf(2, |t|). Par suite, pour tous
Or, pour tout rel t, e 1 =
0
vecteurs u et v de Rd , par application de lingalit de Cauchy-Schwarz, il vient

|exp (ihx, ui) exp (ihx, v i)| |exp [i (hx, ui hx, v i)] 1| = |exp (ihx, u v i) 1|
inf(2, |hx, u v i|) inf(2,
|x||u v |).
Z
Do, pour tous vecteurs u et v de Rd , |X (u)X (v )|
inf(2, |x||uv |)dPX (x). En partiRd
1
culier, pour tout entier naturel non nul n, et pour tous vecteurs u et v de Rd , tels que |uv | ,

n
Z
|x|
|x|
inf 2,
on a |X (u) X (v )|
est
dPX (x). La suite de fonctions inf 2,
n
n
Rd
N
domine par la fonction constante qui vaut 2 sur Rd , et converge
sur

Z vers la fonction-nulle
|x|
Rd . Par le thorme de convergence domine de Lebesgue, lim
inf 2,
dPX (x) = 0.
n+ Rd

n
Z
|x|
Soit > 0 donn, on peut donc trouver un entier n tel que |
inf 2,
dPX (x)| . Par
n
Rd
1
suite, pour tout > 0, il existe (prendre = ) tel que, pour tous vecteurs u et v de Rd ,
n
|u v | implique |X (u) X (v )| , ce qui prouve luniforme continuit de la fonction
caractristique.
Z
Z
d, il suffit dappliquer le thorme de Fubini vu en
d =
Pour prouver que
Rd
Rd
thorie de la mesure et de lintgration et rappel dans le chapitre suivant, proposition 4.3,

page 63. 2
La fonction caractristique prsente plusieurs points dintrt :
1. pour identifier la loi dun vecteur alatoire,
2. pour calculer les moments dune variable alatoire,
3. pour tudier lindpendance dune suite de v.a.r..
Nous allons nous intresser dans ce paragraphe aux deux premiers points. Le dernier sera trait
au chapitre IV.
Commenons par le premier point, qui est d au rsultat suivant :
Proposition 3.26.
Thorme dinjectivit des f.c.
Deux probabilits sur Rd sont identiques si, et seulement si, elles ont la mme fonction
caractristique.
CT U
Besancon
51
Dmonstration : En prambule la dmonstration, montrons que, pour tout rel a > 0,

Z
2d ad
e i<u,y x> e a(|u1 |+|u2 |+|ud |) d(d) (u) = Qk=d
I (x y ) =
.
2
2
Rd
k=1 (a + (yk xk ) )
En effet, en intgrant sparment sur ] , 0], puis sur [0, +[, on obtient
Z
K (x) =
itx a|t|
d(t) =
itx at
e dt +
e itx e at dt =
1
2a
1
+
= 2
.
a ix a + ix
a + x2
e i[u1 (y1 x1 )+u2 (y2 x2 )++ud (yd xd )]a(|u1 |+|u2 |+|ud |) d(d) (u) ou encore
Par suite, I (x y ) =
Rd
Z k=d
Y
I (x y ) =
e i[uk (yk xk )a|uk | d(d) (u).
Rd k=1
Par le thorme de Fubini (son nonc est rappel dans le prochain chapitre, proposition 4.3,
page 63), compte tenu de ce que la fonction intgrer est variables spares, il vient
k=d
k=d
k=d
Y
Y
YZ
2a
, do
K (yk xk ) =
e i[uk (yk xk )a|uk | d(uk ) =
I (x y ) =
2 + (y x )2
a
k
k
R
k=1
k=1
k=1
I (x y ) = Qk=d
k=1
2d ad
(a2 + (yk xk )2 )
Montrons maintenant que :

Z
Z
2d ad
J (x) =
e i<u,x> e a(|u1 |+|u2 |+|ud |) (u) d(d) (u).
d(y ) =
Qk=d 2
2
Rd
Rd
k=1 (a + (yk xk ) )
En effet, en
et en reportant dans lintgrale calculer, on
Z
Z utilisant le rsultat Zprcdent
a J (x) =
I (x y ) d(y ) =
e i<u,y x> e a(|u1 |+|u2 |+|ud |) d(d) (u) d(y ). Par
Rd
Rd
Rd
application du thorme de Fubini aux mesures (d) et (vrifier que les hypothses du thorme
sont bien satisfaites), cette intgrale peut scrire :

Z
Z
i<u,y >
i<u,x> a(|u1 |+|u2 |+|ud |)
J (x) =
e
e
e
d(y ) d(d) (u),
Rd
Rd
ou encore, par dfinition de la fonction caractristique de ,

Z
J (x) =
e i<u,x> e a(|u1 |+|u2 |+|ud |) (u) d(d) (u).
Rd
Z Soit f une fonction de Rd dans R, continue et support compact. Calculons H (a) =

f (x)J (x) d(d) (x).
d
R
"Z
#
Z
2d ad
On a H (a) =
f (x)
d(y ) d(d) (x). Par le thorme de FuQk=d 2
2
Rd
Rd
k=1 (a + (yk xk ) )
#
Z "Z
d d
2 a
d(d) (x) d(y ). Notons Ga (y ) lintgrale
bini, H (a) =
f (x) Qk=d
2
2
Rd
Rd
k=1 (a + (yk xk ) )
CT U
Besancon
52

entre crochets. Elle peut scrire, aprs le changement de variables dans Rd , (u1 , u2 , , ud ) =
(y1 x1 , yZ2 x2 , , yd xd ), ou u = y x, dont le Zjacobien est de valeur absolue gale 1,
2d ad
2d ad
(d)
Ga (y ) =
f (x) Qk=d
d (x) =
f (y u) Qk=d
d(d) (u).
2
2
2
2
Rd
Rd
k=1 (a + (uk ) )
Zk=1 (a + (yk xk ) )
Par suite, H (a) =
Ga (y ) d(y ).
Rd
tudions maintenant, pour tout vecteur y Rd , la limite lim Ga (y ).

a0
Z
d d
2
a
Pour tout vecteur y Rd , Ga (y ) =
f (y u) Qk=d
d(d) (u). Par le changement
2
2
d
R
k=1 (a + (uk ) )
u1 u2
ud
d
de variables dans R , (x1 , x2 , , xd ) = ( , , , ), quon peut crire de faon plus
a a
a
1
synthtique, x = u, dont le jacobien est de valeur absolue gale ad , lintgrale devient
a
Z
2d ad
Ga (y ) =
f (y ax) Qk=d
ad d(d) (x)
2
2
d
k=1 (a + (axk ) )
ZR
2d
f (y ax) Qk=d
d(d) (x).
=
2
Rd
k=1 (1 + xk )
Comme f est continue support compact, elle est borne par un rel M. La famille, indexe par
2d
2d
a, des fonctions x 7 f (y ax) Qk=d
est
domine
par
la
fonction
x
7
M
Q
k=d
2
2
k=1 (1 + xk )
k=1 (1 + xk )
intgrable sur Rd pour la mesure de Lebesgue. En effet, par le thorme de Fubini,
Z +
d
Z

2d
1
(d)
d
d
+ d
M Qk=d
d
(x)
=
M2
dt
=
M2
[Arctan(x)]
= M2d d ,
2
2
1
+
t
(1
+
x
)
Rd
k
k=1
ce qui prouve que la fonction x 7 M Qk=d
2d
xk2 )
est intgrable sur Rd .
k=1 (1 +
Par suite Zen faisant tendre a vers 0, en vertu du thorme de convergence domine, lintgrale
2d
Ga (y ) =
f (y ax) Qk=d
d(d) (x) tend vers lintgrale
2
d
R
k=1 (1 + xk )
Z
Z
2d
2d
(d)
f (y ) Qk=d
d
(x)
=
f
(y
)
d(d) (x) = 2d d f (y ),
Qk=d
2
2
Rd
Rd
k=1 (1 + xk )
k=1 (1 + xk )
daprs le calcul qui vient dtre fait plus haut, cest--dire lim Ga (y ) = 2d d f (y ).
a0
Nous pouvons maintenant en dduire la limite de lintgrale H (a) lorsque a tend vers 0.
En effet, pour tout rel a et tout y Rd ,
Z
2d ad
ad d(d) (x)
|Ga (y )|
|f (y ax)| Qk=d
2
2
d
R
k=1 (a + (axk ) )
Z
2d ad
M
ad d(d) (x) = M2d d .
Qk=d 2
2
d
R
k=1 (a + (axk ) )
La famille de fonctions Ga indexes par a, est donc domine par la constante M2d d intgrable
par rapport la mesure de probabilit . Par le thorme de convergence domine de Lebesgue,
CT U
Besancon
Z
il vient lim H (a) =
a0

Z
lim Ga (y ) d(y ) =
2d d f (y ) d(y ).
Rd a0
53
Rd
Pour conclure, rassemblons les rsultats prcdents, en tenant compte que et sont
deux probabilits sur Rd ayant la mme fonction caractristique = . On remarque alors que J (x) = J (x) et, par suite, pour tout rel a > 0, H (a) = H (a). On
en dduit alors, en faisant tendre a vers 0, que lim H (a) = lim H (a), cest--dire que
a0
a0
Z
Z
Z
Z
d d
d d
2 f (y ) d(y ) =
2 f (y ) d(y ), et finalement
f (y ) d(y ) =
f (y ) d(y ),
Rd
Rd
d
Rd
Rd
pour toute fonction f de R dans R, continue et support compact. Par le critre des fonctions
support compact (proposition 3.18, page 43), on en conclut = . 2
Le thorme dinjectivit snonce alors avec les vecteurs alatoires :
Proposition 3.27.
Critre didentification de lois par les f.c.
Deux vecteurs alatoires sur Rd ont la mme loi si, et seulement si, ils ont la mme fonction
caractristique.
Nous pouvons maintenant regrouper tous les critres didentification de lois vus jusqu prsent
sous une formulation unique qui complte la proposition 3.19, page 44 :
Proposition 3.28.
Critres didentification de lois
alatoire X a pour loi si, et seulement si, la relation
Z
h(t) d(t)
E[h(X )] =
Rd
est vrifie pour tous les lments h dun des ensembles C suivants :
1. Si d 1, C est lensemble des applications borliennes de Rd dans [0, +].
2. Si d 1, C est lensemble des applications positives continues et support compact de
Rd dans [0, +].
3. Si d 1, C est lensemble des applications
hu : x Rd 7 hu (x) = exp(ihu, xi) C
lorsque u parcourt Rd .
4. Si d = 1, C est lensemble des indicatrices 1l],u] lorsque u parcourt R.
Dmonstration : Il suffit de prouver litem 3, les autres ayant dj t vus dans le thorme 3.19
de la page 44. On remarque que, pour tout u Rd , X (u) = E (exp(ihu, X i)) = E (hu (X )) et
(u) = E (hu ) On conclut par le thorme dinjectivit 3.26. 2
Dfinition 3.13.
Les familles de fonctions qui apparaissent dans les diffrents item de la proposition prcdente
sont souvent appeles familles de fonctions-test.
Dans le cas o d = 1, les formules dinversion donnes ci-dessous prcisent le lien entre la
CT U
Besancon
54

probabilit et sa fonction caractristique. Elles permettent de retrouver la probabilit partir
de sa f.c. :
Proposition 3.29.
Formules dinversion ou de rciprocit de Perron-Stieltjs
Si est une probabilit sur R de f.c. , a et b deux
tels que a < b, alors :
rels
Z n ita
1
e
e itb
1. La suite dintgrales au sens de Riemann
(t)dt
est conver2 n
it
N
Z n ita
e
e itb
1
1
(t)dt = (]a, b[) + ({a, b}).
gente dans R et lim
n+ 2 n
it
2
Z n

1
2. La suite dintgrales au sens de Riemann
e ita (t)dt
est convergente dans
2n
n
N
Z n
1
e ita (t)dt = ({a}).
R et lim
n+ 2n n
Indications pour la dmonstration (laisse en exercice non corrig).
Vrifier que les intgrales qui interviennent dans la proposition peuvent bien tre prises au
sens de Riemann car les fonctions complexes
Z + intgrer sont continues (ou prolongeables par
sin t
dt = .
continuit) sur [n, n]. On rappelle que
t
Premier item : Justifier quon peut appliquer le thorme de Fubini pour obtenir :
Z
In :=
n
e ita e itb
(t)dt =
it
Z Z
R
sin(t(x a))
dt
t

sin(t(x b))
dt d(x).
t
u
sin t
u
Posons, pour tout u R, S(u) :=
dt et sg n(u) :=
si u 6= 0 avec sg n(0) := 0.
|u|
Z
Z n 0 t
sin tu
dt = 2sg n(u)S(n|u|) et que In =
fn d o, pour
Montrer que, pour tout u R,
t
R
n
tout x R, fn (x) := 2sg n(x a)S(n|x a|) 2sg n(x b)S(n|x b|). Montrer que la suite
(fn )N converge vers 1l{a,b} + 21l]a,b[ et quil existe M > 0 tel que, pour tout n N, |fn | M.
Conclure laide du thorme de convergence domine.
Second item : Utiliser une dmarche analogue. 2
Dans le cas o la f.c. est intgrable au sens de Lebesgue sur R, on peut prciser la connaissance
de :
Proposition 3.30.
Soit une probabilit sur R de f.c. . Si est intgrable au sens de Lebesgue sur R, alors
admet une densit f par rapport la mesure de Lebesgue sur R. Lapplication f est une
fonction valeurs relles, positive, borne, continue sur R et, pourZ tout x R, f (x) sexprime
+
1
laide de lintgrale gnralise au sens de Riemann f (x) =
e itx (t)dt.
2
Dmonstration : Remarquons que, pour tous rels a et b avec a < b,

Z b
e ita e itb Z b

itx

itx
e
d(x) |b a|.
e
d(x)

=

it
a
a
CT U
Besancon

55

Z n ita
Z n

e itb
e

Par suite,
|(t)| dt. Comme est suppose in(t) dt |b a|

it
n
n
Z +
tgrable au sens de Lebesgue, on a
|(t)| dt < +, ce qui prouve que lintgrale

Z n ita

e itb
e

(t) dt est absolument convergente. On a donc daprs la proposition 3.7,

it
n
page 35,
Z
lim
n+
e ita e itb
(t) dt =
it
e ita e itb
(t) dt =
it
Z
R
e ita e itb
(t)d(t).
it
Daprs le premier item de la proposition 3.29, nous pouvons donc crire

1
1
(]a, b[) + ({a, b}) =
2
2
Z
R
e ita e itb
(t)d(t).
it
On a alors, pour tous rels a et b avec a < b,

1 Z e ita e itb

1
1

({a}) (]a, b[) + ({a, b}) =
(t)d(t)
2 R

2
2
it

Z ita
Z

itb
1
e
1
e

(t) d(t) |b a| |(t)| d(t) = C |b a|,

2 R
it
2
R
Z
1
o C =
|(t)| d(t) est une constante finie car est intgrable au sens de Lebesgue.
2 R
Fixons a, en faisant tendre b vers a, dans lingalit prcdente, on en dduit que la mesure
est diffuse sur R, cest--dire que ({x}) = 0, pour tout rel x.
En revenant la premire formule dinversion de la proposition 3.29, on obtient alors en
tenant compte de la remarque prcdente et du thorme de Fubini, pour tous rels a et b avec
a < b,

Z ita
Z Z
e
e itb
1
1
itx
(]a, b[) =
(t) d(t) =
e
d(x) (t) d(t)
2 R
it
2
R
[a,b]
!
Z
Z
Z
1
itx
=
e
(t) d(t) d(x) =
f (x) d(x)
2 R
[a,b]
[a,b]
Z
1
o on a pos, pour tout rel x, f (x) =
e itx (t) d(t).
2 R
On vrifie aisment laide du thorme de convergence domine que f est une fonction
continue. De plus f est borne sur R. Comme, pour tout rel t, (t) = (t), on en dduit
en prenant le conjugu de lintgrale suivi dun changement de variable lmentaire que, pour
tout rel x, f (x) = f (x), ce quiZprouve que f est une fonction valeurs relles. Pour tous rels
f (x) d(x) 0 et f est continue, on en dduit que f est
a et b avec a < b, (]a, b[) =

[a,b]
positive et que cest bien une densit de probabilit sur R. Comme la fonction sous lintgrale
t 7 e itx (t) est elle-mme continue et borne et intgrable au sens de Lebesgue, lintgrale
Z
1
au sens de Lebesgue
e itx (t) d(t) peut scrire sous la forme dune intgrale gnral2 R
ise au sens de Riemann (cf. proposition 3.7, page 35).
CT U
Besancon
56

La probabilit concide donc avec la probabilit de densit f sur la famille C des intervalles
ouverts de R. On vrifie aisment que C est un -systme qui engendre la tribu borlienne de
R. On conclut alors par le thorme dunicit pour les probabilits (cf. proposition 1.11, page
14) que est la probabilit de densit f . 2
La rciproque de ce rsultat est fausse. En effet on vrifie aisment que la loi exponentielle de
paramtre 1 sur R fournit un contre-exemple. Cependant, sous certaines hypothses, on peut
avoir des renseignements sur le comportement linfini de la fonction caractristique , comme
le prouve la proposition suivante :
Proposition 3.31.
Soit une probabilit sur R de f.c. . On suppose que admet une densit f de classe C n
telle que, pour tout entier 0 k n, la drive f (k) dordre k de f soit intgrable au sens de
Lebesgue sur R (on pose f (0) := f ). Alors lim u n1 (u) = 0.
u+
Indications pour la dmonstration (laisse en exercice non corrig) : Soit k un entier, 1 k n.

Prouver la relation, pour tout x R :
(k1)
Z
(x) =
f (k) (u)du + f (k1) (0).
En dduire que lim |f (k1) (u)| = 0.

u+
Par une intgration par parties, montrer que, pour tout u 6= 0,

Z
iux (k1)
i
(x)dx =
u
e iux f (k) (x)dx.
n Z +
i
En dduire que (u) =
e iux f (n) (x)dx. Conclure. 2
u

Avec les notations de Landau, le rsultat dmontr peut scrire (u) = o
au voisiu n1
nage de +. En fait, si f a ses n drives premires qui existent et sont intgrables au sens
de Lebesgue sur R, en utilisant
le lemme de Riemann-Lebesgue (cf [4], exercice VI-30), on
1
dmontre que (u) = o
au voisinage de +.
un
Passons maintenant au second point dintrt de la notion de f.c.. Les propositions ci-dessous,
3.33, 3.34 et 3.35, donnent un procd de calcul des moments dune variable alatoire relle
laide de sa fonction caractristique.
Ces rsultats se dmontrent en utilisant le thorme de
Z
drivation sous le signe
vu en thorie de lintgration, que nous rappelons sans le dmontrer
dans le cas particulier qui nous intresse (cf. [8], page 105) :
CT U
Besancon
57
Proposition 3.32.
Z
Thorme de drivation sous le signe
Soit (E , E, ) un espace de probabilit, f une application de E R dans R (ou C). Si f vrifie
les trois hypothses suivantes :
1. pour -presque-tout x E , t R 7 f (x, t) R est drivable sur R,
2. pour tout t R, x E 7 f (x, t) R est intgrable par rapport ,
3. il existe une application g , intgrable
par rapport , telle que, pour -presque-tout
f

x E et pour tout t R, (x, t) g (x),
t
alors,
Z
1. Lapplication F : t R 7 F (t) :=
f (x, t)d(x) R est drivable sur R,
E
f
2. Pour tout t R, x E 7
(x, t) R est intgrable par rapport ,
Z t
f
3. Pour tout t R, F 0 (t) =
(x, t)d(x).
E t
En appliquant ce rsultat lapplication (x, u) R R 7 exp (ihx, ui) , et en raisonnant par

rcurrence, on obtient :
Proposition 3.33.
Si X est une variable alatoire relle telle que E(|X |n ) < +, i.e. X Ln (, F, P), o n est
un entier naturel non nul, alors la fonction caractristique X de X est continment drivable
jusqu lordre n et on a, pour tout rel u :
Z

(n)
n
X (u) = i
x n e iux dPX (x) = i n E X n e iuX .
R
En particulier
(n)
X (0)
=i
x n dPX (x) = i n E (X n ) .
Pour les vecteurs alatoires, nous avons en particulier :

Proposition 3.34.
Si X = (X1 , X2 , , Xd ) est un vecteur alatoire de dimension d tel que E(|X |2 ) < +,
i.e. X L2 (, F, P), o d est un entier naturel non nul, alors, pour tout k = 1, 2, , d et
X
2 X
j = 1, 2, , d on a E(Xk ) = i
(0) et E(Xk Xj ) =
(0).
uk
uk uj
Pour le calcul des moments dune variable alatoire relle, la proposition suivante est parfois
utile :
CT U
Besancon
58

Proposition 3.35.
Soient X une variable alatoire relle et n un entier naturel tels que la f.c. de X , X , soit
drivable en 0 lordre n. Alors
1. E(X 2p ) < + o 2p est le plus grand entier pair infrieur n. En particulier, X admet
des moments jusqu lordre 2p.
2. De plus, si le dveloppement limit de X au voisinage de 0 lordre n scrit
k=n
X
X (u) = 1 +
ak u k + o(u n ) alors, pour tout 1 k 2p, E(X k ) = (i)k ak k!.
k=1
Indications pour la dmonstration (laisse en exercice non corrig) : Supposons que X soit
n-fois drivable en 0. Faisons un raisonnement par rcurrence finie sur k tel que 2k n, en
prenant pour proprit de rcurrence lordre k, ( P k ) : "M2k < +."
Montrons dabord ( P 1 ).
Pour simplifier notons f la partie-relle de X et g sa partie-imaginaire. Montrer que g
(2n)
(2n)
est
(0). Montrer que la suite de fonctions
impaire et fpaire. En dduire X (0) = f
1
2n2 (1 f ( )) converge dans R vers f 00 (0). En appliquant le lemme de Fatou (proposition
n
N

x
3.12, page 38) la suite de fonctions 2n2 (1 cos ) , prouver que M2 f 00 (0) < +.
n N
Montrons lhrdit de la proprit.
Supposons ( P k1 ), pour un entier naturel k tel que 2k n, et montrons
Z ( Pk) :
(2k2)
Notons h la partie-relle de X
. Montrer que h(t) = (1)k1
(2k)
x 2k2 cos(tx)dPX (x)
et que h00 (0) =X (0). En dduire,Zen utilisant la convergence de la suite de fonctions

x
1
(2k)
2n2 (1 h( )) , que lim (1)k1 2n2 x 2k2 (1 cos )dPX (x) = X (0). En applin+
n
n
R
N
k (2k)
quant le lemme de Fatou, prouver que M2k (1) X (0) < +. Appliquer le thorme de
rcurrence finie sur k pour conclure.
La deuxime partie rsulte de la proposition 3.33 prcdente.2
On notera que la connaissance des moments ne dtermine pas en gnral la probabilit
(cf. [14], page 89, exemple 11.1). Cependant, sous certaines hypothses, la connaissance des
moments dtermine la probabilit . Cest le cas notamment dans le cas prcis par le rsultat
suivant :
Proposition 3.36.
Soit une probabilit
sur R de f.c. . Supposons quil existe un rel > 0 tel que, pour tout
Z
n
entier naturel n,
|x |d(x) n . Alors la f.c. est dveloppable en srie entire sur R au
vosinage de 0.
Indications pour la dmonstration (laisse en exercice non corrig) : Justifier lapplication de la

formule de Taylor-Lagrange lordre n dont on majorera le reste pour prouver que la f.c. est
dveloppable en srie entire en 0 de rayon de convergence +. Conclure. 2
Une consquence immdiate de ce rsultat est :
CT U
Besancon
59
Proposition 3.37.
Soit uneZprobabilit sur R. Supposons quil existe un rel > 0 tel que, pour tout entier
|x n |d(x) n . Si est une probabilit sur R ayant les mmes moments que ,
naturel n,
R
alors = .
Dmonstration : Daprs la proposition 3.36, les f.c. de et sont dveloppables chacunes en

srie entire. Comme, daprs la proposition 3.35, les coefficients des ces deux sries entires
sont compltement dtermins par les moments des probabilits et , et comme ces deux
probabilits ont les mmes moments par hypothse, on en dduit que les deux sries entires
sont identiques et par suite que leurs f.c., qui sont respectivement gales aux sommes de ces
deux sries, sont gales. On conclut par le thorme dinjectivit des f.c.. 2
3.4
Exercices de rvision sur les chapitres I III

Soit X une v.a.r. de loi N 1 (0, 1). Pour tout rel a > 0, on pose
Xa := X 1l{|X |a} X 1l{|X |>a} .
1. Vrifier que, pour tout rel a > 0 et toute application h de R dans R,
h(Xa ) = h(X )1l[0,a] (|X |) + h(X )1l]a,+[ (|X |).
2. En dduire que, pour tout rel positif a > 0, la v.a.r. Xa suit la loi normale rduite
centre.
Soit X une variable alatoire de densit f dfinie pour tout nombre rel x, par
a
si e x < 1
x
x + 1 a si 1 x < 0
f (x) =
0
sinon
o a est un nombre rel.
1. Calculer a et dterminer la fonction de rpartition F de X .
2. Calculer lesprance de la variable alatoire X .
Soit X une variable alatoire normale centre rduite. Prciser, dans chacun des cas cidessous, la loi de probabilit de la variable alatoire Y dfinie en fonction de X
1. Y = X 3 .
2. Y = F (X ) o F est la fonction de rpartition de la variable X .
CT U
Besancon
60

Soit un paramtre rel strictement positif et f lapplication dfinie sur R par
1 x
e
si x 0
2
f (x) =
1
x
e
si x 0
2
1. Vrifier que f est bien une densit de probabilit.
2. Soit X une variable alatoire relle de densit f , quelle est la loi de la variable alatoire
Y = |X | ? En dduire la variance de la variable X .
Soit X une variable alatoire relle uniforme continue sur [0, 1]. Montrer que la relation
1
Y = ln(1X ), o est un paramtre rel strictement positif, dfinit presque-srement
une variable alatoire relle. Quelle est la loi de la variable alatoire Y ?

Soit X une v.a.r. normale de loi N (m, 2 ), o m et sont des rels avec > 0.
1. Montrer que la fonction caractristique de X peut sexprimer laide de la fonction
caractristique de la loi de Gauss-Laplace standard N (0, 1).
Z
2. En utilisant le thorme 3.32, page 57, de drivation sous le signe
, montrer
que est une solution particulire de lquation diffrentielle du premier ordre
y 0 (t) + ty (t) = 0. En dduire lexpression analytique de la fonction , puis celle
de la fonction caractristique de la variable X .

1. Montrer que si X et Y sont deux v.a.r. presque-srement gales, alors elles ont la
mme loi. Montrer que la rciproque est fausse.
2. Soient X et Y deux v.a.r. de mme loi, g une application borlienne de R dans R.
Montrer que les v.a.r. g (X ) et g (Y ) ont la mme loi. Soit Z une autre v.a.r., montrer
que les v.a.r. X Z et Y Z nont pas ncessairement la mme loi.
Calculer la fonction caractristique des variables alatoire suivantes (pour les dfinitions
se reporter au formulaire de lannexe A, page 205) :
1. X suit une loi gomtrique G(p).
2. Y suit une loi uniforme U([a, b]).
3. Z suit une loi exponentielle E().

Soit une mesure de probabilit sur R et D une partie partout dense dans R (i.e.
ladhrence de D est gale R) telle que, pour tout t D, F (t) {0, 1}. Montrer
quil existe a R tel que = a .
CT U
Besancon
Chapitre 4. Indpendance stochastique
61
Chapitre 4
Indpendance stochastique
Dans la suite, si A et B sont respectivement des parties de Rn et Rp , on posera avec un lger
abus,
AB := {(x1 , , xn+p ) Rn+p /(x1 , , xn ) A et (xn+1 , , xn+p ) B},
c--d AB := (ARp ) (Rn B). De mme, si a := (a1 , , an ) Rn et b := (b1 , , bp )
Rp , on notera (a, b) := (a1 , , an , b1 , , bp ) considr comme lment de Rn+p . On dit que
(a, b) est obtenu par concatnation de a et b.
4.1
Intgration sur Rn+p
Pour introduire la problmatique de lintgration sur Rn+p , commenons par considrer les deux
situations suivantes :
1) Soient a := (a1 , , an ) Rn et b := (b1 , , bp ) Rp . On remarque quavec les notations
prcises en prliminaires on peut crire, pour tous borliens A et B respectivement de Rn et
Rp ,
(a,b) (AB) = 1lAB (a, b) = 1lA (a)1lB (b) = a (A)b (B).
2) De mme, considrons la mesure de Lebesgue sur R2 . Par dfinition pour tous rels
a, b, c, d, avec a < b et c < d, (2) (]a, b]]c, d]) = (]a, b])(]c, d]) o dsigne la mesure
de Lebesgue sur R. Plus gnralement on montre que, pour tous borliens A et B de R,
(2) (AB) = (A)(B).
Gnralisons ces situations en considrant le problme suivant : tant donn deux mesures et
respectivement sur Rn et Rp , existe-t-il une mesure sur Rn+p telle que, pour tous borliens A
et B respectivement de Rn et Rp , (AB) = (A)(B) ? Si oui, y a-t-il unicit de la mesure ?
On montre que dans le cas o et sont des probabilits la rponse est positive. Dans le cas
des mesures plus gnrales ce nest plus ncessairement vrai, cependant cest encore vrai pour
les mesures de Lebesgue. Plus prcisment, on admettra le rsultat suivant :
Proposition 4.1.
Soit (respectivement ) une probabilit ou la mesure de Lebesgue sur Rn (respectivement
sur Rp ) alors il existe une unique mesure sur Rn+p , note , telle que, pour tous borliens
A et B respectivement de Rn et Rp , (AB) = (A)(B).
CT U
Besancon
62

Dfinition 4.1.
On dit que est le produit des mesures et . On dit aussi que est une
mesure-produit sur Rn+p .
On notera que toutes les mesures sur Rn+p ne sont pas ncessairement des mesures-produit.
Exemples 4.1.
On admettra que, pour tous entiers n 1 et p 1, (n+p) = (n) (p) . En particulier on
utilisera souvent la relation (2) = . 2
Le thorme suivant, nonc sous la forme la plus utilise dans ce cours, est un cas particulier
du thorme de Tonelli vu en thorie de la mesure et de lintgration. Il donne un procd
de calcul des intgrales sur Rn+p . Il permettra par un procd de rcurrence den dduire une
mthode de calcul des intgrales sur Rd .
Proposition 4.2.
Thorme de Tonelli (admis)
Soient une probabilit ou la mesure de Lebesgue sur Rn , une probabilit ou la mesure de
Lebesgue sur Rp et f une application borlienne positive de Rn+p dans [0, +], alors
1. Pour tous y Rp et x Rn , les applications partielles
u Rn 7 f (u, y ) [0, +] et v Rp 7 f (x, v ) [0, +]
sont borliennes positives.
2. Les applications
Z
Z
n
p
x R 7
f (x, v )d(v ) [0, +] et y R 7
Rp
f (u, y )d(u) [0, +]
Rn
sont borliennes positives,

3. On a les galits

Z
Z Z
f d( ) =
f (x, y )d(x) d(y )
Rn+p
Rp
Rn

Z Z
=
f (x, y )d(y ) d(x).
Rn
Rp
Le thorme de Tonelli permet en pratique de ramener le calcul dune intgrale multiple, i.e.
sur Rd , au calcul dune succession de d intgrales simples, i.e. sur R, pour lesquelles on
peut appliquer sparment les rgles dintgration dj vues au chapitre III.
Ce rsultat est encore vrai pour les applications f de signe quelconque condition quelles
soient supposes intgrables sur Rn+p suivant la mesure-produit . Il est alors connu sous
le nom de thorme de Fubini :
CT U
Besancon
63
Proposition 4.3.
Thorme de Fubini
Soient une probabilit ou la mesure de Lebesgue sur Rn , une probabilit ou la mesure de
Lebesgue sur Rp et f une application ( )-intgrable de Rn+p dans R, alors,
1. Pour -presque-tout x Rn , lapplication y Rp 7 f (x, y ) R est -intgrable, et,
pour -presque-tout y Rp , lapplication x Rn 7 f (x, y ) R est -intgrable.
Z
p
2. Lapplication y R 7
f (x, y )d(x) R est dfinie -presque-partout et Rn
Z
n
intgrable, et lapplication x R 7
f (x, y )d(y ) R est dfinie -presque-partout
Rp
et -intgrable.
3. Lintgrale de fZ par rapport la mesure-produit
est donne par :
Z Z
f d( ) =
f (x, y )d(y ) d(x)
Rn+p

ZRn ZRp
f (x, y )d(x) d(y ).
=
Rp
Rn
Dautres notations sont utilises dans les ouvrages pour noter une intgrale suivant une mesureproduit. On trouvera indiffremment
Z
Z
Z
f d( ) =
f (x, y ) d( )(x, y ) =
f (x, y ) d(x) d(y )
n+p
Rn+p
Rn+p
ZR
f (x, y ) d(x)d(y ).
=
Rn+p
Exemples 4.2.
Considrons lapplication f dfinie sur R2 par f (x, y ) := 1l]0,+[ (x)1l]a,b[ (y )e xy o a et b
sont des rels tels que 0 < a < b. Cest une fonction borlienne positive sur R2 . Appliquons
le thorme de Tonelli f et la mesure (2) = ,

Z
Z
Z
xy
(2)
f d
=
1l]0,+[ (x)
1l]a,b[ (y )e d(y ) d(x)
R
R2
R
Z

Z
xy
=
1l]a,b[ (y )
1l]0,+[ (x)e d(x) d(y ).
R
Ce qui donne en utilisant la rgle dintgration suivant la mesure de Lebesgue sur R des
fonctions borliennes positives,
Z
Z + ax
e
e bx
(2)
dx
f d
=
x
R2
0

Z
Z b
1
1
b
=
1l]a,b[ (y ) d(y ) =
dy = ln
.
y
a
R
a y
On a ainsi par la mme occasion tabli la valeur de lintgrale gnralise au sens de
Riemann

Z + ax
e
e bx
b
dx = ln
.2
x
a
0
CT U
Besancon
64

Pour complter les techniques dintgration suivant la mesure de Lebesgue sur Rd , le thorme
suivant, dit de changement de variable, est trs utile.
Rappelons quun diffomorphisme F de classe C 1 dun ouvert U sur un ouvert V de Rd
est une application bijective, diffrentiable de U sur V telle que F 1 soit diffrentiable avec les
applications diffrentielles de F et F 1 continues. De plus si f1 , , fd sont les applicationscomposantes de F , on appelle jacobien de F au point u U le dterminant de la matrice carr
dordre d de coefficient gnral j fi (u) o j fi (u) dsigne la drive-partielle de lapplication fi
par rapport la j ime variable calcule au point u U.
Proposition 4.4.
Thorme de changement de variable dans Rd (admis)
Soient T un diffomorphisme de classe C 1 dun ouvert U sur un ouvert V de Rd et f une
application borlienne de Rd dans R. Notons J(v ) le jacobien de T 1 au point v V .
1. Si f est valeurs dans [0, +], alors x Rd 7 1lV (x)f (T 1 (x))|J(x)| est une
application borlienne positive.
2. Si lapplication x Rd 7 1lU (x)f (x) est (d) -intgrable sur Rd , alors lapplication
x Rd 7 1lV (x)f (T 1 (x))|J(x)| est (d) -intgrable sur Rd .
De plus, dans les deux cas ci-dessus
Z
Z

(d)
1lU (u)f (u)d (u) =
1lV (v )f T 1 (v ) |J(v )| d(d) (v ),
Rd
Rd
quon crit encore :

Z
f (u)d
(d)
Z
(u) =

f T 1 (v ) |J(v )| d(d) (v ).
On dit alors quon a effectu le changement de variable v := T (u) o v dsigne le vecteur

des "nouvelles" variables et u celui des "anciennes". On remarquera surtout que le jacobien
utilis est celui de la transformation exprimant les "anciennes" variables en fonction des "nouvelles" c--d de T 1 .
Illustrons par un exemple lutilisation des thormes de Tonelli et de changement de variable.
Exemples 4.3.
Montrons que
Z
I :=
R2
1l]0,+[2 (x, y )e (x
2 +y 2 )
d(2) (x, y ) =
.
4
En effet, ici U :=]0, +[2 , u := (x, y ). Considrons le changement de variable x = r cos
CT U
Besancon
65
et y = r sin o v := (r , ) V :=]0, +[]0, 2 [. Comme |J(v )| = r , il vient

Z
2
I =
1l]0,+[]0, 2 [ (r , )e r r d(2) (r , )
2
Z

ZR
r 2
1l]0,+[ (r )e r
1l]0, 2 [ ()d() d(r )
=
R
R
Z
Z

Z +
2
r 2
r
=
1l]0,+[ (r )e r d(r )
1l]0, 2 [ ()d() =
e r dr
= .
2
4
R
R
0
Dans le calcul prcdent on a utilis le thorme de Tonelli et la rgle dintgration suivant
la mesure de Lebesgue sur R. 2
1) Dduire du rsultat de lexemple prcdent les deux relations
Z +
Z +
1 2
1
1
x 2
e dx =
et
e 2 x dx = 1.
2
2
0
2
2
2
2
2) En
Z remarquant que x + 2xy + 2y = (x + y ) + y , dduire de la question prcdente
2
2
e (x +2xy +2y ) d(2) (x, y ) = .
que
R2
Le thorme de Fubini ou de Tonelli sont en particulier trs utiles dans les calculs faisant
intervenir des probabilits densit dfinies sur Rd . Donnons un exemple dutilisation de la
proposition 3.8, page 35, dans le calcul de lois de probabilit sur R2 .
Exemples 4.4.
Soit (X , Y ) un vecteur alatoire de R2 dont la loi admet pour densit la fonction dfinie sur
R2 := 21 1l o := {(x, y ) R2 /|x| + |y | 1}. Cherchons la loi de la variable alatoire
relle X .
Soit A un borlien de R. Calculons PX (A). Par dfinition de la notion de loi et comme
{X A} = {(X , Y ) AR},
PX (A) = P(X A) = P ((X , Y ) AR)
Z
= P(X ,Y ) (AR) =
1lA (x)1lR (y )dP(X ,Y ) (x, y ).
R2
Daprs la rgle dintgration des mesures densit sur R2 puis par application du thorme
de Tonelli (2) = ,
Z
Z
1
1lA (x)1lR (y )dP(X ,Y ) (x, y ) =
1lA (x)1lR (y ) 1l (x, y )d(2) (x, y )
2
2
R2
Z

ZR
1
=
1lA (x)
1l (x, y )d(y ) d(x)
R
R 2
Z
=
1lA (x)(x)d(x)
R
o on a pos aprs le calcul de lintgrale

Z
1
1l (x, y )d(y ) = (1 |x|)1l[1,1] (x).
(x) :=
R 2
CT U
Besancon
66

Ce qui prouve que la variable alatoire relle X a pour loi la probabilit dfinie sur R par
la densit . On trouve par symtrie des rles jous par X et Y que Y a mme loi que X
(cela ne signifie pas que X = Y !). 2
Citer un exemple simple de variables alatoires relles X et Y distinctes et de mme loi.
En fait on vient de montrer, sur un cas particulier, le rsultat important ci-dessous qui affirme
que si un vecteur alatoire admet une densit, alors ses composantes sont des variables alatoires
relles densit. La rciproque est fausse en gnral comme le montre le contre-exemple propos
dans lexercice 4.4 ci-dessous. Plus prcisment :
Proposition 4.5.
Si X := (X1 , , Xd ) est un vecteur alatoire de densit sur Rd , alors, pour tout entier
1 k d, la v.a.r. Xk admet pour densit lapplication k dfinie sur R par
Z
(x1 , , xk1 , t, xk+1 , , xd )d(d1) (x1 , , xk1 , xk+1 , , xd ).
k (t) :=
Rd1
La rciproque est fausse.

Dmontrer cette proposition pour d = 3 en adaptant la dmarche dveloppe dans
lexemple prcdent dans lequel on avait d = 2.

Soit X une variable alatoire relle de loi normale standard N 1 (0, 1). On pose :=
{(x, y ) R2 , y = x}, Prouver que P(X ,X ) () = 1. En supposant que le vecteur alatoire
(X , X ), admette une densit sur R2 , prouver que, sous cette hypothse, P(X ,X ) () = 0.
En dduire que le vecteur alatoire (X , X ) de dimension 2 nadmet pas de densit sur R2
et que la rciproque de la proposition 4.5 est fausse.
4.2
4.2.1
Indpendance de vecteurs alatoires, dvnements,

de tribus
Indpendance de vecteurs alatoires
Exemples 4.5.
Revenons lexemple 4.4 de la page 65 pour montrer que, dans ce cas, P(X ,Y ) 6= PX PY .
En effet, considrons le borlien de R2 , G :=] 21 , 1[] 12 , 1[, et comparons P(X ,Y ) (G ) avec
PX PY (G ). Il vient dune part,
Z
Z
1
P(X ,Y ) (G ) =
1lG (x, y )dP(X ,Y ) (x, y ) =
1lG (x, y ) 1l (x, y )d(2) (x, y ) = 0
2
R2
R2
CT U
Besancon
67
car 1lG 1l est lapplication nulle sur R2 , et dautre part,

1
1
PX PY (G ) = PX ] , 1[ PY ] , 1[ .
2
2
Or

Z
Z
Z 1
1
1
PX ] , 1[ =
(1 x)dx = .
1l] 1 ,1[ dPX = (1 |x|)1l[1,1] (x)1l] 1 ,1[ (x)d(x) =
2
2
1
2
8
R
R
2
Ce qui montre que 0 = P(X ,Y ) (G ) 6= PX PY (G ) = ( 18 )2 et prouve que le produit des lois
de X et Y , qui est une probabilit sur R2 , nest pas gal la loi du vecteur (X , Y ) i.e.
P(X ,Y ) 6= PX PY . 2
Les situations pour lesquelles on aura lgalit seront celles o on dira quil y a indpendance
des variables suivant la dfinition :
Dfinition 4.2.
Une suite finie de vecteurs alatoires (X1 , , Xn ), de dimensions quelconques (ventuellement
distinctes), est dite indpendante (relativement P) si
P(X1 , ,Xn ) = PX1 PX2 PXn .
On dit aussi, par abus, que les vecteurs alatoires X1 , , Xn sont indpendants. Il sagit l
dun abus car lindpendance est une proprit de la suite (X1 , , Xn ) et non de chacune des
variables alatoires relles Xk .
Dfinition 4.3.
La loi du vecteur alatoire concatn X := (X1 , , Xn ) est dite aussi loi conjointe des
vecteurs X1 , , Xn . Pour tout entier k = 1, , n, la loi du vecteur alatoire Xk sappelle
alors la loi marginale de X de rang k.
Exemples 4.6.
Avec cette terminologie, on peut noncer le rsultat de lexemple 4.5 prcdent en exprimant que le couple de variables alatoires relles (X , Y ) nest pas indpendant.
Dans le chapitre sur les convergences de suite de variables alatoires relles on aura besoin de
la dfinition suivante :
Dfinition 4.4.
Une suite infinie (Xk )N de vecteurs alatoires est dite indpendante (relativement P) si
toute sous-famille finie est indpendante relativement P.
On montre que si (k )kI , o I N, est une suite (finie ou infinie) de probabilits sur R, on
peut toujours construire un espace de probabilit (, F, P) et une suite indpendante (Xk )kI
de variables alatoires relles dfinies sur (, F, P) telle que, pour tout k I , k soit la loi de
la variable alatoire relle Xk .
On peut vrifier aisment quune suite infinie de vecteurs alatoires (Xk )N est indpendante si,
et seulement si, pour tout entier n N, la suite finie (X0 , , Xn ) est indpendante.
CT U
Besancon
68

Soit (U, V ) un couple indpendant de variables alatoires relles dont la loi de chaque
composante
est la loi uniforme U([0,
1]) de densit 1l[0,1] . On dfinit les variables alatoires

X := 2 ln U cos(2V ) et Y := 2 ln U sin(2V ).
1. Montrer que le vecteur alatoire (X , Y ) de dimension 2 admet pour densit
1 x 2 +y 2
lapplication dfinie sur R2 par (x, y ) :=
e 2 . On dit quil suit une loi nor2
male de dimension 2. Les vecteurs de ce type seront tudis plus en dtail au
chapitre suivant.
2. Montrer que les variables alatoires relles X et Y ont toutes les deux pour loi
N 1 (0, 1).
3. Dduire des questions prcdentes que le couple de variables alatoires relles (X , Y )
est indpendant.
4.2.2
Critres dindpendance de vecteurs alatoires
Les propositions qui suivent ont pour but de donner des critres permettant de reconnatre si
une suite finie de vecteurs alatoires est indpendante.
Proposition 4.6.
Soit (X1 , , Xn ) une suite de vecteurs alatoires de dimensions respectives d1 , , dn . Les
assertions suivantes sont quivalentes :
1. La suite (X1 , , Xn ) est indpendante.
2. Pour tout entier 1 k n et tout borlien Bk de Rdk ,
P(X1 , ,Xn ) (B1 B2 Bn ) = PX1 (B1 )PX2 (B2 ) PXn (Bn ).
P [X1 , , Xn ) B1 Bn ] = P(X1 B1 ) P(Xn Bn ).
P [{X1 B1 } {Xn Bn }] = P(X1 B1 ) P(Xn Bn ).
Dmonstration : "(1) implique (2)" rsulte de la dfinition des produits de lois. "(2) implique
(3)" rsulte de la dfinition de la notion de loi et des notations. "(3) implique (4)" rsulte de
la relation ensembliste immdiate vrifier :
{(X1 , , Xn ) B1 Bn } = {X1 B1 } {X2 B2 } {Xn Bn }.
Limplication " (4) implique (1) " rsulte de ce que la probabilit P(X1 , ,Xn ) vrifie la proprit
caractristique des mesures-produits : Pour tout entier 1 k n et tout borlien Bk de Rdk ,
P(X1 , ,Xn ) (B1 B2 Bn ) = PX1 (B1 )PX2 (B2 ) PXn (Bn ). Par unicit de la mesure-produit,
on en dduit que P(X1 , ,Xn ) = PX1 PX2 PXn . Ce qui prouve (1). 2
CT U
Besancon
69
Dans les cas o on manipule des variables alatoires relles discrtes la proposition prcdente
a pour corollaire le critre dindpendance ci-dessous. Pour simplifier on supposera que les
variables alatoires relles sont portes par N mais le rsultat se gnralise aux variables
alatoires relles portes par un ensemble dnombrable quelconque de R, notamment Z.
Proposition 4.7.
Critre des v.a.r. discrtes
Soit (X1 , , Xn ) une suite de variables alatoires relles discrtes portes par N, alors la suite
(X1 , , Xn ) est indpendante si, et seulement si, pour tout (k1 , , kn ) Nn ,
P ({X1 = k1 } {Xn = kn }) = P(X1 = k1 ) P(Xn = kn ).
Dmonstration : La condition ncessaire rsulte de limplication "(1) implique (4)" de la
proposition prcdente o on a pris Bi := {ki }, i = 1, , n, qui sont bien des borliens
de R.
La condition suffisante rsulte du fait que P(X1 , ,Xn ) est une probabilit discrte sur Rn , elle est
donc entirement dtermine par la connaissance des nombres
P(X1 , ,Xn ) ({k1 }{k2 } {kn })
qui sont, par hypothse, gaux
P(X1 = k1 )P(X2 = k2 ) P(Xn = kn ).
De mme on vrifie que PX1 PXn est une probabilits porte par Nn donc discrte. Elle
est donc entirement dtermine par la connaissance des nombres
PX1 PXn ({k1 }{k2 } {kn }) = P(X1 = k1 )P(X2 = k2 ) P(Xn = kn ).
Par suite
P(X1 , ,Xn ) = PX1 PXn .
Ce qui prouve lindpendance de la suite (X1 , , Xn ). 2
Exemples 4.7.
Reprenons les notations de lexemple 3.12, page 42. X := (X1 , X2 ) est un vecteur alatoire
de dimension 2 de loi
X 1
.
PX :=
k+l (k,l)
2
k1,l1
Par suite, pour tous k N et l N ,
P[{X1 = k} {X2 = l}] =
1
2k+l
et P(X1 = k) = P(X2 = k) =
1
.
2k
Ce qui montre que, pour tous k N et l N ,

P[{X1 = k} {X2 = l}] = P(X1 = k)P(X2 = l)
et prouve ainsi lindpendance de la suite de variables alatoires relles (X1 , X2 ). 2
CT U
Besancon
70

On vient dtablir un critre dindpendance pour une grande famille de probabilits, celle des
probabilits discrtes, donnons maintenant un critre pour une autre grande famille de probabilits, celle des probabilits densit.
Proposition 4.8.
Critre des v.a.r. densit
1. Si (X1 , , Xn ) est une suite indpendante de variables alatoires relles telle que, pour
tout k = 1, , n, la variable alatoire relle Xk soit de densit k sur R, alors le vecteur
alatoire X := (X1 , , Xn ) de dimension n admet pour densit sur Rn lapplication
: (x1 , , xn ) Rn 7 (x1 , , xn ) := 1 (x1 )2 (x2 ) n (xn ) [0, +].
2. Rciproquement, si X := (X1 , , Xn ) est un vecteur alatoire de dimension n admettant
pour densit sur Rn une application dfinie par une relation de la forme (x1 , , xn ) :=
g1 (x1 )g2 (x2 ) gn (xn ), o, pour tout k = 1, , n, gk est une application borlienne
positive de R dans [0, +], alors la suite de variables alatoires relles (X1 , , Xn )
est indpendante et, pour tout k = 1, , n, la variable alatoire relle Xk admet pour
densit sur R lapplication
k : t R 7 k (t) := R
gk (t)
[0, +].
g d
R k
Dmonstration : Pour simplifier les notations, faisons la dmonstration dans le cas n = 3.

1) Soient (X , Y , Z ) une suite indpendante de variables alatoires relles et h une application
borlienne positive de R3 dans [0, +]. Par le thorme du transfert, lindpendance de la
suite (X , Y , Z ) i.e. P(X ,Y ,Z ) = PX PY PZ , puis en appliquant le thorme de Tonelli
PX PY PZ , la dfinition des lois densit et nouveau le thorme de Tonelli en sens
inverse = (3) , il vient successivement
Z
E[h(X , Y , Z )] =
h(u, v , w )dPX PY PZ (u, v , w )
R3

Z Z Z
=
h(u, v , w )dPX (u) dPY (v ) dPZ (w )
R
R
R

Z Z Z
=
h(u, v , w )1 (u)d(u) 2 (v )d(v ) 3 (w )d(w )
R
R
ZR
=
h(u, v , w )1 (u)2 (v )3 (w )d(3) (u, v , w ).
R3
Ce qui prouve que la loi du vecteur alatoire (X , Y , Z ) admet pour densit sur R3 lapplication
dfinie par (u, v , w ) := 1 (u)2 (v )3 (w ).
2) Supposons que le vecteur alatoire (X , Y , Z ) admette pour densit sur R3 lapplication
dfinie par (u, v , w ) := g1 (u)g2 (v )g3 (w ).
Commenons par tudier la loi de la premire composante X .
Daprs la proposition 4.5,Rla variable alatoire relle X admet pour densit sur R lapplication
1 dfinie par 1 (t) := R2 (t, u, v )d(2) (u, v ). Par application du thorme de Tonelli
CT U
Besancon
71
(2) = , il vient

Z
Z
Z
(2)
1 (t) =
g1 (t)g2 (u)g3 (v )d (u, v ) = g1 (t)
g2 (u) g3 (v )d(v ) d(u)
R2
R
R
Z
Z

g1 (t)
= g1 (t)
g2 d
g3 d = R
,
g d
R
R
R 1
car, comme est une densit de probabilit,
Z
Z
(3)
1=
(t, u, v )d (t, u, v ) =
g1 (t)g2 (u)g3 (v )d(3) (t, u, v )
3
3
R
RZ
Z
Z

=
g1 d
g2 d
g3 d .
R
On notera que cela implique en particulier que R g1 d 6= 0. On trouve de la mme manire

un rsultat analogue pour Y et Z .
Montrons lindpendance de la suite (X , Y , Z ).
Soient A, B, C des borliens de R. En notant que, pour tout ,
1l{(X ,Y ,Z )ABC } () = 1l{X A}{Y B}{Z C } () = 1l{X A} ()1l{Y B} ()1l{Z C } ()
et 1l{X A} () = 1lA (X ()), en utilisant les proprits de loprateur dintgration donne dans
la proposition 3.1, page 30, puis en appliquant les thormes du transfert et de Tonelli, il vient
P(X ,Y ,Z ) (ABC ) = E[1l{(X ,Y ,Z )ABC } ] = E[1lA (X )1lB (Y )1lC (Z )]
Z
1lA (x)1lB (y )1lC (z)g1 (x)g2 (y )g3 (z)d(3) (x, y , z, )
=
3

Z
Z
RZ
1lC g3 d .
1lB g2 d
1lA g1 d
=
R
De plus, comme les variables alatoires relles X , Y , et Z ont pour densits respectives 1 , 2 ,
et 3 ,

Z
Z
Z
1lA 1 d
1lB 2 d
1lC 3 d
PX (A)PY (B)PZ (C ) =
R
R
R
Z
Z
Z

g1 (t)
g2 (t)
g3 (t)
=
1lA (t) R
d(t)
1lB (t) R
d(t)
1lC (t) R
d(t)
g
d
g
d
g d
1
2
R
R
R
R
R
R 3
Z
Z
Z

=
1lA g1 d
1lB g2 d
1lC g3 d ,
R
toujours en vertu de
Z
R
Z
Z

g1 d
g2 d
g3 d = 1.
R
Ce qui montre que, pour tous borliens A, B, C de R,

P(X ,Y ,Z ) (ABC ) = PX (A)PY (B)PZ (C )
et prouve ainsi lindpendance de la suite de variables alatoires relles (X , Y , Z ). 2
CT U
Besancon
72

Donnons un autre nonc, beaucoup plus utile dans la pratique, du critre dindpendance des
variable alatoire relle densit :
Proposition 4.9.
Soit (X1 , , Xn ) une suite de variables alatoires relles telle que, pour tout k = 1, , n, la
variable alatoire relle Xk soit de densit k sur R. Alors la suite de variables alatoires relles
(X1 , , Xn ) est indpendante si, et seulement si, le vecteur alatoire X := (X1 , , Xn ) de
dimension n admet pour densit sur Rn lapplication
: (x1 , , xn ) Rn 7 (x1 , , xn ) := 1 (x1 )2 (x2 ) n (xn ) [0, +].
Dmonstration : La condition ncessaire est lassertion 1) de la proposition 4.8 prcdente et

la condition suffisante rsulte deR lassertion 2) avec, pour tout k = 1, , n, gk := k en
remarquant que, par hypothse, R k d = 1. 2.
Exemples 4.8.
1) Reprenons les notations de lexercice 4.5, page 68. On y tablit que le vecteur alatoire
1 x 2 +y 2
e 2 et
(X , Y ) de dimension 2 admet pour densit sur R2 lapplication (x, y ) :=
2
que les variables alatoires relles X et Y suivent la mme loi N 1 (0, 1). Leurs densits
t2
1
X et Y sur R sont dfinies sur R par X (t) = Y (t) = e 2 et vrifient la rela2
tion (x, y ) = X (x)Y (y ), ce qui prouve lindpendance de la suite de variables alatoires
relles (X , Y ) en vertu de la proposition prcdente.
2) Dans lexemple 4.4, page 65, on vrifie aisment que (x, y ) 6= (x)(y ), ce qui est une
autre faon de prouver que la suite de variables alatoires relles (X , Y ) nest pas indpendante. 2
Donnons un critre valable pour des vecteurs alatoires gnraux sans hypothses sur le type
de loi quils satisfont.
Proposition 4.10.
Critre des fonctions positives
Soit (X1 , , Xn ) une suite de vecteurs alatoires de dimensions respectives d1 , , dn . Alors,
la suite (X1 , , Xn ) est indpendante si, et seulement si, pour tout entier 1 k n et toute
application borlienne positive fk de Rdk dans [0, +],
E [f1 (X1 )f2 (X2 ) fn (Xn )] = E [f1 (X1 )] E [f2 (X2 )] E [fn (Xn )] .
Dmonstration : Faisons la dmonstration pour n = 2.

- C.N. Par application des thormes du transfert et de Tonelli o on utilise lindpendance
CT U
Besancon
73
en crivant P(X1 ,X2 ) = PX1 PX2 , il vient

Z
E [f1 (X1 )f2 (X2 )] =
f1 (x)f2 (y )dP(X1 ,X2 ) (x, y )
Rd1 +d2
Z

Z
=
f1 (x)
f2 (y )dPX2 (y ) dPX1 (x)
Rd1
Rd2
Z
Z

=
f1 dPX1
f2 dPX2
Rd1
Rd2
= E [f1 (X1 )] E [f2 (X2 )] .

- C.S. Il suffit de prendre f1 := 1lA et f2 := 1lB o A et B sont des borliens respectivement
de Rd1 et Rd2 . En explicitant la relation de lhypothse
E [1lA (X1 )1lB (X2 )] = E [1lA (X1 )] E [1lB (X2 )]
on obtient
P[(X1 , X2 ) AB] = P[X1 A]P[X2 B],
ce qui prouve que P(X1 ,X2 ) = PX1 PX2 . 2
A titre dexemple dutilisation de cette proposition, donnons un corollaire trs utile dans les
calculs faisant intervenir des variables alatoires relles indpendantes et intgrables :
Proposition 4.11.
Soit (X1 , , Xn ) une suite de variables alatoires relles intgrables. Si la suite (X1 , , Xn )
est indpendante, alors la variable alatoire relle produit X1 X2 Xn est intgrable et
E[X1 X2 Xn ] = E(X1 )E(X2 ) E(Xn ).
Dmonstration : Faisons-la pour deux variables alatoires relles X et Y indpendantes et
intgrables i.e. E(|Y |) < + et E(|X |) < +. On peut crire
E(|X Y |) = E(|X ||Y |) = E(|X |)E(|Y |) < +,
o on a appliqu, dans la deuxime galit, la proposition 4.10 avec les fonctions positives
x 7 |x| grce lindpendance de (X , Y ). On a donc prouv que la variable alatoire relle
X Y est intgrable.
Montrons la deuxime relation. Remarquons quen introduisant les parties positives et ngatives
des v.a.r. , on peut crire
X Y = (X + X )(Y + Y ) = X + Y + + X Y X Y + X + Y
qui donne, en prenant les esprances de chaque membres de lgalit prcdente et en appliquant
la proposition 4.10 aux fonctions borliennes positives x 7 x + et x 7 x ,
E(X Y ) = E[X + Y + ] + E[X Y ] E[X Y + ] E[X + Y ]
= E(X + )E(Y + ) + E(X )E(Y ) E(X )E(Y + ) E(X + )E(Y )
= E(X )E(Y ).
CT U
Besancon
74

do la relation cherche. 2
Lexercice suivant propose un contre-exemple prouvant que la rciproque de la proposition
prcdente 4.11 est fausse. Cet exercice est souvent la base de nombreux contre-exemples
concernant lindpendance des variables alatoires.
Soient X une variable alatoire relle de loi N 1 (0, 1) et une variable alatoire relle indpendante de X de loi 12 (1 + 1 ). Montrer que la variable alatoire relle Y := X est
de loi N 1 (0, 1). Prouver que les v.a.r. X , Y vrifient la relation E(X Y ) = E(X )E(Y ) mais
que le couple (X , Y ) nest pas indpendant (pour cela on calculera E(X 2 Y 2 ) et on utilisera
la proposition 4.10).
Proposition 4.12.
Critre des fonctions borne
la suite (X1 , , Xn ) est indpendante si, et seulement si, pour tout entier 1 k n et toute
application borlienne borne fk de Rdk dans [0, +],
E [f1 (X1 )f2 (X2 ) fn (Xn )] = E [f1 (X1 )] E [f2 (X2 )] E [fn (Xn )] .
Dmonstration : Faisons la dmonstration pour n = 2.
- C.N. Par application des thormes du transfert et de Fubini (car les fonctions borliennes
bornes sont intgrables) o on utilise lindpendance en crivant P(X1 ,X2 ) = PX1 PX2 , il vient
Z
E [f1 (X1 )f2 (X2 )] =
f1 (x)f2 (y )dP(X1 ,X2 ) (x, y )
Rd1 +d2

Z
Z
f2 (y )dPX2 (y ) dPX1 (x)
f1 (x)
=
Rd1
Rd2
Z
Z

f1 dPX1
f2 dPX2
=
Rd1
Rd2
= E [f1 (X1 )] E [f2 (X2 )] .

- C.S. Il suffit de prendre f1 := 1lA et f2 := 1lB o A et B sont des borliens respectivement
de Rd1 et Rd2 . En explicitant la relation de lhypothse
E [1lA (X1 )1lB (X2 )] = E [1lA (X1 )] E [1lB (X2 )]
on obtient
P[(X1 , X2 ) AB] = P[X1 A]P[X2 B],
ce qui prouve que P(X1 ,X2 ) = PX1 PX2 . 2

Soit (X , Y ) un couple indpendant de variables alatoires relles de mme loi N 1 (m, 2 ),
montrer que E [(X + Y )2 ] = 4m2 + 2 2 .
CT U
Besancon
75
Comme corollaire de la proposition 4.11,

Proposition 4.13.
Soit X := (X1 , X2 , ..., Xd ) un vecteur alatoire de carr intgrable de dimension d. Si la suite
de variables alatoires relles (X1 , X2 , ..., Xd ) est indpendante, alors la matrice de dispersion
de X est diagonale.
Dmonstration : La proposition 4.11 entrane que, pour tout couple dentiers (i, j) avec i 6= j,
Cov(Xi , Xj ) = 0. On conclut en utilisant lassertion 3) de la proposition 3.24, page 48. 2
Donnons un procd simple de construction de suites indpendantes de vecteurs alatoires
partir de deux fonctions de v.a.r.. Ce procd peut se gnraliser un nombre quelconque de
fonctions.
Proposition 4.14.
Indpendance de fonctions de v.a.r.
Si (X1 , , Xn , Y1 , , Yp ) est une suite indpendante de v.a.r., alors, pour toutes applications
borliennes de Rn dans Rd1 et de Rp dans Rd2 , le couple de vecteurs alatoires
((X1 , , Xn ), (Y1 , , Yp )) est indpendant.
Dmonstration : Considrons les vecteurs alatoires X := (X1 , , Xn ) et Y := (Y1 , , Yp ).
Commenons par montrer que le couple de vecteurs alatoires (X , Y ) est indpendant. Comme
(X1 , , Xn , Y1 , , Yp ) est une suite indpendante, pour tous borliens de R, A1 , , An , il
vient
PX [A1 An ] = P(X1 , ,Xn ) [A1 An ]
= P(X1 , ,Xn ,Y1 , ,Yp ) [A1 An Rp ]
= PX1 (A1 ) PXn (An ).
Ce qui prouve que PX = P(X1 , ,Xn ) = PX1 PXn , et par suite
P(X ,Y ) = P(X1 , ,Xn ,Y1 , ,Yp )
= PX1 PXn PY1 PYp
= PX PY .
Le couple de vecteurs alatoires (X , Y ) est donc indpendant.
Considrons maintenant deux applications borliennes positives f1 et f2 dfinies respectivement
sur Rd1 et Rd2 . Comme f1 et f2 sont des fonctions borliennes positives, en appliquant la
condition ncessaire du critre des fonctions positives ces fonctions et la suite indpendante
(X , Y ), il vient
E[f1 ((X ))f2 ((Y ))] = E[f1 ((X ))]E[f2 ((Y ))].
On applique alors la condition suffisante du critre des fonctions positives aux fonctions f1 , f2
et la suite ((X ), (Y )) pour conclure quelle est indpendante.2
On pourra vrifier que si un couple de vecteurs alatoires (X , Y ) de dimensions respectives d
et k est indpendant avec X := (X1 , , Xd ) et Y := (Y1 , , Yk ) alors, pour tout (i, j) avec
CT U
Besancon
76

1 i d et 1 j k, le couple de v.a.r. (Xi , Yj ) est indpendant.
Donnons un cas particulier de la proposition prcdente, trs utilis en pratique :
Proposition 4.15.
Indpendance de fonctions de v.a.r. (cas usuel)
Si (X1 , , Xn ) est une suite indpendante de v.a.r., alors, pour toute suite dapplications
borliennes (f1 , , fn ) de R dans R, la suite de variables alatoires relles (f1 (X1 ), , fn (Xn ))
est indpendante.
Terminons par un critre dindpendance, simple dapplication, utilisant les fonctions caractristiques :
Proposition 4.16.
Critre dindpendance par les f.c.
la suite (X1 , , Xn ) est indpendante si, et seulement si, pour tout u1 Rd1 , un Rdn ,
(X1 , ,Xn ) (u1 , , un ) = X1 (u1 ) Xn (un )
!#
n
X

< uk , Xk >
= E e i <u1 ,X1 > E e i <un ,Xn > .
i.e. E exp i
"
k =1
Dmonstration : - C.N. Supposons que les vecteurs alatoires (X1 , , Xn ) sont indpendants.
Alors, pour tout u1 Rd1 , , un Rdn ,
(X1 , ,Xn ) (u1 , , un ) = E e

i[<u1 ,X1 >+<u2 ,X2 >++<un ,Xn >]
=E
k=n
Y
!
e i<uk ,Xk >
k=1
Daprs la proprit 4.12, page 74, applique aux fonctions borliennes bornes e i<u1 ,x1 > ,
e i<u2 ,x2 > , , e i<un ,xn > , on a
(X1 , ,Xn ) (u1 , , un ) =
k=n
Y

E e i<uk ,Xk > = X1 (u1 ) Xn (un ).
k=1
- C.S. Soit u1 Rd1 , , un Rdn , et u = (u1 , u2 , , un ) Rd1 +d2 ++dn . Soit

X = (X1 , X2 , , Xn ) un vecteur alatoire de dimension d1 + d2 + + dn de loi PX , la
condition (X1 , ,Xn ) (u1 , , un ) = X1 (u1 ) Xn (un ) scrit, en appliquant le thorme du
transfert et celui de Fubini,
Z
Z
i<u,x>
e
dP(X1 , ,Xn ) (x) =
e i<u,x> d[PX1 PX2 PXn ](x).
Rd1 +d2 ++dn
Rd1 +d2 ++dn
Ce qui prouve que les probabilits PX1 PX2 PXn et P(X1 , ,Xn ) ont les mmes fonctions
caractristiques, donc sont gales en vertu du critre didentification des lois par les fonctions
caractristiques. 2
CT U
Besancon
4.2.3
77
Indpendance dvnements, de tribus
On se donne comme rfrence un espace de probabilit (, F, P). Les rsultats prcdents

incitent largir la notion dindpendance aux famille dvnements (Ai )I et aux familles ( F i )I
de sous-tribus de F, o I est un ensemble quelconque.
Dfinition 4.5.
Une famille quelconque (Ai )I dvnements, est dite (mutuellement) indpendante pour
P si, pour toute sous-famille finie (Ai )K , K I et K fini, on a :
!
\
Y
P
Ai =
P(Ai ).
iK
iK
Dfinition 4.6.
Une famille quelconque ( F i )I de sous-tribus de F, est dite (mutuellement) indpendante
pour P si toute famille dvnements (Ai )I avec Ai F i , pour tout i I , est indpendante
pour P.
On dit aussi plus frquemment, et par abus de langage, que les vnements (Ai )I , sont indpendants (resp. les tribus ( F i )I , sont indpendantes).
On remarquera bien que la notion dindpendance dpend de la probabilit P choisie sur (, F).
De plus si lindpendance mutuelle dune famille dvnements entrane leur indpendance deux
deux, il faut noter que la rciproque est fausse (cf. [14] ex. 3-1 3-3).
La preuve de lindpendance de tribus peut stablir en considrant des -systmes de
gnrateurs daprs la proposition :
Proposition 4.17.
Soient C et D deux familles dvnements stables par intersection finie (-systmes). Si, pour
tout (A, B) C D, les vnements A et B sont indpendants, alors les sous-tribus engendres
respectivement par C et D sont indpendantes.
Dmonstration : Il suffit de montrer que, pour tout (A, B) ( C) ( D), P(A B) =
P(A)P(B).
Montrons dabord que, pour tout B D et pour tout A ( C), on a P(AB) = P(A)P(B).
Soit B D fix.
Si P(B) = 0, alors pour tout A ( C), A B B et par suite P(A B) P(B) = 0. Donc,
dans ce cas, pour tout A ( C), on a bien P(A B) = 0 = P(A)P(B).
P(A B)
[0, 1]. On vrifie
Si P(B) > 0, Considrons lapplication A ( C) 7 PB (A) =
P(B)
aisment que cest une probabilit sur (, ( C)). De plus la probabilit PB , concide avec la
probabilit P sur le -systme C, car en vertu de lhypothse, pour tout (A, B) C D,
les vnements A et B sont indpendants, on a bien P(A B) = P(A)P(B), cest--dire
PB (A) = P(A). Donc daprs le thorme dunicit pour les probabilits (cf. proposition 1.11,
page 14) on en dduit que la probabilit PB concide avec la probabilit P sur la tribu ( C)
engendre par le -systme C cest--dire que, pour tout A ( C), PB (A) = P(A), ou encore
CT U
Besancon
78

P(A B)
= P(A), ou P(A B) = P(A)P(B).
P(B)
En rsum, on a bien montr que, pour tout B D et pour tout A ( C), on a
P(A B) = P(A)P(B).
Montrons maintenant que, pour tout B ( D) et pour tout A ( C), on a P(A B) =
P(A)P(B).
Utilisons la mme dmarche. Soit A ( C) fix.
Si P(A) = 0, alors pour tout B ( D), A B A et par suite P(A B) P(A) = 0. Donc,
dans ce cas, pour tout B ( D), on a bien P(A B) = 0 = P(A)P(B).
P(A B)
[0, 1]. On vrifie
Si P(A) > 0, considrons lapplication B ( D) 7 PA (B) =
P(A)
de mme que cest une probabilit sur (, ( D)). De plus la probabilit PA , concide avec la
probabilit P sur le -systme D, car en vertu de lhypothse, pour tout (A, B) C D, les
vnements A et B sont indpendants, on a P(A B) = P(A)P(B). Donc daprs le thorme
dunicit pour les probabilits (cf. proposition 1.11, page 14) on en dduit que la probabilit PA
concide avec la probabilit P sur la tribu ( D) engendre par le -systme D cest--dire que,
P(A B)
= P(B), ou
pour tout B ( D), PA (B) = P(B), ou encore pour tout B ( D),
P(A)
P(A B) = P(A)P(B).
Finalement, on a bien montr que, pour tout B ( D) et pour tout A ( C), on a
P(A B) = P(A)P(B). 2
En utilisant la mme dmarche, on peut tablir un critre dindpendance des vecteurs alatoires,
qui prouve que dans le critre 4.6, page 68, on peut se limiter qu certains borliens de Rd :
Proposition 4.18.
Une suite (X1 , , Xn ) de vecteurs alatoires de dimensions respectives d1 , , dn , est indpendante si, et seulement si,
"k=n
# k=n
Y
\
P(Xk Ak ),
P
{Xk Ak } =
pour tout A ( C),
k=1
k=1
pour tous Ak C k , o, pour tous k = 1, 2, , n, C k est un -systme engendrant la tribu

borlienne B(Rdk ).
#
"k=n
\
Dmonstration : Pour la dmonstration remarquer que la relation P
{Xk Ak } =
k=1
k=n
Y
P(Xk Ak ), peut scrire encore P(X1 , ,Xn ) (A1 An ) =
k=1
k=n
Y
PXk (Ak ). On montre
k=1
la proposition pour n = 2 en raisonnant comme dans la proposition 4.17, puis on gnralise par
rcurrence au cas n quelconque. 2
En particulier, la proposition prcdente 4.17 a pour corollaire le thorme :
Proposition 4.19.
Soit ( F i )I une famille indpendante de sous-tribus de F. Si K et J sont deux [
parties disjointes
[
et non vides de I , alors les tribus engendres respectivement par les familles
F i et
Fi
iJ
sont indpendantes.
CT U
Besancon
iK
79
Dmonstration : Notons C J la famille des intersections de familles finies dvnements de
Fi.
iJ
Un lment de C J est de la forme
Ai o J 0 est une partie finie de J et, pour tout i J 0 ,
iJ 0
Ai F i .
[
On dfinit de mme C K la famille des intersections de familles finies dvnements de
Fi.
iK
Un lment de C K est de la forme
Ai o K est une partie finie de K et, pour tout i K 0 ,
iK 0
Ai F i .
On a ( C J ) =
Fi
!
et ( C K ) =
iJ
Fi
iK
[
En effet, en considrant les familles un seul lment, on a facilement linclusion
F i CJ ,
iJ
!
[
do linclusion des tribus engendres correspondantes
F i ( C J ). RciproqueiJ
!
[
ment, par la stabilit de lintersection finie dans les tribus, on a C J
F i , et
iJ
!
[
F i . Do lgalit. On montre de la mme faon la relation
par suite ( C J )
! iJ
[
( C K ) =
F i . De plus, on vrifie aisment que les familles C J et C K sont des iK
systmes.
Montrons que, pour tout (A, B) C J C K , \
les vnements A et B sont indpendants.
En effet, soit A C J et B C K . Alors A =
Ai o J 0 est une partie finie de J et, pour
iJ 0
tout i J 0 , Ai F i , et B =
Ai o K 0 est une partie finie de K et, pour tout i K 0 ,
iK 0
\
Ai F i . Par suite, comme J K = , on a J 0 K 0 = , et A B =
Ai . Il vient alors,
0
0
iJ K
!
\
Y
P(A B) = P
Ai =
P (Ai ) , car la suite ( F i )I est une famille indpendante de
iJ 0 K 0
iJ 0 K 0
sous-tribus de F. Par la commutativitY

et lassociativit
et puis par lindpendance
Ydu produit,Y
des sous-tribus, on peut alors crire
P (Ai ) =
P (Ai )
P (Ai ) = P(A) P(B).
iJ 0 K 0
iJ 0
iK 0
Ce qui prouve que, pour tout (A, B) C J C K , les vnements A et B sont indpendants.
On peut alors appliquer la proposition 4.17 aux -systmes C J et C K pour obtenir le rsultat
recherch. 2
Comme corollaire, nous avons un rsultat similaire avec les vnements :
Proposition 4.20.
Soit (Ai )I une famille indpendante dvnements de F. Si K et J sont deux parties disjointes
et non vides de I , alors les tribus engendres ((Ai )iJ ) et ((Ai )iK ) sont indpendantes.
CT U
Besancon
80

Dmonstration : Il suffit dappliquer la proposition 4.19 la famille des sous-tribus ((Ai ))I
de F, et
que ((Ai )iJ ) (resp. ((Ai )iK )) est aussi la tribu engendre par la
[de remarquer [
famille
(Ai ) (resp.
(Ai )). 2
iJ
iK
On peut vrifier facilement que :

Proposition 4.21.
Si la famille dvnements (Ai )I est indpendante, il en est de mme de la famille dvnements
(Bi )I o, pour tout i I , Bi := Ai ou Bi := Aci .
Dfinition 4.7.
Si X est un vecteur alatoire de dimension d, on note (X ) la plus petite sous-tribu de F
rendant mesurable lapplication X . (X ) sappelle la tribu engendre par la variable X .
On vrifie facilement que (X ) est lensemble des images-rciproques de tous les borliens de
Rd . (cf. aussi exercice 4.20, page 93, pour une gnralisation)
Exemples 4.9.
Si A est un vnement de F, (1lA ) = (A) = {, A, Ac , }.
Avec ces notations, le lien entre la notion dindpendance pour les vnements, celle pour les
vecteurs alatoires et celle pour les tribus est mis en vidence par les propositions suivantes
dont les dmonstrations sont lmentaires et laisses en exercice :
Proposition 4.22.
Une famille quelconque (Xi )I de vecteurs alatoires Xi de dimension di , i I , est indpendante
si, et seulement si, la famille de sous-tribus ((Xi ))I est indpendante.
Proposition 4.23.
La famille dvnements (Ai )I est indpendante si, et seulement si, la famille des sous-tribus
((Ai ))I est indpendante.
Proposition 4.24.
La famille dvnements (Ai )I est indpendante si, et seulement si, la famille des v.a.r. (1lAi )I
est indpendante.
Proposition 4.25.
Si A et B sont deux sous-tribus de F indpendantes, X et Y deux vecteurs alatoires
respectivement A-mesurable et B-mesurable, alors les vecteurs alatoires X et Y sont
indpendants.
4.3
Tribu et vnements asymptotiques
Soit (, F, P) un espace de probabilit et (An )N une suite dvnements de F. Pour tout

n N, notons An la tribu engendre par la suite dvnements (Ak )kn i.e. An :=
(An , An+1 , ..., An+k , ...).
CT U
Besancon
81
Dfinition 4.8.
Un vnement A de F est dit vnement asymptotique (relativement la suite
dvnements (An )N ) si A est mesurable par rapport toutes les tribus de la suite ( An )N . Cela
\
quivaut dire que A est mesurable par rapport la tribu
An appele tribu asymptotique
n=0
relative la suite dvnements (An )N .

La loi du Tout ou Rien de Kolmogorov donne des informations sur la valeur de la probabilit
dun vnement asymptotique relativement une suite indpendante dvnements (An )N :
Proposition 4.26.
Loi du Tout ou Rien ou du Zro-Un de Kolmogorov
Soit (An )N une suite indpendante dvnements. Si A est un vnement asymptotique
relativement la suite dvnements (An )N , alors P(A) = 0 ou P(A) = 1.
Dmonstration : On note, pour tout entier naturel n, An := (An , An+1 , , An+k , ), et
\
0
An := (A0 , A1 , A2 , , An ). On note A la tribu asymptotique
An .
n=0
Lide de la dmonstration est de montrer que la tribu asymptotique A est indpendante dellemme.
Montrons que, pour tout entier naturel n, An+1 = (An+1 , An+2 , , An+k , ), et
A0n := (A0 , A1 , A2 , , An ) sont des tribus indpendantes.
Pour cela il suffit dappliquer la proposition 4.20, en reprenant ses notations, au cas o I = N
avec J = {0, 1, , n} et K = {n + 1, n + 2, , n + k, }.
Montrons que, pour tout A A et pour tout B A0 , on a P(A B) =
P(A)P(B) (ce qui exprime que la tribu asymptotique A est indpendante de la tribu A0 :=
(A0 , A1 , A2 , , Ak , ).)
Remarquons tout dabord que, suivant une dmarche dj utilise dans la dmonstration de la
proposition 4.19,
\ A0 est galement engendre par le -systme C constitu des intersections
de la forme
Bi o I est une partie finie de N avec, pour tout i I , Bi (Ai ). Donc
iI
A0 = ( C).
Il reste montrer que, pour tout A A et pour tout B A0 , on a P(A B) = P(A)P(B).
Raisonnons comme dans la dmonstration de la proposition 4.18.
Soit A A fix.
Si P(A) = 0, alors pour tout B A0 , A B A et par suite P(A B) P(A) = 0. Donc,
dans ce cas, pour tout B A0 , on a bien P(A B) = 0 = P(A)P(B).
P(A B)
[0, 1]. Cest une
Si P(A) > 0, considrons lapplication B A0 7 PA (B) =
P(A)
probabilit sur (, A0 ).
La probabilit
\ PA , concide avec la probabilit P sur le -systme C. En effet, soit B C,
alors B =
Bi o I est une partie finie de N avec, pour tout i I , Bi (Ai ). Posons
iI
n0 = max(I ), alors B A0n0 = (A0 , A1 , A2 , , An0 ). mais A A An0 +1 . Comme

daprs le premier point de la dmonstration, les tribus An0 +1 et A0n0 sont indpendantes, on
a P(A B) = P(A)P(B), cest--dire PA (B) = P(B).
Donc daprs le thorme dunicit pour les probabilits (cf. proposition 1.11, page 14) on en
dduit que la probabilit PA concide avec la probabilit P sur la tribu A0 = ( C) engendre
CT U
Besancon
82

par le -systme C cest--dire que, pour tout B A0 = ( C), PA (B) = P(B), ou encore
P(A B)
pour tout B A0 = ( C),
= P(B), et par suite P(A B) = P(A)P(B).
P(A)
Finalement, on a bien montr que, pour tout B A0 et pour tout A A, on a
P(A B) = P(A)P(B).
Soit A un vnement asymptotique relativement la suite indpendante dvnements (An )N ,
i.e. A A. Comme A A0 , on peut appliquer alors le rsultat du point prcdent A A
et B = A A0 , ce qui donne P(A A) = P(A)P(A), ou encore P(A) = [P(A)]2 , ce qui
implique que P(A) ne peut prendre que la valeur 0 ou la valeur 1. 2
Donnons deux exemples importants dvnements asymptotiques :
Si (An )N est une suite dvnements, on notera lim sup An lensemble des tels que
{n N / An } est infini. En consquence, lvnement lim sup An est ralis si, et seulement
si, une infinit dvnements de la suite (An )N sont raliss.
Si (An )N est une suite dvnements, on notera lim inf An lensemble des tels que
{n N / 6 An } est fini. En consquence, lvnement lim inf An est ralis si, et seulement
si, tous les vnements de la suite (An )N , sauf ventuellement un nombre fini dentre eux, sont
raliss.
La proposition suivante affirme que les vnements lim sup(An ) et lim inf(An ) sont bien des
vnements asymptotiques :
Proposition 4.27.
Si (An )N est une suite dvnements, alors
1. lim inf An lim sup An . !
\
[
Ak .
2. lim sup An =
p=0
3. lim inf An =
k=p
p=0
k=p
Ak
!
.
4. lim sup An et lim inf An sont des vnements asymptotiques relativement la suite
dvnements (An )N .
Dmonstration : Les proprits 1), 2) et 3) rsultent directement des dfinitions de lim sup An
et lim inf An .
Montrons la proprit 4) pour lvnement lim sup An . Le raisonnement est analogue pour
[
lim inf An . Posons, pour tout entier naturel p, Bp =
Ak . La suite (Bn )N est une suite dcroisk=p
sante pour linclusion. Par suite, pour tout entier naturel p,
\
k=0
Bk =
Bk . La suite des tribus
k=p
( An := (An , An+1 , ..., An+k , ...))N est une suite dcroissante, donc pour tout entier naturel p
et pour tout entier naturel k p, Bk Ak Ap , ce qui implique que, pour tout entier naturel
\
\
\
Bk Ap . Par suite, pour tout entier naturel p, lim sup An =
Bk =
Bk Ap . Ce
p,
k=p
CT U
Besancon
k=0
k=p

qui prouve que lim sup An
83
Ap . 2
p=0
En combinant litem 4) de la proposition 4.27 prcdente et la loi du Tout ou Rien, on obtient

aisment le corollaire suivant :
Proposition 4.28.
Si (An )N est une suite indpendante dvnements, alors
1. P(lim sup An ) = 0 ou P(lim sup An ) = 1.
2. P(lim inf An ) = 0 ou P(lim inf An ) = 1.
Le lemme suivant donne des conditions suffisantes permettant de prciser laquelle des deux
valeurs possibles est la bonne :
Proposition 4.29.
Lemme de Borel-Cantelli
1. X
Soit (An )N une suite dvnements (non ncessairement indpendante). Si la srie
P(An ) de terme gnral positif P(An ) converge dans R, alors P(lim sup An ) = 0,
cest--dire presque-srement seul un nombre fini des vnements An est ralis.
X
2. Soit (An )N une suite dvnements indpendante. Si la srie
P(An ) de terme gnral
positif P(An ) diverge dans R, alors P(lim sup An ) = 1, cest--dire presque-srement un
nombre infini des vnements An est ralis.
Dmonstration :
1. Posons, pour tout entier naturel m, Bm =
k=+
[
Ak . La suite ensembliste (Bm )N
k=m
est une suite dcroissante (au sens de linclusion). Daprs le thorme de continuit
monotone des probabilits (cf. proposition 1.9, page 12), P(lim sup An ) = lim P(Bm ).
m+
!
k=+
k=+
X
[
Or P(Bm ) = P
Ak
P(Ak ), en vertu de lingalit de Bonferroni. Mais
k=m
k=m
+
X
P(Ak ) est le reste de rang m de la srie
P(An ) convergente par hypothse, donc
k=m
lim
m+
+
X
P(Ak ) = 0, et par suite
k=m
lim P(Bm ) = 0. Donc P(lim sup An ) = 0, ce quil
m+
fallait dmontrer.
p=+
2. Posons, pour simplifier les critures, A = lim sup An . Comme A =

p=+
il vient en passant au complmentaire, Ac =

entier naturel p, Bpc =
k=+
\
k=+
\
p=0
k=p
k=+
[
p=0
k=p
!
Ak
!
Ack
. Posons, pour tout
Ack . Notons que la suite ensembliste (Bpc )N est crois-
k=p
sante. On peut aussi crire Bpc =
m=+
\
k=m
\
m=p
k=p
!
Ack
. Donc, pour tout entier naturel
CT U
Besancon
84

"m=+ k=m !#
!
k=m
\
\
\
. Comme la suite ensembliste
p, P(Bpc ) = P
Ack
Ack
m=p
k=p
k=p
est
mN
dcroissante, par le thorme de continuit monotone des probabilits, il vient P(Bpc ) =

!
k=m
\
c
lim P
Ak . Comme la suite des vnements (An )N est indpendante, il en est de
m+
k=p
mme de la suite des vnements (Acn )N (cf. proposition

4.21, page 80). Par suite, pour
!
k=m
k=m
\
Y
c
c
tout entier naturel p, P(Bp ) = lim P
Ak = lim
P (Ack ) . Donc finalem+
ment P(Bpc ) = lim
m+
k=m
Y
m+
k=p
(1 P(Ak )) . La srie
k=p
ln(1 P(An )) a son terme gnral
k=p
ngatif qui vrifie, pour

X tout entier naturel n, ln(1 P(An )) P(An ). Comme, par
hypothse, la srie
P(An ) de terme gnral positif P(An ) diverge dans R, la srie
X
ln(1 P(An )) de terme gnral ngatif ln(1 P(An )) diverge vers , et donc,
k=m
Y
pour tout entier naturel n, lim
(1 P(Ak )) = 0. Do, pour tout entier naturel p,
m+
k=p
p=+
P(Bpc )
= 0, et par suite P(A ) = P
[
p=0
Bpc
= lim P(Bpc ) = 0, par le thorme de

p+
continuit monotone appliqu la suite croissante (Bpc )N . Finalement P(A) = 1. 2

On notera que si lhypothse dindpendance nest pas utile dans litem 1) du lemme de BorelCantelli, elle est par contre ncessaire dans litem 2) car, sans cette hypothse, on peut construire
des contre-exemples o P(lim sup An ) = 0 avec la srie de terme gnral P(An ) divergente. En
effet, considrons lexemple suivant :
Exemples 4.10.
Soit lespace de probabilit (R, B(R), ) o dsigne la mesure de Lebesgue sur R. Posons,
1
pour tout entier naturel n, An =]0, n+1
]. Alors on vrifie aisment que lim sup An = , do
1
P(lim sup An ) = 0, mais, pour tout entier naturel n, P(An ) =
, ce qui entrane que la
n+1
X
srie
P(An ) terme gnral positif diverge. Ici la suite dvnements (An )N nest pas
1
1 1
indpendante car par exemple P(A1 A2 ) = P(A2 ) = alors que P(A1 ) P(A2 ) = =
3
2 3
1
6= P(A1 A2 ). 2
6
4.4
Somme de v.a.r. indpendantes
Dmontrons dabord un important corollaire de lexercice 3.14, page 49 :
CT U
Besancon
85
Proposition 4.30.
Si (X1 , X2 , , Xn ) est une suite indpendante de variables alatoires relles de carr intgrable,
alors
!2
!
n
n
n
X
X
X
E
Xk
< + et Var
Xk =
Var(Xk ).
k=1
k=1
k=1

Dmonstration : Montrons lintgrabilit. On effectue les majorations
n
X
!2
Xk
k=1
n
X
!2
|Xk |
k=1
n
X
n
X
|Xk | + 2
k=1
|Xk ||Xl |.
1k<ln
Mais |Xk ||Xl | 21 (|Xk |2 + |Xl |2 ), do

n
X
|Xk | + 2
n
X
|Xk ||Xl | K
n
X
k=1
1k<ln
k=1
|Xk |2
o K est une constante. Par suite, grce aux hypothses dintgrabilit sur les variables alatoires
relles
!2
!
n
n
n
X
X
X

2
E |Xk |2 < +.
KE
|Xk | = K
E
Xk
k=1
k=1
k=1
On vrifie aisment que

Var
n
X
k=1
!
Xk
n
X
k=1
Var(Xk ) + 2
Cov(Xi , Xj )
1i<jn
et on conclut en remarquant que, par indpendance des v.a.r. , Cov(Xi , Xj ) = 0 pour tout
couple dentiers (i, j) tel que i 6= j. 2
Trouver, parmi les exercices ou exemples dj proposs, un contre-exemple prouvant que
la rciproque de limplication prcdente est fausse.
On peut gnraliser la proposition 4.30 aux vecteurs alatoires en montrant que, si (X , Y )
est un couple indpendant de vecteurs alatoires de dimension d et de carr intgrable, alors
DX +Y = DX + DY , o DX dsigne la matrice de dispersion de X .
Nous allons maintenant donner quelques rsultats sur la somme de v.a.r. indpendantes suivant
des lois classiques. Auparavant nonons un corollaire du critre des fonctions caractristiques
qui sera commode dans la recherche des lois de sommes de variables alatoires relles
indpendantes.
CT U
Besancon
86

Proposition 4.31.
Si (X1 , X2 , , Xn ) est une suite indpendante de v.a.r., alors, pour tout u R,
X1 ++Xn (u) = X1 (u) Xn (u)
!#
n
X

i.e. E exp iu
Xk
= E e iuX1 E e iuXn .
"
k =1

Dmonstration : Il suffit de prendre u := u1 = u2 = = un dans la condition ncessaire du
critre des fonctions caractristiques. 2
Pour prouver que la rciproque est fausse, construire un contre-exemple en considrant
les deux variables alatoires relles X et Y := X o X est une variable alatoire relle de
1
dont la
Cauchy de paramtre 1 i.e. de densit dfinie sur R par (x) :=
(1 + x 2 )
fonction caractristique est dfinie sur R par (t) := e |t| . Pour montrer que (X , Y )
est non indpendant, on considrera le borlien A = [1 , 1] et on calculera P(X ,Y ) (AAc )
quon comparera au produit PX (A)PY (Ac ).
A titre dapplication de la proposition prcdente, voici un rsultat qui sera fondamental dans
le chapitre sur les vecteurs gaussiens.
Proposition 4.32.
Stabilit des lois normales
Si (X1 , X2 , , Xp ) est une suite indpendante de v.a.r. normales de lois respectives
N 1 (m1 , 12 ), , N 1 (mp , p2 ), alors la v.a.r. Sp := X1 + + Xp est une v.a.r. normale
desprance m1 + + mp et de variance 12 + + p2 .
Dmonstration : On applique le rsultat prcdent 4.31 en notant que la fonction caractristique dune variable alatoire relle X de loi N 1 (m, 2 ) est X (t) = exp(imt 21 t 2 2 ). On
applique ensuite le thorme dinjectivit 3.26 en remarquant que la fonction caractristique de
la variable alatoire relle Sp est celle de la loi N 1 (m1 + + mp , 12 + + p2 ). 2
Citons, titre dexemple, un autre rsultat fondamental dont la dmonstration est laisse en
exercice :
Proposition 4.33.
Si (X1 , X2 , , Xn ) est une suite indpendante de variables alatoires relles de Bernoulli de
mme paramtre p ]0, 1[, alors la variable alatoire relle Sn := X1 + + Xn suit la loi
binomiale B(n, p).
Dmontrer la proposition prcdente.
Soit (X1 , , Xn ) une suite indpendante de n variables alatoires relles de mme densit
CT U
Besancon
87
dfinie sur R par (x) := e x 1l[0,+[ (x) o > 0. Pour tout , on range les
nombres rels X1 (), , Xn () dans lordre dcroissant et on note X(k) () le k ime de ces
nombres ainsi rangs o k = 1, , n.
1. Vrifier que X(1) = max(X1 , , Xn ) et calculer sa fonction de rpartition.
2. Que reprsente la variable alatoire relle X(n) ? Calculer sa fonction de rpartition.
3. Soit t > 0. Pour tout k = 1, , n, on pose Yk := 1l]t,+[ (Xk ).
(a) Prouver que la loi de la variable alatoire relle Yk est PYk = e t 1 +(1e t )0 .
Quelle est la loi de la variable alatoire relle Y1 + Y2 + + Yn ?
(b) Comparer les vnements {X(k) t} et {Y1 + Y2 + + Yn k 1}.
4. Dterminer, pour tout k = 1, , n, la fonction de rpartition de la variable alatoire
relle X(k) .
Dans certains cas on peut directement calculer la loi de la variable alatoire relle "somme".
En voici deux exemples noncs sous forme de propositions 4.34 et 4.36, la dmonstration de
la seconde proposition 4.36 est laisse en exercice.
Proposition 4.34.
Stabilit des lois binomiales
Si (X , Y ) est un couple indpendant de variables alatoires relles de lois binomiales respectives
B(n, p) et B(m, p) de mme paramtre p ]0, 1[, alors la variable alatoire relle X + Y suit
la loi binomiale B(n + m, p).
Dmonstration : Dans ce qui suit on adoptera la convention dcriture : Cnj := 0 pour tout
entier j > n ou j < 0. X et Y sont des lois discrtes portes respectivement par {0, 1, , n}
et {0, 1, , m}. La loi de la variable alatoire relle X + Y sera aussi discrte et porte par
{0, 1, , n + m}. Daprs la proposition 2.10, page 27, il suffit de calculer, pour tout entier
0 k n + m, le nombre P(X + Y = k). Par lgalit ensembliste facile vrifier
j=k
{X + Y = k} =
({X = j} {Y = k j})
j=0
et comme lunion est deux deux disjointe il vient, en appliquant le critre dindpendance des
variables alatoires relles discrtes au couple (X , Y ),
P(X + Y = k) =
j=k
X
P(X = j)P(Y = k j) =
j=0
j=k
X
Cnj Cmkj p k (1 p)n+mk
j=0
k
Cn+m
p k (1
n+mk
p)
La dernire galit du calcul prcdent rsulte de la formule de Vandermonde rappele ci-dessous

(proposition 4.35). La loi de la variable alatoire relle X + Y scrit alors
PX +Y =
n+m
X
k
Cn+m
p k (1 p)n+mk k .
k=0
On reconnat la loi binomiale B(n + m, p). 2

CT U
Besancon
88

Proposition 4.35.
Formule de Vandermonde
Soient n et m deux entiers naturels non nuls. Pour tout entier naturel k vrifiant 0 k n+m,
on a
j=k
X
k
,
Cnj Cmkj = Cn+m
j=0
avec la convention habituelle sur les Cni (cf. formulaire de lannexe A, page 205)
Dmonstration : Il suffit de dvelopper de deux manires diffrentes lgalit (1 + X )n+m =
(1 + X )n (1 + X )m et dgaler le coefficient de X k des deux expressions, o 0 k n + m. 2
Proposition 4.36.
Stabilit des lois de Poisson
Si (X , Y ) est un couple indpendant de variables alatoires relles de lois de Poisson respectives
P() et P(), o les rels et sont strictement positifs, alors la variable alatoire relle
X + Y suit la loi de Poisson P( + ).

Donner deux dmonstrations de la proposition prcdente, lune directe en sinspirant de
la dmonstration pour le cas des variables binomiales et lautre en utilisant les fonctions
caractristiques.
Voici quelques rsultats plus gnraux sur les sommes de variables alatoires relles indpendantes. Plus que de retenir des formules, Il faut surtout tre capable de refaire directement les
calculs dans chaque cas particulier.
Dans la proposition suivante la notation dsigne le produit de convolution de deux
fonctions f et g positives borliennes de R dans R dfini comme lapplication
Z
f g : x R 7 f g (x) :=
f (x u)g (u)d(u) [0, +].

R
Proposition 4.37.
Soit (X , Y ) un couple indpendant de variables alatoires relles admettant pour densits
respectives X et Y , alors la variable alatoire relle X + Y , admet pour densit lapplication
X +Y := X Y .
Dmonstration : Soit h une application positive borlienne dfinie sur R. Par les thormes de
CT U
Besancon
89
transfert, de Tonelli et lindpendance de (X , Y ), il vient

Z
E[h(X + Y )] =
h(x + y )dP(X ,Y ) (x, y ) =

h(x + y )dPX PY (x, y )
R2

Z Z
h(x + y )dPX (x) dPY (y )
R
R

Z Z
h(x + y )X (x)d(x) Y (y )d(y )
R
R
Z
h(x + y )X (x)Y (y )d (x, y )
2
R
Z
h(x + y )X (x)Y (y )d(2) (x, y )
R2
=
=
=
=
R2
Effectuons le changement de variables, (u, v ) := (x + y , x). Le jacobien de lapplication inverse

en (u, v ) est J(u, v ) = 1 do, par application du thorme de changement de variable la
dernire intgrale prcdente,
Z
h(u)X (v )Y (u v )d(2) (u, v )

Z
Z
X (v )Y (u v )d(v ) d(u)
=
h(u)
R
R
Z
=
h(u)(X Y )(u)d(d) (u),
E[h(X + Y )] =
R2
Rd
ce qui prouve que X Y est bien la densit de X + Y . 2

Exemples 4.11.
Soit (X , Y ) un couple indpendant de v.a.r.. On suppose que la variable alatoire relle X
suit la loi uniforme U([0, 1]) dfinie par la densit X := 1l[0,1] et Y suit la loi exponentielle
de paramtre 1 de densit Y dfinie sur R par Y (t) := 1l[0,+[ (t)e t . La densit de la variZ +
able alatoire relle X +Y est dfinie sur R par X +Y (t) :=
1l[0,1] (tx)1l[0,+[ (x)e x dx.

Ce qui aprs le calcul de lintgrale donne X +Y (t) = 1 e t 1l[0,1] (t) + e t (e
1)1l]1,+[ (t).2
Proposition 4.38.
Soit (X , Y ) un couple indpendant de v.a.r. . On suppose que X admet une densit X et
+
X
que Y est une variable discrte porte par N de loi
pk k . Alors la variable alatoire relle
k=0
Z := X + Y admet pour densit lapplication

X +Y : x R 7 X +Y (x) :=
+
X
pk X (x k) [0, +].
k=0
CT U
Besancon
90

Dmonstration : Soit h une application de R dans R borlienne positive. En utilisant le thorme
du transfert puis lindpendance de (X , Y ) avec le thorme de Tonelli, il vient
Z
Z
h(x + y )d(PX PY )(x, y )
E[h(X + Y )] =
h(x + y )dP(X ,Y ) (x, y ) =
R2
R2

Z Z
=
h(x + y )dPX (x) dPY (y )
R
R
!

Z Z
+
X
=
h(x + y )X (x)d(x) d
pk k (y )
R
+
X
k=0
Z
pk
h(x + k)X (x)d(x).

R
k=0
Z
h(x + k)X (x)d(x) le changement de variable dfini sur R, pour k N
Appliquons alors
R
fix, par u := x + k. Il vient

Z
Z
h(u)X (u k)d(u).
h(x + k)X (x)d(x) =
R
Par suite, revenant aux galits prcdentes,

E[h(X + Y )] =
+
X
k=0
Z
=
R
Z
pk
h(x + k)X (x)d(x) =

R
+
X
+
X
k=0
Z
h(u)X (u k)d(u)
pk
R
!
pk X (u k) h(u)d(u)
k=0
La dernire galit se justifie par la proprit de Beppo-Lvi vue au chapitre III. Do le rsultat.
2
Exemples 4.12.
Soit (X , Y ) un couple indpendant de v.a.r. . On suppose que la v.a.r. X suit la loi de
Gauss-Laplace N 1 (0, 1), et Y suit la loi de Poisson de paramtre > 0. Alors la densit
de la v.a.r. X + Y est dfinie sur R par

+
+ k
X
1
e X k
1
e
2
2
exp (t k) =
exp (t k) .2
X +Y (t) :=
2
k!
2
k!
2
2
k=0
k=0
4.5
Exercices de rvision sur les chapitres I IV

Soient A et B deux v.a.r. indpendantes de loi uniforme U([0, 1]). Quelle est la probabilit
que le polynme x 2 2Ax + B ait :
1. deux racines relles distinctes,
2. deux racines complexes et non relles,
CT U
Besancon
91
3. une racine double.

4. Traiter les questions prcdentes en utilisant la loi de la v.a.r. := A2 B.
On considre une variable alatoire (X , Y ) valeurs dans R2 dont la loi P(X ,Y ) admet la
densit
f (x, y ) := (1 x 2 )1l[0,1] (x)ye 3y 1l]0,+[ (y ),
o
1.
2.
3.
4.
est un rel, par rapport la mesure de Lebesgue (2) sur R2 .

Dterminer la valeur du rel .
Dterminer les lois marginales du couple (X , Y ).
Calculer P(0 < X 2, Y 1).
Calculer la matrice de dispersion D de (X , Y ).

Soient n et m deux entiers naturels non nuls, X et Y deux variables alatoires relles
indpendantes. On suppose que la variable alatoire relle X est binomiale de paramtres
1
1
n et , et que la variable alatoire relle Y est binomiale de paramtres m et . Calculer
2
2
la probabilit que X = Y .
Soit (Xk )kN une suite indpendante de v.a.r. de Bernoulli toutes de mme paramtre
0 < p < 1. Soit un entier r 1, on dfinit deux nouvelles v.a.r. , en posant pour tout
,
r () := inf{n N /X1 () + X2 () + ... + Xn () = r }
et
r () := inf{n N /X1 () + X2 () + ... + Xn+r () = r }
avec la convention inf := +.
1. Montrer, pour tout x ]0, 1[, la relation
+
X
Ckr 1 x kr +1 =
k=r 1
1
.
(1 x)r
2. Montrer que la variable alatoire relle r est une variable alatoire relle discrte de
loi (dite loi de Pascal de paramtres r et p )
P(r , p) :=
+
X
r 1 r
Ck1
p (1 p)kr k .
k=r
Vrifier que P(r = +) = 0.

3. Montrer que la variable alatoire relle r est une variable alatoire relle discrte de
loi (dite loi binomiale-ngative de paramtres r et p )
I(r , p) :=
+
X
r 1
r
k
Ck+r
1 p (1 p) k .
k=0

CT U
Besancon
92

4. Donner une interprtation des variables alatoires relles r et r en terme de jeu de
Pile-ou-Face.
5. Montrer quun des deux modles prcdents permet de formaliser le problme dit
des botes dallumettes de Stephan Banach :
Un fumeur a dans chacune de ses deux poches une bote contenant au dpart N
allumettes. Chaque fois quil dsire fumer une cigarette, il choisit une poche au
hasard. Quelle est la probabilit que, le fumeur se rendant compte pour la premire
fois quune bote est vide, lautre bote contienne k allumettes o k est un entier
naturel infrieur ou gal N ?
On considre une v.a.r. relle positive X de fonction de rpartition FX .
1. Pour tout entier naturel n non nul, en considrant sur lespace mesur ( R+ , F
B(R+ ), P ), o est la mesure de Lebesgue, la fonction valeurs relles dfinie
par H(, t) := nt n1 1l]t,+[ (X ()), montrer que
Z +
Z +
n
n1
E[X ] =
nt P(X > t)dt =
nt n1 (1 FX (t))dt.
0
2. Montrer par un exemple que lhypothse X positive est ncessaire.

3. En utilisant le rsultat de la premire question, calculer lesprance et la variance des
variables alatoires suivantes :
(a) X de fonction de rpartition FX (t) := t1l[0,1] (t) + 1l]1,+[ (t).
(b) Y de fonction de rpartition FY (t) := (1 e t )1l[0,+[ (t) o > 0.
+
X
n
(c) Z de fonction de rpartition FZ (t) :=
e 1l[n,+] (t)
n!
n=0
On considre (Xn )N une suite indpendante de v.a.r. de mme loi de Bernoulli B(p) dfinies
sur un mme espace de Probabilit (, F, P). Pour on dfinit
T () := inf{n N / Xn () = 1}
avec la convention inf = +. Montrer que T est une v.a. valeurs dans N , dterminer
sa loi et calculer son esprance.
Le but de cet exercice est de montrer quil nexiste pas de probabilit P sur lespace
1
(N , P(N ) telle que, pour tout n 1, P(nN ) = o nN = {nk, k N }.
n
Supposons quune telle probabilit existe. Soit (pk )N la suite des nombres entiers premiers
rangs en ordre croissant.
1. Par un raisonnement simple montrer que P(lim sup(pk N )) = 0.
k
2. Montrer que la suite (pk N )N est indpendante. En dduire, en utilisant le fait que la
X 1
srie
= +, une autre valeur de P(lim sup(pk N )). Conclure que la probabilit
pk
k
k
P nexiste pas.
CT U
Besancon
93

Soit (Xi )I une famille quelconque de v.a.r. sur un mme espace de probabilit (, F, P).
On note (Xi , i I ) la plus petite (au sens de linclusion) des sous-tribus A de F telles
que, pour tout i I , Xi est A-mesurable (Cette dfinition est une gnralisation, au cas
de plusieurs v.a.r., de la dfinition 4.7, page 80)
1. Justifier lexistence de (Xi , i I ).
2. Soit C la famille des intersections finies dvnements de la forme {Xi B} o i I
et B B(R). Montrer que (Xi , i I ) est la tribu sur engendre par C.
3. On suppose que la famille de v.a.r. (Xi )I est indpendante. Montrer que, si J et K sont
deux parties disjointes et non vides de I , alors les tribus (Xi , i J) et (Xi , i K )
sont indpendantes.
Dterminer la loi dune somme de variables alatoires indpendantes dans les cas suivants :
1. Y := X1 + X2 o X1 suit une loi gamma (a, ) et X2 une loi gamma (b, ).
2. Z := X1 + ... + Xn o, pour tout k = 1, ..., n, Xk suit la loi exponentielle E().
On considre (Xj )j1 une suite indpendante de v.a.r. de mme loi sur un mme espace
de probabilit (, F, P), et donc de mme fonction caractristique . Soit Y une v.a.r.
discrte valeurs dans N et indpendante
de la suite (Xj )j1 . En utilisant la fonction
X
n
dfinie sur ] 1, 1[ par (t) :=
t P(Y = n), dterminer la fonction caractristique Z
n1
de la v.a.r. Z dfinie, pour presque tout , par

j=Y ()
Z () :=
Xj ().
j=1

Soient X et Y deux v.a.r. valeurs dans N , indpendantes et de mme loi sur un espace
de probabilit (, F, P). On dfinit les v.a.r. D := X Y et M := min(X , Y ).
1. On suppose que X et Y suivent la loi gomtrique de paramtre p ]0, 1[ i.e.
X
PX = PY :=
pq k1 k o q := 1 p.
k=1
(a) Montrer que, pour tout (i, j) Z N ,

{X = i + j} {Y = j} si i 0,
{D = i} {M = j} =
{X = j} {Y = j i} si i < 0,
et en dduire que
P(D = i) =
p
p2
q |i| et P(M = j) = 2 q 2j (q + 1).
2
1q
q
(b) Dmontrer que les v.a.r. D et M sont indpendantes.

CT U
Besancon
94

2. Rciproquement, on suppose que les v.a.r. D et M sont indpendantes, montrer que,
pour tout entier n 1,
P [(X = n + 1) (Y = n)]
P(X = n + 1)
P(D = 1)
=
=
.
P [(X = n) (Y = n)]
P(X = n)
P(D = 0)
En dduire que les v.a.r. X et Y suivent une loi gomtrique dont on dterminera le
paramtre.

Soit X et Y deux variables alatoires uniformes sur lintervalle [0, ] o est un rel
strictement positif. On suppose que les variables X et Y sont indpendantes. On pose
inf(X , Y )
Z = sup(X , Y ) inf(X , Y ) et T =
. Dterminer les lois des variables Z et T .
sup(X , Y )
CT U
Besancon
Chapitre 5. Vecteurs alatoires gaussiens
95
Chapitre 5
Vecteurs alatoires gaussiens

Rappelons que, si m et sont des rels avec > 0, N 1 (m, 2 ) dsigne la mesure de probabilit
sur R admettant la densit dfinie sur R par

(x m)2
1
(x) := exp
.
2 2
2
Afin de simplifier les noncs des thormes sur les vecteurs gaussiens, on est amen considrer la probabilit de Dirac au point m R comme un cas, dit dgnr, de loi gaussienne
et par suite on pose N 1 (m, 0) := m .
Dans la suite, M dsignera la matrice-transpose, det(M) le dterminant de la matrice M,
h, i et | | le produit-scalaire et la norme usuels de Rd o d N . Sauf prcision contraire, les
vecteurs de Rd seront reprs par leurs composantes dans la base canonique de Rd . La base
canonique de Rd est le systme de vecteurs (e1 , e2 , ..., ed ) o, pour tout i = 1, , d, ei est le
d-uplet dont tous les termes prennent la valeur 0 sauf le terme de rang i qui prend la valeur 1.
5.1
Vecteur gaussien
Dfinition 5.1.
Une variable alatoire relle de loi N 1 (m, 2 ), o m est un rel et un rel positif ou nul, est
dite gaussienne.
En clair, une variable alatoire relle gaussienne (de loi N 1 (m, 2 )) est soit une variable alatoire relle normale desprance m et de variance 2 > 0, soit une variable alatoire relle de
Dirac au point m (constante dterministe gale m, cest le cas o 2 = 0).
Dfinition 5.2.
Soient X un vecteur alatoire de dimension d et (X1 , X2 , ..., Xd ) ses composantes dans la base
canonique de Rd . On dit que X est un vecteur (alatoire) gaussien de dimension d si,
pour tous rels a1 , a2 , ..., ad , la variable alatoire relle a1 X1 + a2 X2 + ... + ad Xd est une variable
alatoire relle gaussienne.
CT U
Besancon
96

Exemples 5.1.
Une variable alatoire relle gaussienne est un vecteur gaussien de dimension 1.
Compte tenu que, dans un changement de base dans Rd , les composantes dans une nouvelle
base sont des combinaisons linaires des composantes dans lancienne base, la proprit dtre
gaussien pour un vecteur ne dpend pas de la base choisie pour exprimer les composantes du
vecteurs.
La proposition suivante est un corollaire immdiat, dont la dmonstration est laisse en exercice,
de la dfinition.
Proposition 5.1.
Soit (X1 , X2 , ..., Xd ) une suite de v.a.r. . Si le vecteur alatoire X := (X1 , X2 , ..., Xd ) est un
vecteur gaussien de dimension d alors, pour tout k = 1, 2, ..., d, Xk est une variable alatoire
relle gaussienne.
Exemples 5.2.
Reprenons les hypothses et notations de lexercice 4.6, page 74. On vrifie facilement que
P(X + Y = 0) = 21 , et donc que la variable alatoire relle X + Y nest pas une v.a.r. gaussienne, sinon comme X + Y nest pas une variable dterministe (i.e. de loi une probabilit de
Dirac), cela veut dire que X + Y serait une v.a.r. normale et on aurait P(X + Y = 0) = 0.
Le vecteur alatoire (X , Y ) nest donc pas gaussien (sinon X + Y serait une v.a.r. gaussienne) alors que ses composantes sont des v.a.r. gaussiennes, ce qui donne un contre-exemple
la rciproque de la proposition 5.1 prcdente. 2
En revanche si on rajoute une hypothse dindpendance sur la suite des composantes du
vecteur X , on obtient un procd simple de construction de vecteurs gaussiens de dimensions
d 2 grce la proposition :
Proposition 5.2.
Soit (X1 , X2 , ..., Xd ) une suite indpendante de v.a.r. . Le vecteur alatoire X := (X1 , X2 , ..., Xd )
est un vecteur gaussien de dimension d si, et seulement si, pour tout k = 1, 2, ..., d, Xk est une
variable alatoire relle gaussienne.
Dmonstration : La condition ncessaire rsulte de la dfinition des vecteurs gaussiens et
nutilise pas lhypothse dindpendance. Cest un cas particulier de la proposition prcdente.
La condition suffisante rsulte de ce que, si (X1 , X2 , ..., Xd ) est une suite indpendante de
v.a.r. , alors pour tous rels a1 , a2 , ..., ad , la suite (a1 X1 , a2 X2 , ..., ad Xd ) est indpendante. De
plus si la variable alatoire relle Xk a pour loi N 1 (mk , k2 ), la variable alatoire relle ak Xk
a pour loi N 1 (ak mk , ak2 k2 ). Daprs la proposition 4.32, page 86, la variable alatoire relle
a1 X1 + a2 X2 + ... + ad Xd est alors une variable alatoire relle gaussienne comme somme de
variables alatoires relles gaussiennes indpendantes. 2
La proposition 5.1 a aussi pour consquence que si X = (X1 , X2 , ..., Xd ) est un vecteur gaussien
de dimension d, alors, pour tout k = 1, 2, ..., d, Xk est une variable alatoire relle de carr
intgrable car de loi gaussienne. Par suite on peut dfinir lesprance m := E(X ) et la matrice
de dispersion DX := E ([X E(X )][X E(X )] ) du vecteur gaussien X . Lesprance m est
CT U
Besancon
97
un vecteur de Rd et DX est une matrice carre dordre d coefficients rels, symtrique et

de type positif daprs la proposition 3.24, page 48, sur les proprits des matrices de dispersion.

Soit (Uk )N une suite indpendante de variable alatoire relle de mme loi normale centre
et de variance 2 > 0. Pour tout R, on dfinit la suite (Xk )N o Xk = Uk1 + Uk ,
pour tout entier k 2, et X1 = U1 .
Montrer que, pour tout n N , X := (X1 , X2 , , Xn ) est un vecteur gaussien.
Lesprance et la matrice de dispersion dterminent compltement la fonction caractristique
dun vecteur gaussien comme le montre le rsultat suivant :
Proposition 5.3.
Soit X un vecteur alatoire de dimension d admettant une esprance m := (m1 , , md ) Rd
et une matrice de dispersion D. Alors X est un vecteur gaussien si, et seulement si, sa fonction
caractristique X est donne, pour tout u Rd , par

1
1
X (u) = exp ihu, mi hu, Dui ou X (u) = exp iu m u Du .

2
2
Dmonstration : Montrons la condition ncessaire. Posons X := (X1 , , Xd ), u :=
(u1 , , ud ) et Y := u1 X1 + + ud Xd . Comme X est un vecteur gaussien, la variable
alatoire relle Y est de loi gaussienne i.e. PY = N 1 (mY , Y2 ). De plus
mY := E(Y ) = u1 E(X1 ) + + ud E(Xd ) = u1 m1 + + ud md = hu, mi = u m,
et
i
h
Y2 = E[(Y mY )2 ] = E (u1 (X1 m1 ) + + ud (Xd md ))2
X
ui uj E [(Xi mi )(Xj mj )]
=
1i,jd
ui uj Cov(Xi , Xj ) = hu, Dui = u Du.
1i,jd
Comme pour tout u Rd ,

X (u) = E e i(u1 X1 ++ud Xd ) = E e iY = Y (1)

et que Y (1) = exp imY 21 Y2 , on obtient X (u) = exp ihu, mi 21 hu, Dui .
Montrons la condition suffisante. Soit X := (X1 , , Xd ) un vecteur alatoire quelconque de
fonction caractristique dfinie sur Rd par

1
X (u) = exp ihu, mi hu, Dui .
2
Soit Y := a1 X1 + + ad Xd une combinaison linaire des composantes de X . En considrant
la fonction caractristique de Y , il vient, pour tout rel t,

Y (t) = E e iY t = E e i(ta1 X1 ++tad Xd ) = X (a1 t, , ad t)

1 2
= exp itha, mi t ha, Dai
2
CT U
Besancon
98

o on a pos a := (a1 , , ad ).
Ce qui prouve que, pour tout n-uplet de rels (a1 , , ad ), la variable alatoire relle a1 X1 +
+ ad Xd est une variable alatoire relle gaussienne de loi N 1 (ha, mi, ha, Dai). X est bien
un vecteur gaussien. 2
5.2
Loi dun vecteur gaussien
La dernire proposition 5.1 a pour consquence que la loi dun vecteur gaussien X de dimension
d est entirement dtermine par la connaissance des deux paramtres que sont lesprance m
et la matrice de dispersion D du vecteur gaussien X .
Lexistence de vecteurs gaussiens desprance m et de matrice de dispersion D donnes a priori
est affirme par le rsultat suivant que nous admettrons (pour la dmonstration consulter [3]
exercice VII-11) :
Proposition 5.4.
Si m Rd et D est une matrice carre dordre d coefficients rels, symtrique et de type
positif, il existe un espace de probabilit (, F, P) et un vecteur gaussien de dimension d sur
(, F, P) desprance m et de matrice de dispersion D.
Les rsultats prcdents autorisent la dfinition suivante :
Dfinition 5.3.
On appelle loi de Gauss-Laplace ou loi normale sur Rd de paramtres m et D la loi
de probabilit dun vecteur gaussien de dimension d desprance m et de matrice de dispersion
D. Dans ce cas on note N d (m, D) cette probabilit.
La proposition ci-dessous sera souvent utilise pour prouver que certains vecteurs sont
gaussiens :
Proposition 5.5.
Si X est un vecteur gaussien de dimension d, A une matrice rectangulaire kd coefficients
rels et b un vecteur de dimension k, alors le vecteur alatoire Y := AX + b est un
vecteur gaussien de dimension k. De plus si N d (m, D) est la loi de X , la loi de Y est
N k (Am + b, ADA ) ,
Dmonstration : Il suffit de remarquer que les composantes de AX sont des combinaisons
linaires des composantes de X . Donc toute combinaison linaire des composantes de Y est
une combinaison linaire des composantes de X (qui est une v.a.r. gaussienne car X est suppos
gaussien) laquelle on ajoute une constante, dont la somme est encore une v.a.r. gaussienne.
Y suit donc une loi normale de dimension k. Il reste en prciser les paramtres : esprance et
matrice de dispersion. On applique alors litem 2 de la proposition 3.24, page 48, pour prciser
les paramtres de la loi normale de dimmension k. 2

En reprenant les hypothses et notations de lexercice 5.1,
1. Montrer que le vecteur gaussien X admet une densit sur Rn quon explicitera.
CT U
Besancon
99
2. Montrer que le vecteur gaussien X est centr de matrice de dispersion

DX = [di,j ]1i,jn o
d1,1 = 2
di,i = 2 (2 + 1)
dj+1,j = dj,j+1 = 2
di,j = 0
pour i = 2, , n,
pour j = 1, , n 1,
dans les autres cas.
La forme de la fonction caractristique dun vecteur gaussien permet dtablir un critre

important dindpendance des composantes dun vecteur gaussien.
Proposition 5.6.
Soit X := (X1 , X2 , ..., Xd ) un vecteur gaussien de dimension d. Alors la suite de variables
alatoires relles (X1 , X2 , ..., Xd ) est indpendante si, et seulement si, la matrice de dispersion
de X est diagonale.
Dmonstration : La condition ncessaire rsulte de la proposition 4.13, page 75.
Pour la condition suffisante, en vertu du critre dindpendance 4.16, page 76, utilisant les
fonctions caractristiques, il suffit de montrer que si la matrice de dispersion est diagonale, alors
pour tout (u1 , , ud ) Rd ,
X (u1 , , un ) = X1 (u1 ) Xd (ud ).
Or, en utilisant la proposition 5.3 pour obtenir la premire des deux galits suivantes,
d
X
1X 2
uk E(Xk )
X (u1 , , un ) = exp i
uk Var(Xk )
2
k=1
k=1
!
= X1 (u1 ) Xd (ud ),
car, pour tout entier k, la variable alatoire relle Xk est gaussienne et

1 2
Xk (uk ) = exp iuk E(Xk ) uk Var(Xk ) .2
2
On peut donner un nonc plus gnral de cette proposition. Pour cela introduisons une
dfinition.
Dfinition 5.4.
Deux vecteurs alatoires X et Y de dimensions quelconques seront dits non-corrls si la
matrice dintercorrlation
IX ,Y := E ([X E(X )][Y E(Y )] )
est gale la matrice-nulle.
On peut vrifier facilement, en explicitant les coefficients des matrices, que :
CT U
Besancon
100
Proposition 5.7.
Si X et Y sont deux vecteurs alatoires de dimensions respectives d et k, DZ la matrice de
dispersion du vecteur concatn Z := (X , Y ) de dimension d + k, DX et DY les matrices de
dispersion de X et Y , alors :
1. La matrice dintercorrlation IX ,Y est une matrice rectangulaire d lignes et k colonnes
dont le coefficient gnral dindice (i, j), o 1 i d et 1 j k, est Cov(Xi , Yj ).
2. IY ,X = IX ,Y , DX = IX ,X et DZ est la matrice par blocs

DX IX ,Y
DZ =
.
IY ,X DY
Do une version plus gnrale de la proposition 5.6 :
Proposition 5.8.
Soient X := (X1 , X2 , ..., Xd ) un vecteur alatoire de dimension d et Y := (Y1 , Y2 , ..., Yk ) un
vecteur alatoire de dimension k.
Supposons que le vecteur concatn Z := (X1 , X2 , ..., Xd , Y1 , Y2 , ..., Yk ) soit gaussien de
dimension d + k. Alors le couple de vecteurs alatoires (X , Y ) est indpendant si, et seulement
si, les vecteurs X et Y sont non-corrls.
Dmonstration : La condition ncessaire rsulte du fait que, si le couple de vecteurs alatoires
(X , Y ) est indpendant, alors, pour tout (i, j) avec 1 i d et 1 j k, le couple de
variable alatoire relle (Xi , Yj ) est indpendant et par suite le coefficient gnral de la matrice
dintercorrlation Cov(Xi , Yj ) = 0.
Rciproquement,
si IX ,Y = 0, alors, daprs la proposition 5.7, IY ,X = 0, et DZ =

DX 0
o Z est le vecteur concatn (X , Y ). On vrifie alors que, pour tout vecteur
0 DY
w := (u1 , , ud , v1 , , vk ) Rd+k , si on considre les vecteurs u := (u1 , , ud ),
v := (v1 , , vk ), mX := E(X ) et mY := E(Y ),
w DZ w = u DX u + v DY v et w E(Z ) = u mX + v mY .
La fonction caractristique du vecteur Z est alors dfinie sur Rd+k par

1
1
Z (u1 , , ud , v1 , , vk ) = exp (iu mX + iv mY ) exp u DX u v DY v

2
2
= X (u1 , , ud )Y (v1 , , vk ).
On conclut en appliquant le critre dindpendance utilisant les fonctions caractristiques. 2
On notera la ncessit pour le vecteur Z = (X1 , X2 , ..., Xd , Y1 , Y2 , ..., Yk ) dtre gaussien a
priori. Cette hypothse implique que les vecteurs X et Y sont gaussiens, mais on prendra garde
quil ne suffit pas que les vecteurs X et Y soient gaussiens pour que le vecteur concatn
(X1 , X2 , ..., Xd , Y1 , Y2 , ..., Yk ) soit gaussien.
Lexercice 4.6, page 74, fournit encore un contre-exemple prouvant que la proposition devient
fausse si on ne suppose plus a priori que le vecteur (X1 , X2 , ..., Xd , Y1 , Y2 , ..., Yk ) est gaussien.
On vrifie facilement que la proposition 5.6 est bien un cas particulier de la proposition 5.8.
CT U
Besancon
101

On reprend les notations, hypothses et rsultats de lexercice 3.15, page 59.
1. Existe-t-il un rel strictement positif a tel que (X , Xa ) soit non-corrl ?
2. Existe-t-il un rel strictement positif a tel que (X , Xa ) soit un vecteur gaussien ?
3. Existe-t-il un rel strictement positif a tel que (X , Xa ) soit un couple indpendant ?
Terminons par un rsultat prcisant la forme de la loi normale dans le cas o D est une matrice
inversible, ce qui a pour consquence que D est une matrice dfinie-positive. La loi de Gauss
sexplicite alors facilement :
Proposition 5.9.
Soient m Rd et D une matrice carre dordre d coefficients rels, symtrique et de type
positif. Si D est inversible, alors la probabilit N d (m, D) admet la densit sur Rd

1
1
1
d
: x R 7 (x) := p
exp (x m) D (x m) .
2
(2)d det(D)
Dmonstration : Soit X un vecteur gaussien de loi N d (m, D) o m Rd et D une matrice
carre dordre d coefficients rels, symtrique, positive et inversible. Comme D est symtrique
relle, il existe alors une matrice A dordre d orthogonale telle que ADA = o est une
matrice diagonale. Les lments diagonaux de sont strictement positifs car D est positive
et inversible. Notons 12 , , d2 les lments diagonaux de . Considrons le vecteur alatoire
Z := A(X m). Daprs la proposition5.5, Z est un vecteur gaussien de dimension d de loi
N d (0, ). Soient (Z1 , , Zd ) les composantes de Z . Comme la matrice de dispersion de Z ,
, est diagonale, la suite de variable alatoire relle (Z1 , , Zd ) est indpendante et, pour
tout entier 1 k d, la loi de Zk est N 1 (0, k2 ) daprs la proposition 4.5, page 66. La
variable alatoire relle Zk a donc pour densit lapplication fk dfinie sur R par

t2
1
fk (t) := p
exp 2 .
2k
2k2
Par suite, daprs la proposition 4.9, page 72, Z admet pour densit lapplication dfinie sur
Rd par
!

d
d
1 X tk2
1
1
p
.
exp
f (t1 , , td ) = f1 (t1 ) fd (td ) =
2 k=1 k2
2
12 d2
Comme 12 d2 = det(D) et
Pd
1 2
k=1 k2 tk

f (t) = f (t1 , , td ) =
= t 1 t, o t := (t1 , , td ), on obtient
d

1 1
p
exp t t .
2
det(D)
1
Montrons que la loi de X admet une densit. Soit h une application borlienne positive de Rd
dans [0, +]. Comme X = A Z + m, en appliquant le thorme du transfert Z ,
Z
Z
E[h(X )] =
h(A z + m)dPZ (z) =
h(A z + m)f (z)d(d) (z).
Rd
Rd
CT U
Besancon
102
Effectuons le changement de variable dans Rd , z Rd 7 x := A z + m dont le jacobien de

la transformation x Rd 7 z = A(x m) est det(A). Remarquons que, A tant orthogonale,
| det(A)| = 1 et appliquons le thorme de changement de variable. Il vient
Z
E[h(X )] =
h(x)f (A(x m))d(d) (x).
Rd
Le vecteur X admet donc la densit dfinie sur Rd par (x) := f (A(x m)). Par suite,
d

1
1
1
1
p
(x) =
exp (x m) A A(x m)
2
2
det(D)

d

1
1
1
1
p
=
exp (x m) D (x m) ,
2
2
det(D)
do le rsultat cherch. 2
On admettra que si la matrice D nest pas inversible, la loi de Gauss na pas de densit par
rapport la mesure de Lebesgue sur Rd car on montre quelle est porte par un sous-espace
affine de Rd de dimension strictement infrieure d.
Dfinition 5.5.
Si la matrice D est inversible, on dira que la loi de Gauss (ou le vecteur gaussien) N d (m, D)
est non-dgnre. Dans le cas contraire on dira quelle est dgnre.
Exemples 5.3.
1) Une variable alatoire relle gaussienne est non-dgnre si, et seulement si, sa loi
est une loi normale de variance non nulle. Donc une variable alatoire relle gaussienne
dgnre est une variable de loi m o m est un rel quelconque.
2) Soit (X , Y ) un couple de variables
alatoires relles admettant pour densit lapplication

1 2
3
2
2
exp (x xy + y ) . On vrifie alors que
dfinie sur R par (x, y ) :=
4
2

1 x
1
1/2
x
2
2
x xy + y = x y
= x y D
1/2
1
y
y

4/3 2/3
o D :=
est la matrice de dispersion du vecteur (X , Y ). On en dduit que
2/3 4/3
(X , Y ) est un vecteur gaussien de loi N 2 (0, D). On peut aussi affirmer que X et Y suivent
la loi N 1 (0, 43 ) et, puisque D nest pas diagonale, que le couple de variables alatoires
relles (X , Y ) nest pas indpendant. 2
Soit X un vecteur alatoire
de dimension 3. On suppose que la loi de X est N 3 (0, ) o
3 1 0
3 0 . Trouver une matrice A carre dordre 3 telle que les composantes
:= 1
0
0 2
du vecteur AX soient indpendantes et non dgnres.
CT U
Besancon
5.3
103
Exercices de rvision sur les chapitres I V

Soient X un vecteur alatoire de dimension 2, de loi N 2 (0, I ) o 0 dsigne le vecteur nul de
R2 et I la matrice-identit dordre 2 . Soit A une matrice orthogonale dordre 2 coefficients
rels. Dterminer la loi du vecteur alatoire de dimension 2 dfini par U := AX .

1
2
2
Soit (X , Y ) un couple de variables alatoires relles de loi P(X ,Y ) = e 2 (x xy +y ) (2)
o (2) est la mesure de Lebesgue sur R2 . Dterminer la constante et la matrice de
dispersion du couple (X , Y ). Prciser les lois respectives des variables alatoires relles X
et Y . Le couple de variables alatoires relles (X , Y ) est-il indpendant ?
Soit X une variable alatoire relle de loi N 1 (0, 1). On pose
Y = X 1l[0,] (|X |) X 1l],+[ (|X |).
1. Vrifier que, pour toute application h de R dans R,
h(Y ) = h(X )1l[0,] (|X |) + h(X )1l],+[ (|X |).
2. Montrer que la variable alatoire relle Y suit la loi normale rduite centre.
3. Le vecteur alatoire (X , Y ) est-il gaussien ?
4. Le couple de variable alatoire relle (X , Y ) est-il indpendant ?
Soient X , Y , Z trois variables alatoires relles indpendantes de mme loi N1 (0, 1).
1. Dterminer les lois respectives des variables alatoires relles U := X + Y + Z ,
V := 2X Y Z et W := Y Z .
2. Montrer que les variables alatoires relles X Y , Y Z et Z X sont chacunes
indpendantes de la v.a.r. U.
3. Le vecteur alatoire de dimension 3, (U, V , W ), est-il gaussien ? Prciser sa loi.
4. Le triplet de variables alatoires relles (U, V , W ) est-il indpendant ?
5. On note la fonction caractristique de X 2 [on admettra que, pour tout rel x,
1
(x) = (1 2ix) 2 ]. On pose T := (X Y )2 + (Y Z )2 + (Z X )2 . Vrifier, pour
tout (x, y , z) R3 , lgalit

2
1
3
(x y ) + (y z) + (z x) = 2 x (y + z) + (y z)2 ,
2
2
2
et exprimer la fonction caractristique (U,T ) du vecteur alatoire (U, T ) laide de

. En dduire lexpression de (U,T ) (u, t) en fonction de u et t .
CT U
Besancon
104

Thorme de Fisher-Cochran
Soit n N et (X1 , , Xn ) une suite indpendante de v.a.r. toutes de mme loi N 1 (0, 1).
On dfinit respectivement les v.a.r. moyenne empirique et variance empirique par
n
X1 + + Xn
1 X
X :=
et S 2 :=
(Xk X )2 .
n
n 1 k=1
1. Montrer que la v.a.r. X12 suit la loi ( 21 , 12 ) aussi appele loi du Khi-deux 1 degr
de libert et note 2 (1).
2. En utilisant la fonction caractristique des lois Gamma, en dduire que la loi de la
n
X
v.a.r.
Xk2 est ( 12 , n2 ) aussi appele loi du Khi-deux n degrs de libert note
k=1
2 (n).
3. Montrer quil existe une matrice orthogonale
c1,1
c1,2
c2,1
c2,2
..
..
C = .
.
cn1,1 cn1,2
1
n
1
n
C de la forme
c1,n
c2,n
..
...
. .
cn1,n
1
4. Dterminer la loi du vecteur alatoire Y := C X .

n
X
1
5. Calculer Yn et
Yk2 laide de X1 , , Xn . En dduire que X = Yn et
n
k=1
n1
1 X 2
S =
Y .
n 1 k=1 k
2
6. Dmontrer le thorme de Fisher-Cochran : Soit (X1 , , Xn ) une suite indpendante de v.a.r. de mme loi N 1 (0, 1). Alors (X , S 2 ) est indpendant, X suit la loi
N 1 (0, n1 ) et (n 1)S 2 suit la loi 2 (n 1).
Soit (i )i1 une suite indpendante de v.a.r. de mme loi N 1 (0, 1) et X0 une v.a.r. indpendante de la suite (i )i1 et de loi PX0 = N 1 (m, 2 ). On dfinit la suite de v.a.r. (Xn )n1
de la faon suivante : Xn := ln (X0 , . . . , Xn1 ) + bn n o (bn )n1 est une suite de rels et
(ln )n1 une suite de formes linaires sur Rn . Montrer que, pour tout n 1, il existe une
forme linaire Ln sur Rn+1 telle que Xn = Ln (X0 , 1 , , n ) et en dduire que le vecteur
(X0 , . . . , Xn ) est gaussien.
CT U
Besancon
Chapitre 6. Lois des grands nombres et convergences de v.a.r.
105
Chapitre 6
Lois des grands nombres et

convergences de v.a.r.
Dans ce chapitre, sauf indication contraire, toutes les variables alatoires considres seront
relles et dfinies sur un mme espace de probabilit (, F, P).
La plupart des rsultats et dfinitions de ce chapitre sont une traduction en langage probabiliste
de ceux vus en thorie de la mesure (cf. [2] chapitre V). Ils peuvent stendre aux v.a. valeurs
dans Rd en prenant pour | | la norme euclidienne de Rd .
Les espaces Lp (, F, P) et Lp (, F, P) ont t introduits en thorie de la mesure pour
p [1, +]. On rappelle que, pour tout 1 < p < q < +,
L Lq Lp L1 et k kLp k kLq .
De plus
\
p1
Lp 6= L et
Lp 6= L1 (cf. [2] p. 67 ex IV-8 et IV-11).
p1
On note L0 (, F, P) ou plus simplement L0 , lensemble des classes dquivalence, pour lgalit

P-presque-sre, des v.a. valeurs dans R sur (, F, P), dfinies et finies P-presque-srement.
b la classe dquivalence P-presque-sre de la v.a. X . On a, pour
On notera en cas de ncessit X
p
0
c
b un lment de L0 .
tout p [1, +], L L . (Xn )N dsignera une suite dlments de L0 et X
Dans ce chapitre, nous allons passer en revue ces diffrents modes de convergence initialement
tudis dans le cours de thorie de la mesure en les appliquant au cas particulier o la mesure
est une probabilit.
6.1
6.1.1
Convergence en probabilit dune suite de v.a.r.

Loi faible des grands nombres
Commenons par dmontrer deux ingalits souvent utilises en probabilit :

CT U
Besancon
106
Proposition 6.1.
Ingalit de Markov
Soient X une variable alatoire relle et une application borlienne de R dans [0, +], alors
pour tout rel a > 0,
E[(X )]
P [(X ) a]
.
a
Dmonstration : Posons A := {(X ) a}. Puisque est positive, on peut crire :
E[(X )] = E[(X )1lA ] + E[(X )1lAc ] E[(X )1lA ] aE(1lA ) = aP(A). 2
Proposition 6.2.
Ingalit de Bienaym-Tchbycheff
Soit X une v.a.r. telle que E(X 2 ) < +. Alors pour tout rel > 0,
P [|X E(X )| ]
1
Var(X ).
2
Dmonstration : On applique lingalit de Markov avec (t) := [t E(X )]2 et a := 2 . 2

Trs utile en thorie, lingalit de Bienaym-Tchbycheff peut tre parfois trop grossire pour
apporter des informations utiles dans la pratique. Dans ce cas on tablit dautres majorations
plus appropries la situation tudie. A titre dexemple, on pourra tudier lexercice 6.2.
Exemples 6.1.
1) Si X est une variable alatoire relle de loi binomiale B(10, 12 ) alors E(X ) = 5 et
Var(X ) = 52 . Un calcul direct donne lestimation
P (|X 5| 4) =
0
C10
1
C10
9
C10
10
C10
10
1
0, 021,
2
alors que lingalit de Bienaym-Tchbycheff donne la majoration

P (|X 5| 4)
2, 5
0, 156.
42
2) Si X est une variable alatoire relle de carr intgrable de variance 2 , lingalit de

Bienaym-Tchbycheff devient P (|X m| ) 1, alors que dans le cas dune variable
alatoire relle gaussienne de loi N 1 (m, 2 )

Z +
1
x2
exp 2 dx
P (|X m| ) = 2
2
2
2
Z +
1
t
exp
= 2
dt 0, 3174,
2
2
1
et par suite P (m < X < m + ) 0, 6826. 2
CT U
Besancon
107

Rgle des trois "sigmas"
Soit X une v.a.r. telle que E(X 2 ) < + de variance 2 et de moyenne m.
a) Montrer que
P (m 3 < X < m + 3)
3
8
et P (m 2 < X < m + 2) .
9
4
b) Comparer les valeurs obtenues dans la question prcdente avec celles donnes par le
calcul dans le cas o X est une variable alatoire relle de loi N 1 (m, 2 ).

1. On considre une variable alatoire relle X de carr intgrable, centre et de variance
2 . A laide de lingalit de Cauchy-Schwarz de lexercice 3.13, page 48, montrer que,
pour tout rel a > 0,

p
a E (a X )1l],a] (X ) P(X a) 2 + a2 .
En dduire que
P(X > a)
2
.
2 + a2
2. Une usine fabrique chaque semaine un nombre alatoire Y dobjets. On suppose

E[Y ] = 100 et Var(Y ) = 400. Trouver laide de la question prcdente un majorant
de la probabilit que la production hebdomadaire dpasse 120. Comparer ce rsultat
avec celui obtenu par application de lingalit de Bienaym-Tchbycheff.
Dfinition 6.1.
Une suite (Xn )N de variables alatoires relles est dite identiquement-distribue , en abrg
i.d., si toutes les variables alatoires relles de la suite ont la mme loi. Une suite i.i.d. de
variables alatoires relles est une suite indpendante et identiquement distribue de v.a.r..
Dfinition 6.2.
Si (Xn )N est une suite de variables alatoires relles pour tout entier n 1, on appelle moyenne
empirique dordre n associe la suite (Xn )N , et on note X (n) ou plus simplement X , la
v.a.r. dfinie par
X1 + + Xn
X (n) :=
.
n
La dmonstration de la proposition suivante est immdiate et laisse en exercice.
Proposition 6.3.
Si (Xn )N est une suite indpendante et identiquement distribue de variables alatoires relles
de carr intgrable, desprance m et de variance 2 , alors

X1 + + Xn
X1 + + Xn
2
E
= m et Var
= .
n
n
n
CT U
Besancon
108
Une application de lingalit de Bienaym-Tchbycheff dont le rsultat est historiquement

clbre est :
Proposition 6.4.
Thorme de Bernoulli
Soit (Xn )N une suite indpendante et identiquement distribue de variables alatoires relles de
Bernoulli de paramtre p ]0, 1[ i.e. de loi B(1, p). Alors, pour tout rel a > 0 et tout entier
n 1,

X1 + + Xn
1
p a 2 .
P
n
4a n
Dmonstration : On applique lingalit de Bienaym-Tchbycheff la variable alatoire relle
X (n) et on utilise la proposition prcdente pour obtenir la majoration

X1 + + Xn
Var(X0 )
m a
.
P
n
na2
Comme les variable alatoire relle sont de Bernoulli E(X0 ) = m = p et Var(X0 ) = p(1 p).
On conclut en vrifiant que, pour tout p ]0, 1[, p(1 p) 14 . 2
Exemples 6.2.
Dans son Essai darithmtique morale paru en 1777, Buffon relate lexprience qui consiste
lancer 4040 fois une pice de monnaie. Dans la ralisation 0 de cette exprience Buffon
obtient 2049 fois "Pile". Si on note Xk lapplication qui chaque ralisation associe le
nombre 1 si la pice tombe sur "Pile" lors du k ime lancer et 0 sinon, la variable alatoire
relle Xk est une variable alatoire relle de Bernoulli de paramtre p inconnu. On modlise
cette situation en reprsentant les lancers successifs indpendants par une suite i.i.d. de
variable alatoire relle de Bernoulli. On est donc dans les conditions du thorme de
Bernoulli. Avec les notations introduites prcdemment, pour lobservation 0 de Buffon,
on peut crire
2049
0, 507.
X (4040) (0 ) =
4040
1
Choisissons a tel que
0, 05. Par exemple prenons a = 0, 0352. Daprs le
4a2 4040
thorme de Bernoulli,

P / X (4040) () p 0, 0352 0, 05.
La probabilit que la ralisation 0 de cette exprience satisfasse lvnement
{ / |X (4040) () p| 0, 0352}
est infrieure 0, 05. Autrement dit, la probabilit que le paramtre p vrifie la condition
|X (4040) (0 ) p| 0, 0352, c--d approximativement |0, 507 p| 0, 0352, est infrieure
0, 05. Par suite, on peut affirmer, avec une probabilit suprieure 0, 95, que lencadrement
de p obtenu lors de lobservation 0 , i.e. 0, 4718 p 0, 5422, est correct.
Lintervalle [0, 4718; 0, 5422] est dit intervalle de confiance pour p de niveau de confiance 0, 95. 2
CT U
Besancon
109
La technique de dtermination des intervalles de confiance pour des paramtres estimer

relve du domaine de la statistique infrentielle et sera dveloppe dans lunit denseignement
de Statistique.

On cherche mesurer une grandeur physique en faisant N mesures indpendantes.
Toutes ces mesures sont entaches derreur et donnent donc des rsultats alatoires dont
lesprance commune m est la "vraie" valeur de la grandeur mesurer. Ces mesures sont
supposes identiquement distribues. Sachant que la variance de chacune delles est 0, 25,
on veut obtenir un rsultat qui soit loign de moins de 0, 05 de la "vraie" valeur m avec
une probabilit de 0, 99. Quelle valeur choisir pour N ?
En fait la majoration du thorme de Bernoulli peut tre amliore pour montrer que la
convergence vers 0 du second membre est de type exponentiel. Cest ce rsultat, donn
titre dinformation, qunonce le cas particulier suivant du thorme des grandes dviations
(admis et hors programme, pour la dmonstration voir [3] exercice IV-13) :
Proposition 6.5.
Thorme des grandes dviations pour les v.a.r. de Bernoulli (Hors programme)
Si (Xn )N est une suite indpendante de v.a.r. de Bernoulli de mme paramtre p ]0, 1[, alors
pour tout > 0, il existe une constante C > 0 telle que pour tout n N ,

X1 + X2 + ... + Xn

p 2 exp (nC ) .
P
n
nonons une consquence plus faible de lingalit de Bienaym-Tchbycheff :
Proposition 6.6.
Loi faible des grands nombres (1er nonc)
de carr intgrable et desprance m, alors, pour tout rel a > 0,

X1 + + Xn

lim P
m a = 0.
n+
n
Dmonstration : On applique lingalit de Bienaym-Tchbycheff comme dans la dmonstration
du thorme de Bernoulli pour obtenir

X1 + + Xn

Var(X0 )

P
m a
.
n
na2
Ce qui donne le rsultat par passage la limite. 2
6.1.2
Convergence en probabilit
Lnonc de la loi faible des grands nombres suggre alors la dfinition suivante :
CT U
Besancon
110
Dfinition 6.3.
On dit quune suite de variables alatoires relles (Xn )N converge en probabilit vers une
variable alatoire relle Y si, pour tout rel a > 0,
lim P (|Xn Y | a) = 0.
n+
On retrouve ici la traduction de la "convergence en mesure" dans le cas o la mesure est une
probabilit.
Avec cette nouvelle dfinition, la loi faible snonce :
Proposition 6.7.
Loi faible des grands nombres (2ime nonc)
Si (Xn )N est une suite indpendante et identiquement distribue de variables alatoires
relles
de carr intgrable
et desprance m, alors la suite des moyennes empiriques

X1 + X2 + ... + Xn
converge en probabilit vers la variable alatoire relle constante m.
n
N
Exemples 6.3.
n
1
n +
1 ,
n+1
n+1 n
alors la suite (Xn )N converge en probabilit vers la variable alatoire relle constante 0.
En effet, soit a > 0 et n un entier tel que n > a > n1 . Comme la variable alatoire relle Xn
est discrte porte par lensemble {n, n1 },
Si, pour tout entier n 1, Xn est une variable alatoire relle de loi
P(|Xn | a) = P(Xn = n) =
1
.
n+1
Ce qui prouve le rsultat en faisant tendre n vers +. 2

Montrer que si, pour tout entier n 1, Xn est une variable alatoire relle de densit n1l[0, 1 ]
n
alors la suite (Xn )N converge en probabilit vers la variable alatoire relle constante 0.
La limite dune suite de variables alatoires relles convergeant en probabilit est "presquesrement" unique comme lnonce de faon prcise le rsultat suivant :
Proposition 6.8.
Si (Xn )N est une suite de variables alatoires relles convergeant en probabilit vers les variables
alatoires relles X et Y , alors les variables alatoires relles X et Y sont gales presquesrement, i.e. P(X 6= Y ) = 0.
Dmonstration : Avec les notations du thorme on peut crire, pour tout entier naturel n,
|X Y | |X Xn | + |Xn Y |. Soit a > 0 un rel, on vrifie linclusion entre vnements
CT U
Besancon
n
ao n
ao
{|X Y | a} |X Xn |
|Xn Y |
.
2
2
111
Par suite, pour tout a > 0,

a
a
+ P |Xn Y |
P(|X Y | a) P |X Xn |
2
2
et en passant la limite dans le second membre de lingalit prcdente, on trouve par dfinition
de la convergence en probabilit, que, pour tout rel a > 0, P(|X Y | a) = 0. Or

[
1
{X 6= Y } = {|X Y | > 0} =
|X Y |
.
n
n1
Do

X
1
P(X =
6 Y)
P |X Y |
= 0.2
n
n1
La proposition prcdente entrane que la convergence en probabilit induit une convergence

dans lespace L0 dfinie de la faon suivante :
Dfinition 6.4.
b si, pour tout > 0, lim P(|Xn X |
cn ) converge en probabilit vers X
On dit que (X
N
n+
) = 0.
P b
cn )N
b = P-limn (X
cn ).
On note alors (X
X ou X
On montre (cf. [2] p. 86 ex V-9), et nous ladmettrons, le rsultat suivant :
Proposition 6.9.
(Hors programme)
Lapplication
b, Y
b ) L0 L0 7 (X
b, Y
b ) := inf{ > 0, P(|X Y | ) }
: (X
dfinit une mtrique sur L0 appele mtrique de Ky-Fan. De plus (L0 , ) est complet et
cn )N converge en probabilit vers X
b si, et seulement si, lim (X
cn , X
b) = 0 .
(X
n
La proposition suivante permet deffectuer des calculs sur les limites en probabilit.
Proposition 6.10.
Soient f une application continue de R2 dans R, (Xn )N et (Yn )N deux suites de variables
alatoires relles convergeant en probabilit respectivement vers les variables alatoires relles
X et Y , alors la suite de variables alatoires relles (f (Xn , Yn ))N converge en probabilit vers
la variable alatoire relle f (X , Y ).
Dmonstration : Nous allons dmontrer cette proposition dans le cadre plus restrictif des applications f uniformment continues sur R2 . On admettra le rsultat pour les fonctions seulement
continues.
Comme f est uniformment continues sur R2 , pour tout rel > 0, il existe un rel > 0
(dpendant de ), tel que, pour tout (x, y ) R2 et (x 0 , y 0 ) R2 , |x x 0 | + |y y 0 | <
implique |f (x, y ) f (x 0 , y 0 )| < .
Soit > 0 fix. Pour tout entier naturel n, on a alors
{|f (Xn , Yn ) f (X , Y )| } n
{|Xn X | + |Yno Yn| }
o
|Xn X |
|Yn Y |
.
2
2
CT U
Besancon
112
Do, en faisant tendre n vers +, lim P (|f (Xn , Yn ) f (X , Y )| ) = 0, ce qui prouve

n+
que la suite de variables alatoires relles (f (Xn , Yn ))N converge en probabilit vers la variable
alatoire relle f (X , Y ). 2
On admettra galement que cette proposition devient fausse si lapplication f nest plus suppose continue.
Un corollaire immdiat, et trs utilis en pratique, de la proposition prcdente est :
Proposition 6.11.
Si (Xn )N et (Yn )N sont deux suites de variables alatoires relles convergeant en probabilit
respectivement vers les variables alatoires relles X et Y , alors les suites de variables alatoires
relles (Xn + Yn )N et (Xn Yn )N convergent en probabilit respectivement vers les v.a.r. X + Y
et X Y .
Trouver, parmi les exercices ou exemples dj proposs dans ce cours, un contre-exemple
prouvant que si la suite de variables alatoires relles (Xn )N converge en probabilit vers la
variable alatoire relle X , cela nentrane pas ncessairement que la suite des esprances
(si elles existent) (E(Xn ))N converge vers le rel E(X ) (sil existe).
6.2
6.2.1
Convergence presque-sre dune suite de v.a.r.

Loi forte des grands nombres
La proposition suivante, difficile dmontrer, a une grande importance de par sa signification

probabiliste. Nous en donnerons une dmonstration plus loin (cf. proposition 6.19, page 117)
dans le cas des variables alatoires de carr intgrable. Cest en partie grce ce thorme que
le formalisme des probabilits trouve sa cohrence.
Proposition 6.12.
Loi forte des grands nombres de Kolmogorov (1er nonc) (admis)
Si (Xn )N est une suite indpendante et identiquement distribue de variables alatoires
relles
intgrables et desprance
m, alors lensemble des tels que la suite

X1 () + X2 () + ... + Xn ()
ne converge pas vers m est un vnement de probabilit
n
N
nulle.
Donnons une interprtation intuitive de la loi forte des grands nombres. Considrons un
vnement A de probabilit inconnue p relatif une situation alatoire. Rptons un grand
nombre de fois lexprience relative cette situation alatoire et notons Xk lapplication qui
chaque essai associe le nombre 1 si lvnement A est ralis lors de la k ime exprience et 0
sinon. La variable alatoire relle Xk est une variable alatoire relle de Bernoulli de paramtre
p inconnu. On modlise cette situation en considrant les essais successifs indpendants par
une suite i.i.d. de variables alatoires relles de Bernoulli. On est donc dans les conditions
dapplication de la loi forte de Kolmogorov. Cette loi signifie que presque-srement, pour n
assez grand, la moyenne empirique des variables alatoires relles Xk , cest--dire la frquence
de ralisation de lvnement A, est une bonne approximation de la probabilit de A.
CT U
Besancon
6.2.2
113
Convergence presque-sre
On peut noncer la loi forte sous sa forme classique en introduisant un autre mode de convergence pour les suites de variables alatoires.
Auparavant remarquons que :
Proposition 6.13.
Si (Xn )N est une suite de variables alatoires relles et Y une v.a.r., alors lensemble Y des
tels que la suite relle (Xn ())N ne converge pas vers Y () est un vnement de lespace
de probabilit (, F, P), i.e. Y F.
Dmonstration : Vrifions au pralable que
Y =
+
[ +
\ +
[
n=1 k=0 l=k
1
|Xl Y | >
n

.
En effet en prenant la contrapose de la dfinition de la convergence de la suite relle (Xn ())N

vers Y () : Y si, et seulement si, il existe un entier n 1 tel que, pour tout entier
naturel k, il existe un entier l k avec |Xl () Y ()| > n1 .
On conclut alors en utilisant la mesurabilit des variables alatoires relles Xi et Y ainsi que la
stabilit des tribus pour les oprations de runion et dintersection dnombrables (cf. Chapitre
I). 2
On peut alors donner la dfinition suivante :
Dfinition 6.5.
On dit quune suite de variables alatoires relles (Xn )N converge presque-srement vers
une variable alatoire relle Y si P(Y ) = 0.
Cette dfinition est la traduction en langage probabiliste de la dfinition de la "convergence
presque-partout" dfinie en thorie de la mesure.
Exemples 6.4.
Soient := R, F := B(R) et P la probabilit sur R de densit 1l[0,1] . Pour tout entier
n 1, considrons la variable alatoire relle Xn := +n1l[0, 1 ] . Alors la suite (Xn )N converge
n
presque-srement vers la variable alatoire relle constante Y := .
En effet, on vrifie aisment que Y = {0} car limn Xn (0) = + et, pour tout \ {0},
limn Xn () = . De plus P({0}) = 0, do le rsultat. 2
Donnons quelques proprits de la convergence presque-sre. La limite dune suite de variables
alatoires relles convergeant presque-srement est "unique" dans le sens suivant :
Proposition 6.14.
Si (Xn )N est une suite de variable alatoire relle convergeant presque-srement vers les variables
alatoires relles X et Y , alors les variables alatoires relles X et Y sont gales presquesrement, i.e. P(X 6= Y ) = 0.
Dmonstration : Avec les notations introduites ci-dessus on peut crire
{X 6= Y } X Y ,
CT U
Besancon
114
et par suite P(X 6= Y ) P(X ) + P(Y ) = 0. 2

La proposition prcdente entrane que la convergence presque-sre induit une convergence
dans lespace L0 dfinie de la faon suivante :
Dfinition 6.6.
cn )N converge P-presque-srement (ou plus simplement presque-srement
On dit que (X
b , si lensemble des tels que (Xn ())N ne converge pas dans
, ou en abrg p.s.,) vers X
R vers X () est P-ngligeable.
cn )N Pp.s.
b ou X
b = p.s.-limn (X
cn ).
On note alors (X
X
cn )N dlments de L0
En gnral il nexiste pas de mtrique d sur L0 telle que, pour toute suite (X
b L0 , on ait : lim d(X
cn , X
b ) = 0 si, et seulement si, (X
cn )N converge P-presque-srement
et X
n+
b . On peut montrer quil existe une topologie associe la convergence presque-sre si,
vers X
et seulement si, la probabilit P est discrte (cf. [2] p. 86 ex V-10).
La proposition suivante permet deffectuer des calculs sur les limites presque-sres.
Proposition 6.15.
Soit f une application continue de R2 dans R, (Xn )N et (Yn )N deux suites de variables alatoires
relles convergeant presque-srement respectivement vers les variables alatoires relles X et
Y , alors la suite de variables alatoires relles (f (Xn , Yn ))N converge presque-srement vers la
variable alatoire relle f (X , Y ).
Cette proposition devient fausse si lapplication f nest plus suppose continue (cf. [14] ex
14-11).
Un corollaire immdiat de la proposition prcdente est :
Proposition 6.16.
Si (Xn )N et (Yn )N sont deux suites de variables alatoires relles convergeant presque-srement
respectivement vers les variables alatoires relles X et Y , alors les suites de variables alatoires
relles (Xn + Yn )N et (Xn Yn )N convergent presque-srement respectivement vers les variables
alatoires relles X + Y et X Y .

Dmontrer les propositions 6.15 et 6.16.
Lingalit de Tchbycheff est utile dans ltude des questions de convergence en probabilit.
Le lemme de Borel-Cantelli, quant lui, est souvent utilis dans les questions de convergence
p.s. grce la proposition suivante :
CT U
Besancon
115
Proposition 6.17.
1. La suite (Xn )N converge p.s. vers la v.a.r. X si, et seulement si, pour tout > 0,
P(lim sup{|Xn X | }) = 0.
n
X
2. Si pour tout > 0, la srie
P({|Xn X | }) converge dans R, alors la suite (Xn )N
n
converge p.s. vers la v.a.r. X .

3. Si la suite dvnements ({|Xn X | })N est indpendante, alorsX
la suite (Xn )N converge
p.s. vers la v.a.r. X si, et seulement si, pour tout > 0, la srie
P({|Xn X | })
n
converge dans R.
Dmonstration de 6.17 :
1. (Xn ())N converge vers X () si, et seulement si, pour tout > 0, il existe un
entier naturel N tel que, pour tout n N, n > N implique |Xn () X ()| .
En prenant la ngation, (Xn ())N ne converge pas vers X () si, et seulement si, il
existe > 0, tel que, pour tout entier naturel N, il existe n N, vrifiant n > N et
|Xn () X ()| > . La dernire partie de la phrase peut aussi snoncer : il existe > 0,
tel que appartienne une infinit dvnements de la suite ({|Xn X | > })N ; ou
encore par dfinition de la limite-suprieure dune suite dvnements : il existe > 0, tel
que lim sup{|Xn X | > }. Par suite,
n
{ /(Xn ())N ne converge pas vers X ()} =
lim sup{|Xn X | > }.
]0,[
En remarquant que (Xn ())N converge vers X () si, et seulement si, pour tout p N , il
1
existe un entier naturel N tel que, pour tout n N, n > N implique |Xn ()X ()| ,
p
et en raisonnant comme prcdemment on obtient lgalit
[
1
{ /(Xn ())N ne converge pas vers X ()} =
lim sup{|Xn X | > }.
p
n
pN
Si la suite (Xn )N converge presque-srement vers X , alors
P ({(Xn )N ne converge pas vers X }) = 0.
Comme, pour tout > 0,
lim sup{|Xn X | > } { /(Xn ())N ne converge pas vers X ()}
on en dduit que, pour tout > 0, P (lim sup{|Xn X | > }) = 0.
Rciproquement, supposons que, pour tout > 0, P (lim sup{|Xn X | > }) = 0, alors
!

[
X
1
1
P
P lim sup{|Xn X | > } = 0.
lim sup{|Xn X | > }
p
p
pN
pN
Daprs la premire partie on obtient
P ({(Xn )N ne converge pas vers X }) = 0
cest--dire que (Xn )N converge presque-srement vers X .
CT U
Besancon
116

2. Compte tenu de litem 1) quon vient de dmontrer, le rsultat des item 2) et 3) de la
proposition est une consquence immdiate du lemme de Borel-Cantelli. 2
On remarquera que dans le troisime item lindpendance est une hypothse essentielle ; on
trouvera un contre-exemple dans ([14] ex 14-4). Le premier item souligne le lien existant entre
les convergences p.s. et en probabilit en snonant :
Proposition 6.18.
La suite (Xn )N converge presque-srement vers X si, et seulement si, la suite (Mn )N , dfinie
pour tout n N par Mn := sup |Xk X |, converge en probabilit vers 0.
kn
Dmonstration : Soit > 0, lim sup{|Xn X | } =
n=0
k=n
!
{|Xk X | } . En utilisant
le thorme de convergence monotone des probabilits, on obtient

P(lim sup{|Xn X | }) = lim P
n+
De plus,
!
{|Xk X | } .
k=n
{|Xk X | } = {sup |Xk X | }. On conclut alors en vertu du premier

kn
k=n
item de la proposition 6.17 : (Xn )N converge p.s. vers la v.a.r. X si, et seulement si, pour
tout > 0, P(lim sup{|Xn X | }) = 0, ou encore (Xn )N converge p.s. vers la v.a.r. X
n

si, et seulement si, pour tout > 0, lim P sup |Xk X | = 0, ou encore (Xn )N conn+
kn
verge p.s. vers la v.a.r. X si, et seulement si, pour tout > 0, lim P (Mn }) = 0, o on a
n+
pos Mn = sup |Xk X |. Ce qui traduit la convergence en probabilit vers 0 de la suite (Mn )N . 2
kn

Soit (Xn )N une suite i.i.d. de variables alatoires relles de carr intgrable, de variance 2 .
On note, pour tout entier n 2,
n
Sn2 :=
2
1 X
Xk X (n) ,
n 1 k=1
la variance empirique dordre n de la suite (Xn )N . Montrer que

n
Sn2
2
1 X 2
n
=
Xk
X (n)
n 1 k=1
n1
(Formule de Steiner)
et en dduire que la suite de variables alatoires relles (Sn2 )N converge presque-srement

vers 2 .
Avec la notion de convergence presque-sre, la loi forte de Kolmogorov snonce :
CT U
Besancon
117
Proposition 6.19.
Loi forte des grands nombres de Kolmogorov (2ime nonc)
Si (Xn )N est une suite indpendante et identiquement distribue de variables
alatoires relles

X1 + X2 + ... + Xn
intgrables et desprance m, alors la suite des moyennes empiriques
n
N
converge presque-srement vers la variable alatoire relle constante m.
Dmonstration : Conformment au programme de lunit, on ne fera la dmonstration de ce
thorme que dans le cadre plus restreint des variables de carr intgrable seulement. Remarquons quen posant, pour tout entier naturel n, Yn = Xn m, on peut se ramener, sans perte
de gnralit, ne faire la dmonstration que dans le cas dune suite de variables alatoires
centres. On notera 2 la variance commune des variables Xn .
Soit (Xn )N une suite indpendante et identiquement distribue de variables alatoires relles
centres de carr intgrable.
tout entier naturel non nul n, posons Sn = X1 +X2 + +Xn .
Pour
Sn2
converge presque-srement vers 0.
Montrons que la suite
n2 nN
En effet, pour tout > 0, nous avons,
de lingalit de Bienaym-Tchebychev,
par
application
Sn2
2
en tenant compte de lgalit V ar
= 2 (vrifier le calcul),
n2
n

V ar Sn2
Sn2
n2
2
P 2
=
.
n
2
n 2 2

X Sn2

Ce qui prouve que la srie numrique termes positifs
P 2 est convergente, car
n
n
son terme gnral est majore par le terme gnral dune srie de Riemann
On
convergente.

Sn2
conclut alors, en appliquant litem 2) de la proposition 6.17, que la suite
converge
n2 nN
presque-srement vers 0.
Pour tout entier naturel non nul n, notons pn la partie entire de n, i.e. pn est
lunique

Spn2
entier naturel vrifiant la double ingalit pn n < pn + 1. Montrons que la suite

n nN
De la double ingalit, on obtient n 1 < pn n, puis, en levant au carr, n 2 n + 1 <
p2
pn2 n, ce qui implique lim n = 1 et n pn2 2 n. Comme, daprs ce qui vient dtre
n+ n

Spn2
Sn2
vu, la suite
converge
presque-srement
vers
0,
la
suite
converge aussi
n2 nN
pn2 nN
Sp2
Sp 2 p 2
presque-srement vers 0. De la relation, pour tout entier naturel non nul n, n = 2n n , on
n
pn n

2
Spn
peut conclure, en passant la limite presque-sre, que
converge presque-srement
n nN
vers 0.
Pour conclure la dmonstration du thorme, utilisons nouveau lingalit de BienaymTchebychev.
Pour
0,
tout

>

2
2
2
Sn Spn2

1
(n
p
)
2
n
n
= P
Xp2 +1 + Xp2 +2 + + Xn
P
,
n
n
n
n
n
n 2 2
n 2 2
CT U
Besancon
118
car ona vu que n pn2 2 n. Ce qui prouve que la srie numrique termes positifs
X
Sn Sp2
P n est convergente, car son terme gnral est majore par le terme
n
n
n
gnral dune srie de Riemannconvergente.
Toujours en appliquant litem 2) de la propoSn Spn2
converge presque-srement vers 0. Donc en

sition 6.17, on en conclut que
n
n nN2
tenant compte
dans les deux points prcdents, et de lingalit trian des rsultats
dmontrs

Sn Sn Spn2 Spn2
+ , vraie pour tout entier naturel non nul n, on en conclut que
gulaire
n
n
n
n

Sn
converge aussi presque-srement vers 0. 2
n nN
En fait la rciproque de 6.19 est aussi vraie. Pour cela on se reportera
lexercice 6.12, page

X1 + X2 + ... + Xn
122, qui montre que si la v.a.r. X nest pas intgrable, alors la suite
n
N
ne peut pas converger presque-srement dans R. Par contrapose, on obtient justement la
rciproque de la proposition 6.19.
On notera que des conditions suffisantes dexistence de loi forte peuvent tre dmontres sans
lhypothse de lidentit des lois ou de lindpendance mutuelle de la suite de v.a.r..
Par exemple on montre, et on les admettra, les deux propositions 6.20 et 6.21 (hors programme)
suivantes :
Proposition 6.20.
Loi forte des grands nombres pour des v.a.r. uniformment bornes (Hors programme)
Si (Xn )N est une suite indpendante de v.a.r., centres et telles quil existe M > 0 vrifiant,
pour tous n N et , |Xn ()| M, alors la suite des moyennes empiriques

X1 + X2 + ... + Xn
n
N
Proposition 6.21.
Loi forte des grands nombres pour des v.a.r. deux deux indpendantes (Hors
programme)
Si (Xn )N est une suite de v.a.r. intgrables, deux deux
indpendantes, demme loi et
X1 + X2 + ... + Xn
desprance m, alors la suite des moyennes empiriques
converge
n
N
presque-srement vers m.
6.3
Convergence dans Lp ( , F, P) o p [1, +]
La topologie despace vectoriel norm de Lp permet de dfinir un autre mode de convergence

pour les suites dlments de L0 qui sont dans Lp .
CT U
Besancon
119
Dfinition 6.7.
Si p [1, +], on dit que la suite de v.a.r. (Xn )N converge en moyenne dordre p vers
b Lp et pour tout
la v.a.r. X ou plus simplement converge dans Lp vers la v.a.r. X si X
p
c
c
b
n N, Xn L avec lim kXn X kLp = 0. Si p = 2 on parle aussi de convergence en
n
moyenne quadratique.
Lp
On note alors (Xn )N X ou X = Lp -limn (Xn ).
On ne confondra pas la convergence dans Lp avec la convergence de la suite des esprances
mathmatiques. Plus prcisment :
Proposition 6.22.
Si la suite (Xn )N converge dans Lp vers la v.a.r. X , alors la suite des esprances (E(Xn ))N
converge dans R vers E(X ).
Concernant la rciproque on a cependant le rsultat suivant :
Proposition 6.23.
Si la suite (Xn )N converge p.s. vers la v.a.r. X et si, pour tout entier naturel n, Xn 0, alors
(Xn )N converge dans L1 vers la v.a.r. X si, et seulement si, (E(Xn ))N converge dans R vers
E(X ).
6.4
Comparaison des convergences dans L0( , F, P)
Il existe des relations entre les diffrents modes de convergence de suites de variables alatoires.
Ces relations sont la traduction en langage probabiliste des relations entre les modes de convergence vus en thorie de la mesure. Rappelons-les pour mmoire :
La convergence presque-sre est plus forte que la convergence en probabilit comme le prcise
la proposition :
Proposition 6.24.
Si (Xn )N est une suite de variables alatoires relles convergeant presque-srement vers la
variable alatoire relle Y , alors la suite (Xn )N converge en probabilit vers la variable alatoire
relle Y .
Dmonstration : En partant de la dfinition de la convergence des suites, on vrifie dabord
que, pour tout rel a > 0,
\ [
{|Xn Y | a} Y .
mN nm
On observe de plus que P(Y ) = 0 et que, par le thorme de convergence monotone de

Beppo-Lvi,
!
P
\ [
mN nm
{|Xn Y | a}
!
= lim P
m+
{|Xn Y | a} .
nm
CT U
Besancon
120
Comme, pour tout entier m,

!
P
{|Xn Y | a}
P ({|Xm Y | a}) ,
nm
on obtient
!
0 P(Y ) P
\ [
mN nm
Ce qui entrane que
{|Xn Y | a}
lim P ({|Xm Y | a}) 0.

m+
lim P(|Xm Y | a) = 0 c--d que la suite de variables alatoires
m+
relles (Xn )N converge en probabilit vers la variable alatoire relle Y . 2

Ce dernier rsultat nest plus vrai si la mesure nest pas finie ([2] p. 85 ex V-8). Quant la
rciproque, elle nest pas vraie, la convergence en probabilit nentrane pas la convergence
presque-sre (cf. [14] ex 14-3). Cependant on a les rsultats suivants :
Proposition 6.25.
Si (Xn )N converge en probabilit vers X , alors il existe une sous-suite convergeant presquesrement vers X .
Le rsultat suivant montre quelle condition les notions de convergences en probabilit et
presque-sre concident (cf. [2] p. 86 ex V-10) :
Proposition 6.26.
Les notions de convergences en probabilit et presque-sre concident si, et seulement si, la
probabilit P est discrte.
Tenant compte de ce que les variables alatoires relles de carr intgrable sont intgrables
daprs la proposition 3.20, page 45, la loi faible des grands nombres apparat ainsi comme une
consquence immdiate de la loi forte de Kolmogorov.
Proposition 6.27.
Si 1 < p < q < + et si la suite (Xn )N converge dans Lq vers la v.a.r. X , alors la suite (Xn )N
converge dans Lp vers la v.a.r. X .
La rciproque est fausse (cf. [14] ex 14-5). La topologie de Lq contient la topologie induite sur
Lq par celle de Lp , mais on na pas lgalit des topologies.
Concernant le lien entre les convergences presque-sre et dans Lp , en gnral la convergence
presque-sre dune suite de v.a. de Lp nentrane pas la convergence de cette suite dans Lp (cf.
[14] ex 14-8). Cependant on a les deux rsultats suivants :
Proposition 6.28.
Si (Xn )N est domine dans Lp , 1 p < +, et converge presque-srement vers X , alors elle
converge dans Lp vers X .
La rciproque de cette proposition est fausse, la convergence dans Lp nentrane pas la
convergence presque-sre (cf. [14] ex 14-7, [2] p. 83 ex V-1-(3)), mais :
CT U
Besancon
121
Proposition 6.29.
Si (Xn )N converge dans Lp vers X , 1 p < +, alors il existe une sous-suite convergeant
presque-srement vers X .
Concernant le lien entre les convergences dans Lp et en probabilit, on a :
Proposition 6.30.
Si (Xn )N converge dans Lp vers X , 1 p < +, alors elle converge en probabilit vers X .
La rciproque est fausse, la convergence en probabilit nentrane pas la convergence dans Lp
(cf. [14] ex 14-6, [2] p. 83 ex V-1-(5)).
6.5
Exercices de rvision sur les chapitres I VI

Soient (Xn )n1 une suite de v.a.r. de carr intgrable non corrles. On suppose quil existe
un rel et un rel positif C tels que, pour tout n 1, E[Xn ] = et Var(Xn ) C . Montrer
que la suite

X1 + + Xn
n
n1
converge vers dans L2 et en probabilit.

Thorme de Monte-Carlo
Soit f une application de [0, 1] dans R de carr intgrable au sens de Lebesgue sur [0, 1].
On considre une suite indpendante (Un )N de v.a.r. de loi uniforme sur [0, 1]. Dmontrer
directement et sans utiliser la loi des grands nombres que la suite des moyennes empiriques
associe Rla suite de v.a.r. (f (Un ))N converge en probabilit vers lintgrale au sens de
Lebesgue [0,1] f d.
A laide de la loi forte des grands nombres et en considrant une suite indpendante de
v.a.r. (Xi )i1 de mme loi uniforme U([0, 1]), calculer
Z
x1 + + xn
)d(n) (x1 , , xn ),
lim
f(
n+ [0,1]n
n
o (n) est la mesure de Lebesgue dans Rn et f une application continue borne de R dans
R.
Thorme de Weierstrass
Soient f une application continue de [0, 1] dans R et x [0, 1]. Pour tout n N , notons
Sn une v.a.r. binomiale de loi B(n, x).
CT U
Besancon
122

1. Montrer que pn (x) := E[f ( n1 Sn )] est un polynme en x appel polynme de
Bernstein de f .
2. En utilisant luniforme continuit de f sur [0, 1] montrer que, pour tout > 0, il
existe > 0 tel que, pour tout n N et tout x [0, 1],
1
|pn (x) f (x)| E[|f ( Sn ) f (x)|]
n

1
1
P | Sn x| < + 2P | Sn x| sup |f (x)|.
n
n
0x1
En dduire que, pour tout > 0, il existe > 0 tel que, pour tout n N et tout
x [0, 1],
x(1 x)
|pn (x) f (x)| + 2
sup |f (x)|.
n 2 0x1
3. Dmontrer le thorme de Weierstrass : Toute application continue de [0, 1] dans
R est limite uniforme sur [0, 1] dune suite de polynmes.

Pour la premire question de cet exercice, on pourra utiliser le rsultat de lexercice 4.17,
page 92.
X
1. Soit X une v.a.r. , montrer que E(|X |)
P(|X | n).
n0
2. Soit (Xn )N une suite indpendante de v.a.r. de mme loi. On pose, pour tout n N ,
Sn := X1 + X2 + ... + Xn . En utilisant la relation
Sn+1
Sn
Xn+1
Sn
,
n
n+1
n(n + 1) n + 1
Montrer que
1
{( Sn )N converge dans R} [lim sup{|Xn | n}]c .
n
n+
3. On suppose de plus que X1 nest pas intgrable. A laide du lemme de Borel-Cantelli,
1
montrer que la suite de v.a.r. ( Sn )N ne converge pas presque-srement dans R.
n
Soit (Xn )N une suite indpendante de v.a.r. intgrables, de mme loi et desprance m 6= 0.
On note, pour tout entier n 1, Sn := X1 + X2 + ... + Xn . Soit I un intervalle born de R.
1. Montrer linclusion

c
1
Sn
converge vers m lim sup{Sn I } .
n
n
N
2. En dduire que presque-srement seulement un nombre fini des vnements {Sn I }
sont raliss.
CT U
Besancon
Chapitre 7. Thorme-limite central et convergence de lois
123
Chapitre 7
Thorme-limite central et
convergence de lois
Dans ce chapitre, sauf indication contraire, toutes les variables alatoires considres seront
relles et dfinies sur un mme espace de probabilit (, F, P). On notera M1 (R), ou plus
simplement M1 , lensemble des mesures de probabilit sur R. On se propose de munir cet
ensemble dune structure topologique appele topologie de la convergence troite . La
notation Cb (Rd ) dsignera lespace fonctionnel des applications, appeles fonctions-test ,
continues et bornes de Rd dans R.
7.1
7.1.1
Thorme-limite central (TLC)

nonc du thorme-limite central (TLC)
Pour introduire lnonc du TLC, commenons par une proposition lmentaire trs utilise en
statistique infrentielle.
Proposition 7.1.
Si (Xn )N est une suite indpendante et identiquement distribue (i.i.d.) de variables alatoires
relles gaussiennes desprance m et de variance 2 > 0, alors, pour tout entier n > 0, la
variable alatoire relle
X1 + + Xn
m
n
2
est une variable alatoire normale centre de variance
.
n
Dmonstration : Soit n N fix. Comme (X1 , , Xn ) est une suite indpendante de variables
alatoires relles gaussiennes, la somme X1 + +Xn est une variable alatoire relle gaussienne
de loi N 1 (nm, n 2 ). Par suite la v.a.r.
X1 + + Xn
m
n
est de loi N 1 (0,
2
). 2
n
CT U
Besancon
124
En particulier, pour tout x R, on peut crire avec les notations de la proposition prcdente,
X1 + + Xn
m x
n
2
n
1
=
2
u2
e 2 du.
On peut aussi noncer la proposition prcdente sous la forme :

Proposition 7.2.
gaussiennes desprance m et de variance 2 > 0, alors, pour tout entier n > 0, la variable
alatoire relle Sn := X1 + + Xn est une variable alatoire normale desprance nm et de
variance n 2 .
Si, dans les hypothses de la proposition 7.1, on supprime la connaissance a priori de la loi
commune des v.a.r. , le rsultat prcdent devient seulement "asymptotiquement" vrai au sens
prcis dans lnonc du thorme suivant, connu sous le nom de Thorme-limite central ou
en abrg TLC, trs important en statistique infrentielle. Vu son importance, nous donnerons
dans ce chapitre plusieurs noncs quivalents de ce rsultat que nous dmontrerons la page
138 aprs avoir tudi la notion de convergence troite dune suite de probabilits.
Proposition 7.3.
Thorme-limite central (version "moyenne empirique")
de carr intgrable desprance m et de variance 2 > 0, alors, pour tout x R,
r !
Z x
t2
1
2
X1 + + Xn
m x
=
e 2 dt.
lim P
n+
n
n
2
La loi forte des grands nombres affirme que presque-srement, pour n assez grand, la moyenne
X1 + + Xn
empirique
est proche de m. Le thorme-limite central quant lui, donne des
n
X1 + + Xn
renseignements, pour n "assez grand", sur la loi approximative de lerreur
m
n
X1 + + Xn
commise en prenant
comme estimation de m.
n
Dun point de vue pratique, si (Xn )N est une suite indpendante et identiquement distribue de
variables alatoires relles de carr intgrable desprance m et de variance 2 > 0, alors, pour
tout entier naturel n assez grand et pour tout x R,

P
X1 + + Xn
m x
n
c--d avec le changement de variable u := t

P
CT U
Besancon
X1 + + Xn
m x
n
Z x
n
2
t2
e 2 dt
2
,
n
q
2
2 n
u2
2
2 n
du.
125
X1 + + Xn
n
2
X1 + + Xn
m suit la loi normale N 1 (0, ) ou encore que la moyenne empirique
suit approxn
n
2
imativement la loi N 1 (m, ). Cela signifie quasymptotiquement la v.a.r. Sn = X1 + + Xn
n
peut tre approxime par une variable alatoire normale desprance nm et de variance n 2 .
On peut dire quasymptotiquement, i.e. pour tout entier n assez grand, lerreur
On peut alors donner une autre forme quivalente du TLC qui porte sur la somme de n v.a.r
i.i.d. :
Proposition 7.4.
Thorme-limite central (version "somme de n v.a.r.")
de carr intgrable, desprance m et de variance 2 > 0, alors, pour tout rel x,

Z x
t2
1
Sn nm
x =
e 22 dt.
lim P
n+
n
2
On peut aussi exprimer le TCL sous une forme plus intuitive, calque sur lnonc de la
proposition 7.2 mais cette fois sans lhypothse de normalit des variables, ce qui conduit
un rsultat analogue vrai seulement asymptotiquement sur n, au lieu de ltre pour tout n.
Cest dailleurs souvent sous cette dernire forme que le TLC est nonc et utilis dans les
applications pratiques en statistique.
Proposition 7.5.
Approximation dune somme de v.a.r. par la loi normale
de carr intgrable, desprance m et de variance 2 > 0, alors, pour tout entier naturel n 1
suffisamment grand (en pratique n 30), la variable alatoire relle Sn := X1 + + Xn
se comporte approximativement comme une variable alatoire normale desprance nm et de
variance n 2 .
Exemples 7.1.
Considrons une suite i.i.d. (Xn )N de variables alatoires relles de loi uniforme sur
365
X
1 1
Xk . Alors P(|S| 15) 0, 99.
lintervalle [ 2 , 2 ]. Posons S :=
k=1
En effet, en gardant les mmes notations que plus haut, un calcul desprance et de variance
pour la variable alatoire relle X1 de loi uniforme sur lintervalle [ 12 , 21 ] on obtient,
1
m = E(X1 ) = 0 et 2 = Var(X1 ) = 12
. Par suite E(S) = 0 et, en vertu de lidentit
des lois et de lindpendance de la suite (Xn )N ,
!
365
365
X
X
365
Var(S) = Var
Xk =
Var(Xk ) =
.
12
k=1
k=1
Comme daprs ce qui a t crit plus haut, S est pratiquement une variable alatoire
relle normale car n peut tre considr comme grand, on en dduit que la loi
qde S est
pratiquement N 1 (0, 365
). Cela signifie aussi que la variable alatoire relle
12
12
S
365
est
CT U
Besancon
126

q
12
pratiquement de loi N 1 (0, 1). Par suite comme 15 365
2, 72,
r

! Z
r
12
2,72
t2
1
12

e 2 dt.
P(|S| 15) = P
S 15
=
365
365
2
2,72
En utilisant la table de la loi normale centre rduite de lannexe B, page 211, on trouve
P(|S| 15) 0, 99.
Comparons ce rsultat ce que donnerait lingalit de Bienaym-Tchbychev. Par application de cette ingalit,
P(|S| > 15) = P(|S E(S)| > 15)
Var(S)
0, 135,
152
c--d P(|S| 15) 0, 865. 2

On voit quun des intrts du TLC est de permettre dapproximer la loi dune variable alatoire
relle dans des situations o le calcul exact de cette loi serait pratiquement trs compliqu,
voire impossible.
7.1.2
Cas particuliers du thorme-limite central (TLC)
Appliquons le TLC des cas particuliers. Voici un corollaire du thorme-limite central

historiquement important.
Proposition 7.6.
Approximation dune loi binomiale par une loi normale (Thorme de De MoivreLaplace)
Si p ]0, 1[ et, pour tout entier n 1, Zn est une variable alatoire relle de loi binomiale
B(n, p), alors pour tout rel x
!
Z x
t2
1
Zn np
e 2 dt.
lim P p
x =
n+
2
np(1 p)
Dmonstration : Daprs la proposition 4.33, page 86, la variable alatoire relle
Z np
p n
np(1 p)
a mme loi que la variable alatoire relle
Yn :=
X1 + + Xn np
p
np(1 p)
o (Xn )N est une suite indpendante et identiquement distribue de variables alatoires

relles de Bernoulli de loi B(p). De plus avec les notations habituelles, m = E(X0 ) = p,
2 = Var(X0 ) = p(1 p).
On applique alors le thorme-limite central (version "moyenne empirique", cf. proposition 7.3)
CT U
Besancon
127
la suite (Xn )N . 2
Le thorme de De Moivre-Laplace exprime que dans la pratique, pour n assez grand, une
variable alatoire relle X binomiale de taille n peut tre approxime par une variable alatoire
relle normale X 0 . Plus prcisment, si a et b sont des rels avec a < b, alors
!
X np
b np
a np
<p
p
.
P (a < X b) = P p
np(1 p)
np(1 p)
np(1 p)
Do pour un entier n assez grand,
1
P (a < X b)
2
bnp
np(1p)
t2
e 2 dt
anp
np(1p)
u np
c--d avec le changement de variable t = p
,
np(1 p)

Z b
1
(u np)2
P (a < X b) p
exp
du = P (a < X 0 b)
2np(1 p)
2np(1 p) a
o X 0 est une variable alatoire relle normale desprance np et de variance np(1 p).
En conclusion, on peut dire quasymptotiquement, i.e. pour n assez grand, la v.a.r. X
binomiale B(n, p), peut tre approxime par une variable alatoire normale X 0 desprance np
et de variance np(1 p). Dans la pratique cette approximation est considre satisfaisante si
n 20 et p 12 .
Un cinma comporte deux salles contenant chacune n places. N personnes se prsentent
lentre de ce cinma. On admet que les choix des spectateurs sont indpendants les uns
des autres et quun spectateur quelconque a une chance sur deux daller dans la premire
salle.
1. Quelle est la probabilit P que tous les spectateurs ne puissent pas voir le film quils
ont choisi ?
2. Comment le constructeur aurait-il d choisir n si on sait que N = 1000 et si on veut
que P 0, 01 ?
On peut faire, pour les variables alatoires relles de Poisson, un raisonnement analogue celui
fait pour les variables binomiales pour obtenir la proposition suivante :
Proposition 7.7.
Approximation dune loi de Poisson par une loi normale
Soient un rel > 0 et, pour tout entier n 1, Zn une variable alatoire relle de loi de
Poisson P(n), alors pour tout rel x,

Z x
t2
Zn n
1
lim P
x =
e 2 dt.
n+
n
2
CT U
Besancon
128
Dmonstration : La dmonstration de cette proposition se calque facilement sur celle du

thorme de De Moivre-Laplace. 2
Une consquence de la proposition 7.7 est que, pour un rel assez grand, une variable alatoire
relle X de Poisson P() peut tre approxime par une variable alatoire relle X 0 normale
N 1 (, ). Dans la pratique cette approximation est considre satisfaisante si 10.
7.1.3
Correction de continuit
Prenons le cas de lapproximation dune variable alatoire relle X binomiale B(n, p), par une
variable alatoire relle X 0 normale N 1 [np, np(1 p)]. Si on remplace "brutalement" X par X 0
dans les calculs, on aura, pour tout entier 0 k n, P(X = k) P(X 0 = k) = 0 car X 0 tant
une variable alatoire relle densit, P(X 0 = x) = 0 pour tout rel x. Ce qui na aucun intrt.
En gnral pour viter cet inconvnient, quand on veut approximer dans un calcul pratique une
variable alatoire relle X discrte porte par N par une variable alatoire relle X 0 admettant
une densit sur R de fonction de rpartition F , on effectue une correction appele correction
de continuit.
Les corrections de continuit sont donnes par :
1. Pour tout entier 0 k n, on approxime P(X = k) de la faon suivante :

1
1
1
1
0
P k X k+
P(X = k) = P k X k +
2
2
2
2
cest--dire
Z
P(X = k)
k+ 12

(t)d(t) = F
k 12
1
k+
2

F
1
k
2

.
2. Plus gnralement, si a et b sont des rels avec a < b, on approxime P(a < X < b) de
la faon suivante (mmes critures avec les ingalits larges) :

1
1
1
1
0
P(a < X < b) = P a X b +
P a X b+
2
2
2
2
cest--dire
Z
P(a < X < b)
b+ 21

(t)d(t) = F
a 12
1
b+
2

1
F a
.
2
3. On crit, pour tout rel b, (mmes critures avec les ingalits larges) :

Z b+ 1

2
1
1
1
0
P(X < b) = P X b +
(t)d(t) = F b +
P X b+
=
.
2
2
2
4. On crit, pour tout rel a, (mmes critures avec les ingalits larges) :
Z +

1
1
1
0
P(a < X ) = P a X P a X =
(t)d(t) = 1F a
.
2
2
2
a 12
CT U
Besancon
7.2
129
Convergence dune suite de probabilits, convergence en loi
Limportance du thorme-limite central conduit introduire une notion de convergence dans

lensemble M1 (R) des probabilits sur R. Auparavant disons quun rel x est point de continuit , resp. point de discontinuit , dune application f de R dans R si lapplication f est
continue en x, resp. discontinue en x.
Dfinition 7.1.
Soient (n )N une suite de probabilits sur R et une probabilit sur R. On dit que la suite
de probabilits (n )N converge troitement vers la probabilit , si, pour tout point de
continuit x de la fonction de rpartition F de , la suite relle (Fn (x))N converge vers le rel
F (x).
On remarquera quon nexige pas que la suite de rels (Fn (x))N converge vers F (x) aux points
x R o la fonction de rpartition F de nest pas continue. Il se peut quil ny ait pas convergence en certains points de discontinuit.
On notera le rsultat suivant danalyse, consquence de la monotonie de la fonction de
rpartition :
Proposition 7.8.
Lensemble des points de discontinuit dune fonction de rpartition, est dnombrable.
Dmonstration : On rappelle quon a vu dans le premier chapitre, proposition 1.14, page 15, que
la fonction de rpartition de nest pas continue en un point x si, et seulement si, ({x}) > 0.
On en dduit donc que lensemble des discontinuits de F est gal
+
[
k=1
1
x R / ({x}) >
k

.
1
Mais, pour tout entier k 1, {x R/({x}) > } contient au plus k lments. Par suite
k
lensemble des discontinuits de la fonction de rpartition dune probabilit est une runion
dnombrable densembles dnombrables, donc est un ensemble dnombrable. 2
On prendra garde que, si une suite de fonctions de rpartition de probabilits converge, sa
limite nest pas ncessairement la fonction de rpartition dune probabilit, comme le montre
lexercice 7.2 ci-dessous. En revanche, on admettra que :
Proposition 7.9.
La limite, si elle existe, dune suite de fonctions de rpartition est une application de R dans
[0, 1] continue droite et croissante.
En considrant la suite de probabilits de Dirac au point n sur R, (n )N , montrer que la
limite, si elle existe, dune suite de fonctions de rpartition nest pas ncessairement une
fonction de rpartition et quon peut avoir la convergence simple de la suite (Fn )N sans
CT U
Besancon
130
que la suite (n )N converge.

Dfinition 7.2.
Si (Xn )N est une suite de variables alatoires relles et X une v.a.r., on dit que la suite (Xn )N
converge en loi vers la variable alatoire relle X pour exprimer que la suite (PXn )N des lois
des variables alatoires relles Xn converge vers la loi PX de la variable alatoire relle X .
On prendra garde que cette dernire terminologie est trs dangereuse car une suite de variables
alatoires relles (Xn )N peut converger en loi vers des variables alatoires relles diffrentes.
Tout ce quon peut affirmer a priori cest que toutes ces variables alatoires relles auront alors
la mme loi, comme le prcise le rsultat qui suit :
Proposition 7.10.
Si une suite de probabilits sur R, (n )N , converge troitement vers deux probabilits sur R,
et , alors = .
Dmonstration : Notons C (F ), resp. C (F ), lensemble des points de continuit de la fonction
de rpartition de , resp. . Comme lensemble des discontinuits de la fonction de rpartition
dune probabilit est un ensemble dnombrable (cf. proposition 7.8), lensemble des points de
continuit communs F et F , i.e. C (F ) C (F ), est dense dans R comme complmentaire
dun ensemble dnombrable. Pour tout x C (F ) C (F ), F (x) = lim Fn (x) = F (x) car
n
la suite (n )N , converge la fois vers les deux probabilits et . F et F tant continues

droite sur R, on en conclut que F = F et par suite = . 2
On admettra quon peut munir lensemble M1 (R) dune structure despace mtrique dont la
topologie associe est celle de la convergence troite (cf. [3], exercice V-17). Prcisment :
Proposition 7.11.
(Hors programme)
1. Lapplication d de M1 M1 dans R+ dfinie par
d(, ) := inf { > 0; x R, F (x ) F (x) F (x + ) + } ,
o F et F dsignent les fonctions de rpartition respectivement de et , dfinit une
mtrique, dite mtrique de Lvy, sur M1 (R).
2. La suite (n )N de probabilits converge troitement vers la probabilit si, et seulement
si, la suite relle (d(n , ))N converge vers 0.
b, Y
b ), o dsigne la
3. De plus, pour tout couple de v.a.r. (X , Y ), on a d(PX , PY ) (X
mtrique de Ky-Fan (cf. proposition 6.9, page 111).
En utilisant la terminologie (abusive) de la convergence en loi et la version "somme de n v.a.r."
du TLC, on vrifie aisment quon peut noncer le TLC en termes de convergence en loi.
Cet nonc englobe le cas o 2 = 0 et se gnralise au cas o les variables alatoires sont
vectorielles (cf. proposition 7.25, page 138) :
CT U
Besancon
131
Proposition 7.12.
Thorme-limite central (version relle)
Soient (Xn )N une suite indpendante et identiquement distribue de variables alatoires relles
de carr intgrable (i.e. E(|X0 |2 ) < +), desprance m R et de variance 2 . On pose, pour
tout entier
naturelnon nul n, Sn = X1 + X2 + + Xn . Alors, la suite de variables alatoires
Sn nm
converge en loi vers une variable alatoire gaussienne centre de variance

relles
n
N
2.
Soit (Xn )n1 une suite indpendante de variables alatoires relles de mme loi de Poisson
k=n
X
P(1). Pour n 1, on pose Sn :=
Xk . Prciser la loi de Sn et calculer la limite de la
k=1
suite relle
e n
k=n k
X
n
k=0
k!
!
.
n1
Dans le cas o la suite de probabilits est compose de probabilits discrtes portes par N, on
utilise le critre de convergence suivant :
Proposition 7.13.
Critre de convergence pour les probabilits discrtes
Soient, pour tout n N, n et des probabilits discrtes portes par N. Alors la suite (n )N
converge vers si, et seulement si, pour tout k N, la suite de rels (n ({k}))N converge vers
({k}).
Dmonstration : Montrons la condition ncessaire. Comme est une probabilit discrte porte
par N, sa fonction de rpartition est dfinie sur R par
F (x) =
+
X
({k})1l[k,+[ (x).
k=0
On a une criture analogue pour les fonctions de rpartition des probabilits n . Lensemble des
points de discontinuit de F est inclus dans N. Par suite, pour tout entier k, k + 21 et k 21
sont des points de continuit de F et Fn . Comme ({k}) = F (k + 12 ) F (k 12 ), il vient
en utilisant le fait que, pour tout point de continuit x de F , F (x) = limn Fn (x),

1
1
({k}) = lim Fn k +
lim Fn k
n
n
2
2

1
1
= lim Fn k +
Fn k
n
2
2
= lim n ({k}).
n
La condition suffisante est immdiate daprs lcriture des fonctions de rpartition de et n . 2

On notera que le critre prcdent devient faux si les probabilits sont portes par une partie
dnombrable D de R dont les points ne sont pas tous topologiquement isols. On rappelle quun
CT U
Besancon
132
point x D est dit topologiquement isol sil existe un intervalle de la forme ]x , x + [,

avec > 0, ne contenant pas dautre point de D que x lui-mme. On peut construire un
contre-exemple en considrant, pour tout entier n 1, les probabilits n := 1 et prendre
n
:= 0 .
Donnons comme exemple dapplication aux lois classiques du critre des probabilits discrtes
le rsultat suivant :
Proposition 7.14.
Soit ]0, +[. Si (pn )N est une suite de rels de ]0, 1[ telle que limn (npn ) = , alors la suite
de probabilits ( B(n, pn ))N converge vers P().
Dmonstration : Fixons k N, par dfinition de la probabilit binomiale
B(n, pn )({k}) = Cnk pnk (1 pn )nk =
n(n 1)...(n k + 1) k
pn (1 pn )nk .
k!
Au voisinage de +, nk est un quivalent de n(n 1)...(n k + 1) et B(n, pn )({k}) admet

pour quivalent
(npn )k
(1 pn )nk .
k!
De plus, toujours au voisinage de +,
ln(1 pn )nk = (n k) ln(1 pn ) (n k)(pn )
nk
() ,
n
par suite limn (1 pn )nk = e . Par passage la limite on obtient donc

(npn )k
k
(1 pn )nk =
e
n+
k!
k!
lim
et par quivalence
lim B(n, pn )({k}) =
n+
k
e = P()({k}),
k!
pour tout entier k, ce qui donne le rsultat cherch. 2

Dans les calculs pratiques ce rsultat est utilis de la faon suivante :
si n 30, p 0, 1 np 10, on assimile une variable binomiale de loi B(n, p) une variable
de Poisson de paramtre np.

Un fabriquant produit des transistors dont un pour cent sont dfectueux. Il les ensache par
paquets de 100 et les garantit 98 pour cent. Quelle est la probabilit que cette garantie
tombe en dfaut ?
Donnons, toujours titre dexemple, une approximation de la loi hypergomtrique.
CT U
Besancon
133
Dfinition 7.3.
On appelle loi hypergomtrique de paramtres N, n, p, la probabilit sur R dfinie par
H(N, n, p) :=
n
nk
k
X
CNp
CNq
k=0
CNn
k ,
o n N , N N , p ]0, 1[ tels que Np N, et q := 1 p.

On trouvera la valeur de lesprance et de la variance de la loi hypergomtrique dans le
formulaire de lannexe A, page 205.
Proposition 7.15.
Soient n N et p ]0, 1[. Notons S := {N N / Np N}.
Alors la suite de probabilits ( H(N, n, p))NS converge troitement vers B(n, p).

Dmontrer la proposition 7.15 prcdente.
Dans les calculs pratiques ce rsultat est utilis de la faon suivante :
si N > 10n, on assimile une variable hypergomtrique de loi H(N, n, p) une variable binomiale de loi B(n, p).
On notera aussi quune suite de probabilits discrtes peut converger vers une probabilit nondiscrte comme le prouve le thorme de De Moivre-Laplace.
Dans les cas gnraux, on dispose de critres de convergence troite utilisant des familles de
fonctions-test, par exemple le critre suivant (pour une dmonstration, on pourra se reporter
[4], page 178) :
Proposition 7.16.
Critre de convergence troite par les fonctions continues bornes
Soient (n )N une suite de probabilits sur R et une probabilit sur R. La suite de probabilits
(n )N convergeZ troitement vers la probabilit Z si, et seulement si, pour tout f Cb (R), la
suite de rels (
f dn )N converge dans R vers

R
f d.
R
nonc en terme de convergence en loi de v.a.r. cette dernire proposition devient, par
application du thorme du transfert :
Proposition 7.17.
Critre de convergence en loi par les fonctions continues bornes
Soient (Xn )N une suite de v.a.r. et X une v.a.r.. La suite de v.a.r. (Xn )N converge en loi vers la
v.a.r. X si, et seulement si, pour tout f Cb (R), la suite de rels (E(f (Xn ))N converge dans
R vers E(f (X )).
A titre dapplication de ce rsultat, prouvons la proposition suivante :
CT U
Besancon
134
Proposition 7.18.
Soit (Xn )nN une suite de v.a.r. et f une application continue de R dans R. Si la suite de v.a.r.
(Xn )N converge en loi vers une v.a.r. X , alors la suite de v.a.r. (f (Xn ))N converge en loi vers
f (X ).
Dmonstration : On remarque tout dabord que, pour tout n N, lapplication f (Xn ) de
dans R est bien une variable alatoire puisquelle est la compose de lapplication Xn
qui est ( F, B(R))-mesurable et de lapplication f qui est continue donc ( B(R), B(R))mesurable. Si est une application de R dans R continue borne alors f est galement continue borne. Lhypothse de convergence en loi de la suite (Xn )N vers X entrane, compte tenu deZ la proposition 7.16
Z applique f et du thorme de transfert,
lim E[ f (Xn )] = lim f (x)dPXn =
f (x)dPX = E[ f (X )] que lon peut crire
n
lim E[(f (Xn ))] = E[(f (X ))]. Ceci tant valable pour toute application continue borne ,
n
on conclut que la suite (f (Xn ))N converge en loi vers f (X ). 2

Il peut tre utile davoir des critres utilisant dautres familles de fonctions-test, comme par
exemple celle des fonctions continues support compact ou celle des fonctions continues nulles
linfini :
Proposition 7.19.
Critre de convergence troite par les fonctions continues support compact
Soient (n )N une suite de probabilits sur Rd et une probabilit sur Rd . La suite de probabilits
(n )N converge troitement vers la probabilit si, et seulement si,Zpour toute fonction f de
Rd dans R, continue et support compact sur Rd , la suite de rels (
Z
R vers
f d.
Rd
f dn )N converge dans
Dmonstration : Faisons la dmonstration dans le cas o d = 1. On admettra le rsultat pour

d > 1.
C.N. - Si la suite (n )N de probabilits converge troitement vers
Z la probabilit , alors,
daprs la proposition 7.16, pour tout f Cb (R), la suite de rels ( f dn )N converge dans
R
Z
R vers
f d. Comme les fonctions continues support compact sont bornes, on a bien
R
Z
que, pour toute fonction f continue et support compact sur R, la suite de rels ( f dn )N
R
Z
converge dans R vers
f d.
R
C.S. -
On
que, pour toute fonctionZ f continue et support compact sur R, la suite
Z suppose
de rels
f dn
f d.
R
Considrons, pour tout entier naturel non nul k, la fonction k , dfinie, pour tout rel x, par
0,
si x < (k + 1) ou x > k + 1 ;
1,
si k x k ;
(x) =
x + k + 1, si k x k + 1 ;
x + k + 1,
si (k + 1) x k.
CT U
Besancon
135
Pour tout entier naturel non nul k, la fonction k , est une fonction continue support compact
telle que 0 k 1 et la suite de fonctions (k )N converge simplement sur R vers la
fonction constante gale 1. Donc, la suite (1 k )N converge simplement sur R vers la
fonction nulle et cette suite de fonctions est domine par la fonction -intgrable 1lR , car
est par
Z hypothse une Zprobabilit. Donc par le thorme de convergence domine, on obtient
lim
(1 k )d =
lim (1 k )d = 0.
k
R k
Soit h une fonction continue, borne sur R par M. On a, pour tout entier naturel non nul k,
et tout entier naturel n,
Z

Z
Z
Z

Z
Z

hdn hd (h hk )dn + hk dn hk d + (hk h)d

R
R
RZ
R
Z R

ZR
Z

M (1 k )dn + hk dn hk d + M (1 k )d,
R
R
RZ
ZR
Z

M (1 k )d + M (1 k )dn (1 k )d +
R
Z R
R
Z
Z

+ hk dn hk d + M (1 k )d,
RZ
R
R Z
Z

M (1 k )d + M k dn k d +
R
Z R
R
Z
Z

+ hk dn hk d + M (1 k )d,
R
(1 k )dn (1 k )d =
k d
k dn , puisque, et n tant des
R
R
ZR
Z
1ldn = 1. Or les fonctions k et hk sont continues support
1ld =
probabilits,
car
compact. Comme, par

f continue et support compact sur
Z hypothse,
pour toute fonction Z
f d, on a, pour tout entier k fix,
f dn
R, la suite de rels
R
R
N

Z
Z
Z
Z

k d, ou encore lim k dn k d = 0. Pour la mme raison,
lim
k dn =
n
n R
R
Z
R
ZR

pour tout entier k fix, lim (hk )dn hk d = 0.
n
Soit > 0 donn. Alors, condition de

grand, puis de prendre
Z choisir et fixer

Z k suffisamment

n suffisamment grand, on pourra avoir hdn hd . Ce qui prouve que, pour tout
R
R
Z
Z
h Cb (R), la suite de rels ( hdn )N converge dans R vers
hd, et donc que la suite de
R
probabilits (n )N converge troitement vers la probabilit . 2
On peut remplacer dans la proposition prcdente les fonctions continues support compact
par les fonctions continues "nulles linfini".
Dfinition 7.4.
Une application f de Rd dans R est dite nulle linfini si, pour tout > 0, il existe un
compact K Rd tel que, pour tout x K c , |f (x)| .
On note souvent C0 (Rd ) lensemble des applications de Rd dans R continues et nulles linfini.
CT U
Besancon
136
On obtient alors le critre suivant :

Proposition 7.20.
Critre de convergence troite par les fonctions continues nulles linfini
Soient (n )N une suite de probabilits sur Rd et une probabilit sur Rd . La suite de probabilits
(n )N converge troitement vers la probabilit si, et seulementZsi, pour toute fonction f de
Rd dans R, continue sur Rd et nulle linfini , la suite de rels (
Z
vers
f d.
Rd
f dn )N converge dans R
Dmonstration : Raisonnons toujours en dimension d = 1. On peut reprendre mot pour mot

la dmonstration de la proposition 7.19 en remplaant lexpression " support compact" par
"nulle linfini", car on vrifie en reprenant ses notations que, pour tout k, les fonctions k et
hk sont continues et nulles linfini. 2
Dans le cas des probabilits densit on dispose de la condition suffisante (mais non ncessaire)
de convergence troite suivante :
Proposition 7.21.
Thorme de Scheff
Soient, pour tout n N, n et des probabilits absolument continues sur R de densits
respectives fn et f par rapport la mesure de Lebesgue . Si la suite des densits (fn )N converge
-presque-partout vers la densit f , alors la suite de probabilits (n )N converge troitement
vers .
Z
Dmonstration : Comme f et fn sont des densits, pour tout n N, (f fn )d = 0 . Donc
R
1
(f fn ) d = (f fn ) d =
2
R
R
+
Z
|f fn |d
R
o on utilise que, pour tout x R, x = x + x et |x| = x + + x . La suite ((f fn )+ )N

est domine par f et converge -presque-partout vers 0 car lapplication x
7Z x + est continue.

+
Daprs le thorme de convergence domine de Lebesgue, on en dduit que
(f fn ) d
R
N
Z

converge vers 0 et par suite
|f fn |d
converge galement vers 0. Enfin comme, pour
N
Z
R Z
Z

tout t R,
(f fn )d
|f fn |d, la suite
(f fn )d
tend vers 0
],t]
],t]
quand n tend vers linfini. On a montr que, pour tout t R, la suite (Fn (t))N converge vers
F (t) o Fn est la fonction de rpartition de n et F celle de . Do la convergence troite de
(n )N vers . 2
La rciproque est fausse comme le prouve lexercice suivant :
En considrant, pour tout entier n 1, les applications dfinies, pour tout rel x, par
CT U
Besancon
137
fn (x) := [1 cos(2nx)]1l[0,1] (x), montrer quil existe une suite de probabilits qui converge troitement vers une probabilit sans que la suite des densits associes converge
-presque-partout vers la densit de .
Les fonctions caractristiques (f.c.) sont aussi un outil extrmement commode dans ltude
des convergences troites, grce au rsultat suivant quon admettra (on pourra en trouver une
dmonstration dans [4], pages 179-181) :
Proposition 7.22.
Thorme de continuit de Paul Lvy
Soit (n )N une suite de probabilits sur Rd . La suite des f.c. (n )N converge simplement sur Rd
vers une application de Rd dans C continue en 0 si, et seulement si, il existe une probabilit
sur Rd , de fonction caractristique = , telle que la suite (n )N converge troitement vers .
Lhypothse de la continuit de en 0 est essentielle. Dans la proposition 7.22, le fait que
(n )N converge vers une limite qui est une probabilit fait partie du rsultat de la proposition,
contrairement la proposition 7.23 qui suit, o le fait que soit une probabilit fait partie des
hypothses de la proposition.
Le thorme de continuit de Lvy a pour corollaire un critre pratique de convergence troite
utilisant les fonctions caractristiques.
Proposition 7.23.
Critre de convergence troite par les f.c.
Soient (n )N une suite de probabilits sur Rd et une probabilit sur Rd . La suite de
probabilits (n )N converge troitement vers la probabilit si, et seulement si, la suite des
f.c. (n )N converge simplement sur Rd vers la f.c. .
ou encore, nonc avec les v.a.r. :
Proposition 7.24.
Critre de convergence en loi par les f.c.
Soient (Xn )N une suite de v.a.r. et X une v.a.r.. La suite (Xn )N converge en loi vers X si, et
seulement si, la suite des f.c. (Xn )N converge simplement sur R vers la f.c. X .
Dmonstration : C.N. - Supposons que (n )N converge troitement vers la probabilit . Les
fonctions eu : x Rd 7 e i<x,u> C, o u Rd , sont continues et bornes sur Rd . Par
application du critre de convergence troite par les fonctions continues et bornes (proposition 7.16) appliqu aux parties relles et imaginaires
u , on en conclut que, pour
Z des fonctions e
tout u Rd , la suite de nombres complexes
e i<x,u> dn (x)
converge dans C vers
Rd
N
Z
e i<x,u> d(x), donc la suite des f.c. (n )N converge simplement sur Rd vers la f.c. .
Rd
C.S. - Supposons que la suite des f.c. (n )N converge simplement sur Rd vers la f.c. .
Prenons, avec les notations du thorme de continuit de Lvy, = . Alors, la suite des
f.c. (n )N converge simplement sur Rd vers une application de Rd dans C continue en 0.
Par le thorme de continuit de Lvy, on en conclut quil existe une probabilit sur Rd , de
fonction caractristique = , et que la suite (n )N converge troitement vers . Comme
CT U
Besancon
138
= = , on conclut par le thorme dinjectivit des f.c. que = , et que la suite (n )N

converge bien troitement vers . 2
Exemples 7.2.
Si (an )N et (n )N sont deux suites relles convergeant respectivement vers les rels a et
, alors la suite de probabilits ( N 1 (an , n2 ))N converge troitement vers la probabilit
N 1 (a, 2 ). 2
Dmontrer laffirmation de lexemple 7.2 prcdent. Pour cela utiliser la fonction caractristique de la loi N 1 (an , n2 ), faire tendre n vers linfini et conclure en appliquant le critre
des fonctions caractristiques pour la convergence troite des probabilits.
Utilisons le critre de convergence troite par les f.c. pour donner une dmonstration du
thorme-limite central que nous nonons maintenant dans le cadre vectoriel qui gnralise
lnonc donn dans la proposition 7.12 en dimension d = 1 :
Proposition 7.25.
Thorme-limite central (version vectorielle)
Soient (Xn )N une suite indpendante et identiquement distribue de vecteurs alatoires rels de
dimension d, de carr intgrable (i.e. E(|X0 |2 ) < +), desprance m Rd et de matrice de
dispersion D. On pose, pour tout entier naturelnon nul n, Sn = X1 + X2 + + Xn .
Sn nm
converge troitement vers la loi

Alors, la suite des lois des vecteurs alatoires
n
N
gaussienne de dimension d, N d (0, D).
Dmonstration : Nous allons dmontrer le TLC dans le cas d = 1.
Soit (Xn )N une suite indpendante et identiquement distribue de variables alatoires relles de
carr intgrable, desprance m et de variance 2 .
Considrons dabord le cas 2 = 0. Les v.a.r. sont alors dterministes et gales la constante
Sn nm
m. Dans ce cas, pour tout entier non nul n, Sn = nm et

= 0. La suite des v.a.r.
n

Sn nm
est la suite stationnaire nulle. Elle converge troitement vers la loi gaussienne
n
N
dgnre de dimension N 1 (0, 0) = 0 . Ce qui prouve le thorme dans le cas 2 = 0.
Plaons-nous maintenant dans le cas 2 > 0.
Soit la fonction caractristique de la v.a.r. X1 m. Daprs la proposition 3.33, page 57,
comme les variables sont de carr intgrable, la f.c. est de classe C 2 . De plus, on a (0) = 1,
0 (0) = E(X1 m) = 0 et 00 (0) = i 2 E[(X1 m)2 ] = Var(X1 ) = 2 . La fonction admet
2
un dveloppement limit en 0 lordre 2 donn, pour tout rel t, par (t) = 1 t 2 + t 2 (t)
2
Sn nm
avec lim (t) = 0. Donc, la fonction caractristique de la v.a.r.

est lapplication n
t0
n
dfinie, pour tout rel t, par
h
i
h Pk=n
i
h Sn nm i
i< n ,t>
i<S nm, 1n >
i< k=1 Xk , 1n >
n (t) = E e
=E e n
=E e
.
CT U
Besancon

139

n

h
in t n
t
2 2 t 2
i<X1 , 1n >
Do n (t) = E e
.
, ou encore n (t) = 1 t +
=
2n
n
n
n
Il ne reste plus qu montrer que, pour tout rel t, lim n (t) = e
n+
2 t 2
2
En effet, daprs la formule du binme de Newton,

2
t2
1 t2 +
2n
n
Considrons la srie numrique
n
2

k
k=n
X
Cnk t 2k
t
=
+
.
nk
2
n
k=0
uk (n) de terme gnral : uk (n) = 0 si k > n, et
k

2

k
t
Cnk t 2k
si 0 k n. Pour tout rel t fix, il existe une
uk (n) =
nk
2
n
Mk
constante M telle que, pour tout entier naturel non nul n, |uk (n)|
. Donc la srie
k!
+
X
X
uk (n) converge normalement. On peut donc intervertir les symboles lim et
, on obn+
tient lim
n+
+
X
k=0
uk (n) =
+
X
k=0
lim uk (n) =
n+
+
X
2 t 2k
k=0
2(k!)
=e
2 2
2t
k=0
. Donc la suite des fonctions
Sn nm
converge vers la fonction caractristique de la loi normale

n
centre de variance 2 . Ce qui prouve, en vertu du critre de convergence en loi par les fonctions
Sn nm
caractristiques (proposition 7.24, page 137) que la suite des v.a.r.

converge en loi
n
vers une v.a.r. normale centre de variance 2 . 2
caractristiques des v.a.r.
Pour complter ltude des liens, commence au chapitre prcdent, entre les divers modes
de convergences, signalons le rsultat suivant qui prouve que la convergence en probabilit,
et a fortiori la convergence presque-sre, dune suite de variables alatoires relles implique la
convergence de la suite des lois de ces v.a.r. :
Proposition 7.26.
Si (Xn )N est une suite de variables alatoires relles convergeant en probabilit vers la variable
alatoire relle Y , alors la suite des lois (PXn )N converge vers la loi PY de la variable alatoire
relle Y .
Dmonstration : Soit h une fonction numrique positive dfinie sur Rd , continue et support
compact. La fonction h est donc uniformment continue sur Rd . Fixons > 0. Il existe donc
un rel > 0, tel que, pour tout x, y Rd , |x y | implique |h(x) h(y )| .
Comme la suite (Xn )N converge en probabilit vers la variable alatoire relle Y , il existe un
entier naturel N tel que, pour tout entier n N , P(|Xn Y | > ) . Alors, pour tout
entier naturel n N , on a
CT U
Besancon
140
|E[h(Xn ) h(Y )]| E [|h(X

n ) h(Y )|]

= E |h(X
)
h(Y
)|
1
l
+
E
|h(X
)
h(Y
)|
1
l
n
n
{|X
Y
|
}
{|X
Y
|>
}
n

E 1l{|Xn Y | } + 2||h|| E 1l{|Xn Y |> }
E 1l{|Xn Y | } + 2||h|| P(|Xn Y | > )
+ 2||h|| = (1 + 2||h|| ).
Ce qui prouve que lim E [h(Xn )] = E [h(Y )] , pour toute fonction numrique h positive dfinie
n
sur Rd , continue et support compact. On conclut alors en vertu du critre de convergence

troite par les fonctions continues support compact. 2
La convergence des lois dune suite de variables alatoires relles nimplique pas ncessairement
la convergence en probabilit de la suite de v.a.r., cependant cette conclusion devient vraie si
la suite des lois converge vers une probabilit de Dirac :
Proposition 7.27.
Si (Xn )N est une suite de variables alatoires relles sur un mme espace de probabilit
(, F, P) telle que la suite des lois (PXn )N converge vers la probabilit de Dirac a o a est un
rel, alors la suite de variables alatoires relles (Xn )N converge en probabilit vers la variable
alatoire relle constante a.
Rsultat quon peut aussi noncer :
Proposition 7.28.
Une suite de v.a.r. (Xn )N converge en loi vers une constante a R si, et seulement si, elle
converge en probabilit vers a.
Dmonstration : Soit > 0 et f lapplication de R dans R dfinie par
1
f (x) := 1l]a,a+[c (x) + |x a|1l]a,a+[ (x).
f est continue borne donc la suite (E[f (Xn )])n1 converge vers E[f (a)] = 0, daprs la
proposition 7.17 . Comme
P(|Xn a| ) = E[1l]a,a+[c (Xn )] E[f (Xn )],
on conclut que la suite (Xn )n1 converge en probabilit vers a. On remarque que, lorsque la
limite est une v.a.r. presque-srement constante, il y a quivalence entre la convergence en loi
et la convergence en probabilit.2
Notons que, dans le cas gnral, on ne peut pas effectuer doprations lmentaires sur les
limites-en-loi. Cependant on admettra (pour une dmonstration de la premire assertion on
pourra se reporter lexercice 7.10, page 142) :
Proposition 7.29.
Thorme de Slutsky
Soient (Xn )N une suite de v.a.r. convergeant en loi vers une v.a.r. X et (Yn )N une suite de v.a.r.
convergeant en loi vers 0, alors
1. la suite de v.a.r. (Xn + Yn )N converge en loi vers X ,
2. la suite de v.a.r. (Xn Yn )N converge en loi (et aussi en probabilit) vers 0.
CT U
Besancon
141
Pour terminer citons pour information deux thormes-limites particulirement importants

portant sur la convergence de lois, (que nous admettrons et qui sont hors programme) :
Proposition 7.30.
Loi des vnements rares (Hors programme)
(n)
(n)
Soient (Xk )(k,n)N2 une suite de v.a.r. indpendantes valeurs dans N. On pose pk :=
(n)
(n)
(n)
P(Xk = 1) et k := P(Xk 2). On suppose de plus que
(n)
(n)
1. lim(p1 + p2 + ... + pn(n) ) = ]0, +[,
n
(n)
(n)
2. lim(max(p1 , p2 , ..., pn(n) )) = 0,

n
(n)
(n)
3. lim(1 + 2 + ... + (n)

n ) = 0.
n
(n)
(n)
Alors la suite de v.a.r. (X1 + X2 + ... + Xn(n) )N converge en loi vers une v.a.r. de loi P().
En remarquant quune v.a.r. de loi binomiale B(n, p) a mme loi que la somme de n v.a.r.
indpendantes de loi B(p), la proposition 7.14 est un cas particulier de la loi des vnements
rares (cf. [3], exercice V-16).
Notons que les thormes-limites jouent un rle thorique important en statistique dans la
vrification des modles probabilistes de phnomnes alatoires. En particulier celui-ci (cf. [3],
problme V-1) :
Proposition 7.31.
Thorme fondamental de la statistique (Hors programme)
Soit (Xn )N une suite de v.a.r. indpendantes et de mme loi. Alors, pour P-presque-tout ,
la suite des lois empiriques de (X1 , X2 , ..., Xn )
!
k=n
1X
X ()
n k=1 k
nN
converge troitement vers la loi de X1 .
7.3
Exercices de rvision sur les chapitres I VII

tudier la convergence troite de la suite de probabilits (n )n1 de densits respectives
(fn )n1 o, pour tout n 1, fn est dfinie par fn (x) := nx n1 1l[0,1] (x).

Soit (Xn )n1 une suite indpendante de v.a.r. de mme loi de Cauchy C(1) (Pour la dfk=n
X
inition, cf. formulaire de lannexe A, page 205). Pour tout n 1, on pose Sn :=
Xk .
k=1

1
1
tudier les convergences en probabilit et en loi des suites de v.a.r. Sn
,
Sn
n
n
n1
n1
CT U
Besancon
142

1
et
Sn
.
n2
n1

Le but de cet exercice est de prouver litem 1 du Thorme de Slutsky (cf. proposition
7.29, page 140).
Soient X une v.a.r. , (Xn )N et (Yn )N deux suites de v.a.r..
1. Montrer que, pour tous t R, > 0, et n N,

|Xn +Yn (t) Xn (t)| 2P(|Yn | > ) + E 1l],] (|Yn |)|e itYn 1|
o Z dsigne la fonction caractristique de la v.a.r. Z .
2. Dmontrer le thorme de Slutsky : Si (Xn )N converge en loi vers X et (Yn )N converge
en loi vers 0, alors la suite (Xn + Yn )N converge en loi vers X .
3. A laide dun exemple, montrer que lon a pas ncessairement (Xn X )N qui converge
en loi vers 0.

Soit (Uk )N une suite indpendante de v.a.r. de loi normale centre et de variance 2 > 0.
Pour tout R, on dfinit la suite (Xk )N par la relation de rcurrence Xn = Xn1 + Un ,
pour tout n 1, avec X0 = 0.
1. Dterminer, pour tout n N, la loi de la v.a.r. Xn .
2. tudier la convergence en loi de la suite de v.a.r. (Xk )N .
Soient X une v.a.r. et (Xn )N une suite de v.a.r.. On suppose que, pour tout n N, PXn := xn
o xn R.
1. Si PX = x , o x R, montrer que la suite (Xn )N converge en loi vers X si et seulement
si la suite de rels (xn )N converge vers x.
2. Montrer que si la suite (Xn )N converge en loi vers X , alors il existe x R tel que
PX = x . On pourra utiliser le rsultat de lexercice 3.23, page 60.

Dans cet exercice on se propose de dmontrer la rciproque du rsultat de lexercice 7.7,
page 138.
Soit (n )N une suite de probabilits de Gauss o, pour tout n N, n := N 1 (an , n2 ).
On suppose que cette suite converge troitement vers une probabilit . On se propose de
montrer qualors les suites relles (an )N et (n2 )N convergent respectivement vers les rels a
et 2 et que = N 1 (a, 2 ) (avec la convention N 1 (a, 0) = a ).
1. En utilisant les fonctions caractristiques, montrer que la suite (n2 )N est borne et
quelle admet une seule valeur dadhrence dans R. En dduire quelle converge dans
R, on notera 2 sa limite.
CT U
Besancon
143
2. A laide du thorme de continuit de Lvy, montrer que la suite (an )N converge

troitement vers la probabilit de Dirac en un point a. En dduire que la suite (an )N
converge vers a et que = N 1 (a, 2 ).
CT U
Besancon
144
CT U
Besancon
Chapitre 8. Corrigs des exercices
145
Chapitre 8
Corrigs des exercices

8.1
Corrigs des exercices du chapitre I
Corrig de lexercice 1.1, page 2

1. Sil existe x {f }, alors f (x) appartient ce qui est absurde. Donc {f } = .
2. Soit x {f A}, alors f (x) A et comme A B, f (x) B et donc x {f B}.
On a donc montrer que tout lment x de lensemble {f A} est aussi dans {f B}
ce qui signifie que {f A} {f B}.
3. On va raisonner par quivalence1 . On a
x {f iI Ai } f (x) iI Ai i0 ; f (x) Ai0 i0 ; x {f Ai0 }
x iI {f Ai } .
Do lgalit. De mme on crit
x {f iI Ai } f (x) iI Ai i ; f (x) Ai i ; x {f Ai }
x iI {f Ai } .
4. On procde encore par quivalence :
x {f A}c x
/ {f A} f (x)
/ A f (x) Ac x {f Ac } .

1. Dans les deux cas (a) et (b) on a 1lAB = 1lA .1lB . Par contre 1lAB sexprime diffremment
suivant que A et B sont disjoints ou non. On peut vrifier cela en tudiant toutes les
valeurs prises par ces fonctions
.
1lA (x) 1lB (x) 1lA (x).1lB (x) 1lAB (x) cas (a) 1lAB cas (b)
x (A B)c
0
0
0
0
0
c
x AB
1
0
0
1
1
x Ac B
0
1
0
1
1
x AB
1
1
1
1
0
1
Si vous ntes pas sr de vous lors de lcriture dune quivalence, vrifiez rapidement les deux implications
pour vous en persuader
CT U
Besancon
146

Ainsi dans le cas (a) : 1lAB = 1lA + 1lB
et dans le cas (b) : 1lAB = 1lA + 1lB 1lA .1lB .
2. On a trivialement 1lAc = 1 1lA et 1lA\B = 1lAB c = 1lA .1lB c = 1lA (1 1lB ). On remarque
que si B A, 1lA .1lB = 1lB et dans ce cas 1lA\B = 1lA 1lB .
Enfin 1lABC = 1l(AB)C = 1lAB + 1lC 1lC 1lAB . On dveloppe de mme lindicatrice
de A B et on obtient :
1lABC = 1lA + 1lB + 1lC (1lA 1lB + 1lB 1lC + 1lC 1lA ) + (1lA 1lB 1lC )

1. Reprsentation graphique de la fonction
1l[n,+[ :
n0
6
r
n+1
1 r
n+1
1l[0,n] :
n0
+ r
(n + 1)1l[n,n+1[ :
n0
CT U
Besancon
147
6
r
n+1
1 r
n+1

Cet exercice nest pas difficile mais demande de la rigueur lors de sa rdaction. Il faut dmontrer
les trois axiomes qui feront de A une tribu.
i) Tout dabord E A car E = A1 An par dfinition dune partition. Donc E scrit
bien comme iI Ai en choisissant I = {1, ..., n}.
ii) Soit B A. Montrons que B c A. On a :
B A I {1, ..., n} ; B = iI Ai
et comme les A1 , ..., An forment une partition de E on a B c = jJ Aj o J est le complmentaire
de I dans {1, ..., n}. Donc B c A.
iii) Soit maintenant (Bk )kN une suite dlments de A. Pour tout k N, il existe un sousensemble Ik {1, ..., n} tel que Bk = iIk Ai . Par suite
kN Bk = kN (iIk Ai ) = jJ Aj
o J = kN Ik {1, ..., n}. Ainsi kN Bk est bien la runion dune sous-famille des A1 , ..., An
et donc kN Bk A.
1) On commence par considrer une famille quelconque (finie ou infinie) de tribu : (Ai )iI . On
considre B la famille des parties de E communes toutes les tribus Ai pour i I . On dit que
B est lintersection des tribus Ai et on crit B = iI Ai . On va montrer que B est elle-mme
une tribu.
E Ai pour tout i car les Ai sont des tribus et donc E B.
Soit A B. Alors A Ai pour tout i et donc Ac Ai pour tout i. Donc pour tout
A B.
Soit (Ak )kN une suite dlments de B. On a k N, i I , Ak Ai . Donc comme
Ai est une tribu, pour tout i I , kN Ak Ai . Par suite kN Ak B.
Ainsi B est une tribu sur E .
2) Prouvons par un contre-exemple que la runion dune famille de tribu sur E nest pas ncessairement une tribu sur E . En effet prenons E = R, A = {1} et B = {2} deux parties de E .
On vrifie facilement que la famille quatre lments a = {,A,Ac ,E } est une tribu sur E . Il
CT U
Besancon
148
en est de mme pour la famille B = {,B,B c ,E }. Considrons la runion C = a B. On a

C = {,A,Ac ,B,B c ,E }. Ce nest pas une tribu car on na pas A B C.
A et B mesurables relativement la tribu A signifie juste que A A et B A. Comme A
est une tribu, B c A et donc A \ B = A B c est lintersection de deux lments de la tribu
A et donc cest aussi un lment de A. Donc A \ B est mesurable par rapport A.
On note F la famille des tribus sur R contenant tous les intervalles de la forme ]a, b] o a et
b sont des rels tels que a < b. Notons B la tribu obtenue par intersection de toutes les tribus
de la famille F. B est une tribu daprs le rsultat de lexercice 1.5. On remarque quon a :
B est une tribu,
B contient tous les intervalles de la forme ]a, b] o a et b sont des rels tels que a < b.
B appartient donc la famille F dfinie plus haut.
B est la plus petite, au sens de linclusion, des tribus de la famille F. Cela signifie que si A
est une tribu sur R appartenant la famille F, alors B A, car B, qui est lintersection
des tribus de la famille F, est contenue dans toutes les tribus de la famille F et en
particulier dans la tribu A.
Des trois points ci-dessus, on dduit que B = B(R) est la tribu de Borel sur R.
Il faut montrer que si B est une tribu contenant les parties A1 , ..., An , alors A B. Soit
B une telle tribu. Par dfinition et proprits des tribus, elle contient toutes les runions des
sous-familles de A1 , ..., An cest--dire que pour tout sous-ensemble I de {1, ..., n}, iI Ai B.
Donc B contient tous les lments de A et on a donc bien A B.
1. Soit A1 , ..., An une suite finie de parties de N deux deux disjointes. Deux cas se
prsentent :
Pn
S
S
+ car il existe
Premier cas : 0 n1 Ai . Alors ( n1 Ai ) = + et S
1 (Ai ) =P
n
un Aio contenant 0 et donc de mesure infinie. Donc ( 1 Ai ) = n1 (Ai ).
S
S
Second cas : 0 6 n1 Ai . Alors si n1 Ai est fini, tous les Ai sont finis et
n
[
X
( Ai ) =
S
k i Ai
n X
n
X
X
1
1
=
(
)=
(Ai ).
k2
k2
1 kA
1
i
S
S
P
Si n1 Ai est infini, alors il existe un Aio infini et on a ( n1 Ai ) = + = n1 (Ai ).
Lapplication est donc additive.
2. Cependant que nest pas -additiveS(et donc ce nest pas une mesure). En effet,
considrons N , (N ) = + et NP= +
1 {k}. Comme
P la suite ({k})N est forme de
parties deux deux disjointes on a k1 ({k}) = k1 k12 < +. Ainsi
!
{k}
k1
CT U
Besancon
6=
({k}) .
k1
149
En consquence, lapplication nest pas -additive bien quelle soit additive.

Corrig de lexercice 1.10,Spage 7
On vrifie aisment que R = kZ ]k, k + 1]. Les intervalles ]k,k + 1] sont des borliens disjoints
deux deux. Par -additivit de la mesure de Lebesgue sur R, on obtient
! k=+
[
X

(R) =
]k, k + 1] =
]k,k + 1] .
kZ
k=
Or pourPtout k Z, (]k,k + 1]) = 1 (la longueur de lintervalle ]k,k + 1]), do

+
(R) = k=
1 = +.
On peut remarquer tout dabord que si A est un borlien alors a (A) = 1l{a} (A). Vrifions que
a est une mesure sur R,B(R)).
Cest bien une application positive de B(R) dans [0, + ].
On a a () = 0.
Soit (An )nN une suite de borliens deux deux disjoints. Deux cas se prsentent.
Tout dabord si a nN An alors il existe un unique n0 (les An sont disjoints deux
deux) tel que a An0 et donc a (nN An ) = 1 et
X
n=0
P
a (Ak ),
a (An ) = a (A0 ) + ... + a (An0 1 ) + a (An0 ) +
{z
} | {z } | k =n0 +1
|
{z
}
=0
=1
=0
P
do lgalit a (nN An ) = nN a (An ).
Si
/ nN An , alors n N ; a
/ An et par suite a (nN An ) = 0 et
P maintenant a
(A
)
=
0
donc
on
a
encore
lgalit.
n
nN a
Ainsi a est une mesure et comme a (R) = 1, cest aussi une probabilit.
Avec les notations de la proposition 1.4, page 8, il suffit de prendre k = k , pour tout k N
et, suivant le cas,
1. pour la probabilit binomiale :
k = Cnk p k (1 p)nk pour 0 6 k 6 n
k = 0 pour k > n + 1.
k
2. pour la probabilit de Poisson : k = e k! , pour tout k N.
3. pour la probabilit gomtrique : 0 = 0, et k = p(1 p)k1 pour k > 1.
4. pour la probabilit uniforme-discrte :
k = n1 pour 1 6 k 6 n
0 = 0 et k = 0 pour k > n + 1.
Corrig de lexercice
P 1.13, page 9
1) B(n; p)({i}) = nk=0 Cnk p k (1 p)nk k ({i}) o k ({i}) = 1 si i = k et 0 sinon. On a donc
B(n; p)({i}) = Cni p i (1 p)ni .
CT U
Besancon
150

i
De mme pour la loi de Poisson on trouve P()({i}) = e i! .

2) On a par ladditivit des probabilits pour les ensembles deux deux disjoints :
P(1/10)({1, 3, 5, 7}) = P(1/10)({1}) + P(1/10)({3}) + P(1/10)({5}) + P(1/10)({7}).
On trouve donc
(0, 1)1 (0, 1)3 (0, 1)5 (0, 1)7
+
+
+
P(1/10)({1, 3, 5, 7}) = e
1!
3!
5!
7!
' 0, 0905 + 0, 0002 + 0 + 0 ' 0, 0907 .
0,1
De mme on trouve B(7; 0.3)({0, 3, 5} ' 0.3343.

Le fait que, pour tout entier naturel n, Bn An est vident. Pour montrer que les Bn sont
disjoints deux deux, supposons que Bn Bm 6= pour n 6= m. On peut considrer que n < m.
Soit x Bn Bm . Comme x Bm , x
/ A0 A1 ... Am1 donc x
/ An car n 6 m 1.
Donc x
/ Bn car Bn An . Ainsi x
/ Bn Bm et il y a donc contradiction. Donc par labsurde,
Bn Bm = .
Comme Bn An ,
n=0 Bn n=0 An . Montrons linclusion inverse. Soit x n=0 An , il existe
n0 tel que x An0 et pour tout k < n0 , x
/ Ak (cet indice n0 peut tre 0), donc x Bn0
et ainsi x
B
.
On
vient
de
montrer
linclusion
n=0 n
n=0 An n=0 Bn et on en dduit donc
lgalit souhaite.
n=K
Soit K un entier naturel. Comme Bn An , n=K
n=0 Bn n=0 An . Montrons linclusion inverse.
n=K
/ Ak (cet indice n0 peut
Soit x n=0 An , il existe n0 tel que x An0 et pour tout k < n0 , x
n=K
n=K
tre 0), donc x Bn0 et ainsi x n=0 Bn . On vient de montrer linclusion n=K
n=0 An n=0 Bn
et on en dduit donc lgalit souhaite.
Rx
On doit trouver une fonction f de R dans R intgrable telle que F (x) = f (t)dt. Comme
F est drivable drive continue sur R, il suffit de prendre f = F 0 cest--dire
1 +x
e , si x 6 0 ;
2
f (x) =
1 x
e , si x > 0.
2
Ainsi F est la fonction de rpartition dune probabilit densit f dfinie par f (x) = 12 e |x| .
La f.r. de N1 (0; 1) est lapplication de R dans [0,1] dfinie par
Z x
t2
1
e 2 dt
(x) =
2
cest donc une application continue sur R. Par suite daprs la proposition 1.14 2.(c), page 15,
on en dduit que pour tout rel x, N1 (0;P
1)({x}) = 0.
SupposonsPmaintenant que N1 (0; 1) =
k=0 pk k o (pk )kN est une suite de rels positifs
telle que
p
=
1
et
(
)
est
une
suite de nombres rels, deux deux distincts. On
k kN
k=0 k
aPalors, pour tout entier naturel k, N1 (0; 1)({k }) = pk = 0 ; ce qui contredit le fait que
k=0 pk = 1. Donc N1 (0; 1) nest pas une probabilit discrte.

CT U
Besancon
151
Rx
1. Cela rsulte de la continuit de la fonction de rpartition x 7 (t)dt et de la
proposition 1.14, 2.(c), page 15.
2. On a (]a,b[) = (]a,b]) ({b}) = (F (b) F (a)) (F (b) F (b)) = F (b) F (a).
De mme ([a,b[) = (]a,b[) + ({a}) = (F (b) F (a)) + (F (a) F (a)) =
F (b) F (a).
La fonction de rpartition F de U([0,1]) est continue sur R et est donne par
0, si x < 0 ;
x, si 0 6 x 6 1 ;
F (x) =
1, si x > 1.
On a donc U([0,1])([1/6,4/3]) = F (4/3) F (1/6) = F (4/3) F (1/6) = 1 1/6 = 5/6.
Comme Q = qQ {q} (union de singletons disjoints deux deux), on a par continuit de la
f.r.,
X
U([0,1])(Q) =
U([0,1])({q}) = 0 .
{z
}
|
qQ
=0
La fonction de rpartition de E(2) est continue et est donne par

0,
si x < 0 ;
F (x) =
2x
1 e , si x > 0.
Donc E(2)({}) = 0 et E(2)({}[9/2,7]) = E(2)({})+E(2)([9/2,7]) = 0+F (7)F (9/2) =
e 9 e 14 .
La reprsentation graphique de F est :
1
3/4 r

1/2 b

r

1/4
-2
-1
On peut crire F de la manire (moins
0,
x+2
,
4
F (x) =
3
,
4
1,
synthtique mais plus lisible) suivante :

si
si
si
si
x < 1 ;
1 6 x < 0 ou 1 6 x 6 2 ;
0 6 x 6 1;
x > 2.
CT U
Besancon
152
La fonction F prsente des sauts ce qui est rvlateur de la prsence de Dirac dans lexpression
de la probabilit.
Par ailleurs, F est bien une fonction de rpartition car elle est croissante, continue droite et
limx F (x) = 0 et limx+ F (x) = 1.
La mesure sera la somme dune mesure densit et dune variable discrte. A priori
on ne dispose pas de rsultat dans le cours pour conjecturer ce fait mais en pratique (en
refaisant dautres exercices de ce type) la mthode dcrite ci-aprs permet de conclure. On
peut considrer que pour tout x R, F (x) = F1 (x) + F2 (x) o
0,
si x < 1 ;
x+1
4 , si 1 6 x < 0 ;
1
,
si 0 6 x 6 1 ;
F1 (x) =
4
,
si 1 6 x 6 2 ;
14
,
si x > 2.
2
et
0, si x < 1 ;
1
, si 1 6 x < 0 ;
F2 (x) =
14
, si x > 0.
2
On remarque
R x que F1 est continue et F2 permet de prendre en compte les sauts. On peut crire
F1 (x) = f1 (t)dt o

f1 (t) =
1
,
4
si 1 6 t < 0 ou 1 6 t 6 2 ;
0, sinon.
Ainsi F1 (x) = 1 (] ,x]) o 1 est la mesure de densit f1 . Pour F2 on crit

1
1
F2 (x) = 1l[1,+[ (x) + 1l[0,+[ (x)
4
4
1
1
= 1 (] ,x]) + 0 (,x])
4
4
= 2 (] ,x])
o 2 = 41 1 + 14 0 . Finalement F est la fonction de rpartition de la probabilit = 1 + 2 .
On remarquera que 1 et 2 ne sont pas elles-mmes des probabilits.
8.2
Corrigs des exercices du chapitre II

Il suffit de vrifier que B B(Rd ), (f )1 (B) A. Or (f )1 (B) = 1 (f 1 (B)),
comme f est borlienne, f 1 (B) B(Rk ) et comme est Amesurable, 1 (f 1 (B)) A
do le rsultat.
Soit FX et FY les f.r. de X et Y respectivement. Soit t R.
Si t 6 0, comme , Y () = e X () > 0 on en dduit que FY (t) = P(Y 6 t) =
P() = 0.
CT U
Besancon
153
Supposons maintenant
t > 0. On rappelle que X tant une v.a.r. de loi N1 (0; 1),
R x que
u 2 /2
FX (x) = (1/ 2) e
du. On a donc
FY (t) = P(Y 6 t) = P(e X 6 t) = P(X 6 ln t) = FX (ln t)
Z ln t
1
2
=
e u /2 du
2
et en faisant le changement de variable u = ln x (en remarquant que < u 6 ln t
0 < x < t) on obtient
Z t (ln x)2 /2
1
e
dx.
FY (t) =
x
2 0
Il reste faire apparatre une densit ce qui revient crire FY (t) sous forme dune intgrale
entre et t :
Z t
FY (t) =
(x)dx
o on a pos
(x) =
1
1
2
e 2 (ln x) 1l]0,+[ (x)
2x
do le rsultat cherch.
Dterminons la fonction de rpartition de la v.a.r. Y .

0
si t < 0
FY (t) = P(Y t) =
P(t X t) si t 0
Puisque FX est continue, on peut crire P(t X t) = FX (t) FX (t) = 12 (2 e t )
1 t
e = 1 e t . On reconnat la fonction de rpartitiondune v.a. de loi exponentielle E(1).
2
On crit les quivalences suivantes :
Y = X + m
t
(xm)2
1
suit une loi N 1 (m; ) t R ; P(Y 6 t) =

e 22 dx
2

Z t
(xm)2
t m
1
t R ; P X 6
=
e 22 dx
Z x
v2
1
e 22 dv ,
x R ; P (X 6 x) =
2
o on a dabord pos x = (t m)/ puis fait le changement de variable v = (u m)/.

Soit X une variable alatoire relle de loi
PX :=
p k k .
kN
CT U
Besancon
154
Fixons n N, il vient
PX ({n}) :=
pk k ({n}).
kN
Or k ({n}) = 0, si k 6= n et n ({n}) = 1. Par suite

Do le rsultat cherch.
kN
pk k ({n}) = pn et PX ({n}) = pn .

1. Le graphe de F est une fonction en escalier, croissante et continue droite, prsentant
des sauts de discontinuit de premire espce en tout point dabscisse n 1, la hauteur
du saut tant gale P(X = n).
2. F est une fonction de rpartition car elle est dfinie sur R valeurs dans [0, 1], croissante,
continue droite en tout point, avec lim F (x) = 0 et lim F (x) = 1.
x
x+
3. Soit n > 1 un entier naturel. Daprs le cours, pour tout rel x, P(X = x) est gal la
valeur du saut de F au point dabscisse x. Cest--dire

1
2
1
.
1
=
P(X = n) = F (n) F (n) = 1
2
n(n + 1)
n(n 1)
n(n 1)
1
On a de mme P(X = 0) = 0 et P(X = 1) = .
2
4. Par dfinition, comme X est une variable discrte valeurs dans N,
E(X ) :=
nP(X = n)
n=1
E(X ) =
E(X ) =
E(X ) =
E(X ) =
1 X
2
+
2 n=2 (n 1)(n + 1)

1
1 X
+
2 n=2 n 1 n + 1

1
1
1 1
1 1
1
1
+ 1
+
+ +
+
2
3
2 3
3 4
n1 n+1
1
1
+ 1 + = 2.
2
2
5. Calculons la variance de X . Vrifions auparavant que la variable X est de carr intgrable,

cest--dire que E(X 2 ) est un rel fini. Or, par dfinition des moments dordre 2, et suivant
un calcul analogue au prcdent, il vient :
E(X 2 ) =
n2 P(X = n) =
n=1
La srie terme gnral rel positif
X
n=2
CT U
Besancon
1 X
2n
+
.
2 n=2 (n 1)(n + 1)
2n
ne converge pas. En effet, son
(n 1)(n + 1)
1
terme gnral est quivalent , terme gnral dune srie divergente (srie harmonique).
n
155
Daprs le critre de lquivalence pour les sries terme gnral positif, la srie
X
2n
diverge. Donc la variable alatoire X nadmet pas de variance.
(n
1)(n
+
1)
n=2
8.3
Corrigs des exercices du chapitre III

Pn
1. Daprs la conclusion 1.(b) de la proposition 3.1, page 30, E (f ) =
i=1 ai E (1lAi ).
Or
Pn daprs 1.(a) de cette mme proposition, E (1lAi ) = (Ai ) et donc E (f ) =
i=1 ai (1lAi ).
2. Daprs ce qui vient dtre vu, E (f ) = ([0,1/3]) + ([6,10] + 3({5}). Mais
([0,1/3]) = 0 ([0,1/3]) + 5 ([0,1/3]) + ([0,1/3]) = 4/3 .
| {z } | {z } | {z }
=1
=0
=1/30
De mme
([6,10]) = 0 ([6,10]) + 5 ([6,10]) + ([6,10]) = 4 et
| {z } | {z } | {z }
=0
=0
=106
({5}) = 0 ({5}) + 5 ({5}) + ({5}) = 1 .

| {z } | {z } | {z }
=0
=1
=0
Par suite E (f ) = 34 + 7.
1. On introduit lapplication I : M+ [0,] dfinie pour f M+ (E , A) par
I(f ) = E (f ) + E (f ). On montre aisment que I vrifie les conditions 1.(a), 1(b)
et 1.(c) de la proposition 3.1, page 30, cest--dire :
(a) Pour tout A A, I(1lA ) = ( + )(A).
(b) Pour tous f et g appartenant M+ (E , A) et tout rel 0.
I(f + g ) = I(f ) + I(g ) et I(f ) = I(f ).
(c) Pour toute suite croissante (fn )nN dlments de M+ (E , A),

lim I(fn ) = I
lim fn .
n+
n+
On conclut alors par lunicit de loprateur que I = E+ , cest--dire que pour tout
f M+ (E , A), I(f ) = E+ (f ) ou encore E (f ) + E (f ) = E+ (f ).
2. Daprs la question prcdente, E (f ) + E (f ) = E+ (f ) or
E (f ) = E (f ) daprs la proposition 3.1, page 30,
Z +
=
(x)f (x)dx daprs la proposition 3.2, page 31,
Z 1
=
e x e x dx = ,
0
et E (f ) = e f (1) daprs la proposition 3.4, page 32,

= e e 1 = 1 .
CT U
Besancon
156

Finalement E+ (f ) = + 1.
3. Un raisonnement analogue conduit :
Z
E (f ) =
e x e x dx = 2
E (f ) =
X
k
k=0
k!
f (k) =
X
k
k=0
k!
X
(e )k
k=0
k!
= exp(e ) .
Par suite E+ (f ) = 2 + exp(e ). De mme

Z
E+ (1lR ) = E (1lR ) + E (1lR ) =
dx +
X
k
k=0
k!
e e
+ e > 1
donc + nest pas une probabilit.

Lapplication borlienne f est intgrable suivant si, et seulement si, E (|f |) < +. Or
daprs la proposition 3.4, page 32,
E (|f |) =
X
i=0
i |f |(ai ) =
i |f (ai )|.
i=0
P
Ainsi f sera intgrable
par rapport =
i=0 i i si, et seulement si, la srie numrique
P
termes positifs i=0
Pi |f (ai )| est convergente ce qui est quivalent labsolue convergence de
la srie numrique
i=0 i f (ai ).
Corrig de lexercice 3.5, page
p36
Soit x = (x1 , ..., xd ) Rd , |x| = x12p
+ ... + xd2 . Lapplication f sera intgrable pour si, et
seulement si, E (|f |) < , c--d E ( f12 + ... + fd2 ) < . Or pour tout i = 1, ..., d on a
|fi | 6
f12 + ... + fd2 6 |f1 | + ... + |fd | .
Do par la croissance de loprateur E pour les fonctions positives (proposition 3.1, assertion
2, page 30),
d
X
E (|fi |) 6 E (|f |) 6
E (|fi |)
i=1
et par suite E (|f |) < + i = 1, ..., d ; E (|fi |) < +.

1. Cas o Rest la probabilit de Dirac sur R au point a.
(t) = R e itx d(a )(x) = e iat .
2. Cas o Rest la P
probabilit binomiale de paramtres
P n et p.
(t) = R e itx nk=0 Cnp p k (1p)nk dk (x) = nk=0 Cnp (pe it )k (1p)nk . Ce qui donne
avec la formule du binme de Newton : (t) = (1 p + pe it )n .
CT U
Besancon
157
3. Cas o est la probabilit de Poisson de paramtres > 0.

R
P
it k
it
(e )
(t) = R e itx +
dk (x) = e (e 1) .
k=0 e
k!
1. Mthode 1) : on applique le thorme de transfert (cas positif) la fonction h dfinie
par h(x) = e x . En notant = PX = N (0; 1) on a (daprs les rgles dintgration)
Z
Z
Z +
1
2
x
x 1
X
x 2 /2
e xx /2 dx .
e dPX (x) =
e e
E(e ) = E (h) =
d(x) =
2
2
R
R
Or x x 2 /2 = (x 1)2 /2 + 1/2 do
Z +
1
e
2
X
E(e ) =
e 2 (x1) dx = e .
2
Mthode 2) : On a vu au chapitre II, exercice 2.3, page 22, que la v.a.r. Y = e X est une
v.a.r. densit donne par

1
1
2
(x) := exp (ln x) 1l]0,+[ (x).
2
x 2
On a alors E(e X ) = E(Y ) = E (f ) o f (y ) = y et est la probabilit de densit .
Ainsi

Z +
Z
y
1
2
X
exp (ln y ) 1l]0,+[ (y )
y (y )d(y ) =
E(e ) =
2
y 2
R
Z +
Z
1
1
1
2
2
e u /2 e u du
=
e 2 (ln y ) dy =
2 0
2
R +
2
o on a effectu le changement de variables u = ln y . Do E(e X ) = 12 e uu /2 du
et on est ramen la mme intgrale que dans la premire mthode.
2. En effectuant le changement de variable u = x 2 et en faisant une intgration par parties
on crit
Z +
Z +
1
2
2
3 x 2 /2
3
|x| e
dx =
|x|3 e x /2 dx
E(|X | ) =
2
2 0
Z +
2
du
=
u ue u/2
2 u
2 0

Z +
1
1
u /2
= (2u)e
(2)e u/2 du ,
2
2
0
0 |
{z
}
{z
}
|
=0
=4/ 2
do E(|X |3 ) = 4/ 2 < donc X 3 est intgrable.

Calculons E(X 3 ) :
Z +
1
2
3
E(X ) =
x 3 e x /2 dx = 0
2
car la fonction x 7 x 3 e x
2 /2
est impaire sur R.
CT U
Besancon
158

On montre que E(X
Z ) = (2;2). On sait que si X = (X1 ,X2 ), E(X ) = (E(X1 ),E(X2 )). Or
h(x, y )dPX (x, y ) o on a pos h fonction de R+ R+ R+ dfinie
E(X1 ) = E(h(X )) =
par h(x, y ) = x. Do
R2
Z
h(x, y )d
E(X1 ) =
k ,l =1 2k+l (k ,l )
R2
X
X
1
k
(x, y ) =
h(k, l) =
.
k+l
k+l
| {z }
2
2
k=1 l=1
k=1 l=1
=k
Par suite
X
k
E(X1 ) =
2k
k=1
!
k
X
X
1
1
=
k
l
2
2
| l=1{z } k=1
=1
et comme en drivant terme terme une srie gomtrique on montre facilement que
X
1/2
x
pour
0
<
x
<
1,
on
dduit
que
E(X
)
=
= 2. On
x
kx k1 =
1
2
2
(x
1)
(1
1/2)
k=1
raisonne de mme pour montrer que E(X2 ) = 2.
On dtermine la loi de la v.a.r. Z = X1 + X2 . On applique le critre didentification des lois
par les fonctions borliennes positives. Soit h de R [0,] borlienne. En posant (x, y ) =
h(x + y ) (qui est borlienne positive car h lest), on a E(h(Z )) = E(h(X1 + X2 )) = E((Z )).
Par le thorme du transfert,
Z
E(h(Z )) =
=
Z
(x, y )dPX (x, y ) =
R2
XX
k=1 l=1
h(k + l) =
2k+l
h(x + y )d
R2
i=2 (k,l)/k+l=i
k ,l =1
1
2k+l

(k ,l ) (x, y )
1
h(i) .
2i
X
Or il existe i 1 couples (k, l) tels que k + l = i avec 1 6 k et 1 6 l donc
(k,l)/k+l=i
1
h(i) =
2i
(i 1) h(i)/2i . Do
Z
X
i 1
E(h(Z )) =
h(i) =
h(x)d(x)
i
2
R
i=2
X
X
i 1
i 1
avec =
i =
i car i 1 = 0 pour i = 1.
i
i
2
2
i=2
i=1

1. On a V ar (X ) = E((X E(x)2 ) = C ov (X , X ). En posant E(X ) = m :
V ar (X ) = E(X m)2 = E(X 2 2mX + m2 ) = E(X 2 ) 2mE(X ) + m2
E(X 2 ) 2m2 + m2 = E(X 2 ) m2 = E(X 2 ) (E(X ))2 .
CT U
Besancon
159
2. On pose mX = E(X ) et mY = E(Y ) et on a :

C ov (X , Y ) = E((X mX )(Y mY )) = E(X Y ) mX E(Y ) mY E(X ) + mX mY
= E(X Y ) E(X )mY mY E(X ) + mX mY = E(X Y ) mX mY
= E(X Y ) E(X )E(Y ) .

On
que est bien une densit de probabilit sur R. En particulier on a donc
R +peutxvrifier
2 /2
xe
dx = 1. On remarque que X est une v.a.r. positive (presque-srement) cest-0
dire P(X < 0) = 0 ou encore P(X = 0) = 1. On peut donc faire les calculs comme si X est
valeurs dans [0, + ].
Soit r un entier naturel strictement positif, par le thorme de transfert :
r
E(X ) =
x dPX (x) =
R
r +1 x 2 /2
Z
1lR+ (x)d(x) =
x r +1 e x
2 /2
dx .
Par des techniques dintgration par parties successives, on recherche une relation de rcurrence
sur lentier r > 2 :
Z
Z
x
0
r +1 x 2 /2
x r 1 e x
dx = r
2 /2
dx
r 2
cest--dire E(X r ) =
). Enpdistinguant les cas o r = 2k et r = 2k 1, et en
R r E(X
2
tenant compte que 0 e x /2 dx = /2, on trouve les relations demandes. En particulier
p
E(X ) = /2 et E(X 2 ) = 2 do V ar (X ) = 2 /2.

Pd
2
Supposons tout dabord que pour tout i, E(Xi2 ) < . Alors comme |X |2 =
i=1 Xi ,
P
E(|X |2 ) = di=1 E(Xi2 ) < .
Rciproquement, si E(|X |2 ) < alors E(Xi2 ) < car Xi2 6 |X |2 .
Notons X1 , ..., Xd les composantes de X dans la base canonique de Rd , M la matrice
[aij ]16i6c,16j6d . Le vecteur MX de Rc a pour composante ((MX )1 , ..., (MX )c ) o pour
P
i = 1, ..., c, (MX )i = dj=1 aij Xj .
Le vecteur Y = X E(X ) Rd a pour composante Yi = Xi E(Xi ) do E(Yi ) = 0. Ainsi
Y = Y E(Y ) = X E(X ) et par suite
DY = E ((Y E(Y ))(Y E(Y ))t ) = E ((X E(X ))(X E(X ))t ) = DX
do une premire assertion du point 2) de la
Pproposition 3.24, page 48.
Le vecteur E(MX ) a pour composantes dj=1 aij E(Xj ) pour i = 1, ..., c. Ce sont aussi les
composantes de M E(X ). Do lgalit E(MX ) = ME(X ).
Le terme (i, j de la matrice DX est E[(Xi E(Xi ))(Xj E(Xj ))] = C ov (Xi ,Xj ), ce qui prouve
aussi que DX est symtrique car C ov (Xi ,Xj ) = C ov (xj ,Xi ). Par ailleurs, les lments diagonaux
de DX sont C ov (Xi ,Xi ) = V ar (Xi ) pour i = 1, ..., d.
CT U
Besancon
160
Montrons que DMX = MDX M t . Soit i, j = 1, ..., c, le coefficient (i, j) de DMX est

C ov (MX )i ,(MX )j = E[(MX )i (MX )j ] E[(MX )i ]E[(MX )j ]
" d
#
" d
# " d
#
d
X
X
X
X
=E
aik Xk
ajl Xl E
aik Xk E
ajl Xl
=
k=1
d
d
XX
k=1 l=1
d X
d
X
l=1
k=1
aik ajl E(Xk Xl ) E(Xk )E(Xl )

{z
}
|
l=1
=C ov (Xk ,Xl )
aik C ov (Xk ,Xl )ajl
k=1 l=1
= coefficient (i, j) de la matrice MDX M t (matrice carre dordre c)

do lgalit cherche.
t
d
Montrons que dx est positive. Soit U = (u1 , ..., uP
d ) R (U est aussi une matrice colonne).
d
On a DU t X = U t DX (U t )t = U t DX U. Or U t X = j=1 uj Xj et DU t X reprsente la variance de
cette v.a.r. . Ainsi U t DX U > 0 pour tout vecteur U (ou matrice unicolonne).
Le reste des proprits de la matrice DX se dduisent de la thorie de la diagonalisation des
matrices symtriques, de type positif.
1. Les quivalences suivantes donnent :
2
|X | |Y | > 0 X 2 + Y 2 2|X Y | > 0 X 2 + Y 2 > 2|X Y | > |X Y | .
On en dduit que E(|X Y |) 6 E(X 2 ) + E(Y 2 ) < , ainsi la v.a.r. X Y est intgrable.
En choisissant Y = 1l (cest la variable alatoire constante gale 1), on a |X Y | =
|X | 6 X 2 + 1l do
E(|X |) 6 E(X 2 ) + E(1l ) = E(X 2 ) + 1 < .
On procde de mme pour Y .
2. Pour tout R,
0 6 E((X + Y )2 ) = 2 E(Y 2 ) + 2E(X Y ) + E(X 2 ) .
Nous avons un polynme en de degr deux qui est positif. Il ne peut donc pas avoir
de racines
et son discriminant est donc ngatif ou nul, cest--dire
2 relles 2distinctes
2
E(X Y ) E(Y )E(X ) 6 0 do le rsultat.
CT U
Besancon
161
1. Pour tout i = 1, ..., n, Xi est de carr intgrable car E(|X |2 ) < . On a

2
Y =
n
X
i=1
n
X
Xi X j
16i6=j6n
Xi2 +
i=1
E(Y 2 ) 6
Xi2 +
n
X
|Xi X j| ce qui entrane
16i6=j6n
E(Xi2 )
|i=1 {z
E(|Xi X j|)
16i6=j6n
< car Xi intgrables
do E(Y 2 ) < ce qui prouve que

2. On a :
Pn
k=1
{z
< daprs lexercice 3.13, page48
Xi est de carr intgrable.
!2
n
X
V ar (Y ) = E[(Y E(Y ))2 ] = E
(Xi E(Xi ))
i=1
n
X
i=1
E[(Xi E(Xi ))2 ] +

{z
}
|
=V ar (Xi )
X
16i6=j6n
E[(Xi E(Xi ))(Xj E(Xj ))] ,

|
{z
}
=C ov (Xi ,Xj )
do le rsultat en remarquant que

X
X
E[(Xi E(Xi ))(Xj E(Xj ))] = 2
E[(Xi E(Xi ))(Xj E(Xj ))]
16i<j6n
16i6=j6n
car C ov (Xi , Xj ) = C ov (Xj , Xi ).

1. Pour vrifier la relation, on tudie la valeur de chacun des deux membres de lgalit pour
tel que |X ()| > a, puis pour tel que |X ()| a. On constate alors que les deux
membres concident dans chaque cas.
2. Remarquons que X et X ont la mme loi. En effet ltude des fonctions caractristiques
1 2
donne X (t) = E[e itX ] = X (t) = e 2 t = X (t). Soient h une application
borlienne positive de R dans R, a un rel strictement positif, de la relation,
h(Xa ) = h(X )1l[0,a] (|X |) + h(X )1l]a,+[ (|X |)
on obtient, en passant lesprance,
E[h(Xa )] = E[h(X )1l[0,a] (|X |)] + E[h(X )1l]a,+[ (|X |)].
En remarquant que X et X ont la mme loi et en utilisant le thorme du transfert, il
vient
E[h(X )1l]a,+[ (|X |)] = E[h(X )1l]a,+[ (|X |)].
Ce qui, en reportant dans le deuxime membre de lgalit prcdente, donne E[h(Xa )] =
E[h(X )], pour toute application borlienne positive de R dans R. Ce qui prouve que Xa
suit la mme loi que X cest--dire N 1 (0, 1).
CT U
Besancon
162

R +
1. Le rel a est dtermine par la contrainte f (x)dx = 1 qui sexprime ici par
Z 1
Z 0
a
(x + 1 a)dx = 0
dx +
e x
1
et un rapide calculRdonne a = 1/4. La fonction de rpartition de X est dfinie pour
x
x R par F (x) = f (t)dt. On a :
Si x 6 e, F (x) = 0.
Rx
Rx
Si e < x < 1, F (x) = e f (t)dt = e 1/(4t)dt = (1/4) ln(x) + 1/4.
R 1
Rx
Si 1 6 x < 0, F (x) = e 1/(4t)dt + 1 (t + 5/4)dt = x 2 /2 + 5x/4 + 1.
R0
Rx
Si x > 0, F (x) = f (t)dt = e f (t)dt = 1.
Do F est dfinie par
0
si x 6 e ;
(1/4) ln(x) + 1/4, si e < x 6 1 ;

F (x) =
x 2 /2 + 5x/4 + 1,
si 1 < x 6 0 ;
1,
si x > 0.
2. Pour calculer E(X ) on crit que
Z +
Z
E(X ) =
xf (x)dx =
x
dx +
4x
(x 2 + 5x/4)dx = (6e + 1)/24 .

1. crivons la fonction de rpartition de Y = X 3 . Soit y R,
3
FY (y ) = P(Y 6 y ) = P(X 6 y ) = P(X 6 y

Z y
1
1
2/3
e z /2 z 2/3 dz ,
=
3
| 2
{z
}
1/3
y 1/3
)=
1
2
e t /2 dt
2
:=f (z)
Ry
o on a effectu le changement de variables t = z 1/3 . Par suite FY (y ) = f (z)dz et
X 3 est une v.a.r. de densit f donne ci-dessus.
2. La fonction de rpartition de la loi normale centre rduite est une application continue,
strictement croissante donc bijective de R sur ]0,1[. Ainsi F 1 existe bien et on peut
crire pour tout y ]0,1[
P(Y 6 y ) = P(F (X ) 6 y ) = P(X 6 F 1 (y )) = F (F 1 (y )) = y .
Comme F prend ses valeurs dans lintervalle ]0,1[, lensemble {F (X ) 6 y } = ds que
y 6 0 et donc FY (y ) = P(F (X ) 6 y ) = 0 quand y 6 0.
Pour la mme raison, {F (X ) 6 y } = ds que y > 1 et dans ce cas FY (y ) = P() = 1.
En conclusion on a
0, si y 6 0 ;
y , si 0 < y < 1 ;
FY (y ) =
1, si y > 1.
donc Y est une v.a.r. uniforme sur [0,1].
CT U
Besancon
163

R +
R
1. Lapplication f est bien positive, continue sur R et on a f (t)dt = 0 e u du = 1.
2. La v.a.r. Y = |X | ne prend que des valeurs positives. On procde comme dans lexercice
3.17, page 59,. Soit y R+ ,
Z y
FY (y ) = P(Y 6 y ) = P(|X | 6 y ) = P(y 6 X 6 y ) =
f (t)dt
y
Z y
e t dt = 1 e y .
=
0
Si maintenant y < 0, {T 6 y } = {|X | 6 y } = et donc FY (y ) = P() = 0.

Finalement, FY (y ) = (1 e y )1lR+ (y ) et donc Y est une v.a.r. exponentielle de
paramtre > 0.
Daprs le formulaire de lannexe A, page 205, on sait que E(Y ) = 1/ et V ar (Y ) =
1/2 . Par la formule de Knig (proposition 3.22, page 46), E(Y 2 ) = V ar (Y )+(E(Y ))2 =
2/2 . Or Y 2 = X 2 et donc E(X 2 ) = 2/2 . On vrifie que E(X ) = 0 et on conclut que
V ar (X ) = E(X 2 ) = 2/2 .
Remarquons que si est tel que X () = 1, alors Y () nest pas dfinie. Mais comme
P({X = 1}) = 0, la probabilit que Y soit dfinie est 1. On remarque que Y prend ses valeurs
dans R+ . Soit y > 0, FY (y ) = P(Y 6 y ) = P(X 6 1e y ) = 1e y car 0 6 1e y 6 1
et x suit une loi uniforme sur [0,1]. Comme pour y 6 0, P(Y 6 y ) = 0 on reconnat que Y
suit la loi exponentielle de paramtre > 0.
X m
alors Y suit la loi normale N 1 (0, 1), daprs le thorme
Si on considre la v.a. Y :=
de standardisation. Do, pour tout rel u, X (u) = E[e iu(Y +m) ] = e ium (u) avec
Z
Z
x2
1
iY t
ixt
(t) = E(e ) =
e dPY (x) =
e 2 e ixt d(x).
2 R
R
Pour calculer cette intgrale, on va montrer que vrifie une quation diffrentielle.
Z
x2
1
(t) =
e 2 (cos(tx) + i sin(tx))d(x)
2 ZR
x2
1
=
e 2 cos(tx)d(x).
2 R

x2
x2

Comme xe 2 cos(tx) |x|e 2 et que cette dernire fonction est intgrable sur R pour la
R
mesure de Lebesgue, par le thorme de drivation sous le signe de la thorie de Lebesgue,
on en dduit que est drivable et que
Z
x2
1
0
(t) =
xe 2 sin(tx)d(x)
2 R
Z
i+
x2
1
1 h x2
2
e
te 2 cos(tx)d(x)
=
sin(tx)
2
2 R
= t(t).
CT U
Besancon
164

Z
x2
e 2 sin(tx)d(x) = 0 comme intgrale par rapport la mesure de Lebesgue, sur
Car
R
un intervalle centr en 0 dune fonction impaire. Comme est une f.c., elle prend ncessairement la valeur 1 au point 0. Donc est la solution particulire de lquation diffrentielle y 0 + ty = 0 telle que y (0) = 1. La solution particulire de cette quation diffrentielle
t2
qui prend la valeur 1 en 0 est (t) = e 2 . Par suite,

en revenant
au dbut du corrig
2 2
2
2
u
u
X (u) = E[e iu(Y +m) ] = e ium (u) = e ium e 2 = exp ium
.
2
1. Soit A un vnement. On a P(X A) = E(1lA (X )) et P(Y A) = E(1lA (Y )).
Comme X = Y presque-srement, on a 1lA (X ) = 1lA (Y ) presque-srement. Par suite
P(X A) = P(Y A), c--d PX = PY .
La rciproque est fausse. Pour montrer cela donnons deux contre-exemples, un dans le
cas discret, un dans le cas non discret.
Pour le cas discret, considrons le jeu de Pile-ou-Face modlis de la faon suivante :
:= {P, F }, F := P({P, F }), P est dfinie sur F partir de P({F }) = P({P}) = 21 ,
considrons les v.a.r. X := 1lA et Y := 1lAc . On vrifie aisment que ces deux v.a.r. ont
pour loi 12 (0 + 1 ) (il sagit dune loi de Bernoulli), cependant ces v.a.r. ne sont pas
presque-srement gales.
Pour le cas non discret, considrons une v.a.r. X de loi N 1 (0, 1) et posons Y := X .
On a alors, en utilisant le thorme du transfert,
Z
Z
P(Y A) = E(1lA (X )) =
1lA (X )dP =
1lA (x)dPX (x)
R
Z +
Z +
x2
1
t2
1
1lA (t) exp( )dt
=
1lA (x) exp( )dx =
2
2
2
2
= P(X A).
X et Y ont donc la mme loi, bien quelles ne soient pas presque-srement-gales car
P(X = Y ) = P(X = X ) = P(X = 0) = 0.
2. Soit h une application positive borlienne de R dans R.
Z
Z
E[h(g (X ))] =
h(g (X ))dP =
h(g (x))dPX (x)
R Z
Z
=
h(g (x))dPY (x) =
h(g (Y ))dP = E[h(g (Y ))],
R
do le rsultat cherch. On peut aussi remarquer que h g est une application positive
borlienne de R dans R. On applique alors lquivalence PX = PY si, et seulement si,
pour toute application k positive borlienne de R dans R, E(k(X )) = E(k(Y )) avec
k = h g.
Montrons par un contre-exemple quon peut avoir PX = PY et PX Z 6= PY Z . Considrons
le jeu de Pile-ou-Face prcdent et avec les notations prcdentes posons Z = X . On a
alors X Z = X 2 = X et Y Z = Y X = 0. Par suite PX = PX Z 6= PY Z = 0 bien que
PX = PY .
CT U
Besancon
165

itX
Dune faon gnrale, par le thorme du transfert, on a X (t) = E[e ] =

e itx dPX (x).
R
Z
+
+
it
X
X
pe
1. X (t) =
e itx
pq k1 dk (x) =
pq k1 e itk =
.
1 qe it
R
k=1
k=1
Z
1 e ita e itb
1
e itx 1l[a,b] (x)d(x) =
.
2. Y (t) =
ba R
ba
it
+

Z
itx
x
(1)
(it)x
=
3. Z (t) =
e e
1l[0,+[ (x)d (x) =
e
.
it
it
R
0
Montrons que, pour tout t R, F (t) {0, 1}. En effet, par densit de D dans R si t R, il
existe une suite dcroissante (tn )N de rels de D convergeant vers t. Par continuit droite de
la fonction de rpartition F , la suite (F (tn ))N converge vers F (t). Comme pour tout n N
F (tn ) {0, 1}, par passage la limite F (t) {0, 1}.
Considrons a := inf{t R/F (t) = 1}. On ne peut pas avoir a = + sinon, pour tout
t R, F (t) = 0, ce qui contredirait le fait que lim F (t) = 1. De mme on ne peut pas
t+
avoir a = sinon, pour tout t R, F (t) = 1, ce qui contredirait le fait que lim F (t) = 0.
t
a est donc un rel et la continuit droite de F implique que F (a) = 1. Enfin la proprit
de croissance des fonctions de rpartition implique que F = 1l[a,+[ , cest--dire que est la
mesure de Dirac au point a.
Ce rsultat sapplique en particulier lensemble D des points o la fonction de rpartition est
continue, puisque son complmentaire dans R est un ensemble dnombrable.
8.4
Corrigs des exercices du chapitre IV

2
2
2
1. En posant f (x, y ) = 1l]0,[ (x)1l]0,[ (y )e x e y = h(x) g (y ) avec h(x) = 1l]0,[ (x)e x
2
et g (y ) = 1l]0,[ (y )e y , et en utilisant lexemple 4.3, page 64, on a
Z

Z
Z
(2)
g (y )
h(x)d(x) d(y )
f (x, y )d (x, y ) =
=
4
R
R2
R
Z
Z

=
g (y )d(y )
h(x)d(x)
R
R
Z
Z

y 2
x 2
=
e dy
e dx .
0
2
Comme les deux intgrales ci-dessus sont gales, on obtient 0 e x dx = /2. Lautre
galit est immdiate aprs un changement de variable.
2. Daprs la remarque de lnonc,
Z
Z
2
2
(x 2 +2xy +2y 2 )
(2)
e
d (x, y ) =
e (x+y ) +y d(2) (x, y )
R2
R2
Effectuons le changement de variables T de classe C 1 dfini par T : (x, y ) R2

T (x, y ) = (u, v ) R2 avec u = x + y et v = y . Le jacobien de T 1 au point (u, v )
CT U
Besancon
166

vaut 1. Le thorme de changement de variable donne :
Z
Z
2
2
(x+y )2 +y 2
(2)
e
d (x, y ) =
e (u +v ) d(2) (u, v )
R2
R2
Z
Z

u 2
v 2
=
e d(u)
e d(v )
R
Z
R
+
x 2
2
dx
Z
= 2
x 2
2
dx
2
=4
= ,
2
o lon a utilis le thorme de Tonelli et le rsultat de la premire question.

Vrifions que est une probabilit sur B(Rd ) que lon notera B dans cette correction.
Lapplication 1lA est borlienne et positive pour tout A B donc (A) [0,].
R
La fonction 1l est la fonction-nulle sur Rd donc () = Rd 1l d(d) = 0.
R
R
Par dfinition de la densit , (Rd ) = Rd 1lRd d(d) = Rd d(d) = 1.
Il reste montrer la -additivit. Soit (Ak )kN une
Psuite dlments de B deux deux
disjoints. Alors si on note A = k=1 Ak , 1lA = k=0 1lAk car les Ak sont deux deux
disjoints. On a alors en utilisant le thorme de Beppo-Levi
Z
Z
X
X
X
(d)
(d)
d =
1lAk d(d) =
(Ak ) ,
1lA d =
(A) =
Rd
Rd
k=0
k=0
Rd
k=0
ce qui donne la -additivit.

est donc bien une mesure de probabilit.
Considrons un d quilibr 6 faces. On lance le d deux fois de suite. Soit X le rsultat
obtenu au premier lancer et Y celui obtenu au second.
Les v.a.r. X et Y ont la mme loi. En effet elles sont valeurs dans {1, 2, 3, 4, 5, 6} et
pour k = 1, ..., 6, P(X = k) = P(Y = k) = 1/6, cest--dire que PX = PY .
En revanche, X 6= Y car lgalit signifierait que, chaque double lancer, le rsultat du
second lancer est toujours le mme que celui du premier lancer ce qui est faux.
Soit (X , Y , Z ) un vecteur alatoire de densit sur R3 . Cherchons la loi de Y (ce serait la
mme chose pour X et Z ). Soit A un borlien de R, {Y A} = {(X , Y , Z ) R A R}
do

PY (A) = P(Y A) = P (X , Y , Z ) R A R = P(X ,Y ,Z ) (R A R)
Z
=
1lR (x)1lA (y )1lR (z)dP(X ,Y ,Z ) (x, y , z)
R3
et par application des rgles dintgration des mesures densit (proposition 3.8, page 35,) et
du thorme de Tonelli, on obtient comme dans lexemple 4.4, page 65, que
Z

Z
Z
(2)
PY (A) =
1lA (y )
1lR (x)1lR (z)(x, y , z)d (x, z) d(x) =
1lA (y )(y )d(y )
R
R2
R
|
{z
}
:=(y )
CT U
Besancon
167
ce qui prouve que la v.a.r. Y admet pour densit la fonction dfinie ci-dessus.
Tout dabord, comme lvnement {(X , X ) } est certain, on a P((X , X ) ) = 1.
Supposons que soit une densit pour le vecteur (X , X ). Un autre calcul donnerait alors :
Z
P((X , X ) ) = P(X ,X ) () =
1l (x, y )(x, y )d(2) (x, y )
R2
Z
=
1l (x, y )(x, x)d(2) (x, y )
2
Z

ZR
=
(x, x)
1l (x, y )d(y ) d(x) .
R
R
R
Or R 1l (x, y )d(y ) = R 1l{x} (y )d(y ) = ({x}) = 0 pour tout x R. Par suite
P((X , X ) ) = 0 ce qui contredit le premier calcul et fournit ainsi un contre-exemple
pour la rciproque de la proposition 4.5, page 66.
1. Soit h une application borlienne positive de R2 dans R+ . En utilisant successivement le
thorme du transfert, lindpendance de U et V , les rgles dintgration par rapport
des mesures densit, on obtient :

E(h(X , Y )) = E h 2 ln U cos(2V ), 2 ln U sin(2V )
Z

=
h 2 ln u cos(2v ), 2 ln u sin(2v ) dP(U,V ) (u, v )
2
ZR

h 2 ln u cos(2v ), 2 ln u sin(2v ) dPU dPV (u, v )
=
2
ZR

=
h 2 ln u cos(2v ), 2 ln u sin(2v ) 1l]0,1[ (u)1l]0,1[ (v )d(2) (u, v ) .
R2
Effectuons le changement de variable T : ]0,1[2 R2 dfini pour (u, v ) R2 par

x = 2 ln u cos(2v )
y = 2 ln u sin(2v )
u = exp((x 2 + y 2 )/2)
1
v = 2
arctan(y /x)
Le jacobien de T 1 est
x
JT 1 = det
2 +y 2
xe 2
y
1
2
x 2 +y 2
ye
2 +y 2
2
1
x
2 x 2 +y 2
!
=
1 x 2 +y 2
e 2 .
2
On obtient par le thorme de changement de variable :

Z

x 2 +y 2
1
E h(X , Y ) =
h(x, y ) e 2 d(2) (x, y ) ,
2
R2
et donc la v.a. (X , Y ) admet bien la densit annonce.
CT U
Besancon
168

2. Pour trouver la loi de la v.a.r. X (idem pour Y ), on applique la proposition 4.5, page 66,
qui nous permet daffirmer que X est une v.a.r. de densit X dfinie par
Z
Z
1 x 2 /2 y 2 /2
X (x) =
(x, y )d(y ) =
e
e
dy
R
R 2
Z
1 x 2 /2
1
2
2
=
e
e y /2 dy = e x /2 ,
2
2
| R {z
}
= 2
donc X est une v.a.r. normale centre rduite (idem pour Y ).

3. Pour tout A, B borliens de R
Z
x 2 +y 2
1
P(X ,Y ) (A B) =
1lA (x)1lB (y ) e 2 d(2) (x, y )
2
2
Z

RZ
1 y 2 /2
1 x 2 /2
d(x)
1lB (y ) e
d(y )
=
1lA (x) e
2
2
R
R
= PX (A) PY (B)
et ceci pour tout borliens A et B ce qui prouve que P(X ,Y ) = PX PY et donc (X , Y )
est un couple indpendant.
tudions la fonction de rpartition de la v.a.r. Y . Pour tout y R, FY (y ) = P(Y 6 y ). On
peut exprimer lvnement {Y 6 y } en fonction des v.a.r. et X :
{Y 6 y } = [{ = 1} {X 6 t}] [{ = 1} {X > y }]
Comme (, X ) indpendants, les vnements { = 1} et {X 6 y } sont indpendants (il en est
de mme pour { = 1} et {X > 1}). Les vnements entre crochets tant disjoints, on
obtient :
FY (y ) = P( = 1) P(X 6 y ) + P( = 1) P(X > y )
Z
Z
Z y
1 x 2 /2
1 + 1 x 2 /2
1
1 y
2
e
e
e x /2 dx
dx +
dx =
=
2 2
2 y
2
2
et donc Y est une v.a.r. de loi N (0; 1).

Pour montrer que X et Y sont non-corrls, il suffit de calculer
E[(X E[X ])(Y E[Y ])] = E[X 2 ] = E[]E[X 2 ] = 0
du fait que (X , ) est indpendant et que est centre. Si (X , Y ) tait indpendant, alors
(X 2 , Y 2 ) le serait aussi et on aurait
E[X 2 Y 2 ] = E[X 2 ]E[Y 2 ].
Cependant, du fait que Y 2 = X 2 ,
E[X 2 Y 2 ] = E[X 2 ]E[Y 2 ] = (E[X 2 ])2 = 1.
CT U
Besancon
169
Mais, par ailleurs,

1
E[X Y ] = E[X ] =
2
2
1 2
x 4 e 2 x d(1) (x) = 3 ,
o la dernire intgrale est calcule par une intgration par parties ; ce qui montre une contradiction. Le couple de v.a.r. (X , Y ) nest donc pas indpendant.
Daprs les formules de Knig-Huygens (Proposition 3.22, page 46), V ar (X ) = E(X 2 )
(E(X ))2 . Do E(X 2 ) = V ar (X ) + (E(X ))2 = 2 + m2 (idem pour Y ). Par indpendance de
(X , Y ), E(X Y ) = E(X )E(Y ) et donc on a
E((X + Y )2 ) = E(X 2 + 2X Y + Y 2 ) = E(X 2 ) + 2E(X Y ) + E(Y 2 )
== E(X 2 ) + 2E(X )E(Y ) + E(Y 2 ) = 4m2 + 2 2 .

On reprend les notations de lexercice 4.6, page 74. On a
V ar (X + Y ) = V ar (X ) + 2 C ov (X , Y ) +V ar (Y )
| {z }
=0
= V ar (X ) + V ar (Y )
bien que (X , Y ) ne soit pas indpendant.
On a X +Y (t) = 2X (t) = E[e 2itX ] = e 2|t| = (e |t| )2 = (X (t))2 = X (t) Y (t).
Pour montrer que (X , Y ) est non indpendant, on prend (comme le recommande
lnonc) A = [1 , 1] et on calcule
Z
PX (A) =
1
1 1
1 1
1
1
dx = [arctan(x)]1 =
+
= .
1 + x2
4
4
2
On a alors P(X ,Y ) (AAc ) = P((X , X ) AAc ) = 0 et P(A)P(Ac ) = P(A)(1P(A)) =

1/4 6= 0. Donc X et Y ne sont pas indpendants.
Si Xk est une v.a.r. de Bernoulli de paramtre p ]0,1[, sa fonction caractristique est
Xk (t) = pe it + (1 p). Par indpendance de X1 , ..., Xn on a

n
Sn (t) = X1 (t) ... Xn (t) = pe it + (1 p)
et on reconnat la fonction caractristique dune loi B(n; p). Donc Sn est une v.a.r. B(n; p).
CT U
Besancon
170

1. Pour tout , X(1) () = max(X1 (), ..., Xn ()) car cest le premier nombre dans la
suite X1 (), ..., Xn () rordonns de faon croissante. Soit x R, FX(1) (x) = P(X(1) 6 x)
or {max(X1 , ..., Xn ) 6 x} = nk=1 {Xk 6 x} et par indpendance de X1 , ..., Xn on dduit
que
n
Y
n
n
Fx(1) (x) = P (k=1 {Xk 6 x}) =
P(Xk 6 x) = F (x)
k=1
o F est la fonction de rpartition des v.a.r. Xi , cest dire que F (x) = (1

e x )1l]0,[ (x). Do FX(1) (x) = (1 e x )n 1l]0,[ (x).
2. On vrifie de mme que X(n) = min(X1 , ..., Xn ). Soit x R, {X(n) 6 x} = {X(n) >
x}c = nk=1 {Xk > x}. Par suite
FX(n) (x) = 1 P(X(n) > x) = 1
P (nk=1 {Xk
> x}) = 1
n
Y
P(Xk > x)
k=1
=1
n
Y
(1 P(Xk 6 x)) = 1
k=1
nx
= (1 e
n
Y
[1 F (x)] = 1 [1 F (x)]n
k=1
)1l]0,[ (x) .
3. (a) La v.a.r. Yk ne prend que deux valeurs, 0 et 1. Cest donc une v.a.r. de Bernoulli
de paramtre
p = P(Yk = 1) = P(Xk > t) = 1 P(Xk 6 t) = 1 F (t) = 1 (1 e t )
do p = e t et donc PYk = e t 1 + (1 e t )0 , pour k = 1, ..., n. Par suite
Y1 + ... + Yn est une somme de v.a.r. de Bernoulli de mme paramtre p. Ces v.a.r.
sont indpendantes car elles sont de la formes f1 (X1 ), ..., fn (Xn ) avec fk = 1l]t,[ (on
utilise la proposition 4.15, page 76). La v.a.r. Y1 + ... + Yn est donc une v.a.r. de
loi B(n; p).
(b) On remarque que Yk = 1 signifie que Xk est strictement suprieur t. Ainsi
Y1 + ... + Yk est gal au nombre de v.a.r. Xi qui sont strictement suprieure
t. Ceci entrane que {Y1 + ... + Yn 6 k 1} = {X(k) 6 t}.
4. Soit t R, daprs ce qui prcde on a :
FX(k) (t) = P(X(k) 6 t) = P(Y1 + ... + Yn 6 k 1) =
k1
X
Cnj p j (1 p)nj
j=0
k1
X
Cnj e jt (1 e t )nj .
j=0

On fait la preuve du deuxime point (lautre preuve est identique, quelques amnagements
vidents prs, celle utilise dans la dmonstration de la proposition 4.34, page 87). On a
X (t) = exp[(e it 1)] et Y (t) = [(e it 1)]. Comme (X , Y ) indpendant, la fonction
caractristique de X + Y est donne pour tout t R par
X +Y (t) = X (t) Y (t) = exp[( + )(e it 1)]
CT U
Besancon
171
et ainsi X +Y est la fonction caractristique dune loi de Poisson de paramtre + .

Pour donn, le polynme x 2 2A()x + B() admet :
1. deux racines relles distinctes si, et seulement si, A2 () B() > 0.
En utilisant le thorme de transfert, lindpendance du couple de v.a.r. (A, B), le
thorme de Tonelli, ainsi que le passage de lintgrale de Lebesgue celle de Riemann,
il vient
P(A2 B > 0) = E[1l]0,+[ (A2 B)]
Z
=
1l]0,+[ (x 2 y )dP(A,B) (x, y )
R2

Z Z
2
=
1l]0,+[ (x y )1l[0,1] (x)1l[0,1] (y )d(y ) d(x)
R
R
Z

Z
2
=
1l[0,1] (x)
1l]0,+[ (x y )1l[0,1] (y )d(y ) d(x)
R
R
Z 1 Z x2 !
Z 1
1
=
dy dx =
x 2 dx = .
3
0
0
0
2. deux racines complexes et non relles distinctes si, et seulement si, A2 () B() < 0.
En menant le calcul de faon analogue au cas prcdent, il vient
P(A2 B < 0) = E[1l],0[ (A2 B)]
Z
1l],0[ (x 2 y )dP(A,B) (x, y )
=
2

ZR Z
2
=
1l],0[ (x y )1l[0,1] (x)1l[0,1] (y )d(y ) d(x)
R
R

Z
Z
2
1l],0[ (x y )1l[0,1] (y )d(y ) d(x)
=
1l[0,1] (x)
R
R
Z 1 Z 1
Z 1
2
=
dy dx =
(1 x 2 )dx = .
3
0
x2
0
3. une racine double si, et seulement si, A2 () B() = 0.
En remarquant que {A2 B = 0}c = {A2 B > 0} {A2 B < 0}, il vient
P(A2 B = 0) = 1 P(A2 B < 0) P(A2 B > 0) = 0.
4. Dterminons la loi de la v.a.r. := A2 B. Soit h une application borlienne positive
de R dans R.
Z
Z
2
(2)
E[h()] =
h(x y )d (x, y ) =
h(x 2 y )d(2) (x, y ).
[0,1]2
]0,1[2
Par le changement de variable de classe C 1 y = t 2 z et x = t louvert ]0, 1[2 a pour

image rciproque louvert
U :=
{(t, z) R2 / z [0, 1[, t ] z, 1[}
S
{(t, z) R2 / z ] 1, 0[, t ]0, 1 + z[}.
CT U
Besancon
172

Par le thorme de changement de variable (cf. 4.4, page 64) puisque la valeur absolue
du jacobien est gale 1, il vient
Z
Z
2
(2)
h(x y )d (x, y ) =
h(z)d(2) (t, z).
]0,1[2
Par suite, en utilisant le thorme de Tonelli, et en remarquant que 1lU (t, z) =

1l[0,1[ (z)1l]z,1[ (t) + 1l]1,0[ (z)1l]0,1+z[ (t),
E[h()
=

Z
Z
Z
=
h(z) 1l]0,1[ (z) 1l] z,1[ (t)d(t) + 1l]1,0[ (z) 1l]0, 1+z[ (t)d(t) d(z)
R
ZR

R
=
h(z) 1l]0,1[ (z)(1 z) + 1l]1,0[ (z) 1 + z d(z).
R
La loi de est la mesure de probabilit sur R admettant la fonction
1l]0,1[ (z)(1 z) + 1l]1,0[ (z) 1 + z

pour densit par rapport la mesure de Lebesgue. On retrouve les rsultats des questions
prcdentes en calculant
Z
1l{>0} ()dP()
P( > 0) =
=
1l]0,+[ (z)(1l]0,1[ (z)(1 z) + 1l]1,0[ (z) 1 + z)d(z)
R
Z 1
2
1
=
1 zdz = 1 = ,
3
3
0
Z
1l{<0} ()dP()
P( < 0) =
=
1l],0[ (z)(1l]0,1[ (z)(1 z) + 1l]1,0[ (z) 1 + z)d(z)
R

0
Z 0
2
2
3/2
=
1 + zdz = (1 + z)
= ,
3
3
1
1
P( = 0) = 1 P( > 0) P( < 0) = 0.

1. La fonction f tant borlienne positive, on peut lui appliquer le thorme de Tonelli et
en se ramenant des intgrales de Riemann on obtient
Z
2
P(X ,Y ) (R ) =
f (x, y )d(2) (x, y )
2
R
Z 1
Z +
2
=
(1 x )dx
ye 3y dy
0
0

x 3 1 1 3y +
1 3y +
2
= [x ]0 [ ye ]0 + [ e ]0
= .
3
3
9
27
CT U
Besancon
173
Comme P(X ,Y ) est une mesure de probabilit sur R2 , on a P(X ,Y ) (R2 ) = 1 do on dduit
= 27
.
2
2. En utilisant le rsultat de lexercice I-9, on sait que X et Y admettent des densits fX et
fY dtermines par :
Z
3
1
fX (x) :=
f (x, y )d(y ) = (1 x 2 )1l[0,1] (x) = (1 x 2 )1l[0,1] (x)
9
2
ZR
f (x, y )d(x) = 9ye 3y 1l[0,+[ (y ).
fY (y ) :=
R
3. La relation ensembliste {0 < X 2} {Y 1} = {(X , Y ) ]0, 2] [1, +[} permet

dcrire
P(0 < X 2, Y 1) = P((X , Y ) ]0, 2] [1, +[)
= P(X ,Y ) (]0, 2] [1, +[)
Z
=
f (x, y )d(2) (x, y )
]0,2][1,+[

x 3 1 1 3y +
1 3y +
= [x ]0 [ ye ]1 + [ e ]1
3
3
9
1
1
= 9( e 3 + e 3 ) = 4e 3 .
3
9
4. Il sagit de calculer Var(X ), Var(Y ) et Cov(X , Y ).
Z
Z 1
3
3
E[X ] =
xfX (x)d(x) =
(x x 3 )dx =
8
R
0 2
Z
Z 1
1
3 2
(x x 4 )dx =
E[X 2 ] =
x 2 fX (x)d(x) =
2
5
ZR
Z 0+
2
E[Y ] =
y fY (y )d(y ) =
9y 2 e 3y dy =
3
ZR
Z0 +
2
E[Y 2 ] =
y 2 fY (y )d(y ) =
9y 3 e 3y dy = .
3
R
0
Par suite
19
320
2
Var(Y ) = E[Y 2 ] (E[Y ])2 =
9
Cov(X , Y ) = E[X Y ] E[X ]E[Y ] = 0
Var(X ) = E[X 2 ] (E[X ])2 =
o la dernire galit est une consquence directe du thorme de Fubini en remarquant

que xy f (x, y ) = (xfX (x))(y fY (y )) et par suite que E[X Y ] = E[X ]E[Y ]. La matrice de
dispersion est alors donne par :
11
0
64
.
D=
2
0 9
CT U
Besancon
174

Sans restreindre la gnralit, on peut supposer que n 6 m. On a
{X = Y } = nk=0 [{X = k} {Y = k}]
et la runion est forme de sous-ensemble de deux deux disjoints. On a alors
P(X = Y ) =
n
X
P {X = k} {Y = k}
k=0
n
X
P(X = k) P(Y = k)
par indpendance de X et Y
k=0
n
X
m
n
1
1
k
Cm
=
2
2
k=0
!
n+m X
n
n+m
1
1
k k
=
Cn Cm =
2
2
k=0
Cnk
n
X
!
Cnk Cmmk
k=0
et en utilisant lindication de lnonc, on obtient P(X = Y ) =
1
Cm .
2n+m n+m

1. Cette relation est obtenue par (r 1) drivations successives partir de la somme de la
X
1
xk =
.
srie entire
1x
kN
2. r est une v.a.r. valeurs dans N {+}. En effet, a priori il se peut trs bien quon
ait un tel que {n N /X1 () + X2 () + ... + Xn () = r } soit vide, dans ce cas par
convention, r () := +.
On sait alors que la loi de r sera de la forme
P r =
P{r = k}k + P(r = +)+
k0
Fixons un entier k N et considrons lvnement {r = k}.

Si k < r , {r = k} = , et si k r , on peut crire,
k1
X
{r = k} = {
Xi = r 1} {Xk = 1}.
i=1
De plus en vertu de lindpendance de la suite de v.a.r. (Xi )N ,

k1
X
P{r = k} = P({
Xi = r 1} {Xk = 1})
i=1
k1
X
= P({
Xi = r 1})P({Xk = 1}).
i=1
CT U
Besancon

175
P
La variable alatoire relle k1
i=1 Xi est la somme de (k 1) v.a. de Bernoulli indpendantes et de paramtre p, elle suit donc la loi binomiale B(k 1, p). On trouve alors, en
posant pour simplifier les critures q := 1 p :
r 1 r 1 (k1)(r 1)
r 1 r kr
P{r = k} = Ck1
p q
p = Ck1
pq
Remarquons que
+
X
P{r = k} =
k=0
r 1 r kr
Ck1
pq
=
kr
1
pr = 1
(1 q)r
o la dernire galit a t obtenue par application de la relation de la premire question.

Ce qui donne la loi cherche pour la variable alatoire relle r car P(r = +) = 0. Il
suffit de remarquer pour cela que P(r = +) = 1 P{r N}, et
P{r N} =
+
X
P{r = k} = 1.
k=0
Il vient alors que P{r = +} = 0. On dit que r est presque-srement finie.

3. Remarquons dabord que r = r r 0. Cela prouve que r est une v.a. valeurs
N {+}, quelle est presque-srement finie et que sa loi est donne par
X
P{r = k}k
Pr =
k0
o
r 1
r k
P{r = k} = P{r = k + r } = Ck+r
1 p q ,
ce qui donne le rsultat cherch.

4. Interprtons ce qui prcde de la faon suivante : Appelons jeu de Pile-ou-Face
lexprience alatoire qui consiste lancer, une infinit de fois, la mme pice de monnaie
truque. On note p la probabilit davoir "Face" (ou "succs") et q = 1 p la probabilit
davoir "Pile" (ou "chec").
La suite des v.a.r. (Xk )N reprsente les valeurs successives obtenues dans un jeu de
Pile-ou-Face, en notant Xk = 1 quand on a obtenu "Face" lors du k i e`me -lancer et par
consquent Xk = 0 quand on a obtenu "Pile" lors du k i e`me -lancer.
La v.a.r. X1 + X2 + ... + Xn reprsente alors le nombre de "succs" en n lancers dans ce
jeu.
La v.a.r. r reprsente le rang darrive (ou encore temps dattente) du r i e`me -"succs" et
la v.a.r. r reprsente le nombre d"checs" avant le r i e`me -"succs" dans une infinit de
lancers dune pice de monnaie.
Si on prend r = 1, la variable alatoire relle 1 est le temps dattente du premier "succs"
dans une infinit de lancers dune pice de monnaie, cest--dire une variable alatoire
relle gomtrique de paramtre p. Une variable alatoire relle gomtrique de paramtre
p est une variable alatoire relle de Pascal de paramtres r = 1 et p.
CT U
Besancon
176
5. Soit (, F, P) un espace probabilis. Notons Ak lvnement "le fumeur se rendant

compte pour la premire fois quune bote est vide, lautre bote contient k allumettes",
Gk lvnement "le fumeur se rendant compte pour la premire fois que la bote Gauche
est vide, la bote droite contient k allumettes", Dk lvnement "le fumeur se rendant
compte pour la premire fois que la bote Droite est vide, la bote gauche contient k
allumettes". Nous avons la runion disjointe Ak = Gk Dk et, pour des raisons de
symtrie, P(Dk ) = P(Gk ) do P(Ak ) = 2P(Gk ).
Notons Xn la variable alatoire relle dfinie, pour tout , par Xn () = 0 si, au
ni e`me -coup, on cherche lallumette dans la poche droite et Xn () = 1 si, au ni e`me -coup,
on cherche lallumette dans la poche gauche. On suppose lquiprobabilit de tirer dans
la poche gauche ou dans celle de droite, ce que lon exprime en disant que la variable
alatoire relle Xn suit une loi de Bernoulli de paramtre 21 . La variable alatoire relle
Sn := X1 + X2 + ... + Xn reprsente le nombre de fois o le fumeur a puis dans sa poche
gauche. On considrera que le fumeur sapercevra que la bote gauche est vide lorsquil
cherchera une allumette dans cette poche pour la (N + 1)i e`me-fois. Cela signifie que
lvnement Gk est ralis lorsquon extrait N k allumettes de la bote droite avant la
(N + 1)i e`me-fois o on puise dans la poche gauche. Par suite avec les notations de la
question 2, Gk = {N+1 = N k}. Il vient alors
1
1
P(Ak ) = 2P(Gk ) = 2CN2Nk ( )2Nk+1 = CN2Nk ( )2Nk .
2
2
1. Considrons sur lespace mesur ( R+ , F B(R+ ), P ), o est la mesure de
Lebesgue, la fonction valeurs relles dfinie par H(, t) := nt n1 1l]t,+[ (X ()). H est
positive et ( F B(R+ ), B(R))-mesurable, on peut appliquer le thorme de Tonelli,

Z Z
Z
n1
nt 1l[0,X ()[ (t)d(t) dP()
Hd(P ) =
R+
R+
Z
(X ())n dP()
=
Z
=
X n dP = E[X n ]
et
Z
Z
Hd(P ) =
R+
nt
R+
Z
=
n1

1l{X >t} ()dP() d(t)
nt n1 P(X > t)d(t).
R+
Comme lapplication t 7 P(X > t) est monotone, son ensemble des points de
discontinuits est dnombrable donc de mesure de Lebesgue nulle. Par suite lapplication
t 7 nt n1 P(X > t) est intgrable au sens de Riemann sur tout compact de R+ (cf [2]
proposition 0-6 p.9). On obtient le rsultat en remarquant que P(X > t) = 1 FX (t).
1
2. Considrons maintenant une v.a. dont la loi est donne par PX := (1 + 1 ). Sa
2
1
fonction de rpartition est FX (t) = (1l[1,+[ (t) + 1l[1,+[ (t)) et
2
Z +
Z
1 1 n1
1
n1
nt (1 F (t))dt =
nt dt =
2 0
2
0
CT U
Besancon
177
alors que E[X n ] = 12 ((1)n + 1). La formule nest vrifie pour aucune valeur de n 1.
La condition X positive est bien ncessaire. On peut videment calculer les esprances
E[|X |n ] par la formule dmontre ici mais en prenant la fonction de rpartition de |X |.
3. Comme les trois variables sont positives presque-srement, on peut utiliser la relation
de la question 1) avec n = 1 pour lesprance et n = 2 pour E[X 2 ], puis on calcule
X2 = E[X 2 ] (E[X ])2 .
(a) Pour la variable X on obtient :
Z 1
Z +
Z +
1
(1 FX (t))dt =
(1 t)dt +
0dt =
E[X ] =
2
0
0
1
Z +
Z 1
1
2
E[X 2 ] =
2t(1 FX (t))dt =
2t(1 t)dt = [t 2 t 3 ]10 =
3
3
0
0
1 1
1
X2 = E[X 2 ] (E[X ])2 = = .
3 4
12
(b) Pour la variable Y on obtient :
Z +
Z +
1
e t dt =
(1 FY (t))dt =
E[Y ] =
0
Z +
Z0 +
2te t dt
2t(1 FY (t))dt =
E[Y 2 ] =
0
0

Z +
t +
2te
2 t
2
=
+
e dt = 2
0
0
2
1
1
Y2 = E[Y 2 ] (E[Y ])2 = 2 2 = 2 .
+
X
k
1l],k[ (t). Comme 1 FZ (t) est la somme dune srie
k!
k=0
R
P
de fonctions positives mesurables, on peut intervertir et .
(c) On a 1 FZ (t) =
(1 FZ (t))dt =
E[Z ] =
0
k=0
+
X
k=1
2
2t(1 FX (t))dt =
0
= e [
k
dt
k!
k
=
(k 1)!
E[Z ] =
+
X
k=2
Z2
+ Z
X
+ Z
X
k=0 0
+
k1
X
k!
2tdt =
+
X
k=1
k
k
(k 1)!
k2
+
] = 2 +
(k 2)! k=1 (k 1)!
= E[Z ] (E[Z ])2 = .

T
Pour tout entier k 1 on a {T = k} = {Xk = 1} k1
i=1 {Xi = 0} F et
CT U
Besancon
178
{T = +} = +
i=1 {Xi = 0} F. T est bien une variable alatoire valeurs dans N .
Calculons la loi de T . Pour k 1 on a, en utilisant lindpendance des variables (X1 , ..., Xk ),
P(T = k) = P({Xk = 1}
k1
\
{Xi = 0})
i=1
= P(Xk = 1)P(X1 = 0) P(Xk1 = 0) = p(1 p)k1 .

P+
P+
k1
Comme P(T < +) =
= 1, on en dduit que
k=1 P(T = k) =
k=1 p(1 p)
P
+
P(T = +) = 0 c--d que T est finie p.s. . PT = k=1 p(1 p)k1 k est la loi gomtrique
G(p).
Calculons maintenant lesprance de T . Il vient en utilisant le thorme du transfert
Z
tdPT (t) =
E[T ] =
R
+
X
k1
p(1 p)
tdk (t) =
R
k=1
+
X
p(1 p)k1 k.
k=1
P+ k
On
reconnat
la
drive
terme
terme
de
la
srie
k=1 px calcule pour x = p 1. De plus
P+ k
1
1
et
sa
drive
est
.
En
conclusion
E[T ] = p1 .
x
=
k=1
1x
(1x)2
1. On a
\
\[
pn N [pk , +[= ,
lim sup(pk N ) =
k
k nk
donc P(lim sup(pk N )) = 0.

k
2. Montrons que la suite (pk N )kN est indpendante. Soit {pk1 , ..., pkn } des entiers
premiers, comme pk1 N ... pkn N = (pk1 ...pkn )N , il vient
P(pk1 N ... pkn N ) = P ((pk1 ...pkn )N )
1
=
pk1 ...pkn
= P(pk1 N )...P(pkn N ).
Ce qui prouve lindpendance de la suite (pk N )kN . Daprs un rsultat darithmtique
+
X
1
la srie
= +, et comme les pk N sont indpendants par rapport P, en applip
k
k=1
quant le thorme de Borel-Cantelli on dduit que P(lim sup(pk N )) = 1. La contradiction
k
prouve que la probabilit P nexiste pas.

1. Considrons la famille de toutes les sous-tribus A de F telles que, pour tout i I , Xi
est A-mesurable. Cette famille est non vide car elle contient la tribu F. On vrifie alors
que (Xi , i I ) est lintersection de toutes les tribus composant cette famille.
2. Un lment de C est donc de la forme
{Xi1 B1 } {Xi2 B2 } ... {Xin Bn }
CT U
Besancon
179
o n N , i1 , i2 , ..., in I sont distincts deux deux et B1 , B2 , ..., Bn B(R).

Comme, pour tout k I , Xk est (Xi , i I )-mesurable, {Xk B} (Xi , i I ) pour
tout borlien B. Par suite la famille C est incluse dans la tribu (Xi , i I ). Il en est de
mme pour la tribu engendre par C.
Rciproquement, pour tous k I et borlien B de R, {Xk B} C. Donc, pour tout
k I , lapplication Xk est mesurable par rapport la tribu engendre par C. Par suite
la tribu engendre par C contient la tribu (Xi , i I ) qui est la plus petite possder
cette proprit.
3. Notons C J (resp. C K ) la famille dfinie comme dans la question prcdente et engendrant
la tribu (Xi , i J) (resp. (Xi , i K )).
Comme les familles C J et C K sont stables par intersections finies, pour montrer
lindpendance des tribus (Xi , i J) et (Xi , i K ), il suffit de montrer que, pour
tous C C J et D C K , on a P(C D) = P(C )P(D).
C C J est donc de la forme {Xj1 A1 } {Xj2 A2 } ... {Xjn An } o n N ,
j1 , j2 , ..., jn J sont distincts deux deux et A1 , A2 , ..., An B(R), et, de mme, D C K
est de la forme {Xk1 B1 }{Xk2 B2 }...{Xkm Bm } o m N , k1 , k2 , ..., km K
sont distincts deux deux et B1 , B2 , ..., Bm B(R).
Par suite, en vertu de lindpendance des v.a.r. (Xi )I , il vient
P(C D) =
= P ({Xj1 A1 } ... {Xjn An } {Xk1 B1 } ... {Xkm Bm })
= P(Xj1 A1 )...P(Xjn An )P(Xk1 B1 )...P(Xkm Bm )
= P ({Xj1 A1 } ... {Xjn An }) P ({Xk1 B1 } ... {Xkm Bm })
= P(C )P(D).
Do la relation cherche.
Nous utiliserons le fait que la fonction caractristique dune somme finie de variables alatoires
indpendantes est gale au produit des fonctions caractristiques des variables alatoires de la
somme (Pour obtenir les fonctions caractristiques des lois classiques on pourra se reporter au
formulaire de lannexe A, page 205).
1. Comme les fonctions caractristiques de X1 et X2 sont donnes par X1 (t) = (1 it)a
et X2 (t) = (1 it)b , on a Y (t) = (1 it)(a+b) et Y est une v.a.r. de loi gamma
(a + b, ).
2. On sait que, pour tout k = 1, 2, , n, Xk (t) = (1 it)1 , on a donc Z (t) =
(1 it)n et Z est une v.a.r. de loi gamma (n, ).
Par dfinition
Z (t) = E[e
itZ
]=E e
it
PY
j=1 Xj
=E
" +
X
#
e
it
Pn
j=1 Xj
1l(Y =n) .
n=1
k
X
Pn
Or la suite de v.a.r. (
e it j=1 Xj 1l(Y =n) )k1 est borne en module par 1, une seule des
n=1
indicatrices 1l(Y =n) est ventuellement non nulle. On obtient donc en utilisant le thorme
CT U
Besancon
180
de convergence domine puis lindpendance des v.a.r.

+
+
n
h Pn
i X
X
Y
it j=1 Xj
Z (t) =
E e
1l(Y =n) =
E[1l(Y =n) ]
E[e itXj ]
n=1
+
X
n=1
j=1
P(Y = n)((t))n = (t).
n=1
Lapplication qui est aussi dfinie par (t) = E[t Y ] est appele fonction gnratrice de
la variable discrte Y .
D est une v.a.r. valeurs Z et M valeurs N . De plus, les v.a.r. tant discrtes, le couple
(D, M) est indpendant si, et seulement si, pour tout (i, j) Z N , P({D = i} {M =
j}) = P(D = i)P(M = j).
1. Supposons que X et Y suivent la loi gomtrique de paramtre p ]0, 1[.
On vrifie aisment que, pour j N fix,

{X = i + j} {Y = j} si i 0,
{D = i} {M = j} =
{X = j} {Y = j i} si i < 0.
Par suite en vertu de lindpendance du couple (X , Y ) il vient
si i 0, P({D = i} {M = j}) = P({X = i + j} {Y = j})
= P(X = i + j)P(Y = j) = p 2 q i+j1 q j1 = p 2 q i+2j2
si i < 0, P({D = i} {M = j}) = P({X = j} {Y = j i})
= P(X = j)P(Y = j i) = p 2 q ji1 q j1 = p 2 q 2ji2
p2
On peut rassembler ces deux critures sous la forme P({D = i} {M = j}) = 2 q 2j+|i| .
q
[
Calculons, pour tout i Z fix, P(D = i). Comme {D = i} =
({D = i} {M = j})
jN
o lunion est mutuellement disjointe et par un calcul simple de somme de sries

gomtriques, il vient
X
P(D = i) =
P ({D = i} {M = j})
jN
X p2
p2
2j+|i|
q
=
q |i| .
2
2
q
1
q
jN
Calculons maintenant, pour tout

[ j N fix, P(M = j). De la mme faon que
prcdemment {M = j} =
({D = i} {M = j}) o lunion est mutuellement
iZ
disjointe. Par un calcul simple de somme de sries gomtriques, il vient

X
P(M = j) =
P ({D = i} {M = j})
iZ
X p2
iZ
CT U
Besancon
q2
q 2j+|i| =
p 2j
q (q + 1).
q2
181
Comparant les trois valeurs trouves, on vrifie aisment que P({D = i} {M = j}) =
P(D = i)P(M = j), ce qui prouve lindpendance du couple (D, M).
2. Rciproquement, supposons les v.a.r. D et M indpendantes. Soit n N , fix. Par
lindpendance du couple (X , Y ), il vient
P(X = n + 1)P(Y = n)
P(X = n + 1)
P ((X = n + 1) (Y = n))
=
=
,
P ((X = n) (Y = n))
P(Y = n)P(X = n)
P(X = n)
ce qui donne la premire galit.
De plus (X = n + 1) (Y = n) = (D = 1) (M = n) et (X = n) (Y = n) = (D =
0) (M = n). Par lindpendance du couple (M, D), il vient
P ((X = n + 1) (Y = n))
P(D = 1)P(M = n)
P(D = 1)
==
=
P ((X = n) (Y = n))
P(D = 0)P(M = n)
P(D = 0)
do la deuxime galit.
On remarque que le rapport ne dpend pas de lentier n. Soit sa valeur. On a la relation
de rcurrence, pour tout n N , P(X = n + 1) = P(X = n).
P
Par suite, pour tout n N , P(X = n) = n1 P(X = 1). De la relation k1 P(X =
X
1
k1 P(X = 1) =
k) = 1 on dduit que
P(X = 1) = 1, et par suite que
1
k1
P(X = 1) = 1 .
X
k1 (1 )k . Les v.a.r. X et Y suivent
La loi de X et Y scrit alors : PX = PY =
k1
donc la loi gomtrique de paramtre 1 .

La probabilit que les variables alatoires X et Y prennent leurs valeurs dans le complmentaire
de lintervalle ]0, [ est nulle. On peut donc considrer, dans la suite, que les variables X et Y
sont valeurs dans lintervalle ]0, [.
Par ailleurs, en vertu de lindpendance du couple (X , Y ), le vecteur alatoire (X , Y ) de dimen1
sion 2 admet pour densit la fonction dfinie sur R2 par : pour tout (x, y ) R2 , (x, y ) = 2
si (x, y ) ]0, [2 , et (x, y ) = 0 si (x, y ) ]0,

/ [2 . Cest--dire que la vecteur alatoire (X , Y )
de dimension 2 suit la loi uniforme de dimension 2 sur ]0, [2 .
a(]0, [2 )
En consquence, pour tout borlien A de R2 , P[(X , Y ) ] =
, o a(]0, [2 )
2
dsigne la mesure de laire de lintersection du borlien avec le carr ouvert ]0, [2 .
Pour dterminer les lois des variables Z et T , nous pouvons tudier leurs fonctions de rpartition, que nous noterons respectivement F et G .
Loi de Z .
Remarquons que la variable Z peut aussi scrire Z = max(X , Y ) min(X , Y ) = |X Y |.
Cest une variable alatoire positive qui prend ses valeurs dans lintervalle [0, ].
tudions la fonction de rpartition F de Z . Soit z rel fix. Cela revient tudier la probabilit
F (z) = P(Z z) de lvnement {Z z}.
Si z < 0, comme Z est positive, lvnement {Z z} = (vnement impossible). Par
suite F (z) = 0.
CT U
Besancon
182

Si z , comme Z prend ses valeurs dans [0, ], lvnement {Z z} = (vnement
certain). Par suite F (z) = 1.
Il reste tudier le cas 0 z < . Supposons 0 z < fix. On peut crire
{Z z} = {(X , Y ) ]0, [2 } o = {(x, y ) R2 / |x y | z} dsigne la
bande dfinie par les points de R2 contenus entre les deux droites dquations respectives
y = x + z et y = x z dans un systme daxes orthonorm. Un raisonnement
gomtrique lmentaire montre que la mesure de laire de lintersection ]0, [2 est :
a ]0, [2 = 2 ( z)2 .
En consquence, daprs la remarque prliminaire sur la loi du couple (X , Y ),

2 ( z)2

z 2
.
=
1
F (z) = P(Z z) = P (X , Y ) ]0, [2 =

2
En rsum, la fonction de rpartition de la variable alatoire Z est donne, pour tout rel
z, par :
si z < 0,
0
2
z
F (z) =
1 1
si 0 z < ,
1
si z .
Comme la fonction de rpartition est de classe C 1 sur les trois intervalles ] , 0[, ]0, [
et ], +[, une densit f vrifiera lquation F 0 = f sur chacun de ces intervalles. Les
valeurs de f aux bornes, f (0) et f (), peuvent tre choisies arbitrairement (on rappelle
quune densit nest dfinie que presque-partout pour la mesure de Lebesgue).
En conclusion, la variable alatoire Z admet pour densit, la fonction f dfinie pour tout
rel z, par :
(
f (z) =
0
z
2
1
si z < 0 ou si z > ,
si 0 z ,
Loi de T
Remarquons que la variable T est une variable alatoire positive qui prend ses valeurs dans
lintervalle [0, 1].
tudions la fonction de rpartition G de T . Soit z rel fix. Cela revient tudier la probabilit
G (z) = P(T z) de lvnement {T z}.
Si z < 0, comme T est positive, lvnement {T z} = (vnement impossible). Par
suite G (z) = 0.
Si z 1, comme T prend ses valeurs dans [0, 1], lvnement {T z} = (vnement
certain). Par suite G (z) = 1.
Il reste tudier le cas 0 z < 1. Supposons 0 z < 1 fix. On peut
crire
{T z} = {(X , Y ) 0 ]0, [2 } o 0 = 1 2 avec 1 =

n
o
x
y
(x, y ) R2 / 0 < x < y et
z et 2 = (x, y ) R2 / 0 < y < x et
z .
y
x
0 est le complmentaire (dans ]0, +[2 ) du secteur angulaire dfini par les points de
x
]0, +[2 contenus entre les deux droites dquations respectives y = et y = zx dans
z
un systme daxes orthonorm. Un raisonnement gomtrique lmentaire
montre que la

0
2
2
0
2
mesure de laire de lintersection ]0, [ est : a ]0, [ = z .
CT U
Besancon
183
En consquence, daprs la remarque prliminaire sur la loi du couple (X , Y ),

z2

G (z) = P(T z) = P (X , Y ) 0 ]0, [2 = 2 = z.
En rsum, la fonction de rpartition de la variable alatoire T est donne, pour tout rel
z, par :
si z < 0,
0
z
si 0 z < 1,
G (z) =
1
si z 1.
On reconnat la fonction de rpartition de la loi uniforme sur lintervalle [0, 1]. La variable
alatoire T suit donc la loi uniforme sur lintervalle [0, 1].
8.5
Corrigs des exercices du chapitre V

Le vecteur alatoire X est limage du vecteur U par lapplication linaire A dont la matrice
[ai,j ]1i,jn dans la base canonique de Rn a pour coefficients
pour i = 1, , n,
pour j = 1, , n 1,
ai,i = 1
aj+1,j =
ai,j = 0
Par suite toute combinaison linaire des variables alatoires X1 , X2 , , Xn est une combinaison
linaire des variables alatoires U1 , U2 , , Un . Comme (U1 , U2 , , Un ) est une suite indpendante de variable alatoire relle gaussiennes, le vecteur U est gaussien. Par suite toute combinaison linaire des variables alatoires U1 , U2 , , Un est une variable alatoire gaussienne.
Il en est donc de mme de toute combinaison linaire des variables alatoires X1 , X2 , , Xn .
Ce qui prouve, par dfinition des vecteurs gaussiens, que le vecteur X = AU est lui-mme un
vecteur gaussien.
1. Dterminons la loi de X par le critre didentification des lois par les fonctions positives.
Soit h une application borlienne positive de Rd dans [0, +[. Reprenons les notations
du corrig 8.5, page 183, de lexercice 5.1, page 97. Par application du thorme du
transfert au vecteur U, par indpendance de la suite (U1 , U2 , , Un ) en notant f (t) la
densit de N 1 (0, 2 ) et x = (x1 , x2 , , xn ), il vient
Z
E(h(X )) = E(h(AU)) =
h(Ax)dPU (x)
Rn
Z
=
h(Ax)f (x1 )f (x2 ) f (xn )d(n) (x).
Rn
Faisons le changement de variable laide du C 1 -diffomorphisme A i.e. y := Ax, pour

tout x Rn . Lapplication rciproque est dfinie, pour tout entier 1 k n, par
CT U
Besancon
184

xk =
Pk1
j
j=0 () ykj
et son jacobien en un point y est det(A1 ) = 1. On obtient
Z
h(y )f (y1 )f (y2 y1 ) f
E(h(X )) =
Rn
!
d(n) (y )
j=0
Z
h(y )
n1
X
()j ynj
Rn
n
n
k1
1 X X
exp 2
()j ykj
2 k=1 j=0
!2
d(n) (y ).
Ce qui prouve que X est un vecteur alatoire de densit dfinie, pour tout
x = (x1 , x2 , , xn ) Rn , par

fX (x) =
n
n
k1
1 X X
exp 2
()j xkj
2 k=1 j=0
!2
.
2. Lesprance de X est E[X ] = E[AU] = AE[U] = 0 (vecteur nul de Rn ).

La matrice de dispersion de X est donne par
DX := E(X X ) = E(AU(AU) ) = ADU A = 2 AA
car DU = 2 In , o In dsigne la matrice-identit dordre n. On peut calculer DX en
effectuant le produit matriciel AA . On trouve que DX = [di,j ]1i,jn o
d1,1 = 2
di,i = 2 (2 + 1)
dj+1,j = dj,j+1 = 2
di,j = 0
pour i = 2, , n,
pour j = 1, , n 1,

1. On remarque que E[X Xa ] = E[X 2 1l{|X |a} ] E[X 2 1l{|X |>a} ]. Le thorme du transfert
permet dcrire
1
E[X 1l{|X |a} ] =
2
2
2 21 x 2
x e
a
2
dx, E[X 1l{|X |>a} ] =
2
2
1 2
x 2 e 2 x dx.
E[X Xa ] est donc gale la diffrence de deux fonctions de la variable a relle positive,
continues sur R+ , dont la premire est strictement croissante de 0 E[X 2 ] = 1 et la
seconde strictement dcroissante de E[X 2 ] = 1 0. Il existe donc une unique valeur de
a0 pour laquelle E[X Xa0 ] = 0 cest--dire (X , Xa0 ) est non-corrl.
2. Comme, pour tout rel a > 0, X + Xa = 2X 1l{|X |a} nest pas une v.a.r. gaussienne car
X + Xa est une variable alatoire borne par 2a, le vecteur (X , Xa ) nest gaussien pour
aucune valeur de a.
3. Si le couple (X , Xa ) tait indpendant, le vecteur (X , Xa ) serait gaussien car ses composantes seraient des v.a.r. gaussiennes indpendantes. Daprs la question prcdente, il
y aurait contradiction. Pour tout rel a > 0, le couple (X , Xa ) nest donc pas indpendant.
CT U
Besancon
185

Si on considre X comme un vecteur colonne, alors le vecteur alatoire Y := AX suit une loi
gaussienne N 3 (A0, A A ) = N 3 (0, A A ). Comme Y est un vecteur gaussien il suffit, pour
que ses composantes soient indpendantes, que la matrice A A soit diagonale. Si de plus on
veut que les composantes de AX soient non-dgnres, alors il faut que la matrice A A soit
inversible. Comme est relle symtrique, elle est diagonalisable dans R et il existe une matrice
orthogonale U telle que la matrice := U 1 U soit diagonale. Les valeurs propres de sont
2 et 4. La matrice est donc inversible ainsi que la matrice . Les vecteurs e1 := 12 (1, 1, 0) et
e2 := (0, 0, 1) sont des vecteurs propres linairement-indpendants associs la valeur propre
double 2 et e3 := 12 (1, 1, 0) est un vecteur propre associ la valeur propre 4. La base de
vecteurs propres (e1 , e2 , e3 ) est orthonorme et la matrice

1/2 0 1/ 2
U := 1/ 2 0 1/ 2
0
1
0
est orthogonale. Posons A = U = U 1 . On vrifie que la matrice A ainsi dfinie rpond la
question pose.
Avec les notations du cours concernant les oprations matricielles, lesprance de U est donne
par A0 = 0 et sa matrice de dispersion est donne par AI A = AA = I . En effet A est une
matrice orthogonale donc A = A1 . Limage du vecteur gaussien X par lendomorphisme de
R2 de matrice A dans la base canonique de R2 est encore un vecteur gaussien. Par suite la loi
de U est N 2 (0, I ).
1. Comme P(X ,Y ) est une probabilit sur R2 , doit tre tel que P(X ,Y ) (R2 ) = 1. Le thorme
de Tonelli permet dcrire
Z
1
2
2
2
e 2 (x xy +y ) d(2) (x, y )
P(X ,Y ) (R ) =
2
ZR
Z
y 2
1
83 y 2
e 2 (x 2 ) d(1) (x)d(1) (y )
= e
ZR
ZR
3 2
1 2
e 2 x d(1) (x)d(1) (y )
= e 8 y
R
ZR
Z 3 y 2 (1)
4
83 y 2
(1)
= e
2d (y ) = 2 e 8 d (y ) = .
3
R
R
R (xm)2 (1)
2 2 d
(x)
=
2. Par suite
O on
a
utilis
la
valeur
de
lintgrale
de
Gauss
e
R
3
= 4 .
2. On rappelle que la loi N 2 (m, D) admet une densit par rapport la mesure de Lebesgue
(2) si et seulement si la matrice D est inversible (cf cours). Dans ce cas la densit scrit,
pour tout t R2 ,

1
1
1
p
exp (t m) D (t m) .
2
2 det(D)
CT U
Besancon
186

Le terme constant m D 1 m, obtenu par t = 0 dans lexpression (t m) D 1 (t m),
reprsente la norme du vecteur m relativement la forme quadratique dfinie positive
dfinie par D 1 . Il est nul si et seulement si m = 0. Comme

1
1/2
x
2
2
x xy + y = x y
,
1/2
1
y
on reconnat en P(X ,Y ) la loi gaussienne N
a pas de terme
2 (m, D) o m =0 puisquil ny

1
1/2
4/3 2/3
1
constant dans lexponentielle et D =
. Donc D :=
1/2
1
2/3 4/3
est la matrice de dispersion du vecteur (X , Y ).
On en dduit que X et Y suivent la loi N 1 (0, 34 ) et, puisque D nest pas diagonale, le
couple de variable alatoire relle (X , Y ) nest pas indpendant.
On peut aussi dterminer directement Var(X ), Var(Y ) et Cov(X , Y ) par un calcul
dintgrales partir de la densit de la loi du couple (X , Y ).

Remarquons que X et X ont la mme loi. En effet ltude des fonctions caractristiques donne
1 2
X (t) = E[e itX ] = X (t) = e 2 t = X (t) pour tout rel t.
1. La relation
h(Y ) = h(X )1l[0,] (|X |) + h(X )1l],+[ (|X |)
est facile vrifier. Il suffit pour cela dtudier sparment le cas o satisfait
|X ()| [0, ] et le cas o satisfait |X ()| ], +[. Pour observer que dans le
premier cas, h(Y ()) = h(X ()) et dans le second cas h(Y ()) = h(X ()). La relation avec les indicatrices sert rsumer ces deux cas en une seule expression.
2. Soient h une application borlienne positive de R dans R, de la relation
h(Y ) = h(X )1l[0,] (|X |) + h(X )1l],+[ (|X |).
on obtient, en passant lesprance,
E[h(Y )] = E[h(X )1l[0,] (|X |)] + E[h(X )1l],+[ (|X |)].
En remarquant que X et X ont la mme loi et en utilisant le thorme du transfert, il
vient
E[h(X )1l],+[ (|X |)] = E[h(X )1l],+[ (|X |)].
Ce qui, en reportant dans le deuxime membre de lgalit prcdente, donne E[h(Y )] =
E[h(X )], pour toute application borlienne positive de R dans R. Ce qui prouve que Y
suit la mme loi que X cest--dire N 1 (0, 1).
3. La variable alatoire relle X + Y = 2X 1l[0,] (|X |) nest pas une gaussienne car X + Y
est une variable alatoire borne par 2. Le vecteur (X , Y ) nest donc pas gaussien.
CT U
Besancon
187
4. Si le couple (X , Y ) tait indpendant, le vecteur alatoire (X , Y ) serait gaussien car ses

composantes seraient des variable alatoire relle gaussiennes indpendantes. Daprs la
question prcdente, il y aurait contradiction. En conclusion, le couple (X , Y ) nest donc
pas indpendant.
1. Du fait de lindpendance des variables alatoires relles X , Y et Z , la fonction caractristique de U est gale au produit des fonctions caractristiques de X , Y et Z . Cette
3 2
fonction caractristiqueest donc donne, pour tout t R, par U (t) = e 2 t et par suite
U a pour loi N 1 (0, 3).
De la mme faon, on montre que la variable alatoire relle V := 2X Y Z suit la
loi N 1 (0, 6) et que la variable alatoire relle W := Y Z suit la loi N 1 (0, 2).
2. On remarque que le couple (U, X Y ) est limage de (X , Y , Z ) par lapplication
linairede R3 dans R2 de matrice, dans les bases canoniques respectives de R3 et R2 ,
1
1 1
A :=
. Comme (X , Y , Z ) est un vecteur gaussien de loi N 3 (0, I ) o 0
1 1 0
est le vecteur nul de R3 et I la matrice identit dordre 3, le vecteur (U, X Y ) est
aussi gaussien
de

loi N 2 (0, AI A ). La matrice de dispersion de (U, X Y ) est donc
3 0
AA =
. Cette matrice tant diagonale, le couple de variables alatoires relles
0 2
(U, X Y ) est indpendant.
On procde de faon analogue pour les couples (U, Y Z ) et (U, Z X ).
3. On remarque que le vecteur (X + Y + Z , 2X Y Z , Y Z ) est limage du vecteur
3
3
gaussien
(X , Y , Z ) parlendomorphisme de R de matrice (dans la base canonique de R )
1
1
1
B := 2 1 1 . Le vecteur alatoire (U, V , W ) est donc un vecteur gaussien de
0
1 1
3 0 0
loi N 3 (0, BI B ) = N 3 (0, BB ) o BB = 0 6 0 .
0 0 2
4. La matrice des covariances du vecteur (U, V , W ), BB , est diagonale et le vecteur
(U, V , W ) gaussien, le triplet des variables alatoires relles (U, V , W ) est donc indpendant.
5. La fonction caractristique du couple (U, T ) est dfinie, pour tout (u, t) R2 , par
(U ,T ) (u, t)
= E [exp (i(uU + v T ))]

3
1
2
2
,
= E exp iu(X + Y + Z ) + it(2X Y Z ) + it(Y Z )
2
2
o on a utilis lidentit vrifier. Comme la famille des v.a.r. (U, 2X Y Z , Y Z )
CT U
Besancon
188

est indpendante,
(U ,T ) (u, t)

iuU
1
3
2
2
E exp
E exp
= E e
it(2X Y Z )
it(Y Z )
2
2
3 2
= e 2 u 1 (2X Y Z )2 (3t) 1 (Y Z )2 (3t).

6
Comme (2X Y Z ) suit la loi N 1 (0, 6) et que (Y Z ) suit la loi N 1 (0, 2),
1
1
(2X Y Z ) et (Y Z ) suivent la loi N 1 (0, 1). On conclut lgalit des
6
2
fonctions caractristiques 1 (2X Y Z )2 = 1 (Y Z )2 = . Il vient alors
6
3 2
3 2
(U,T ) (u, t) = e 2 u [(3t)]2 = e 2 u
1
.
1 6it

1. En utilisant la technique des fonctions borliennes positives, si h est une telle fonction,
on a
Z
Z
1 2
1
2
2
E[h(X1 )] =
h(x )dPX1 (x) =
h(x 2 ) e 2 x d(x)
2
R
R
Z
1 2
1
= 2
h(x 2 ) e 2 x d(x),
+
2
R
puisque la fonction intgre par rapport la mesure de Lebesgue est paire. On utilise
ensuite le thorme de changement de variable dans une intgrale relative la mesure de
Lebesgue, en posant t = x 2 .
Z
Z
1 1
1 t 1
2
h(t)d( , )(t).
E[h(X1 )] =
h(t) e 2 t 2 1lR+ (t)d(t) =
2 2
2
R
R
On a montr PX12 = ( 12 , 12 ) = 2 (1).
2. En utilisant les fonctions caractristiques des lois Gamma (voir le formulaire de lannexe
A, page 205) et la proposition 4.31, page 86, la somme de deux v.a.r. indpendantes de
loi respective (a, b) et (a, b 0 )P
est une v.a.r. de loi (a, b +b 0 ). Par rcurrence immdiate
sur n, on montre que la v.a.r. nk=1 Xk2 suit une loi ( 12 , n2 ) = 2 (n).

1
1
n
3. On considre lespace vectoriel euclidien R et on pose Vn := n ... . Daprs les
1
thormes dalgbre linaire, il est possible de construire une base B orthomorme qui
complte la famille libre (Vn ), B = (V1 , , Vn ). La matrice de passage de la base
canonique B est la matrice orthogonale ( i.e. sa transpose est gale son inverse)
forme des vecteurs colonnes de B. Sa transpose, que lon note C , est aussi orthogonale
et de la forme
c1,1
c1,2 c1,n
c2,1
c2,2 c2,n
..
..
..
.
.
C = .
.
.
. .
cn1,1 cn1,2 cn1,n

1
1
1
n
n
n
CT U
Besancon
189
4. En utilisant la proposition 5.5, page 98, comme X suit la loi N n (0, In ), Y = C X suit la
loi N n (0, C In C ) = N n (0, In ), o C dsigne la transpose de C , et C = C 1 puisque
C est orthogonale.
n
1 X
5. De Y = C X , on dduit facilement que Yn =
Xk = n X . Avec les rgles du
n k=1
calcul matriciel, on remarque que
n
X
Yk2
= Y Y = (C X ) (C X ) = X (C C )X = X X =
k=1
n
X
Xk2 .
k=1
De plus,
(n 1)S 2 =
n
X
(Xk X )2 =
k=1
n
X
(Xk2 2X Xk + X )
k=1
k=1
n
X
n
X
Xk2
2X
n
X
Xk + nX =
k=1
2
Xk2 nX =
k=1
n
X
n
X
k=1
n1
X
Yk2 Yn2 =
k=1
Xk2 + n(2X + X )
Yk2 .
k=1
n1
1
1 X 2
Y . Le vecteur Y est gaussien et sa matrice
Ainsi X = Yn et S 2 =
n 1 k=1 k
n
de dispersion est diagonale donc (Y1 , , Yn ) est indpendant. Par suite X et S 2 sont
indpendantes en vertu du thorme dindpendance des fonctions de v.a.r. (cf proposition
4.14, page 75).
6. La fonction caractristique de X est
X (t) = E[e itX ] = E[e
i t n Yn
1 2
t
] = Yn ( ) = e 2n t .
n
1
Donc PX = N 1 (0, ). Enfin, daprs la deuxime question, le vecteur alatoire
n
(Y1 , , Yn1 ) suit la loi N n1 (0, In1 ), la v.a.r. (n 1)S 2 suit la loi 2 (n 1).
Montrons que, pour tout entier n 1, il existe une forme linaire Ln sur Rn+1 telle que
Xn = Ln (X0 , 1 , . . . , n ). Pour n = 1, posons L1 (x0 , x1 ) := l1 (x0 ) + b1 x1 et remarquons que
X1 = L1 (X0 , 1 ). Supposons construites les formes linaires Li pour i = 1, , n et construisons
Ln+1 . On a
Xn+1 = ln+1 (X0 , X1 , . . . , Xn ) + bn+1 n+1
= ln+1 (X0 , L1 (X0 , 1 ), . . . , Ln (X0 , 1 , . . . , n )) + bn+1 n+1 .
Posons
Ln+1 (x0 , . . . , xn+1 ) := ln+1 (x0 , L1 (x0 , x1 ), . . . , Ln (x0 , x1 , . . . , xn )) + bn+1 xn+1 .
CT U
Besancon
190
Ln+1 est bien une forme linaire sur Rn+2 et Xn+1 = Ln+1 (X0 , 1 , . . . , n+1 ), ce qui prouve
lexistence de la suite (Ln )n1 .
Maintenant, pour tout n 0, construisons lendomorphisme An de Rn+1 en posant, pour tout
(x0 , x1 , , xn ) Rn+1 ,
An+1 (x0 , . . . , xn ) := (x0 , L1 (x0 , x1 ), . . . , Ln (x0 , . . . , xn )) .
Avec ces notations,
(X0 , X1 , . . . , Xn ) = An (X0 , 1 , . . . , n ).
Comme les composantes de (X0 , 1 , . . . , n ) sont gaussiennes et mutuellement indpendantes,
ce vecteur est gaussien. Par suite le vecteur (X0 , X1 , . . . , Xn ) est galement gaussien comme
image dun vecteur gaussien par une application linaire.
8.6
Corrigs des exercices du chapitre VI
Dans ce paragraphe, toutes les variables alatoires considres sont supposes dfinies sur un
mme espace de probabilit (, F, P).
1. Daprs lingalit de Bienaym-Tchbycheff, P(|X m| > 3) 6
P(m 3 < X < m + 3) = 1 P(|X m| > )
1
2
=
et donc
9 2
9
8
' 0.88 .
9
Un raisonnement analogue donne lautre partie de la question.

2. Comme X est de loi N (m; 2 ), on utilise les tables numriques (voir mode demploi dans
lannexe B, page 211) et on obtient en notant T = (X m)/ qui est de loi gaussienne
centre rduite

X m
P(m 3 < X < m + 3) = P 3 <
<3
= P(3 < T < 3) = P(T < 3) P(T < 3)

= P(T < 3) [1 P(T < 3)] = 2P(T < 3) 1
' 2 0.99865 1 ' 0.9973 ,
o lon a lu P(T < 3) dans la partie basse de la table correspondant aux grandes valeurs
de u. On trouverait de mme P(m 2 < X < m + 2) ' 0.9544.
1. En utilisant le fait que X est desprance nulle on a :
a = E[a X ] = E[(a X )1l(X a) + (a X )1l(X >a) ]
1
E[(a X )1l(X a) ] (P(X a)) 2 (E[(a X )2 ]) 2
CT U
Besancon
191
o la dernire ingalit est obtenue en utilisant lingalit de Cauchy-Schwarz. De plus

E[(a X )2 ] = a2 2aE[X ] + E[X 2 ] = a2 + 2 ce qui donne :
1
a E[(a X )1l(X a) ] (P(X a)) 2 a2 + 2 .
En levant au carr lingalit prcdente on obtient :
a2
2
P(X > a) = 1 P(X a) 1 2
= 2
.
a + 2
a + 2
2. Si on pose X = Y 100 alors X est une v.a. centre de variance
Var(X ) = E[(Y 100)2 ] = E[(Y E[Y ])2 ] = Var(Y ) = 400.
Lingalit de la question 1) nous conduit
P(Y > 120) = P(X > 20)
400
1
= .
+ 400
2
202
Avec lingalit de Bienaym-Tchebycheff on obtient :

P(Y > 120) = P(X > 20) P(|X | > 20)
400
=1
202
qui ne donne pas de renseignement.

Notons Xk la kime mesure effectue sur les N. On peut considrer que Xk est une v.a.r.
desprance m, que les v.a.r. X1 , ..., XN sont indpendantes et de mme loi. On note
N
1 X
XN =
Xk la moyenne empirique des valeurs observes. Par lingalit de BienaymN k=1
V ar (X N )
V ar (X1 )
0.25
. Or V ar (X N ) =
=
et donc
2
(0.05)
N
N
0.25
0.25
P(|X N m| > 0.05) 6
. On cherche donc N tel que
6 0.01 do
2
N(0.05)
N(0.05)2
0.25
N
= 10000.
(0.05)2 0.01
Tchbicheff, P(|X N m| > 0.05) 6

Soit a > 0, prenons un entier n suffisamment grand pour que 0 < 1/n < a. On veut tudier la
limite quand n de P(|Xn 0| > a). Pour n tel que 1/n < a, on a
P(|Xn 0| > a) = P(|Xn | > a) = P(Xn 6 a) + P(Xn > a)
Z a
Z +
=
n 1l[0, 1 ] (x) dx +
n 1l[0, 1 ] (x) dx
n
n
}
}
| {z
| {z
a
=0 sur ] , a[
=0 sur [a, + [
do pour tout a > 0, limn P(|Xn 0| > a) = 0 ce qui prouve que (Xn )nN converge en
probabilit vers 0.
CT U
Besancon
192

On considre lexemple 6.3, page 110, du cours. La suite (Xn )nN converge en probabilit vers
n
1 n
la v.a.r. 0. Mais pour tout entier n > 1, E(Xn ) =
+
= 1. Donc la suite des
n+1
nn+1
esprances (E(Xn ))nN ne converge pas vers lesprance de la limite qui est 0 = E(0).
p.s
1) Comme Xn X , il existe X tel que P(X ) = 0 et pour tout cX ,
n
lim Xn () = X (). De mme il existe Y de probabilit nulle tel que pour tout cY ,
lim Yn () = Y (). Posons = X Y , alors pour tout c , lim Xn () = X () et
limn Yn () = Y (). Comme la fonction f est continue sur R2 , la suite (f (Xn (), Yn ()))nN
converge vers f (X (), Y ()). De plus, 0 6 P() 6 P(X ) + P(Y ) et donc P() = 0 ce qui
prouve la convergence presque-sre de (f (Xn , Yn ))nN vers f (X , Y ).
2) Il suffit dappliquer le premier point avec f : (x, y ) x + y et g : (x, y ) xy qui sont
des applications continues sur R2 .
n
X
Xk = nX n et on a
On commence par remarquer que
k=1
n
X
n
X
2
(Xk X n ) =
(Xk2 2Xk X n + X n )
2
k=1
k=1
n
X
!
Xk2
n
X
2X n
k=1
n
X
!
2
Xk
+ nX n
k=1
!
Xk2
2
2nX n
2
nX n
n
X
!
Xk2
nX n
k=1
k=1
do la relation pour Sn2 .

Daprs la loi forte des grands nombres applique la suite (Xn )nN o la moyenne commune
tous les Xk est m = E(X0 ) et la variance commune est 2 = V ar (X0 ). On a
p.s.
X n m
n
p.s.
et X n m2 .
n
De mme la suite (Xk2 )kN est une suite i.i.d. et on peut donc lui appliquer la loi forte des
grands nombres qui prouve que
n
1 X 2 p.s.
X E(X02 ) .
n k=1 k n
Ainsi
Sn2 =
n
1X 2
n
2
p.s.
Xk
X n E(X02 ) m2 = 2 .
|{z} n
n
1
n
n
1
| {z }
| {z } m2
| k=1
{z }
1
1
E(X02 )
CT U
Besancon
193

Posons, pour tout n 1, Sn := X1 + + Xn . En utilisant le fait que E(Sn ) = n et que la
variance dune somme de variables non corrles est gale la somme des variances, on obtient

n
Sn
1 X
C
Sn
2
= 2
Var(Xi ) .
E ( ) = Var
n
n
n i=1
n

On a donc la convergence vers dans L2 , et par consquent en probabilit, de la suite ( Snn )n1 .
n
X
1
Posons, pour tout entier n 1, In :=
f (Uk ) et remarquons que
n
k=1
!
n
X
1
1
E(In ) = E(f (U1 )), Var(In ) = 2 Var
f (Uk ) = Var (f (U1 )) .
n
n
k=1
Pour obtenir ces deux rsultats, on utilise lindpendance et lidentit des lois des v.a.r. f (Uk ).
De plus comme f est une application de carr intgrable, la constante C := Var (f (U1 )) est
finie.
Soit > 0, appliquons lingalit de Bienaym-Tchebycheff la v.a.r. In L2 . Il vient, pour
tout entier n 1,
P (|In E(In )| )
C
Var(In )
do P (|In E(f (U1 ))| ) 2
2
en reportant les expressions trouves ci-dessus. Cela prouve que, pour tout > 0,
lim P (|In E(In )| ) = 0, cest--dire que la suite de v.a.r. (In )N converge en probabiln
it vers E(f (U1 )).

Calculons E(f (U1 )). Par le thorme de transfert il vient
Z
Z
E(f (U1 )) =
f (U1 )dP =
f (x)dPU1 (x)
R
Z
Z
=
f (x)1l[0,1] d(x) =
f d
R
[0,1]
ce qui achve la dmonstration.

Pour tout i 1, Xi est une v.a.r. intgrable. La loi forte des grands nombres implique
n
1
1X
p.s.
Xi E[X1 ] = ,
n i=1
2
do, comme f est continue,
n
1X
1
p.s.
f(
Xi ) f ( ).
n i=1
2
CT U
Besancon
194

n
Comme f est borne, il existe une constante M telle que, pour tout n 1, |f (
1X
Xi )| M.
n i=1
Par application du thorme de convergence domine de Lebesgue

"
#

n
1
1X
1
E f(
Xi ) E f ( ) = f ( ).
n i=1
2
2
On applique maintenant le thorme du transfert la variable alatoire vectorielle (X1 , , Xn ),
il vient
"
#
Z
n
1X
x1 + + xn
E f(
Xi ) =
f(
) dP(X1 , ,Xn ) (x1 , , xn )
n i=1
n
Rn
Z
n
x1 + + xn Y
)
=
f(
1l[0,1] (xi )d(n) (x1 , , xn )
n
Rn
i=1
Z
x1 + + xn
f(
)d(n) (x1 , , xn ).
=
n
[0,1]n
en conclusion,
Z
f(
lim
n+
[0,1]n
x1 + + xn
1
)d(n) (x1 , , xn ) = f ( ).
n
2

1. Comme f est continue sur le compact [0, 1] elle est borne et en particulier sup |f (x)|
0x1
1
est fini, de plus la v.a.r. f ( Sn ) est intgrable. Par le thorme de transfert il vient
n
!
Z
n
X
1
t
k k
nk
pn (x) := E[f ( Sn )] =
f( ) d
Cn x (1 x) k (t)
n
n
R
k=0
=
n
X
k
f ( )Cnk x k (1 x)nk .
n
k=0
2. Comme f est continue sur le compact [0, 1] elle est uniformment continue sur [0, 1].
Fixons > 0, il existe alors > 0 tel que, pour tout (x, y ) [0, 1]2 , |x y | < implique
|f (x) f (y )| < . De plus

1
1
|pn (x) f (x)| = |E f ( Sn ) f (x) | E |f ( Sn ) f (x)| .
n
n
1
Considrons lvnement An := {| Sn x| < }, il vient
n

1
1
1
E |f ( Sn ) f (x)| = E 1lAn |f ( Sn ) f (x)| + E 1lAcn |f ( Sn ) f (x)|
n
n
n
E(1lAn ) + 2E(1lAcn ) sup |f (x)|
0x1
2P(Acn )
P(An ) +
sup |f (x)|
0x1

1
+ 2P | Sn x| sup |f (x)|
n
0x1
CT U
Besancon
195
ce qui prouve la deuxime ingalit.

Utilisons maintenant lingalit de Bienaym-Tchebycheff pour majorer le deuxime terme
du second membre de lingalit prcdente.
1
Comme {| Sn x| } = {|Sn E(Sn )| n} il vient
n
1
1
x(1 x)
P(| Sn x| ) = P(|Sn E(Sn )| n)
Var(Sn ) =
2
n
(n)
n 2
ce qui en revenant la deuxime ingalit donne, pour tout n N et tout x [0, 1],
|pn (x) f (x)| + 2
x(1 x)
sup |f (x)|.
n 2 0x1
3. Daprs la question prcdente, pour tout n N , on obtient

sup |pn (x) f (x)| +
0x1
o on a utilis sup (x(1 x)) =

0x1
1
sup |f (x)|
2n 2 0x1
1
(tudier la fonction numrique h(x) := x(1 x) sur
4
[0, 1]).
Par suite, pour tout > 0, il existe N N tel que, pour tout n N , n N implique
sup |pn (x) f (x)| < 2, ce qui prouve que la suite de polynmes (pn )N converge uni0x1
formment sur [0, 1] vers la fonction f .

1. Appliquons le rsultatRde lexercice 4.17, page 92, la v.a.r. positive |X | pour n = 1.
+
Cela donne E(|X |) = 0 P(|X | > t)dt. On peut alors crire
Z
E(|X |) =
XZ
n0
1l[n,n+1[ (t)P(|X | > t)dt
n0
+
1l[n,n+1[ (t)P(|X | > t)dt
P(|X | n)
n0
o pour obtenir la dernire ingalit on a utilis la majoration

1l[n,n+1[ (t)P(|X | > t) 1l[n,n+1[ (t)P(|X | n).
1
2. Soit {( Sn )N converge dans R}. Comme
n
Sn () Sn+1 ()
Sn ()
Xn+1 ()
n
n+1
n(n + 1)
n+1
et que

Sn () Sn+1 ()
Sn ()
= 0 = lim
,
lim
n+
n+ n(n + 1)
n
n+1
CT U
Besancon
196

1
la suite
Xn+1 ()
converge vers 0. Par suite seuls un nombre fini dentiers n
n+1
N
1
vrifient Xn () 1 ou encore |Xn ()| n. ne peut donc pas appartenir lensemble
n
lim sup{|Xn | n}, ce qui prouve linclusion cherche.
n
3. Comme les v.a.r. sont toutes de mme loi, pour tout n N, nous avons P(|X1 | n) =
P(|Xn | n) et par suite, en revenant lingalit de la premire question applique la
v.a.r. X1 ,
X
X
E(|X1 |)
P(|X1 | n) =
P(|Xn | n).
n0
n0
Comme X1 nest pas

P intgrable, E(|X1 |) = + et par suite en vertu de lingalit
prcdente, la srie n P(|Xn | n) diverge. Comme la suite (Xn )N est indpendante, les
vnements {|Xn | n} sont indpendants. Par application du lemme de Borel-Cantelli

on en dduit que P(lim sup{|Xn | n}) = 1 ou encore P [lim sup{|Xn | n}]c
n
= 0.
Mais de linclusion de la deuxime question on dduit que

1
P ( Sn )N converge dans R = 0.
n
1
Ce qui signifie que la suite de v.a.r. ( Sn )N ne converge pas presque-srement dans R.
n
1
1. Considrons lvnement A := {( Sn )N converge vers m}. Soit A, alors la suite
n
(Sn ())N converge vers + si m > 0 ou si m < 0. Par suite lensemble
{n N/Sn () I } est fini car lintervalle I est suppos born; ce qui signifie
que
c
lim sup{Sn I }
. On a donc linclusion dvnements A lim sup{Sn I } .

n
n

c
2. Il sagit de montrer que P lim sup{Sn I }
= 1. Daprs la loi forte des grands
n
1
nombres, lvnement A = {( Sn )N converge vers m} est de probabilit gale 1, cestn
-dire P(A) = 1. Ce qui donne, compte-tenu de linclusion dmontre en 1), le rsultat
cherch.
8.7
Corrigs des exercices du chapitre VII
Dans ce paragraphe, toutes les variables alatoires considres sont supposes dfinies sur un
mme espace de probabilit (, F, P).
1) Considrons pour k = 1, ..., N la v.a.r. Xk = 1 si la kime va dans la salle 1 et Xk = 0 sinon
(elle va alors dans la salle 2). La v.a.r. Xk est de loi de Bernoulli de paramtre 1/2. Comme
le choix des spectateurs est suppos indpendant, X1 , ..., XN sont des v.a.r. indpendantes. Le
nombre de spectateurs qui dsirent aller dans la salle 1 est donc S = SN = X1 + ... + XN qui
CT U
Besancon
197
est une v.a.r. B(N; 12 ). Lvnement "tous les spectateurs ne peuvent pas voir le film quils ont
choisi" se modlise par :
{S > n} {N S > n} = {S > n} {S < N n} .
On remarque que si N > 2n, on est sr quil y a au moins un spectateur qui ne verra pas son
film. Dans ce cas, P = 1. De mme, si N < n, on est sr que tous les spectateurs pourront
voir leur film. Dans ce cas, P = 0.
tudions le cas o n N 6 2n cest--dire 0 N n 6 n. Dans ce cas, {S > n} {S <
N n} = et donc P = P(S > n) + P(S 6 N n). Daprs le thorme central limite (N
est implicitement suppos grand), on a
! Z
1
S
x
1
2
e u /2 du .
lim P N 1 2 6 x =
N
2
2 N
Si on note T =
S
N
1
2
2 N
, cest une v.a.r. asymptotiquement de loi N (0,1) et donc
n N
P =P T > p 2
N/4
n N
= P |T | > p 2
N/4
!
N n N2
+P T < p
N/4
!

= 2 1 (2n N)/ N ,
o dsigne la fonction de rpartition de la loi N (0,1).
1000] > 0.95.

2) Si N = 1000 et si on veut P 6 0.01, il faut choisir n pour que [(2n1000)/
La lecture inverse de la table de N (0, 1) donne (2.58) ' 0.95 do (2n1000)/ 1000 > 2.58
et par suite il faut prendre n > 541.
La fonction de rpartition de n est 1l[n,[ pour tout n N. De plus lim 1l[n,[ (x) = 0 donc la
n
limite de la suite de fonctions de rpartition (1l[n,[ )nN est la fonction-nulle qui nest pas une
fonction de rpartition car elle ne vrifie pas lim F (x) = 1.
x
On a donc la convergence simple de la suite de fonction de rpartitions (Fn )nN mais la suite
(n )nN ne converge pas troitement vers une limite , sinon on aurait lim Fn (x) = F (x) = 0
n
pour tout point x de continuit de F et donc F = 0, ce qui est impossible.

On sait par le thorme de stabilit de la somme de variables de Poisson indpendantes, que la
loi de Sn est P(n). Remarquons alors que
e
k=n k
X
n
k=0
1
= P(Sn n) et {Sn n} = { (Sn n) 0}.
k!
n
Par suite,
e
k=n k
X
n
k=0
k!

=P

1
(Sn n) 0 .
n
CT U
Besancon
198

1
converge en loi
Le thorme-limite central permet daffirmer que la suite (Sn n)
n
n1
1
1
vers une variable Y de loi N 1 (0, 1). En particulier P( (Sn n) 0) tend vers P(Y 0) =
2
n
!
k=n
X nk
1
quand n tend vers +. On conclut donc que la suite e n
converge vers .
k!
2
k=0
n1

Soit X le nombre de transistors dfectueux dans un sachet de 100, X suit une loi B(100;0.01).
Lvnement "la garantie tombe en defaut" se modlise par {X > 3}. Comme le proposent les
commentaires qui suivent la proposition 7.14, page 132, on approxime la loi binomiale par la
loi de Poisson de paramtre 1 car on a n = 100 > 30, np = 100 0.01 < 10 et p 6 0.1. Do
P(X > 3) = 1 P(X 6 2) ' 1 P(P(1) 6 2) ' 1 0.92 ' 8% .
Pour tout N S, posons N := H(N, n, p). N est une probabilit discrte porte par
lensemble des entiers compris entre 0 et n. Daprs le critre de convergence des probabilits
discrtes, il suffit de montrer que, pour tout entier k compris entre 0 et n, la suite (N ({k}))NS
converge vers B(n, p)({k}) = Cnk p k q nk .
Soit k un entier compris entre 0 et n, aprs explicitation des coefficients binomiaux, on peut
crire
N ({k}) = Cnk
[(Np)(Np 1)...(Np k + 1)] [(Nq)(Nq 1)...(Nq n + k + 1)]

.
[N(N 1)...(N n + 1)]
Mais, pour N voisin de linfini,

[(Np)(Np 1)...(Np k + 1)] ,
[(Nq)(Nq 1)...(Nq n + k + 1)]
et
[N(N 1)...(N n + 1)]
sont respectivement quivalents (Np)k , (Nq)nk et N n . Par suite, pour N voisin de linfini,
N ({k}) est quivalent Cnk p k q nk , ce qui termine la dmonstration. Ce rsultat exprime
quune loi hypergomtrique peut tre approxime par une loi binomiale.
Pour tout n 1, on vrifie facilement que lapplication dfinie par

1 cos(2nx) si x [0, 1]
fn (x) :=
0
si x [0, 1]c
est une densit de probabilit. La fonction de rpartition Fn associe la probabilit de densit
fn est donne par
Z
0
si t ] , 0],
1
t 2n sin(2nt) si t ]0, 1],
Fn (t) =
fn (x)d(x) =
],t]
1
si t ]1, +[.
CT U
Besancon
199
La suite (Fn )n1 converge simplement vers la fonction F dfinie par F (t) := t1l[0,1[ (t) +
1l[1,+[ (t). F est la fonction de rpartition de la loi uniforme U([0, 1]) de densit f = 1l[0,1] . On
a donc une convergence troite des probabilits de densits fn vers la loi uniforme, mais la suite
des densits na de limite en aucun point de ]0, 1[.
Si (an )N et (n )N convergent respectivement vers les rels a et , alors (an )N et (n2 )N con2
vergent
t R, la suite (n (t))N =
vers les rels a et , et pour tout

respectivement
1 2 2
1 2 2
converge vers exp iat t . La suite des fonctions caracexp ian t t n
2
2
N

tristiques N 1 (an ,n2 ) N converge simplement vers la fonction caractristique de la probabilit
N 1 (a, 2 ). On conclut alors en utilisant le critre des fonctions caractristiques.
On obtient facilement, pour tout n 1, la fonction de rpartition Fn de n : Fn (t) =
t n 1l[0,1[ (t) + 1l[1,+[ (t). Cette suite de fonctions de rpartition converge simplement vers 1l[1,+[
qui est la fonction de rpartition de 1 . La suite (n )n1 converge donc troitement vers 1 . On
remarquera quune suite de probabilits absolument continues peut converger troitement vers
une probabilit discrte.
On sait que la fonction caractristique de la loi de Cauchy est dfinie par (t) = e |t| .
1
Pour tout n 1, la fonction caractristique de Sn est donne par
n

n
it
it
S
X
1 Sn (t) = E[e n n ] = E[e n 1 ] = e |t| n
n

du fait de lindpendance de la suite (Xn )n1 . Comme la suite e |t| n
n1
tend vers 1l{0} (t)
qui dfinit une application non continue en 0, c--d

quela limite des fonctions caractristiques
1
nest pas une fonction caractristique, la suite Sn
ne converge pas en loi et donc ne
n
n1
peut pas converger en probabilit.
1
Pour tout n 1, la fonction caractristique de Sn est donne par 1 Sn (t) = e |t| . La suite
n
n

1
Sn
converge donc en loi vers une v.a.r. de loi de Cauchy. Si cette suite convergeait en
n
n1

Sn S2n
probabilit, alors la suite
convergerait en probabilit vers 0 et donc convergerait

n
2n n1
Sn S2n
est donne par

en loi vers 0. Or la fonction caractristique de
n
2n
it
Sn S2n (t) = E[e 2n (X1 ++Xn (Xn+1 ++X2n )) ] = e |t|

n
2n
qui ne converge pas vers1R , fonction

caractristique de la v.a.r. constante 0, lorsque n tend

1
vers +. Donc la suite
Sn
ne converge pas en probabilit.
n
n1
CT U
Besancon
200
|t|
1
n
1
(t)
=
e
S
est
donne
par
qui
n
S
n
n2
n2
1
converge en + vers 1, fonction caractristique de la v.a.r. 0. La suite
Sn
converge
n2
n1
donc en loi vers 0 et daprs la premire question, elle converge aussi en probabilit vers 0.
Pour tout n 1, la fonction caractristique de

1. Pour tous t R, > 0, et n N,

|Xn +Yn (t) Xn (t)| = E e itXn (e itYn 1) E |e itYn 1|
Z
Z
itYn
=
|e
1|dP +
|e itYn 1|dP
{|Yn |>}
{|Yn |}
Z
|e itYn 1|dP.
2P(|Yn | > ) +
{|Yn |}
2. Remarquons que (Yn )N converge en loi vers la v.a.r. 0 si et seulement si (Yn )N converge
en probabilit vers la v.a.r. 0 (cf. exercice V-6). Soit > 0, il existe 0 > 0 tel que pour
|y | 0 on ait |e ity 1| . De plus la convergence de la suite (Yn )N en probabilit
vers 0 conduit lexistence de n0 N tel que pour n n0 , P(|Yn | > 0 ) et par
suite |Xn +Yn (t) Xn (t)| 3. La convergence en loi vers X de la suite (Xn )N entrane
lexistence dun entier n1 , que lon peut choisir plus grand que n0 , tel que, pour tout
n n1 , |Xn (t) X (t)| . On a montr que pour tout n n1 ,
|Xn +Yn (t) X (t)| |Xn +Yn (t) Xn (t)| + |Xn (t) X (t)| 4,
ce qui prouve la convergence en loi vers X de la suite (Xn + Yn )N .
3. Supposons que X soit une v.a.r. de loi symtrique , i.e. X a mme loi que X (par
exemple PX := 21 (1 + 1 ) ou PX := N 1 (0, 1)), et posons, pour tout n N, Xn := X .
Il est clair que la suite (Xn )N converge en loi vers X et que la suite (Xn X )N converge
en loi vers 2X 6= 0.
1. Un raisonnement par rcurrence montre facilement que, pour tout n N ,
Xn =
n
X
nk Uk .
k=1
La suite des v.a.r. (nk Uk )k=1, ,n est indpendante, car (Uk )N lest. De plus on vrifie
aisment que la loi de nk Uk est N 1 (0, 2n2k 2 ).
Xn est la somme de v.a.r. normales indpendantes centres, sa loi est donc la loi normale
centre de variance
P
2n
si || =
6 1, Var(Xn ) = nk=1 2n2k 2 = 1
2
12
si || = 1, Var(Xn ) = n 2 .
CT U
Besancon
201
2. Considrons la fonction caractristique de la v.a.r. Xn . Pour tout t R,

12n 2 2
si || =
6 1, Xn (t) = exp 12 t
si || = 1, Xn (t) = exp (n 2 t 2 ) .

1
2 2
Si || < 1, la suite (Xn (t))N converge, pour tout t R, vers exp
qui
t
2
1

1
2
est la valeur en t de la fonction caractristique de la loi N 1 0,
. Dans ce cas
1 2

1
la suite (Xk )N converge en loi vers une v.a.r. de loi N 1 0,
2 .
1 2
Si || = 1, la suite (Xn (t))N converge, pour tout t 6= 0, vers 0 et pour t = 0, vers 1. La
fonction limite ntant pas continue en 0, elle ne peut pas tre la fonction caractristique
dune probabilit. Dans ce cas la suite (Xk )N ne converge pas en loi.
Si || > 1, la suite (Xn (t))N converge, pour tout t R, vers 0. La fonction limite
ne prenant pas la valeur 1 en 0, elle ne peut pas tre la fonction caractristique dune
probabilit. Dans ce cas la suite (Xk )N ne converge pas en loi.
1. Supposons que la suite (Xn )N converge en loi vers X et considrons lapplication continue
borne f , > 0, dfinie par
f (t) := (x )1l],x[ (t) + t1l[x,x+[ (t) + (x + )1l[x+,+[ (t).
Comme E[f (Xn )] = f (xn ), pour tout n N, la suite (f (xn ))N converge vers f (x) = x. Il
existe un entier n0 tel que, pour tout entier n n0 ,, |f (xn ) x| < , par suite f (xn ) = xn
et |xn x| < . La suite (xn )N converge vers x.
Rciproquement si la suite (xn )N converge vers x alors, pour toute application f de R
dans R continue borne et tout n N, E[f (Xn )] = f (xn ). Comme E[f (X )] = f (x), on
en dduit que la suite (E[f (Xn )])N converge vers E[f (X )], do la convergence en loi de
la suite (Xn )N vers X .
2. Soit FX la fonction de rpartition de la v.a.r. X et FXn celle de Xn , n N. Par hypothse,
en dehors de lensemble D des points de discontinuit de F , la suite (Fn )N converge
simplement vers FX . Comme, pour tous n N et t 6 D, FXn (t) = 1l[xn ,+[ (t), il vient
FX (t) {0, 1}. On peut alors utiliser le rsultat de lexercice 3.23, page 60, puisque
D := Dc est partout dense comme complmentaire dun ensemble dnombrable dans
R (cf. proposition 7.8, page 129). Donc il existe x R tel que PX = x et daprs la
question prcdente on peut ajouter que la suite (xn )N converge vers x.
2
On rappelle que
la f.c. de la probabilit de Gauss N 1 (a, ) est lapplication dfinie sur R par
1
(t) = exp iat t 2 2 .
2
CT U
Besancon
202

1. (a) Montrons que la suite (n2 )N est borne.
Raisonnons par labsurde et supposons que la suite de rels positifs (n2 )N nest
pas borne. Il existe alors une suite (n2k )kN extraite de la prcdente convergeant
vers +. Comme la suite (n )N converge troitement vers , daprs le critre des
fonctions caractristiques, la f.c. de est la limite simple sur R de la suite de
f.c. (n )N . En considrant la suite des modules de ces f.c. on obtient, pour tout
t R,

1 2 2
| (t)| = lim | exp(ian t)| exp t n
n
2

1 2 2
1 2 2
= lim exp t n = lim exp t nk .
n
k
2
2
Par suite, | (0)| = 1 et si t 6= 0, | (t)| = 0. La f.c. nest donc pas continue
en 0, ce qui contredit la proprit de continuit sur R des f.c. et prouve ainsi que la
suite (n2 )N est borne.
Montrons que la suite (n2 )N est convergente.
La suite (n2 )N est borne, donc il existe M > 0 tel que, pour tout n N, n2 [0, M].
Comme [0, M] est un compact, la suite (n2 )N admet au moins une valeur dadhrence
2 dans [0, M]. Si (n2 )N admet une autre valeur dadhrence 2 dans [0, M], alors
2
2 (resp. 2 ) est limite de la suite (m
)
(resp. (n2k )kN ) extraite de (n2 )N . Par
k kN
un raisonnement dj effectu, il vient, pour tout t R,

1 2 2
1 2 2
| (t)| = lim exp t nk = exp t
k
2
2

1 2 2
1 2 2
= lim exp t mk = exp t ,
k
2
2
ce qui implique que 2 = 2 . Cela montre que 2 est la seule valeur dadhrence de
la suite (n2 )N dans le compact [0, M], do
lim inf (n2 ) = lim sup(n2 ) = lim(n2 ) = 2 .
n
(b) Considrons, pour tout n N, la f.c. n de an . On peut crire, pour tout t R,

1 2 2
t
n (t) = exp(ian t) = n (t) exp
2 n

1 2 2
et par passage la limite (t) := lim n (t) = (t) exp
t . Lapplication
n
2
ainsi dfinie est continue en 0 et limite simple dune suite de f.c.. Daprs le thorme
de continuit de Lvy, il existe une probabilit sur R dont est la f.c. et la suite
(an )N converge troitement vers . Par suite, si on note C lensemble des rels o
la fonction de rpartition de est continue, pour tout t C , F (t) = lim Fan (t).
n
On en dduit que, pour tout t C , F (t) {0, 1}, mais C est une partie partout
dense de R, ce qui implique que est la mesure de Dirac en un point a R. On
conclut alors que la suite (an )N converge dans R vers le rel a.
Revenant la fonction caractristique de , on peut crire, pour tout t R,

1 2 2
1 2 2
(t) = lim exp ian t t n = exp iat t ,
n
2
2
CT U
Besancon
Annexe . Corrigs des exercices
203
ce qui, avec la convention adopte, prouve que = N 1 (a, 2 ).
CT U
Besancon
204
CT U
Besancon
Annexe A. Formulaire
205
Annexe A
Formulaire
Ce formulaire sera fourni avec les sujets lors des preuves terminales.
A.1
Rappels de notations
On rappelle les conventions et notations suivantes :

n!
1. Pour tous entiers relatifs k et n, Cnk :=
si 0 k n, et Cnk := 0 sinon.
k!(n k)!
2. Lcriture := signifie que est une densit de probabilit dfinie sur R par (x)
et que est la probabilit sur R dfinie par cette densit .
3. dsigne la mesure de Lebesgue sur R.
Z +
4. Pour tout rel a > 0, (a) :=

e x x a1 dx. En particulier, (1/2) = et, pour
0
tout entier n 1, (n) = (n 1)! .

Pour chaque probabilit de la liste, on trouvera :
1. son nom, sa notation, sa dfinition ;
2. sa fonction de rpartition F dfinie sur R par F (x) := (] , x]) ;
Z
3. sa fonction caractristique dfinie sur R par (t) :=
e itx d(x) (sauf pour la
R
probabilit hypergomtrique) ;
Z
4. son esprance (moment dordre 1) m :=

xd(x) et sa variance (moment centr dordre
R
Z
2) 2 := (x m)2 d(x), si ces moments existent.
R
A.2
Quelques relations connatre en probabilits
Somme dune srie gomtrique et ses drives terme terme

Pour tout rel 0 < x < 1,
+
X
1
xk =
1x
k=0
CT U
Besancon
206

+
X
kx k1 =
k=1
+
X
1
(1 x)2
k(k 1)x k2 =
k=2
2
(1 x)3
et de faon plus gnrale, pour tout entier naturel p 1,

+
X
k(k 1)(k 2) (k p + 1)x kp =
k=p
p!
.
(1 x)p+1
Somme de la srie exponentielle nprienne

Pour tout rel x,
+ k
X
x
= ex
k!
k=0
Intgrale de Gauss
Z
1 2
e 2 t dt =
Formule du binme de Newton

Pour tous rels a, b, et tout entier naturel n,
n
(a + b) =
k=n
X
Cnk ak b nk
k=0
Relation de Vandermonde
Pour tous entiers naturels n, m, et N tels que 0 N n + m,
k=N
X
N
Cnk CmNk = Cn+m
k=0
Relation de Pascal
Pour tous entiers naturels n, k tels que 0 k n,
k
Cn+1
= Cnk + Cnk1
Deux autres relations utiles

Pour tous entiers naturels n, p tels que 0 p n,
p1
pCnp = nCn1
k=n+p
n+1
Ckn = Cn+p+1
k=n
CT U
Besancon
A.3
207
Probabilits usuelles discrtes
1. Dirac : a , a R
F (x) = 1l[a,+[ (x) et (t) = e ita
m = a et 2 = 0
2. Bernoulli : B(p) := p1 + (1 p)0 , p ]0, 1[
F (x) = (1 p)1l[0,1[ (x) + 1l[1,+[ (x) et (t) = 1 p + pe it
m = p et 2 = p(1 p)
3. Bernoulli-symtrique : B s (p) := (1 p)1 + p1 , p ]0, 1[
F (x) = (1 p)1l[1,1[ (x) + 1l[1,+[ (x) et (t) = (1 p)e it + pe it
m = 2p 1 et 2 = 4p(1 p)
k=n
X
Cnk p k (1 p)nk k , p ]0, 1[ et n N
4. Binomiale : B(n, p) :=
k=0
F (x) =
k=n
X
Cnk p k (1 p)nk 1l[k,+[ (x) et (t) = (1 p + pe it )n
k=0
m = np et 2 = np(1 p)
5. Binomiale-ngative : I(r , p) :=
r 1
r
k
Ck+r
1 p (1 p) k , p ]0, 1[ et r N
k0
F (x) =
+
X
r 1
r
Ck+r
1 p (1
p) 1l[k,+[ (x) et (t) =
k=0
p
1 (1 p)e it
r
r (1 p)
r (1 p)
et 2 =
p
p2
+
X
6. Gomtrique : G(p) :=
p(1 p)k1 k , p ]0, 1[
m=
k=1
F (x) =
+
X
k1
p(1 p)
k=1
m=
pe it
1l[k,+[ (x) et (t) =
1 (1 p)e it
1
1p
et 2 =
p
p2
7. Hypergomtrique : H(n1 , n2 , n) :=
k=n
X
Cnk Cnnk
1
k=0
k=0
avec n n1 + n2
F (x) =
k=n
X
Cnk Cnnk
Cnn1 +n2
Cnn1 +n2
k , n N , n1 N et n2 N
1l[k,+[ (x)
CT U
Besancon
208

n1 n2 (n1 + n2 n)
nn1
et 2 = n
n1 + n2
(n1 + n2 )2 (n1 + n2 1)
+
X
k
8. Poisson : P() :=
e k , > 0
k!
k=0
m=
F (x) =
+
X
k=0

k
1l[k,+[ (x) et (t) = exp (e it 1)
k!
m = et 2 =
k=n
1X
9. Uniforme-discrte : U(n) :=
k , n N
n k=1
k=n
k=n
1X
1 X itk
F (x) =
1l[k,+[ (x) et (t) =
e
n k=1
n k=1
m=
A.4
n+1
n2 1
et 2 =
2
12
Probabilits usuelles densit
1. Uniforme-continue : U([a, b]) := , a, b R avec a < b et

1
(x) :=
1l]a,b[ (x)
ba
e itb e ita
x a
1l[a,b[ (x) + 1l[b,+[ (x) et (t) =
F (x) =
ba
it(b a)
m=
a+b
(b a)2
et 2 =
2
12
2. Gamma : (a, ) := , a > 0 et > 0 avec (x) :=

x
a x a1 x
e 1l]0,+[ (x)
(a)
a

a t a1
F (x) =
e t 1l]0,+[ (t)dt et (t) =
it
(a)
a
a
m = et 2 = 2
3. Exponentielle : E() := (1, ) = , > 0 avec (x) := e x 1l]0,+[ (x)

Z
F (x) = (1 e x )1l[0,+[ (x) et (t) =

m=
it
1
1
et 2 = 2
n 1
x 2 1 x
n e 2 1l]0,+[ (x)
4. Khi-deux : (n) := ( , ) = , n N avec (x) :=
2 2
n2 2 2

n2
Z x
1
F (x) =
(t)dt et (t) =
1 2it
m = n et 2 = 2n
CT U
Besancon
a
5. Cauchy : C(a) := , a > 0 avec (x) :=
2
(a + x 2 )
x i
1 h
+ arctan
et (t) = e a|t|
F (x) =
2
a
209
Les moments m et 2 nexistent pas

6. Normale ou Gauss-Laplace : N 1 (a, b) := , a R et b > 0 avec (x) :=
(xa)2
1
e 2b
2b

Z x
(ua)2
bt 2
1
2b
e
du et (t) = exp iat
F (x) =
2
2b
m = a et 2 = b
7. Normale d-dimensionnelle : N d (m, D) := d , o d N , m Rd , D matrice carre dordre d coefficients
rels, symtrique, inversible, de type positif, et

1
1
(x) := p
exp (x m) D 1 (x m) , o x Rd ;
d
2
(2) det(D)

1
X (u) = exp iu m u Du , o u Rd et lopration dsigne la transposition ;
2
m est le vecteur-esprance et D la matrice de dispersion de N d (m, D)
CT U
Besancon
210
CT U
Besancon
Annexe B. Table de la loi normale standard
211
Annexe B
Table de la loi normale

standard
Dans ce cours nous nutiliserons que la table de la fonction de rpartition de la loi normale
standard appele aussi loi normale centre-rduite ou loi de Gauss-Laplace standard.
Cette table, qui est reproduite la fin de lannexe, sera fournie, sans les explications dutilisation,
avec les sujets lors des preuves terminales.
B.1
Calculs avec des v.a.r. normales centres-rduites
Voici quelques exemples dutilisation de la table de la loi normale standard.

Tout calcul numrique de probabilit avec une variable alatoire X normale standard se ramne
dterminer la valeur dexpressions de la forme P(a < X < b) ou P(X < b) ou P(a < X ).
Les ingalits pouvant tre strictes ou larges, cela ne change rien aux calculs car la fonction de
rpartition de la loi normale standard est continue sur R.
La table de la loi normale standard reproduite donne les valeurs, connaissant le rel t positif,
des expressions P(X < t). On peut toujours se ramener ces cas moyennant les relations
1. Si t est une rel positif, P(X < t) est donn par la table.
2. Si t est une rel positif, P(X > t) = 1 P(X < t).
3. Si t est une rel strictement ngatif, P(X < t) = 1 P(X < t).
4. Si t est une rel strictement ngatif, P(X > t) = P(X < t).
Pour lire dans la table la valeur de P(X < t) pour t positif, par exemple pour t = 2, 37, on
procde de la faon suivante. On remarque que 2, 37 = 2, 3 + 0, 07. La valeur de P(X < 2, 37)
est lue lintersection de la ligne horizontale 2, 3 (valeur lue dans la premire colonne de la
table) et de la colonne verticale 0, 07 (valeur lue dans la premire ligne de la table). On trouve
P(X < 2, 37) = 0, 9911.
On peut remarquer que la table ne donne des valeurs de P(X < t) que pour 0 < t < 3. Cela
est d au fait que pour les valeurs suprieures 3, P(X < t) 1 et par suite P(X > t) 0.
Toutefois la table donne les valeurs de P(X < t) pour t prenant des valeurs entre 3 et 4, 5 avec
cinq dcimales (tables des grandes valeurs pour t situe au bas de la page).
CT U
Besancon
212
B.2
Calculs avec des v.a.r. normales de paramtres

quelconques
Pour ce qui est du calcul de probabilit dans le cas de v.a.r. normales quelconques, on rappelle
la proposition suivante, qui est une rcriture avec le langage des v.a.r. de la proposition 2.9,
page 26 :
Proposition B.1.
Procd de standardisation
Une v.a.r. X est normale desprance m et de variance 2 > 0 si, et seulement, si la v.a.r.
X m
est une v.a.r. normale centre-rduite.
Z :=
Comme, pour tout rel a et b avec a < b,

{a < X < b} = {
on a
P(a < X < b) = P
am
bm
<Z <
},
!
bm
am
<Z <
.
Ainsi tout vnement faisant intervenir dans sa formulation une v.a.r. X normale desprance m
X m
et de variance 2 > 0 peut donc tre exprim avec la v.a.r. Z :=
de loi normale centre
rduite. Le procd de standardisation permet de ramener tout calcul de probabilit relatif
une loi normale quelconque un calcul de probabilit relatif la loi normale centre-rduite, et
donc lutilisation uniquement de la table statistique de la loi normale centre-rduite.
CT U
Besancon
Annexe B. Table de la loi normale standard
213
Fonction de rpartition de la loi normale centre-rduite ou standard

(Pour tout u > 0, la table donne la probabilit que la v.a. prenne une valeur infrieure u>0)
u
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
0
0,5000
0,5398
0,5793
0,6179
0,6554
0,6915
0,7257
0,7580
0,7881
0,8159
0,8413
0,8643
0,8849
0,9032
0,9192
0,9332
0,9452
0,9554
0,9641
0,9713
0,9772
0,9821
0,9861
0,9893
0,9918
0,9938
0,9953
0,9965
0,9974
0,9981
0,01
0,5040
0,5438
0,5832
0,6217
0,6591
0,6950
0,7291
0,7611
0,7910
0,8186
0,8438
0,8665
0,8869
0,9049
0,9207
0,9345
0,9463
0,9564
0,9649
0,9719
0,9778
0,9826
0,9864
0,9896
0,9920
0,9940
0,9955
0,9966
0,9975
0,9982
0,02
0,5080
0,5478
0,5871
0,6255
0,6628
0,6985
0,7324
0,7642
0,7939
0,8212
0,8461
0,8686
0,8888
0,9066
0,9222
0,9357
0,9474
0,9573
0,9656
0,9726
0,9783
0,9830
0,9868
0,9898
0,9922
0,9941
0,9956
0,9967
0,9976
0,9982
0,03
0,5120
0,5517
0,5910
0,6293
0,6664
0,7019
0,7357
0,7673
0,7967
0,8238
0,8485
0,8708
0,8907
0,9082
0,9236
0,9370
0,9484
0,9582
0,9664
0,9732
0,9788
0,9834
0,9871
0,9901
0,9925
0,9943
0,9957
0,9968
0,9977
0,9983
0,04
0,5160
0,5557
0,5948
0,6331
0,6700
0,7054
0,7389
0,7704
0,7995
0,8264
0,8508
0,8729
0,8925
0,9099
0,9251
0,9382
0,9495
0,9591
0,9671
0,9738
0,9793
0,9838
0,9875
0,9904
0,9927
0,9945
0,9959
0,9969
0,9977
0,9984
0,05
0,5199
0,5596
0,5987
0,6368
0,6736
0,7088
0,7422
0,7734
0,8023
0,8289
0,8531
0,8749
0,8944
0,9115
0,9265
0,9394
0,9505
0,9599
0,9678
0,9744
0,9798
0,9842
0,9878
0,9906
0,9929
0,9946
0,9960
0,9970
0,9978
0,9984
0,06
0,5239
0,5636
0,6026
0,6406
0,6772
0,7123
0,7454
0,7764
0,8051
0,8315
0,8554
0,8770
0,8962
0,9131
0,9279
0,9406
0,9515
0,9608
0,9686
0,9750
0,9803
0,9846
0,9881
0,9909
0,9931
0,9948
0,9961
0,9971
0,9979
0,9985
0,07
0,5279
0,5675
0,6064
0,6443
0,6808
0,7157
0,7486
0,7794
0,8078
0,8340
0,8577
0,8790
0,8980
0,9147
0,9292
0,9418
0,9525
0,9616
0,9693
0,9756
0,9808
0,9850
0,9884
0,9911
0,9932
0,9949
0,9962
0,9972
0,9979
0,9985
0,08
0,5319
0,5714
0,6103
0,6480
0,6844
0,7190
0,7517
0,7823
0,8106
0,8365
0,8599
0,8810
0,8997
0,9162
0,9306
0,9429
0,9535
0,9625
0,9699
0,9761
0,9812
0,9854
0,9887
0,9913
0,9934
0,9951
0,9963
0,9973
0,9980
0,9986
0,09
0,5359
0,5753
0,6141
0,6517
0,6879
0,7224
0,7549
0,7852
0,8133
0,8389
0,8621
0,8830
0,9015
0,9177
0,9319
0,9441
0,9545
0,9633
0,9706
0,9767
0,9817
0,9857
0,9890
0,9916
0,9936
0,9952
0,9964
0,9974
0,9981
0,9986
Table pour les grandes valeurs de u

u
F(u)
3
0,99865
3,1
0,99903
3,2
0,99931
3,3
0,99952
3,4
0,99966
3,5
0,99977
4
0,99997
4,5
0,999997
CT U
Besancon
214
CT U
Besancon
Annexe C. Devoirs envoyer la correction
215
Annexe C
Devoirs envoyer la
correction
Les trois devoirs ci-dessous sont renvoyer pour leur correction, au plus tard la date indique,
ladresse suivante :
Bruno Saussereau,
Laboratoire de Mathmatiques de Besanon,
UFR Sciences et Techniques,
16, route de Gray,
25030 Besanon cedex, FRANCE
Le but premier dun devoir est de montrer au correcteur que vous avez compris le cours, que
vous connaissez les rsultats vus en cours et les hypothses qui les commandent, et que vous
savez les mobiliser pour rpondre une question ou dmontrer un rsultat nouveau. Il est donc
recommander de tout mettre en oeuvre pour atteindre cet objectif.
En particulier :
Un devoir de mathmatiques est un devoir de franais qui traite de mathmatiques, cest
donc avant tout un texte de franais. Il doit donc tre rdige de faon correcte en franais.
Les hypothses spcifiques justifiant lutilisation de chaque thorme doivent tre correctement
explicites et le rsultat du cours utilis doit tre clairement identifi voire explicitement nonc.
Les rsultats intermdiaires et les conclusions obtenues doivent tre mis en vidence. Les
notations utilises ou introduites, surtout si elles sont nouvelles par rapport au cours, doivent
tre clairement annonces. La rdaction du cours peut tre considre comme un guide de
rdaction dun texte mathmatique.
CT U
Besancon
216
C.1
Devoir 1 renvoyer le 21 fvrier 2014 au plus tard
La rdaction et la prsentation de la copie, la justification des affirmations par rfrence aux

rsultats du cours seront des lments dapprciation essentiels dans la notation.
Exercice I
Soit X une variable alatoire normale centre rduite. Prciser, dans chacun des cas ci-dessous,
la loi de probabilit de la variable alatoire Y dfinie en fonction de X
1. Y = X 3 .
2. Y = F (X ) o F est la fonction de rpartition de la variable X .
Exercice II
Soit X une v.a.r. normale de loi N (m, 2 ), o m et sont des rels avec > 0.
1. Montrer que la fonction caractristique de X peut sexprimer laide de la fonction
caractristique de la loi de Gauss-Laplace standard N (0, 1).
Z
2. En utilisant le thorme de drivation sous le signe , montrer que est une solution
particulire de lquation diffrentielle du premier ordre y 0 (t) + ty (t) = 0. En dduire
lexpression analytique de la fonction , puis celle de la fonction caractristique de la
variable X .
Exercice III
Soit (Xk )kN une suite indpendante de v.a.r. de Bernoulli toutes de mme paramtre 0 < p <
1. Soit un entier r 1, on dfinit deux nouvelles v.a.r. , en posant pour tout ,
r () := inf{n N /X1 () + X2 () + ... + Xn () = r }
et
r () := inf{n N /X1 () + X2 () + ... + Xn+r () = r }
avec la convention inf := +.
1. Montrer, pour tout x ]0, 1[, la relation
+
X
Ckr 1 x kr +1 =
k=r 1
1
.
(1 x)r
2. Montrer que la variable alatoire relle r est une variable alatoire relle discrte de loi
(dite loi de Pascal de paramtres r et p )
P(r , p) :=
+
X
r 1 r
Ck1
p (1 p)kr k .
k=r
CT U
Besancon
217
3. Montrer que la variable alatoire relle r est une variable alatoire relle discrte de loi
(dite loi binomiale-ngative de paramtres r et p )
I(r , p) :=
+
X
r 1
r
k
Ck+r
1 p (1 p) k .
k=0

4. Donner une interprtation des variables alatoires relles r et r en terme de jeu de
Pile-ou-Face.
5. Montrer quun des deux modles prcdents permet de formaliser le problme dit des
botes dallumettes de Stephan Banach :
Un fumeur a dans chacune de ses deux poches une bote contenant au dpart N
allumettes. Chaque fois quil dsire fumer une cigarette, il choisit une poche au hasard.
Quelle est la probabilit que, le fumeur se rendant compte pour la premire fois quune
bote est vide, lautre bote contienne k allumettes o k est un entier naturel infrieur ou
gal N ?
Exercice IV
Le but de cet exercice est de montrer quil nexiste pas de probabilit P sur lespace (N , P(N )
1
telle que, pour tout n 1, P(nN ) = o nN = {nk, k N }.
n
Supposons quune telle probabilit existe. Soit (pk )N la suite des nombres entiers premiers rangs
en ordre croissant.
1. Par un raisonnement simple montrer que P(lim sup(pk N )) = 0.
k
2. Montrer que la suite (pk N )N est indpendante. En dduire, en utilisant le fait que la
X 1
srie
= +, une autre valeur de P(lim sup(pk N )). Conclure que la probabilit P
p
k
k
k
nexiste pas.
CT U
Besancon
218
C.2
Devoir 2 renvoyer le 28 mars 2014 au plus tard

Exercice I

1
2
2
Soit (X , Y ) un couple de variables alatoires relles de loi P(X ,Y ) = e 2 (x xy +y ) (2) o
(2) est la mesure de Lebesgue sur R2 . Dterminer la constante et la matrice de dispersion
du couple (X , Y ). Prciser les lois respectives des variables alatoires relles X et Y . Le couple
de variables alatoires relles (X , Y ) est-il indpendant ?
Exercice II
Thorme de Fisher-Cochran
Soit n N et (X1 , , Xn ) une suite indpendante de v.a.r. toutes de mme loi N 1 (0, 1).
On dfinit respectivement les v.a.r. moyenne empirique et variance empirique par
n
X1 + + Xn
1 X
(Xk X )2 .
X :=
et S 2 :=
n
n 1 k=1
1. Montrer que la v.a.r. X12 suit la loi ( 12 , 12 ) aussi appele loi du Khi-deux 1 degr de
libert et note 2 (1).
2. En utilisant la fonction caractristique des lois Gamma, en dduire que la loi de la v.a.r.
n
X
Xk2 est ( 12 , n2 ) aussi appele loi du Khi-deux n degrs de libert note 2 (n).
k=1
3. Montrer quil existe une matrice orthogonale C
c1,1
c1,2
c2,1
c2,2
..
..
C = .
.
cn1,1 cn1,2
1
n
1
n
de la forme
..
.
c1,n
c2,n
..
.
cn1,n
1
n
4. Dterminer la loi du vecteur alatoire Y := C X .

n
X
1
5. Calculer Yn et
Yk2 laide de X1 , , Xn . En dduire que X = Yn et S 2 =
n
k=1
n1
1 X 2
Y .
n 1 k=1 k
6. Dmontrer le thorme de Fisher-Cochran : Soit (X1 , , Xn ) une suite indpendante
de v.a.r. de mme loi N 1 (0, 1). Alors (X , S 2 ) est indpendant, X suit la loi N 1 (0, n1 ) et
(n 1)S 2 suit la loi 2 (n 1).
Exercice III
CT U
Besancon
219
Soit (i )i1 une suite indpendante de v.a.r. de mme loi N 1 (0, 1) et X0 une v.a.r. indpendante de la suite (i )i1 et de loi PX0 = N 1 (m, 2 ). On dfinit la suite de v.a.r. (Xn )n1 de
la faon suivante : Xn := ln (X0 , . . . , Xn1 ) + bn n o (bn )n1 est une suite de rels et (ln )n1
une suite de formes linaires sur Rn . Montrer que, pour tout n 1, il existe une forme linaire
Ln sur Rn+1 telle que Xn = Ln (X0 , 1 , , n ) et en dduire que le vecteur (X0 , . . . , Xn ) est
gaussien.
CT U
Besancon
220
C.3
Devoir 3 renvoyer le 18 avril 2014 au plus tard

Exercice I
Thorme de Weierstrass
Soient f une application continue de [0, 1] dans R et x [0, 1]. Pour tout n N , notons Sn
une v.a.r. binomiale de loi B(n, x).
1. Montrer que pn (x) := E[f ( n1 Sn )] est un polynme en x appel polynme de Bernstein
de f .
2. En utilisant luniforme continuit de f sur [0, 1] montrer que, pour tout > 0, il existe
> 0 tel que, pour tout n N et tout x [0, 1],
1
|pn (x) f (x)| E[|f ( Sn ) f (x)|]
n

1
1
P | Sn x| < + 2P | Sn x| sup |f (x)|.
n
n
0x1
En dduire que, pour tout > 0, il existe > 0 tel que, pour tout n N et tout
x [0, 1],
x(1 x)
sup |f (x)|.
|pn (x) f (x)| + 2
n 2 0x1
3. Dmontrer le thorme de Weierstrass : Toute application continue de [0, 1] dans R
est limite uniforme sur [0, 1] dune suite de polynmes.
Exercice II
Soit (Xn )n1 une suite indpendante de v.a.r. de mme loi de Cauchy C(1) (Pour la dfinition,
k=n
X
cf. formulaire de lannexe A, page 205). Pour tout n 1, on pose Sn :=
Xk . tudier les con

k=1

1
1
1
vergences en probabilit et en loi des suites de v.a.r. Sn
,
Sn
et
Sn
.
n
n2
n
n1
n1
n1
Exercice III
Soit (Uk )N une suite indpendante de v.a.r. de loi normale centre et de variance 2 > 0. Pour
tout R, on dfinit la suite (Xk )N par la relation de rcurrence Xn = Xn1 + Un , pour tout
n 1, avec X0 = 0.
1. Dterminer, pour tout n N, la loi de la v.a.r. Xn .
2. tudier la convergence en loi de la suite de v.a.r. (Xk )N .
CT U
Besancon
Bibliographie.
[1] Lelong-Ferrand J. - Arnaudis J.M., Cours de mathmatiques, Dunod, 1977.
[2] Ansel J.P.- Ducel Y., Exercices corrigs en thorie de la mesure et de lintgration, Ellipses,
1995.
[3] Ansel J.P.- Ducel Y., Exercices corrigs en thorie des probabilits, Ellipses, 1996.
[4] Bouleau N., Probabilits de lingnieur : variables alatoires et simulation, Hermann, 1986.
[5] Brmaud P., Introduction aux probabilits : modlisation des phnomnes alatoires,
Springer-Verlag, 1988.
[6] Commission inter-IREM "Statistique et Probabilits" (coordination M. Henry), Autour
de la modlisation en probabilits, Presses universitaires de Franche-Comt, collection
"Didactiques", Besanon, 2001
[7] Ducel Y., Introduction la thorie mathmatique des probabilits, Ellipses, 1998.
[8] Gramain A., Intgration, Hermann, coll. Mthodes, 1994.
[9] Guinot M., Le paradoxe de Banach-Tarski, Alas, 1991.
[10] Hennequin P.L., Pourquoi des tribus ?, Bulletin APMEP n 303, pp 183-195.
[11] Leboeuf C.- Roque J.L.- Guegand J., Cours de probabilits et de statistiques, Ellipses,
2me dition 1983.
[12] Leboeuf C.- Roque J.L.- Guegand J., Exercices corrigs de probabilits, Ellipses, 1987.
[13] Revuz D., Mesure et intgration, Hermann, coll. Mthodes, 1994.
[14] Stoyanov J., Counterexamples in probability, John Wiley and Sons, 1989.

Zazaazz

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Zazaazz

Transféré par

Droits d'auteur :

Formats disponibles

Cours de thorie des

Licence de mathmatiques, 3i`eme anne

Anne universitaire 2013-2014

Saussereau, Laboratoire de Mathmatiques de Besanon, UFR Sciences & Techniques, 16,

Thorie des probabilits, Bruno Saussereau, 2013-2014, version 10/01/2014

C entre de Tele-enseignement U niversitaireFranche-ComteBesancon

Thorie des probabilits, Bruno Saussereau, 2013-2014, version 10/01/2014

C entre de Tele-enseignement U niversitaireFranche-ComteBesancon

Besanon, le 10 janvier 2014,

C entre de Tele-enseignement U niversitaireFranche-ComteBesancon

Thorie des probabilits, Bruno Saussereau, 2013-2014, version 10/01/2014

C entre de Tele-enseignement U niversitaireFranche-ComteBesancon

Table des matires.

2 Loi dun vecteur alatoire

3 Moments dun vecteur alatoire

Thorie des probabilits, Bruno Saussereau, 2013-2014, version 10/01/2014

5 Vecteurs alatoires gaussiens

7 Thorme-limite central et convergence de lois

8 Corrigs des exercices

C entre de Tele-enseignement U niversitaireFranche-ComteBesancon

Table des matires.

B Table de la loi normale standard

C entre de Tele-enseignement U niversitaireFranche-ComteBesancon

Thorie des probabilits, Bruno Saussereau, 2013-2014, version 10/01/2014

C entre de Tele-enseignement U niversitaireFranche-ComteBesancon

C entre de Tele-enseignement U niversitaireFranche-ComteBesancon

Thorie des probabilits, Bruno Saussereau, 2013-2014, version 10/01/2014

C entre de Tele-enseignement U niversitaireFranche-ComteBesancon

Chapitre 1. Modles probabilistes

Certaines dfinitions et notations de la thorie lmentaire des ensembles seront constamment

Thorie des probabilits, Bruno Saussereau, 2013-2014, version 10/01/2014

au moins un indice k I , x Ak . De mme,

Exercice 1.3. (Corrig de lexercice : page 146)

C entre de Tele-enseignement U niversitaireFranche-ComteBesancon

Chapitre 1. Modles probabilistes

Tribu sur un ensemble

Exercice 1.5. (Corrig de lexercice : page 147)

Thorie des probabilits, Bruno Saussereau, 2013-2014, version 10/01/2014

Dmonstration : = E c , on conclut par les axiomes 1 et 2 de la dfinition des tribus.

On utilise alors le rsultat prcdent et laxiome 2. 2

C entre de Tele-enseignement U niversitaireFranche-ComteBesancon

Chapitre 1. Modles probabilistes

Thorie des probabilits, Bruno Saussereau, 2013-2014, version 10/01/2014

On notera que si toute runion dnombrable ou intersection dnombrable dintervalles de R est

Le triplet (E , A, ) sappelle un espace mesur.

C entre de Tele-enseignement U niversitaireFranche-ComteBesancon

Chapitre 1. Modles probabilistes

1. est simplement-additive sur N, i.e.!pour toute suite finie A1 , , An de parties de

2. nest pas -additive sur N.

-additivit de la mesure de Lebesgue.

C entre de Tele-enseignement U niversitaireFranche-ComteBesancon

Thorie des probabilits, Bruno Saussereau, 2013-2014, version 10/01/2014

est une mesure sur (E , A) note

Dmonstration : On vrifie aisment que () = 0. La -additivit de dcoule immdiatement

k k est une probabilit sur (E , A).

C entre de Tele-enseignement U niversitaireFranche-ComteBesancon

Chapitre 1. Modles probabilistes

1. la probabilit binomiale de paramtres n et p :

2. la probabilit de Poisson de paramtre :

3. la probabilit gomtrique de paramtre p :

4. la probabilit uniforme-discrte de paramtre n ou quiprobabilit sur {1, 2, , n}

Exercice 1.13. (Corrig de lexercice : page 149)

de vecteurs de Rd et F dsigne lensemble des an Rd pour lesquels pn > 0.