Académique Documents
Professionnel Documents
Culture Documents
Zazaazz
Zazaazz
probabilits
avec exercices corrigs et devoirs
Prsentation du cours
Prsentation du cours
Ce cours correspond lunit denseignement de thorie des probabilits dispense dans le cadre
du semestre 5 de lenseignement distance de la Licence de Mathmatiques.
La diffusion de ce cours est strictement limite aux tudiants rgulirement inscrits lunit
denseignement correspondante du Centre de Tl-enseignement Universitaire.
Public vis
Cet enseignement par correspondance sadresse en priorit aux tudiants dsireux de poursuivre
des tudes de Master en vue de la recherche, de passer le concours de lagrgation externe de
mathmatiques ou ceux qui se destinent des tudes de mathmatiques appliques en vue
de devenir ingnieurs-mathmaticiens.
Pr-requis et rvisions
Ce cours ne suppose aucun pr-requis sur le formalisme des probabilits. Tout le formalisme et
le vocabulaire des probabilits est dfini et introduit au fur et mesure des besoins. Il suppose
juste une sensibilisation aux phnomnes alatoires et leur tude lmentaire telle quelle est
enseigne depuis quelques annes au lyce et dans le semestre 4 de la Licence. Pour une rapide
mise niveau sur lapproche lmentaire des probabilits on peut se reporter aux deux ouvrages
classiques [11] et [12]. Certains des exercices proposs dans cette unit sont inspirs de ces
deux ouvrages moyennant quelques adaptations de vocabulaire dues au formalisme introduit
dans le cours.
En revanche ce cours suppose connus les concepts classiques de la thorie de la mesure et
de lintgration, dite intgrale de Lebesgue. Ces concepts seront souvent rappels dans ce
cours de faon rendre sa lecture autonome. Ces rsultats seront noncs sous leur version la
plus utile pour les applications en probabilits, ils seront admis et ne feront donc pas lobjet
dune dmonstration sauf cas particuliers. Pour leur version gnrale et leurs dmonstrations,
on pourra se reporter louvrage [8].
Outre ces rsultats spcifiques, le cours ncessitera la connaissance de rsultats et de techniques
classiques de mathmatiques gnrales. Cest donc loccasion, ds maintenant, de rviser
galement ces notions mathmatiques indispensables qui seront supposes connues. A cet
effet, on pourra se reporter un cours classique de mathmatiques gnrales, par exemple
[1], largement suffisant pour revoir ces notions. Il sagit en particulier de bien connatre
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
ii
Conseils de travail
Le cours proprement dit comprendra des dfinitions, des propositions (thormes, lemmes,
formules, ...), des dmonstrations, des exemples et des exercices corrigs. Les dmonstrations
doivent tre connues, elles sont exigibles lors des preuves dvaluation.
Les dmonstrations dveloppes dans le cours sont choisies en fonction de lintrt pdagogique du raisonnement quelles mettent en oeuvre. Il faut les tudier, crayon en main, essayer
de les refaire en mettant en vidence les deux ou trois axes de la dmonstration quil convient
de retenir pour tre capable de la restituer sans document. Cest ce critre que vous pourrez
mesurer si vous avez compris quelque chose. Il est conseill aussi de bien mettre en vidence
dans ces dmonstrations, en les nonant compltement et en vrifiant que leurs hypothses
de validit sont satisfaites, les rsultats antrieurs sur lesquels elles prennent appui. Certaines
dmonstration seront dtailles, dautres seront volontairement plus succinctes afin de vous
entraner dtailler par vous-mme les passages rapides de la dmonstration.
Les exemples du cours servent illustrer une dfinition sur un cas particulier ou montrer
une application concrte dune proposition. Leur rdaction est aussi parfois volontairement succincte. Il convient alors den dtailler les calculs, de vrifier les rsultats annoncs, et dessayer
de noter les astuces ou techniques utilises et transposables dans dautres situations, ventuellement moyennant certaines adaptations. Ce qui est dit pour les exemples est aussi valable pour
tous les exercices proposs en auto-correction et leurs corrigs.
Les exercices sont diviss en deux catgories :
1. Les exercices de la premire catgorie sont les exercices insrs dans le texte du cours
proprement dit. Ils sont assez simples et sont conus comme des applications directes du
cours et de ce qui vient dtre vu.
2. Les exercices de la seconde catgorie, dits de rvision, sont placs en fin de chaque
chapitre partir du chapitre III. Ils sont, quant eux, de difficults variables et font appel
aux diverses notions mises en place dans les chapitres antrieurs y compris le chapitre
tudi.
CT U
Besancon
Prsentation du cours
iii
Vous devez essayer de chercher rsoudre le maximum dexercices, en vous aidant du cours.
Pour les exercices que vous ne savez pas rsoudre ou que vous navez pas pu chercher, par
exemple par manque de temps, il faut au moins tudier leurs solutions en vous reportant au
chapitre VIII.
Ce qui a t dit, plus haut, pour ltude des dmonstrations sapplique galement pour tudier
la correction dun exercice. Encore une fois, aprs avoir tudi une dmonstration ou la
solution dun exercice, vous devez tre capable de refaire cette dmonstration ou cet exercice,
sans regarder le cours, trois ou quatre jours plus tard. Cest l un bon test pour savoir si vous
avez compris la dmonstration ou la solution de lexercice. Il ne faut pas hsiter rviser les
chapitres dj travaills cest--dire revenir plusieurs fois, aprs de longs intervalles de temps,
sur les dmonstrations ou exercices tudis auparavant.
Trois devoirs rdiger et retourner la correction sont proposs dans le cadre de cet
enseignement afin de vous permettre de tester vos connaissances et de vous inciter un travail
rgulier. Ces devoirs permettent aussi de montrer au correcteur que vous avez compris le cours,
que vous connaissez les rsultats vus en cours et les hypothses qui les commandent, et que
vous savez les mobiliser pour rpondre une question ou dmontrer un rsultat nouveau. Il est
donc recommander de tout mettre en uvre pour atteindre cet objectif.
Il est bon de porter son attention, en particulier, sur les conseils suivants :
Un devoir de mathmatiques est un devoir de franais qui traite de mathmatiques, cest donc
avant tout un texte de franais. Il doit donc tre rdige de faon correcte en franais. Les
hypothses spcifiques justifiant lutilisation de chaque thorme doivent tre correctement explicites et le rsultat du cours utilis doit tre clairement identifi voire explicitement nonc.
Les rsultats intermdiaires et les conclusions obtenues doivent tre mis en vidence. Les notations utilises ou introduites, surtout si elles sont nouvelles par rapport au cours, doivent tre
clairement annonces. La rdaction du cours peut tre considre comme un guide de rdaction
dun texte mathmatique.
Les preuves dexamen comporteront des exercices et des questions portant sur lensemble
du cours. Elles peuvent galement comprendre des questions de cours proprement dites : noncer un ou plusieurs rsultats du cours, refaire une ou plusieurs dmonstrations vues en cours,
traiter un exemple ou un exercice corrig proposs dans les documents fournis dans le cadre de
cette unit denseignement. La table de la loi normale standard de lannexe B (sans les explications sur son utilisation), ainsi que le formulaire de lannexe A, seront disponibles avec les sujets
lors des preuves dvaluation. Lors de ces preuves, lutilisation dune calculatrice est autorise.
Certaines propositions du cours concernent des rsultats mentionns "hors programme". Ils
sont simplement donns dans un but de culture mathmatique, mais ne feront donc pas lobjet
dvaluation et leur connaissance nest pas exigible dans les valuations. Souvent ils apportent
des complments ou des prcisions sur un rsultat ou une remarque qui viennent dtre faits.
Enfin, il est vident que lapprciation dune copie par le correcteur, que ce soit celle dun
devoir ou dune preuve dexamen, accordera une place importante la rdaction, la clart
des justifications et de largumentation ainsi qu la prsentation globale de la copie. Une copie
illisible ou mal rdige pourra ne pas tre corrige et sera sanctionne en consquence.
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
iv
Annexes
Ce document comprend cinq annexes :
1. Lannexe A, page 205, est un rappel des principales relations mathmatiques utilises
dans les calculs de probabilits et des lois de probabilits classiques connatre. Ce
formulaire sera disponible lors des preuves de contrles ou dexamens.
2. Lannexe B, page 211, explique lusage de la table statistique de la loi normale centrerduite reproduite en fin de lannexe. La table de la loi normale standard, sans les
explications qui laccompagnent, sera disponible lors des preuves dexamen.
3. Lannexe C, page 215, comprend les sujets des trois devoirs qui devront tre envoys
la correction et prcise les dates de ces trois envois. Les corrigs de ces devoirs seront
retourns avec la copie corrige.
Bibliographie
Pour le cours, et surtout pour apporter des complments ce cours, on pourra utiliser avec
profit le livre de [4]. Pour les exercices on pourra se reporter [2] pour ceux relevant de la
thorie de la mesure de de lintgration, et [3] o on trouvera des exercices supplmentaires
concernant la thorie des probabilits.
Pour une justification du choix du formalisme et de sa signification en tant que modle de la
"ralit", on pourra consulter avec profit en premire lecture le chapitre I de [5] et [7] puis, en
seconde lecture, [4] pages 93 et 132, et [13] page 56.
Une approche historique et pistmologique en liaison avec les questions denseignement des
concepts probabilistes peut tre trouve dans [6].
Calendrier de travail
Le cours lui-mme est divis en sept chapitres auxquels sajoute un huitime chapitre regroupant
les corrections des exercices proposs dans les chapitres prcdents.
Les trois premiers chapitres sont principalement destins mettre en place le formalisme des
probabilits en transcrivant dans le langage des probabilits les notions de thorie de la mesure
et de lintgration vues dans lunit correspondante : tribu, application mesurable, mesure,
image dune mesure, rgles dintgration, thormes de Lebesgue, ... etc. Normalement ces
notions ont t vues dans lunit dintgration qui est conseille pour suivre cet enseignement
de probabilit. Elles doivent tre tudies assez rapidement de faon faire porter votre travail
sur les autres chapitres. Dans ces trois premiers chapitres la notion de loi de probabilit, le
thorme du transfert, la notion de fonction caractristique et les critres didentification des
lois, doivent tre bien assimils et matriss.
Les concepts vraiment nouveaux et propres la thorie des probabilits : indpendance, vecteurs
gaussiens, convergences, thormes-limites, ... etc, sont vues dans les quatre derniers chapitres
et constituent le noyau de lunit de probabilits.
CT U
Besancon
Prsentation du cours
Il faut consacrer en gros un tiers du temps de travail de lunit ltude des chapitres 1, 2 et
3. Un tiers du temps aux chapitres 4 et 5, et un tiers du temps aux chapitres 6 et 7.
Vous avez rdiger trois devoirs envoyer pour correction ladresse suivante :
Bruno Saussereau, Laboratoire de Mathmatiques de Besanon, UFR des Sciences
et Techniques, 16, route de Gray, 25030 Besanon cedex, France.
1. Le devoir 1, dont le texte se trouve en annexe C, page 216, porte sur les chapitres I, II
et III. Il doit tre envoy au plus tard pour le 21 fvrier 2014.
2. Le devoir 2, dont le texte se trouve en annexe C, page 218, porte principalement sur le
chapitre IV et V mais pourra bien sr faire appel des rsultats des chapitres prcdents.
Il doit tre envoy au plus tard pour le 28 mars 2014.
3. Le devoir 3, dont le texte se trouve en annexe C, page 220, porte principalement sur
les chapitres VI et VII, mais pourra bien sr faire appel des rsultats des chapitres
prcdents. Il doit tre envoy au plus tard pour le 18 avril 2014.
Le calendrier ci-dessus est donn titre indicatif. Bien entendu, jaccepterai de corriger
vos devoirs nimporte quel moment. Cependant je vous conseille dessayer de travailler
rgulirement et de suivre ce calendrier.
Remarque finale
Comme pour tout document, des erreurs ou des coquilles peuvent stre glisses lors de sa
rdaction, merci de me signaler celles que vous pourriez relever. Plus gnralement, si vous
avez des remarques sur le document, nhsitez pas men faire part.
CT U
Besancon
vi
CT U
Besancon
Notations
xi
1 Modles probabilistes
1.1 Prliminaires . . . . . . . . . . . . . . . . . .
1.2 Tribu sur un ensemble . . . . . . . . . . . . .
1.3 Mesures et probabilits . . . . . . . . . . . . .
1.3.1 Mesure . . . . . . . . . . . . . . . . .
1.3.2 Probabilits et vnements . . . . . .
1.3.3 Proprits lmentaires des probabilits
1.4 Fonctions de rpartition . . . . . . . . . . . .
.
.
.
.
.
.
.
1
1
3
6
6
7
11
13
.
.
.
.
.
.
.
.
19
19
19
20
20
21
23
23
24
.
.
.
.
.
.
.
.
.
.
.
29
29
29
33
36
37
38
40
40
45
49
59
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
viii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
61
61
66
66
68
77
80
84
90
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
105
105
105
109
112
112
113
118
119
121
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
123
123
123
126
128
129
141
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
145
145
152
155
165
183
190
196
.
.
.
.
205
205
205
207
208
du
du
du
du
du
du
du
chapitre
chapitre
chapitre
chapitre
chapitre
chapitre
chapitre
A Formulaire
A.1 Rappels de notations . . . . .
A.2 Quelques relations connatre
A.3 Probabilits usuelles discrtes
A.4 Probabilits usuelles densit
CT U
Besancon
I .
II .
III
IV
V.
VI
VII
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. . . . . . . .
en probabilits
. . . . . . . .
. . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
ix
215
216
218
220
Bibliographie.
221
CT U
Besancon
CT U
Besancon
Notations
xi
Notations
Nous rpertorions ici quelques notations gnrales qui seront utilises dans lensemble du cours.
On note de faon classique respectivement par les lettres, N, Z, Q, R, C, les ensembles des
nombres entiers naturels, relatifs, rationnels, rels, complexes.
Les lettres P et E seront introduites dans le cours mais ne devront pas tre confondues avec
les notations densembles de nombres.
On pose R := R {+, }. On tend lordre usuel de R R en posant, pour tout x R,
< x < +. On prolonge les oprations classiques sur R de la faon suivante : pour
tout x R {+}, x + (+) = +, x () = +; pour tout x R {},
x + () = , x (+) = . On remarquera que (+) + () et (+) (+)
ne sont pas dfinis.
On suppose connues les notations classiques de la thorie lmentaire des ensembles : intersection , runion , diffrence de deux ensembles \, ensemble vide , passage au complmentaire
{ ou plus frquemment c , inclusion (au sens large) .
Le symbole de Halmos, 2, dsignera la fin dune dmonstration.
Le symbole := signifie "est gal par dfinition". Il indique que le membre de gauche de := est
une notation pour le membre de droite.
Chaque proposition, exemple, exercice, est numrote par deux nombres spars par un point.
Par exemple "proposition 5.12" dsigne la proposition 12 du chapitre 5.
CT U
Besancon
xii
CT U
Besancon
Chapitre 1
Modles probabilistes
Le formalisme de la thorie des probabilits utilise les outils de la thorie de la mesure en
adoptant un vocabulaire spcifique aux probabilits.
1.1
Prliminaires
CT U
Besancon
iI
iI
iI
4. {f A}c = E \ {f A} = {f F \ A} = {f Ac }.
On fera attention lambigut de la notation c pour le complmentaire dun ensemble dans
lassertion 4 de cette proposition : {f A}c signifie {E {f A} et {f Ac } signifie {f {F A}.
Exercice 1.1. (Corrig de lexercice : page 145)
Dmontrer la proposition prcdente.
Dfinition 1.3.
Lindicatrice dune partie A de E est lapplication, note 1lA , de E dans R dfinie, pour
tout x E , par 1lA (x) := 0 si x 6 A et 1lA (x) := 1 si x A.
Exercice 1.2. (Corrig de lexercice : page 145)
Soient A, B et C trois parties dun ensemble .
1. crire 1lAB et 1lAB en fonction de 1lA et 1lB lorsque :
(a) A et B sont disjoints ( i.e. A B = ).
(b) A et B sont quelconques.
2. Exprimer, en fonction des indicatrices de A, B et C , les indicatrices des ensembles
suivants : Ac , A \ B, A B C .
2.
1l[0,n] .
n0
CT U
Besancon
(n + 1)1l[n,n+1[ .
n0
Enfin, rappelons que, si f et g sont deux applications dun ensemble E dans R, la notation
f g signifie que, pour tout x E , f (x) g (x).
1.2
Dfinition 1.4.
Une famille A de parties dun ensemble E est appele une tribu sur E , (ou dans certains
ouvrages une -algbre sur E ), si elle vrifie les trois axiomes suivants :
1. E A,
2. Si A A, alors Ac A,
[
3. Si (An )N est une suite dlments de A, alors
An A.
nN
Dfinition 1.5.
Le couple (E , A) sappelle un espace mesurable et les lments de A sont appels les
parties mesurables de E relativement la tribu A ou parties A-mesurables de E
On notera bien que A est un ensemble constitu de parties de E et donc une partie de P(E ),
lensemble de toutes les parties de E .
Exemples 1.2.
les familles de parties de E , {, E } et P(E ), sont des tribus sur E appeles tribus triviales
de E . On peut donc dfinir au moins une tribu sur tout ensemble E .
Exercice 1.4. (Corrig de lexercice : page 147)
Soient n un entier strictement positif et (A1 , A2 , , An ) une partition de E , i.e. une suite
de parties non vides de E , deux deux disjointes, dont la runion est gale E . Soit A
la famille des runions quon peut fabriquer partir de toutes les sous-familles
de la suite
[
(A1 , A2 , , An ), cest--dire la famille des parties de E de la forme
Ai o K parcourt
iK
lensemble des parties de {1, 2, , n}. Montrer que la famille A est une tribu sur E .
Pour une gnralisation de ce rsultat, on pourra consulter [2] exercice I-7 question 2.
CT U
Besancon
iI
Ai =
Aci
iI
CT U
Besancon
Dfinition 1.7.
La tribu borlienne sur R, note B(R), est la plus petite des tribus sur R contenant tous les
intervalles de la forme ]a, b], o a et b sont des rels tels que a < b, et les intervalles ]a, +]
o a R.
Dfinition 1.8.
Les lments des tribus B(R), resp. B(Rd ), sont appels borliens de R, resp. Rd .
Exercice 1.7. (Corrig de lexercice : page 148)
Prouver lexistence de la tribu de Borel de R. Pour cela, montrer que B(R) est lintersection
de la famille (non vide car la tribu P(R) en fait partie) des tribus contenant tous les intervalles de la forme ]a, b] o a et b sont des rels tels que a < b.
Plus gnralement :
Dfinition 1.9.
Soit C une famille de partie dun ensemble E . On appelle tribu engendre par C sur E , et
on note ( C), la plus petite tribu (au sens de linclusion) dfinie sur E contenant la famille C.
On vrifiera aisment que la tribu ( C) est lintersection de toutes les tribus sur E qui contiennent C.
Exemples 1.3.
On montre en thorie de la mesure que la tribu borlienne de Rd est engendre par la
famille constitue des parties ouvertes de Rd .
Exercice 1.8. (Corrig de lexercice : page 148)
Soient n un entier strictement positif et (A1 , A2 , , An ) une partition de E . Montrer
que la tribu construite dans lexercice 1.4 est la tribu sur E engendre par la famille
(A1 , A2 , , An ).
Dans la suite du cours les ensembles R et Rd seront toujours supposs munis de leurs tribus
borliennes.
La proposition suivante donne des exemples de borliens de R. Pratiquement ceux-ci correspondent la plupart des ensembles qui seront manipuls dans la suite :
Proposition 1.3.
1. Tout singleton de R est un borlien.
2. Toute partie dnombrable de R est un borlien.
3. Tous les intervalles de R, quelle que soit leur forme, sont des borliens de R.
4. Toutes les runions dnombrables ou intersections dnombrables dintervalles de R, ou
plus gnralement de borliens, sont des borliens.
Dmonstration : Pour le singleton, on remarque que si a R, on peut crire
+
\
1
{a} =
a ,a .
k
k=1
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
+
[
1
, ] , b] =
] k, b].2
a, b
k
k>b
+
[
k=1
1.3
1.3.1
Mesures et probabilits
Mesure
Dfinition 1.10.
Soit (E , A) un espace mesurable. Une mesure sur (E , A) est une application de A dans
[0, +] vrifiant les axiomes :
1. () = 0,
2. -additivit : pour toute suite (An )N dlments de A deux deux disjoints
! +
+
[
X
Ak =
(Ak ).
k=0
k=0
k=0
quil ne suffit pas que le deuxime axiome de la dfinition prcdente soit vrai pour les suites
finies deux deux disjointes pour quil le soit pour les suites infinies deux deux disjointes. Un
contre-exemple est propos dans lexercice suivant.
Exercice 1.9. (Corrig de lexercice : page 148)
On considre lapplication de P(N) dans [0, +] dfinie, pour tout A N, par
X 1
1
(avec
la
convention
= +) si A est fini, (A) = + si A est infini,
(A) :=
2
n
0
nA
et () = 0. Montrer que
CT U
Besancon
k=1
1.3.2
Probabilits et vnements
Dfinition 1.11.
Une probabilit sur (E , A) est une mesure sur (E , A) telle que (E ) = 1. Le triplet
(E , A, ) sappelle alors un espace de probabilit, les parties mesurables sappellent les
vnements relatifs . E est lvnement certain, est lvnement impossible. Deux
vnements disjoints sont dits incompatibles.
Dornavant, sauf indication contraire, (E , A, ) dsignera un espace de probabilit.
Dfinition 1.12.
Une partie A de E est dite ngligeable pour , sil existe un vnement B tel que A B avec
(B) = 0. Une proprit P(x), dpendant de llment x E , est dite -presque-sre (en
abrg -p.s.) si lensemble des x E pour lesquels la proprit P(x) nest pas vrifie est
ngligeable pour .
Dfinition 1.13.
Deux vnements A et B sont dits -presque-srement gaux si lvnement (A\B)(B \A)
est ngligeable pour .
Un vnement ngligeable pour est -presque-srement vide, cest--dire -presque-srement
impossible.
CT U
Besancon
+
X
k k .
k=0
ai,j =
+ X
+
X
i=0 j=0
ai,j .
j=0 i=0
Cette somme peut tre ventuellement infinie. Pour une dmonstration du lemme se reporter
[1] tome 2, p. 306. 2
On notera que si les mesures k sont des probabilits sur (E , A) et si
+
X
k = 1, alors la
k=0
mesure
+
X
k=0
Exemples 1.5.
Appliqu au cas particulier o les probabilits k sont les probabilits sur R de Dirac au
point k N, le procd prcdent permet de construire dautres exemples classiques de
probabilits. Si n N , ]0, +[, p ]0, 1[ et q := 1 p, on dfinit :
CT U
Besancon
n
X
Cnk p k q nk k .
k=0
k=0
k
k .
k!
+
X
pq k1 k .
k=1
1
3
) ({1, 3, 5, 7}) et B(7, ) ({0, 3, 5}) .
10
10
Dfinition 1.14.
d
Une probabilit sur
XR est dite discrte et porte par lensemble F si elle peut scrire
sous la forme =
pn an o (pn )N est une suite de rels positifs ou nuls, (an )N est une suite
nN
CT U
Besancon
10
(t)dt = 1.
On montre alors quil existe une unique probabilit sur R telle que, pour tout x R,
Z x
(] , x]) =
(t)dt.
On dit que est une probabilit densit sur R. On crit = pour exprimer que
admet pour densit. Nous gnraliserons de faon dfinitive la dfinition de densit dune
probabilit sur Rd au chapitre III par la dfinition 3.2, page 35.
Comme prcdemment, le rel (] , x]) reprsente la mesure de laire sous la courbe
dquation y = (t), comprise entre et x.
On peut de faon plus gnrale dfinir des mesures densit, qui ne sont plus ncessairement
des probabilits, en remplaant dans laZ dfinition de la densit ci-dessus, la condition
Z
+
(t)dt < +.
Lexistence des mesures densit rsulte dun thorme de prolongement assez technique que
nous nnoncerons pas. Nous nous contenterons dadmettre lexistence de telles mesures.
Exemples 1.7.
1. La probabilit de Gauss-Laplace standard vue plus haut admet la densit dfinie
1 2
1
sur R par (t) := e 2 t .
2
1
2. Lapplication :=
1l[a,b] , avec a < b, est la densit dune probabilit sur R
ba
appele probabilit uniforme-continue sur [a, b] et note U([a, b]).
3. Lapplication , dfinie sur R par (t) := e t 1l]0,+[ (t), est la densit dune probabilit sur R appele probabilit exponentielle de paramtre > 0 et note E().
CT U
Besancon
11
On pourrait se demander pourquoi on ne dfinit pas les mesures comme des applications
-additives de lensemble des parties de E dans [0, +] avec () = 0. Cela reviendrait
prendre toujours A := P(E ) et viterait le recours la notion de tribu. En fait, on montre que
certaines probabilits, comme celle de Gauss dfinie plus haut, ne peuvent pas tre dfinies pour
toutes les parties de R. Plus prcisment, on montre que, toujours dans le cas de E := R, les
seules probabilits qui satisferaient cette nouvelle dfinition seraient les probabilits discrtes.
Malheureusement cette famille nest pas assez riche pour permettre de modliser grand nombre
des situations alatoires qui se prsentent dans les applications concrtes de la thorie. Pour
plus de dveloppements se reporter lannexe ??, page ??, de ce cours.
1.3.3
et
+
[
k=0
Bk =
+
[
k=0
Ak .
k=0
CT U
Besancon
12
Ak
(Ak ).
k=0
k=0
Ak =
(Ai1 Ai2 Aik ) .
k=1
k=1
Proposition 1.9.
Thorme de continuit monotone
1. Pour toute suite (An )N dlments de A, croissante au!sens de linclusion, ((An ))N est
+
[
une suite relle croissante convergeant vers
Ak c--d
k=0
+
[
!
Ak
= lim (An ).
n+
k=0
+
\
k=0
!
Ak
= lim (An ).
n+
CT U
Besancon
13
k=0
+
[
!
Ak
k=0
+
[
!
Bk
k=0
= (A0 ) + lim
n
+
X
(Bk ) = (A0 ) +
k=0
k=n
X
+
X
((Ak ) (Ak1 ))
k=1
k=1
Do la premire partie.
2) Comme est une probabilit,
+
\
!
=1
Ak
k=0
+
[
!
Ack
k=0
+
\
k=0
!
Ak
Do la deuxime partie. 2
1.4
Fonctions de rpartition
La possibilit de dfinir une probabilit sur une tribu partir de la connaissance des valeurs
de cette mesure sur une sous-famille de la tribu, rsulte dun thorme de prolongement assez
technique que nous nnoncerons pas. En revanche, il est souvent utile de montrer quil existe
une unique probabilit sur la tribu qui prend des valeurs seulement connues sur une sous-famille
de la tribu.
Lunicit dans le cas des probabilits rsulte dun thorme, appel thorme dunicit, qui
dcoule lui-mme du thorme des classes monotones quon admettra, dont il est utile de
connatre lnonc. Commenons tout dabord par donner deux dfinitions :
Dfinition 1.16.
Une famille M de parties de E est appele une classe monotone sur E si elle vrifie les trois
axiomes suivants :
1. E M.
2. Si A M et B M avec B A, alors A \ B M.
3. Si (An )N est une suite croissante au sens de linclusion dlments de la famille M, alors
+
[
An M.
n=0
CT U
Besancon
14
CT U
Besancon
15
Dfinition 1.18.
On dit que F est la fonction de rpartition de la probabilit , en abrg f.r. .
Avec ces notations on peut noncer autrement le lemme dunicit pour les probabilits sur R :
Proposition 1.13.
Deux probabilits sur R sont identiques si, et seulement si, elles ont la mme fonction de
rpartition.
Exemples 1.8.
1) La f.r. de a , o a R, est 1l[a,+[ .
2) La f.r. de B(p) est p1l[1,+[ + (1 p)1l[0,+[ .
3
1
3
1
3) La f.r. de 0 + N 1 (0, 1) est 1l[0,+[ + F o F dsigne la f.r. de la probabilit N 1 (0, 1).
4
4
4
4
Les valeurs de la fonction de rpartition de la probabilit N 1 (0, 1) sont "tabules". On trouvera la tables des valeurs de la fonction de rpartition de la probabilit normale standard,
appele communment table de la loi normale centre-rduite, avec un mode demploi
dans lannexe B, page 211, de ce cours.
A titre dentranement, on pourra galement chercher exprimer les fonctions de rpartition
des probabilits E() et U([a, b]) (On trouvera leur expression dans le formulaire reproduit en
annexe A, page 205.
lim F (x) = 1.
x+
CT U
Besancon
16
l F (x0 ) > l . Donc, pour tout x ]x0 , a[, l F (x) F (x0 ) > l c--d |F (x) l| < ,
ce qui donne lexistence de la limite--gauche en a pour F .
On montre de mme lexistence dune limite--droite F (a+) := inf F (x).
x>a
+
\
1
1
est dcroissante et
La suite dintervalles ] , a + ]
] , a + ] =] , a], donc
n N
n
k=0
par le thorme de continuit monotone 1.9 de la page 12
1
(] , a]) = lim ] , a + ]
n
n
1
c--d F (a) = lim F a +
= F (a+) car la limite--droite existe au point a. F est donc
n
n
continue--droite en tout point de R.
+
\
La suite dintervalles (] , n])N est dcroissante et
], n] = . La suite (] , n])N
n=0
est croissante et
+
[
n=0
CT U
Besancon
17
x+
Proposition 1.15.
Si F est une application croissante de R dans [0, 1], continue--droite sur R avec
lim F (x) = 0 et
lim F (x) = 1,
x+
alors il existe une unique probabilit sur R dont F est la fonction de rpartition.
Exercice 1.19. (Corrig de lexercice : page 151)
Donner une reprsentation graphique de lapplication
3
1
F : t R 7 F (t) = (t + 2)1l[1,0[]1,2[ (t) + 1l[0,1] (t) + 1l[2,+[ (t),
4
4
et montrer que F est la fonction de rpartition dune probabilit densit quon prcisera.
CT U
Besancon
18
CT U
Besancon
19
Chapitre 2
Le but de ce premier paragraphe est de fournir quelques lments de rflexion sur la modlisation mathmatique de phnomnes alatoires. Pour une analyse plus approfondie sur lintrt
dintroduire la notion de variable alatoire et de loi de probabilit, on pourra consulter lannexe
??, page ??.
Considrons les deux situations suivantes :
2.1.1
Cas discret
Une personne sintresse la somme des valeurs obtenues dans le lancer simultan de deux ds
quilibrs. On modlisera lensemble des issues possibles de cette exprience alatoire par
:= {(i, j) N2 /1 i, j 6}.
Les vnements peuvent tre modliss par des parties de . On peut prendre comme tribu
des vnements lensemble P() de toutes les parties de . Les ds tant quilibrs, on
choisira pour probabilit P sur (, P()) lquiprobabilit sur i.e. pour tout (i, j) ,
1 X
1
ou encore P =
(i,j) .
P({(i, j)}) =
36
36 1i,j6
Le triplet (, P(), P) reprsente le modle mathmatique permettant de traiter la situation.
Cependant comme on sintresse plutt la somme des valeurs obtenues, lvnement "La
somme des valeurs obtenues appartient A", o A est un borlien de R, se modlise par la
partie eA de forme des couples (i, j) tels que i + j A. On peut aussi crire lvnement eA
grce au langage des applications en notant X lapplication de dans R qui, tout = (i, j),
associe X () = i + j et en remarquant que eA = { /X () A} = {X A} c--d que
eA est limage-rciproque de A par lapplication X . On remarque enfin que ce qui est important
pour notre tude du phnomne cest de connatre la valeur de P(eA ) = P(X A) pour tout
borlien A de R.
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
20
2.1.2
Cas continu
Envisageons maintenant le cas dun ingnieur hydraulicien qui sintresse aux risques dinondation
par un fleuve dans lintention de construire une digue protectrice. Pour cela il va considrer
lvolution de la hauteur du niveau de leau sur lanne. Cela revient considrer la hauteur sur
une anne comme une application continue de [0, 1] dans R+ . Lensemble des issues possibles
de ce phnomne alatoire peut tre modlis par := C([0, 1], R+ ) ensemble des applications
continues de [0, 1] dans R+ . Comme pour R, et contrairement ce quon a fait pour le cas
prcdent, il nest pas possible de prendre P() comme tribu sur . On considrera une tribu
F plus petite quon ne prcise pas pour linstant. De mme on ne prcisera pas la probabilit P
dfinie sur F. On verra plus loin quau fond ce nest pas ncessaire, seule lexistence du triplet
(, F, P) devant tre assure.
En fait lingnieur sintressera surtout aux vnements de la forme "La hauteur maximale
du niveau du fleuve sur une anne appartient A" o A est un intervalle de R. Cet vnement se modlise par la partie eA de forme des fonctions C([0, 1], R+ ) telles que
sup0t1 (t) A. On peut aussi crire lvnement eA grce au langage des applications en
notant X lapplication de dans R qui tout associe X () = sup0t1 (t) et en remarquant que eA = { /X () A} = {X A} c--d que eA est limage-rciproque de A par
lapplication X .
Pour que lexpression P(X A) ait un sens, il faudra sassurer (ou imposer) plus gnralement
que, pour tout borlien A de R, limage-rciproque de A par lapplication X soit un lment
de F. Car, comme dans la situation prcdente, cest la valeur de P(X A) qui intressera
lingnieur, c--d lapplication PX : A F 7 P(X A). PX est une probabilit sur R donc
un objet mathmatique beaucoup plus facile manipuler quune probabilit sur une tribu de
C([0, 1], R+ ).
2.1.3
Principe de modlisation
CT U
Besancon
2.2
21
Applications mesurables
Dfinition 2.1.
Soient (E , A) et (F , B) deux espaces mesurables, une application f de E dans F est dite
( A, B)-mesurable si, pour tout B B, {f B} A.
Dans les cas o (E , A) est quelconque et (F , B) := (Rk , B(Rk )), on dit simplement
A-mesurable au lieu de ( A, B(Rk ))-mesurable.
Une application A-mesurable valeurs dans R est une application ( A, B(R))-mesurable.
La proposition suivante donne un premier exemple dapplications mesurables :
Proposition 2.1.
Soit A une partie de E . Alors 1lA est A-mesurable si, et seulement si, A A.
Dmonstration : On remarque que si B est un borlien de R, limage rciproque de B par 1lA
est lun des ensembles , A, Ac , ou E . Ce qui prouve par dfinition de la mesurabilit que 1lA
est A-mesurable si, et seulement si, A est A-mesurable. 2
Dfinition 2.2.
Dans les cas o (E , A) := (Rn , B(Rn )) et (F , B) := (Rk , B(Rk )) on dit que f est borlienne
pour exprimer quelle est ( B(Rn ), B(Rk ))-mesurable.
La proposition suivante donne des classes importantes de fonctions borliennes qui correspondent la plupart des cas quon considrera par la suite. Pour une dmonstration dune partie
de la proposition on pourra consulter [2] exercice I-10.
Proposition 2.2.
(admis)
Toute application continue de Rn dans Rk est borlienne. Toute application monotone de R
dans R est borlienne. Toute drive dune application drivable de R dans R est borlienne.
Exercice 2.1. (Corrig de lexercice : page 152)
Soit f une application borlienne de Rk dans Rd et une application A-mesurable de E
dans Rk . Montrer que lapplication f est une application A-mesurable de E dans Rd .
Comme pour la notion densemble mesurable, les applications mesurables correspondent aux
applications sur lesquelles la thorie de la mesure permet de dire quelque chose dintressant.
On doit sattendre ce que toutes les applications quon est amen manipuler dans la pratique
soient mesurables.
Introduisons la notation suivante qui est utile pour tendre une proprit, vraie pour la classe
des fonctions positives, la classe des fonctions de signe quelconque :
Dfinition 2.3.
Si f est une application dun ensemble E dans R notons f + := sup(f , 0) et f := sup(f , 0).
Les applications f + et f sont appeles respectivement la partie positive et la partie
ngative de f .
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
22
Cette criture sappelle la dcomposition canonique de f . On vrifie aisment que la dcomposition canonique dune application tage est unique.
Lintrt de cette dfinition rside dans la proposition suivante. Pour la dmonstration on pourra
consulter [2] exercice I-13.
Proposition 2.4.
Lemme fondamental (admis)
Toute application A-mesurable de E dans [0, +] est la limite dune suite croissante
dapplications A-mesurables tages et positives.
Ce lemme est la base dune technique de dmonstration utilise en probabilits lorsquon veut
montrer que les applications A-mesurables possdent une certaine proprit P. Pour cela, on
montre que les indicatrices 1lA , o A A, vrifient P, puis on montre quil en est de mme
n
X
pour les applications A-mesurables de la forme
i 1lAi o i R+ et Ai A, 1 i n.
i=1
CT U
Besancon
23
On montre ensuite, en utilisant le lemme fondamental, que la proprit P est encore vrifie par
les applications A-mesurables positives, puis par les applications A-mesurables quelconques f
en remarquant que f = f + f o f + := sup(f , 0) et f := sup(f , 0) sont des applications
A-mesurables positives. Cette technique de dmonstration est souvent appele "technique
des fonctions tages" .
2.3
2.3.1
Paralllement aux dfinitions introduites ci-dessus, une terminologie diffrente est utilise en
probabilit pour les applications mesurables dans le cas o (E , A) est lespace mesurable de
base (, F).
Dfinition 2.5.
Si (E , A) := (, F) et (F , B) = (Rd , B(Rd )), une application ( F, B(Rd ))-mesurable
sappelle un vecteur alatoire , ou variable alatoire vectorielle, de dimension d.
Un vecteur alatoire de dimension d = 1 sappelle aussi une variable alatoire relle en
abrg v.a.r. .
On peut tre quelquefois amen considrer des variables alatoires valeurs dans R, ce sont
les applications ( F, B(R))-mesurables de dans R.
Les variables alatoires sont traditionnellement notes par des lettres majuscules X , Y , . . .
La proposition suivante est lnonc avec un vocabulaire diffrent du rsultat de lexercice 2.1
de la page 21 sur la composition des applications mesurables.
Proposition 2.5.
Si f est une application borlienne de Rk dans Rd et X un vecteur alatoire de dimension k,
alors lapplication f X est un vecteur alatoire de dimension d.
Dmonstration : Il suffit pour cela de remarquer que si B est un borlien de Rd , alors limagerciproque de B par f X est (f X )1 (B) = X 1 [(f 1 (B)] et dappliquer ensuite la dfinition
de la mesurabilit de f et X . 2
On notera dans la suite par abus f (X ) au lieu de f X . Par exemple, on crira e X pour exprimer
lapplication compose de lapplication exponentielle et de la variable alatoire relle X .
Proposition 2.6.
X = (X1 , X2 , , Xd ) un vecteur alatoire de dimension k si, et seulement si, pour tout
i = 1, 2, , d, Xi est une variable alatoire relle.
Dmonstration : La dmonstration est une consquence directe de la proposition 2.5 o on
prend pour f les projections de Rd sur R. 2
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
24
2.3.2
Proposition 2.7.
Soit X un vecteur alatoire de dimension d. Lapplication
PX : B B(Rd ) 7 PX (B) := P ({X B}) [0, 1]
est une probabilit sur Rd .
Dmonstration : On rappelle la notation {X B} := { / X () B} et on notera que
{X B} F, ce qui donne bien un sens P({X B}).
Soit B B(Rd ), PX (B) = P({X B}) [0, 1]. De plus, comme {X Rd } = ,
PX (Rd ) = P({X Rd }) = P() = 1. Soit (An )N une suite deux deux disjointe de borliens
de Rd , alors
(
)
[
[
X
Ak =
{X Ak }
kN
kN
kN
X
kN
P(X Ak ) =
kN
PX (Ak )
kN
do la -additivit de PX . 2
Dfinition 2.6.
La probabilit PX est appele la loi de probabilit relativement P du vecteur alatoire
X ou plus simplement la loi de X .
On notera que cette loi dpend de X mais aussi de la probabilit P de lespace de probabilit
de base.
On admettra le rsultat thorique suivant dmontr dans [3] exercice I-16 :
Proposition 2.8.
Si est une probabilit sur R, alors il existe un espace de probabilit de base (, F, P) et une
variable alatoire relle X sur cet espace telle que PX = .
Exemples 2.2.
Soit X une variable alatoire relle de loi N 1 (0, 1) (on notera quune telle affirmation a un
sens daprs la proposition prcdente). Dterminons la loi de la variable alatoire relle
Y := X 2 .
CT U
Besancon
25
{Y y } = {X 2 y } = { y X y }.
Par suite si y < 0, FY (y ) = 0, et si y 0,
FY (y ) = P( y X y ) = PX ([ y , y ]) = FX ( y ) FX ( y )
Z y
Z y
1
1 1 t2
x2
e 2 dt =
dx.
=
e
2
2x
0
y
On notera quon a utilis dans la troisime galit la continuit ( gauche) de FX . Le
rsultat prcdent montre que la f.r. de PY peut scrire
Z y
x
1
(x)dx avec (x) :=
FY (y ) = PY (] , y ]) =
e 2 1l]0,+[ (x).
2x
1 t
e 1l],0] (t) + (2 e t )1l]0,+[ (t) .
2
CT U
Besancon
26
o (pn )N est une suite de rels positifs ou nuls, alors pn = P(X = n) pour tout n N.
On notera quon peut avoir affaire des probabilits qui ne sont ni discrtes ni densit. Par
exemple, on peut avoir des probabilits dfinies sur R, telles = 1 +2 o 1 est une mesure
densit (mais pas une probabilit) et 2 une mesure discrte (mais pas une probabilit), cest-dire quil existe une application f (par exemple positive et continue sur R), et une suite de
Z +
+
X
rels positifs (n )N , avec
f (t) dt +
n = 1, telle que, pour tout intervalle ]a, b[ de R,
n=0
Z
(]a, b[) =
f (t) dt +
a
CT U
Besancon
+
X
n n (]a, b[).
n=0
f (t) dt = 1 et
n=0
sairement
+
X
27
+
X
n=0
Les variables alatoires relles discrtes sont les variables alatoires relles valeurs presquesrement dans un ensemble dnombrable. De faon prcise :
Proposition 2.10.
Un vecteur alatoire X de dimension d est discret si, et seulement si, il existe une partie
D := {ek , k K N} de Rd telle que P(X D) = 1. Dans ce cas la loi du vecteur alatoire
X scrit
X
PX =
P (X = ek ) ek .
kK
Dmonstration : Soit X une v.a. telle quil existe une partie dnombrable D de Rd avec
X D := {ek , k K N} presque-srement i.e. P(X D) = 1.
Soit A un borlien de Rd , on a PX (A) = PX (A D) = P(X A D). Comme
[
{X = x}
{X A D} =
xAD
xD
xD
kK
P (X = ek ) ek .
XkK
Rciproquement soit X une v.a. de loi =
pn en o (pn )K est une suite (finie ou infinie) de
nK
rels strictement positifs avec K N, et (en )K une suite (finie ou infinie) dlments de Rd .
Prenant D := {en /n K }, on a P(X D) = 1 et, pour tout n K , P(X = en ) = pn . 2
On dit aussi dans ce cas que la loi de X est porte par D, ou encore que X a ses valeurs
presque-srement dans D, pour exprimer P(X D) = 1. On notera que D est une partie
dnombrable (finie ou infinie) de Rd .
Ce rsultat ramne alors la dtermination de la loi dune variable alatoire relle discrte au
calcul des coefficients P(X = ak ) qui interviennent dans son criture. Il explique aussi le choix
de certains auteurs de manuels scolaires de dfinir la loi dune variable alatoire relle valeurs
dans N comme tant lapplication n N 7 P(X = n). En fait cette dfinition nest pas judicieuse car elle ne se gnralise pas au cas des variable alatoire relle densit. En effet, pour
une variable alatoire relle densit, pour tout rel x, P(X = x) = PX ({x}) = 0 daprs ce qui
a t vu au premier chapitre. Par suite lapplication x R 7 P(X = x) est lapplication-nulle
pour toute variable alatoire relle X admettant un densit, ce qui ne prsente plus dintrt.
La proposition prcdente sera notamment applique dans le cas o les variable alatoire relle
sont entires i.e. prennent leurs valeurs dans N ou Z.
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
28
kZ
CT U
Besancon
29
Chapitre 3
3.1.1
n
X
k (Ak ).
k=1
CT U
Besancon
30
rels, les rels 1 , 2 , , n ntant pas ncessairement deux deux distincts. On dit que
est une fonction en escalier sur R. Alors
E () :=
n
X
k (]ak1 , ak ]) =
k=1
n
X
k (ak ak1 ).
k=1
n+
CT U
Besancon
31
n
X
i=1
n
X
ai (Ai ).
i=1
R
R
f d = 34 + 7. 2
Exemples 3.3.
Z
e
R
Z
1l[0,+[ (x)d(x) =
Z
dx = 1 et
x 2 1l[0,+[ (x)d(x) = +.
Proposition 3.3.
Cas de la mesure de Dirac sur Rd (admis)
On suppose E := Rd , A := B(Rd ), := a o a Rd .
Si f est une application borlienne de Rd dans [0, +], alors
Z
f (t) d(t) = f (a).
E (f ) =
Rd
CT U
Besancon
32
f (t) d(t) =
+
X
Rd
i f (ai ).
i=0
Exemples 3.4.
Soient = P() :=
+
X
k=0
k
k la probabilit de Poisson sur R o > 0.
k!
E (f ) =
+
X
k=0
k
f (k)
k!
ii)
Z
x(x 1)1l[1,+[ (x)d(x) =
R
+
X
k=2
k
k(k 1) = 2 .
k!
Exemples 3.5.
Soit (un )N une suite de rels positifs ou nuls.
+
+
X
X
Considrons lapplication f :=
uk 1l{k} et la mesure :=
i . On vrifie aisment que
i=0
k=0
E (f ) =
+
X
uk .2
k=0
Ce dernier exemple montre que la thorie des sries termes rels positifs peut tre considre comme une thorie de lintgration suivant la mesure sur R dite de dnombrement
+
X
:=
i . La thorie de lintgration permet ainsi dunifier dans un mme formalisme ltude
i=0
des probabilits discrtes, qui font intervenir des sries dans les calculs, et celle des probabilits
densit o pratiquement interviennent des intgrales de Riemann classiques.
La proposition suivante ramne le calcul dintgrales suivant les mesures densit au calcul
dune intgrale de Lebesgue sur R quon effectue alors par application de la proposition 3.2.
CT U
Besancon
33
Proposition 3.5.
Cas des mesures densit sur R (admis)
On suppose E := R, A := B(R), une mesure admettant une densit sur R.
Si f est une application borlienne de R dans [0, +], alors,
Z
Z
E (f ) =
f (t) d(t) =
f (t)(t) d(t) = E (f ).
R
Exemples 3.6.
Z
1 2
1
x 2 e 2 x d(x). On est ramen au calcul dune
2
R
R
intgrale suivant la mesure de Lebesgue. Do
Z
Z +
1 2
1
21 x 2
2 1
x 2 e 2 x dx = 1,
x e
d(x) =
2
2
R
Z
x 2 d(x) = 1. 2
c--d
x d(x) =
3. Soient > 0, la mesure sur R de densit dfinie par (x) := e x 1l[1,1] (x) et
Z
Z
+ k
X
x
k . Calculer
e d( + )(x) et
1lR d( + ).
:=
k!
R
R
k=0
La mesure + est-elle une probabilit ?
3.1.2
CT U
Besancon
34
xd(x) = 0.
R
En effet, f + (x) = x1l[0,+[ (x) et f (x) = x1l],0] (x). On vrifie les deux suites dgalits
Z +
1 2
1
te 2 t dt < +
f (x)d(x) =
x1l[0,+[ (x)d(x) =
2 0
R
R
Z 0
Z
Z
1 2
1
te 2 t dt
et
f (x)d(x) =
x1l],0] (x)d(x) =
2
R
R
Z +
1 2
1
=
te 2 t dt < +,
2 0
Z
Les rgles dintgration des fonctions de signe quelconque intgrables sont les mmes que
celles pour les fonctions positives vues dans le cas des mesures discrtes ou densit. On
peut dmontrer cela en crivant les fonctions comme diffrence de leur partie positive et de
leur partie ngative. Par contre dans le cas de la mesure de Lebesgue sur R la proposition 3.2
devient fausse pour les fonctions qui ne sont pas de signe constant. Dans ce cas on utilise si
possible la proposition suivante :
CT U
Besancon
35
Proposition 3.7.
Cas de la mesure de Lebesgue sur R pour les fonctions relles (admis)
On suppose E := R, A := B(R), := o dsigne la mesure de Lebesgue sur R.
1. Si f est une application borlienne de R dans R nulle en dehors dun intervalle ferm
born [a, b] et intgrable au sens de Riemann sur [a, b], alors son intgrale sur R suivant
est gale son intgrale au sens de Riemann sur [a, b], c--d
Z
E (f ) =
f (t) d(t) =
f (t)dt.
a
2. Si f est une application borlienne de R Zdans R intgrable au sens de Riemann sur tout
+
intervalle ferm born de R et telle que
|f (t)|dt < +, alors son intgrale sur R
Rd
La proposition suivante (admise) montre que la rgle dintgration suivant une mesure de probabilit densit est tout fait analogue celle dj vue pour les fonctions positives.
Proposition 3.8.
Soit une densit de probabilit sur Rd .
1. Lapplication
d
: A B(R ) 7 (A) :=
Rd
Rd
CT U
Besancon
36
3.1.3
Soit f une application A-mesurable de E dans Rd . Dans la base canonique de Rd , f admet les
composantes f1 , f2 , , fd , o, pour tout entier k d, fk est une application A-mesurable de
E dans R. On crira f := (f1 , f2 , , fd ).
Dfinition 3.3.
On dit que f est intgrable sur E suivant si toutes les applications-composantes
f1 , f2 , , fd sont intgrables sur E suivant . Dans ce cas on appelle intgrale de f sur E
suivant le vecteur de Rd de composantes dans la base canonique E (f1 ), E (f2 ), , E (fd ),
et on note E (f ) := (E (f1 ), E (f2 ), , E (fd )) .
Rn
f1 et f2 sont donc -intgrables, par dfinition il en est de mme de f . On peut donc dfinir
E (f ) C pour tout vecteur u de Rn .
Dfinition 3.4.
Lapplication
n
: u R 7 (u) :=
CT U
Besancon
37
Exemples 3.8.
Si est la
Z probabilit de Bernoulli de paramtres p.
(t) =
e itx d(p1 + (1 p)0 )(x) = pe it + (1 p) daprs les rgles dintgration par
R
3.1.4
Proprits de lintgrale
Lintgrale dune fonction suivant une mesure possde toutes les proprits des intgrales
classiques vues en premier cycle universitaire, on admettra :
Proposition 3.9.
Soient f et g deux applications de E dans Rd intgrables suivant , a et b deux rels, alors
1. E (af + bg ) = aE (f ) + bE (g ).
2. |E (f )| E (|f |) o | | est la norme euclidienne sur Rd .
3. Si de plus d = 1 et f g , alors E (f ) E (g ).
Exemples 3.9.
Comme lindicatrice de A1 A2 An , o A1 , A2 , , An , sont des parties de E , est
donne par
1lA1 A2 An = 1 (1 1lA1 )(1 1lA2 ) (1 1lAn ),
en dveloppant le second membre de cette galit et en utilisant les proprits 1)a du
thorme fondamental de lintgration et 1) de la proposition prcdente, on obtient aisment une autre dmonstration de la formule de Poincar 1.8, page 12, nonce dans le
premier chapitre.
Les noncs de thormes permettant dintervertir les symboles E et lim sont particuliren+
ment simples dans cette thorie de lintgration. Commenons par rappeler (cf. [8], page 82) :
Proposition 3.10.
Thorme de convergence monotone de Beppo-Lvi (admis)
Pour toute suite croissante (fn )N dapplications A-mesurables positives,
E lim fn = lim E (fn ).
n+
n+
CT U
Besancon
38
X
0
X
X
E
fn =
E (fn ).
n=0
n=0
n
X
k=0
n+
Notons que ces trois rsultats prcdents sont faux si les fonctions fn ne sont plus supposes
positives.
Terminons par un thorme valable pour les fonctions ( valeurs relles) de signe quelconque
la condition dtre intgrables (cf. [8], page 102). Ce thorme ainsi que celui de Beppo-Lvi
sont des thormes fondamentaux de la thorie de lintgration. Ce sont principalement ces
rsultats qui font la supriorit de la thorie de Lebesgue sur celle de Riemann vue en premier
cycle universitaire.
Proposition 3.13.
Thorme de convergence domine de Lebesgue (admis)
Si (fn )N est une suite dapplications A-mesurables convergeant presque-partout vers une
application A-mesurable f et sil existe une application intgrable telle que, pour tout k N,
|fk | , alors f est intgrable et E (f ) = lim E (fn ).
n+
3.1.5
CT U
Besancon
39
CT U
Besancon
40
3.2
3.2.1
Le thorme du transfert est dun usage constant en probabilit. Donnons-en deux versions, une
pour les fonctions positives (cest la plus utile), lautre pour les fonctions vectorielles intgrables.
Proposition 3.15.
Thorme du transfert (cas positif)
Soient h une application borlienne positive de Rd dans [0, +] et X un vecteur alatoire de
dimension d, alors
Z
E[h(X )] =
hdPX = EPX (h)
Rd
h(x)dPX (x).
Rd
CT U
Besancon
41
Proposition 3.16.
Thorme du transfert (cas vectoriel) (admis)
Soient h une application borlienne de Rd dans Rn et X un vecteur alatoire de dimension d.
Alors h est intgrable sur Rd suivant PX si, et seulement si, h(X ) est intgrable sur suivant
P, et dans ce cas
Z
E[h(X )] =
hdPX = EPX (h)
Rd
h(x)dPX (x).
Rd
Exemples 3.10.
Soient X un vecteur alatoire de dimension d et X sa fonction caractristique. Par
application du thorme du transfert (cas vectoriel) on obtient, pour tout lment u de Rd ,
Z
X (u) :=
exp (ihx, ui) dPX (x) = E [exp (ihX , ui)] .2
Rd
Exemples 3.11.
Soit X une variable alatoire relle de loi N 1 (0, 1) i.e. PX = N 1 (0, 1). Calculons E(X 2 ).
Donnons deux mthodes.
Premire mthode : E(X 2 ) est de la forme E[h(X )] avec h(t) := t 2 . On applique le
thorme du transfert (cas positif), on remarque que h est continue donc borlienne. On
doit donc calculer laide dune intgration par parties,
Z
1
t dPX (t) =
E(X ) =
2
R
2
1 2
t 2 e 2 t dt = 1.
Deuxime mthode : On a vu au chapitre II dans lexemple 2.2, page 24, que la variable
alatoire relle Y := X 2 suit la loi ( 21 , 12 ) de densit
(x) :=
x
1
e 2 1l]0,+[ (x).
2x
On cherche calculer
Z
x
1
E(X ) = E(Y ) =
tdPY (t) =
x
e 2 1l]0,+[ (x)d(x)
2x
R
R
Z +
Z +
1 x
x
x
e 2 dx = 1.
=
x e 2 1l]0,+[ (x)dx =
2
2
Dans ces calculs nous avons utilis les rgles dintgration suivant une mesure densit et
une mesure de Lebesgue, puis effectu un changement de variable pour calculer lintgrale
gnralise finale. 2
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
42
hd,
Rd
Z
h(X )dP =
h(x)d(x).
Rd
Rd
C.S. - Supposons
que, pour toute application borlienne positive h de Rd dans [0, +],
Z
E[h(X )] =
hd. Alors, comme pour tout B B(Rd ) h := 1lB est une application borlienne
Rd
X
k1,l1
(k,l) .
2k+l
On note X1 , X2
CT U
Besancon
43
R2
+ X
+
+ X
+
X
X
1
1
=
h(j)1
l
(i,
j)
+
h(i)1lAc (i, j)
A
i+j
i+j
2
2
i=1 j=1
i=1 j=1
j1
+ X
i
+ X
X
X
1
1
=
h(j) +
h(i)
i+j
i+j
2
2
j=1 i=1
i=1 j=1
+
+
+
X
X
X
1
1
1
1
3
1
1 j1 h(j) +
1 i h(i) =
2 i h(i)
=
j
i
i
2
2
2
2
2
2
i=1
i=1
j=1
Z
+
X
1
3
=
2 i
h(z)di (z).
2i
2
R
i=1
On notera que, pour obtenir le premier X
terme X
de la quatrime galit, il a t fait usage
du lemme de permutation des symboles
et
pour une suite-double de rels positifs.
Z
hd avec :=
On a donc E[h(Y )] =
i
+
X
i=1
3
1
2 i i , ce qui prouve que est la loi
2i
2
f d.
Rd
d
- C.S. Rciproquement, supposons que, pour
Z toute application positive h de R dans [0, +],
une rsultat danalyse fonctionnelle, il existe une suite croissante (fn )N de fonctions positives,
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
44
n+
Rd
Rd n+
Rd
ouvert A de R , (A) = PX (A). Les probabilits et PX concident sur une famille de parties
de Rd stable par intersection finie (-systme) qui engendre la tribu borlienne de Rd , donc
elles sont gales en vertu du thorme dunicit 1.11 de la page 14.2
Les deux critres des fonctions positives expriment quun vecteur alatoire X , de dimension d,
a pour loi la probabilit si, et seulement si, la relation EP [h(X )] = E (h) est vrifie pour
tout fonction h de la famille C des applications borliennes positives dfinies sur Rd (ou de de
la famille C des applications continues positives support compact sur Rd ).
Le critre didentification de lois utilisant les fonctions de rpartition (lemme dunicit) peut
aussi snoncer sous cette forme. Ainsi, ces trois critres peuvent se formuler en un seul nonc :
Proposition 3.19.
Critres didentification de lois
Soient X un vecteur alatoire de dimension d et une probabilit sur Rd . Alors le vecteur
alatoire X a pour loi si, et seulement si, la relation EP [h(X )] = E (h) est vrifie pour tous
les lments h dun des ensembles C suivants :
1. Si d 1, C est lensemble des applications borliennes de Rd dans [0, +].
2. Si d 1, C est lensemble des applications positives continues et support compact de
Rd dans [0, +].
3. Si d = 1, C est lensemble des indicatrices 1l],u] lorsque u parcourt R.
Dmonstration : 1) A dj t vu dans la proposition 3.17.
2) A dj t vu dans la proposition 3.18.
3) On se limite au cas d = 1. On remarque que, pour tout u R,
PX (] , u]) = E 1l],u] (X )
et (] , u]) = E (1l],u] ).
CT U
Besancon
3.2.2
45
Dfinition 3.6.
Soit X est une v.a.r. sur (, F, P). On appelle esprance mathmatique de X suivant
P ou quelquefois
moyenne de X , et on note E(X ), la quantit (si elle est dfinie)
Z
E(X ) =
X dP.
Dfinition 3.7.
Le moment centr dordre 2 sappelle aussi la variance de X et se note Var(X ). Sa racine
carre positive sappelle lcart-type de X et se note X .
Si X et Y sont deux v.a.r. on appelle covariance de X et Y , le rel (sil est dfini)
Cov(X , Y ) := E([X E(X )][Y E(Y )]).
La proposition suivante donne une condition suffisante dexistence des moments dune v.a.r. .
Proposition 3.20.
Existence des moments de v.a.r.
1. Soit X une v.a.r. telle quil existe un entier naturel non nul p vrifiant E(|X |p ) < +,
i.e. X Lp (, F, P). Alors, pour
tout entier
k vrifiant 1 k p, les moments dordre
k
0
k
k, mk := E(X ) et mk := E (X m1 ) , existent dans R.
2. Si X et Y sont deux variables alatoires relles vrifiant E(X 2 ) < + et E(Y 2 ) < +,
i.e. X et Y sont dans L2 (, F, P), alors la covariance de X et Y , Cov(X , Y ), existe
dans R.
CT U
Besancon
46
R
Z
Z
2
2
(X () m1 ) dP() = (x m1 )2 dPX (x).
X :=
R
Z
Z
mp :=
X p ()dP() =
x p dPX (x).
R
Z
Z
p
0
(X () m1 ) dP() = (x m1 )p dPX (x).
mp :=
Dfinition 3.8.
Une variable alatoire relle X est dite de carr intgrable
X L2 (, F, P).
Exemples 3.13.
Soit X une variable alatoire normale standard. Le calcul dvelopp dans lexemple 3.7
, page 34, prouve que E(X ) = 0 et celui dvelopp dans lexemple 3.6, page 33, que
V ar (X ) = 1. Plus gnralement, on vrifie aisment par un calcul lmentaire que, si X est
une variable de loi normale N (m, 2 ), alors E(X ) = m et Var(X ) = 2 . 2
Proposition 3.22.
Formules de Knig-Huygens
Soient X et Y deux variable alatoire relle de carr intgrable. Alors
1. Var(X ) = Cov(X , X ) = E(X 2 ) [E(X )]2 .
2. Cov(X , Y ) = E(X Y ) E(X )E(Y ).
On vrifie aisment quon retrouve les dfinitions classiques de lesprance pour les v.a.r.
discrtes ou densit comme lindique le rsultat suivant :
CT U
Besancon
47
Proposition 3.23.
1. Si X est une variable alatoire relle intgrable discrte de loi
+
X
PX :=
P(X = ak )ak , alors
k=0
E(X ) =
+
X
ak P(X = ak ).
k=0
2. Si X est une variable alatoire relle intgrable densit continue sur R, alors
Z +
t(t)dt.
E(X ) =
On trouvera la liste des valeurs de lesprance et de la variance des v.a.r. de lois usuelles dans
le formulaire de lannexe A, page 205, de ce cours.
2k1
(2k)!
= k
2 k!
et E X 2k = 2k k!.
2
CT U
Besancon
48
X
k1,l1
(k,l) .
2k+l
CT U
Besancon
49
2. Dmontrer la relation
Var
n
X
!
Xk
k=1
3.3
n
X
Var(Xk ) + 2
Cov(Xi , Xj ).
1i<jn
k=1
d.
Rd
CT U
Besancon
50
1
culier, pour tout entier naturel non nul n, et pour tous vecteurs u et v de Rd , tels que |uv | ,
n
Z
|x|
|x|
inf 2,
on a |X (u) X (v )|
est
dPX (x). La suite de fonctions inf 2,
n
n
Rd
N
domine par la fonction constante qui vaut 2 sur Rd , et converge
sur
Z vers la fonction-nulle
|x|
Rd . Par le thorme de convergence domine de Lebesgue, lim
inf 2,
dPX (x) = 0.
n+ Rd
n
Z
|x|
Soit > 0 donn, on peut donc trouver un entier n tel que |
inf 2,
dPX (x)| . Par
n
Rd
1
suite, pour tout > 0, il existe (prendre = ) tel que, pour tous vecteurs u et v de Rd ,
n
|u v | implique |X (u) X (v )| , ce qui prouve luniforme continuit de la fonction
caractristique.
Z
Z
d, il suffit dappliquer le thorme de Fubini vu en
d =
Pour prouver que
Rd
Rd
CT U
Besancon
51
itx a|t|
d(t) =
itx at
e dt +
e itx e at dt =
1
2a
1
+
= 2
.
a ix a + ix
a + x2
e i[u1 (y1 x1 )+u2 (y2 x2 )++ud (yd xd )]a(|u1 |+|u2 |+|ud |) d(d) (u) ou encore
Par suite, I (x y ) =
Rd
Z k=d
Y
I (x y ) =
e i[uk (yk xk )a|uk | d(d) (u).
Rd k=1
Par le thorme de Fubini (son nonc est rappel dans le prochain chapitre, proposition 4.3,
page 63), compte tenu de ce que la fonction intgrer est variables spares, il vient
k=d
k=d
k=d
Y
Y
YZ
2a
, do
K (yk xk ) =
e i[uk (yk xk )a|uk | d(uk ) =
I (x y ) =
2 + (y x )2
a
k
k
R
k=1
k=1
k=1
I (x y ) = Qk=d
k=1
2d ad
(a2 + (yk xk )2 )
Rd
Rd
application du thorme de Fubini aux mesures (d) et (vrifier que les hypothses du thorme
sont bien satisfaites), cette intgrale peut scrire :
Z
Z
i<u,y >
i<u,x> a(|u1 |+|u2 |+|ud |)
J (x) =
e
e
e
d(y ) d(d) (u),
Rd
Rd
CT U
Besancon
52
7
M
Q
k=d
2
2
k=1 (1 + xk )
k=1 (1 + xk )
intgrable sur Rd pour la mesure de Lebesgue. En effet, par le thorme de Fubini,
Z +
d
Z
2d
1
(d)
d
d
+ d
M Qk=d
d
(x)
=
M2
dt
=
M2
[Arctan(x)]
= M2d d ,
2
2
1
+
t
(1
+
x
)
Rd
k
k=1
ce qui prouve que la fonction x 7 M Qk=d
2d
xk2 )
k=1 (1 +
Par suite Zen faisant tendre a vers 0, en vertu du thorme de convergence domine, lintgrale
2d
Ga (y ) =
f (y ax) Qk=d
d(d) (x) tend vers lintgrale
2
d
R
k=1 (1 + xk )
Z
Z
2d
2d
(d)
f (y ) Qk=d
d
(x)
=
f
(y
)
d(d) (x) = 2d d f (y ),
Qk=d
2
2
Rd
Rd
k=1 (1 + xk )
k=1 (1 + xk )
daprs le calcul qui vient dtre fait plus haut, cest--dire lim Ga (y ) = 2d d f (y ).
a0
Nous pouvons maintenant en dduire la limite de lintgrale H (a) lorsque a tend vers 0.
En effet, pour tout rel a et tout y Rd ,
Z
2d ad
ad d(d) (x)
|Ga (y )|
|f (y ax)| Qk=d
2
2
d
R
k=1 (a + (axk ) )
Z
2d ad
M
ad d(d) (x) = M2d d .
Qk=d 2
2
d
R
k=1 (a + (axk ) )
La famille de fonctions Ga indexes par a, est donc domine par la constante M2d d intgrable
par rapport la mesure de probabilit . Par le thorme de convergence domine de Lebesgue,
CT U
Besancon
Z
il vient lim H (a) =
a0
Rd a0
53
Rd
Pour conclure, rassemblons les rsultats prcdents, en tenant compte que et sont
deux probabilits sur Rd ayant la mme fonction caractristique = . On remarque alors que J (x) = J (x) et, par suite, pour tout rel a > 0, H (a) = H (a). On
en dduit alors, en faisant tendre a vers 0, que lim H (a) = lim H (a), cest--dire que
a0
a0
Z
Z
Z
Z
d d
d d
2 f (y ) d(y ) =
2 f (y ) d(y ), et finalement
f (y ) d(y ) =
f (y ) d(y ),
Rd
Rd
d
Rd
Rd
pour toute fonction f de R dans R, continue et support compact. Par le critre des fonctions
support compact (proposition 3.18, page 43), on en conclut = . 2
Le thorme dinjectivit snonce alors avec les vecteurs alatoires :
Proposition 3.27.
Critre didentification de lois par les f.c.
Deux vecteurs alatoires sur Rd ont la mme loi si, et seulement si, ils ont la mme fonction
caractristique.
Nous pouvons maintenant regrouper tous les critres didentification de lois vus jusqu prsent
sous une formulation unique qui complte la proposition 3.19, page 44 :
Proposition 3.28.
Critres didentification de lois
Soient X un vecteur alatoire de dimension d et une probabilit sur Rd . Alors le vecteur
alatoire X a pour loi si, et seulement si, la relation
Z
h(t) d(t)
E[h(X )] =
Rd
est vrifie pour tous les lments h dun des ensembles C suivants :
1. Si d 1, C est lensemble des applications borliennes de Rd dans [0, +].
2. Si d 1, C est lensemble des applications positives continues et support compact de
Rd dans [0, +].
3. Si d 1, C est lensemble des applications
hu : x Rd 7 hu (x) = exp(ihu, xi) C
lorsque u parcourt Rd .
4. Si d = 1, C est lensemble des indicatrices 1l],u] lorsque u parcourt R.
Dmonstration : Il suffit de prouver litem 3, les autres ayant dj t vus dans le thorme 3.19
de la page 44. On remarque que, pour tout u Rd , X (u) = E (exp(ihu, X i)) = E (hu (X )) et
(u) = E (hu ) On conclut par le thorme dinjectivit 3.26. 2
Dfinition 3.13.
Les familles de fonctions qui apparaissent dans les diffrents item de la proposition prcdente
sont souvent appeles familles de fonctions-test.
Dans le cas o d = 1, les formules dinversion donnes ci-dessous prcisent le lien entre la
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
54
Premier item : Justifier quon peut appliquer le thorme de Fubini pour obtenir :
Z
In :=
n
e ita e itb
(t)dt =
it
Z Z
R
sin(t(x a))
dt
t
sin(t(x b))
dt d(x).
t
u
sin t
u
Posons, pour tout u R, S(u) :=
dt et sg n(u) :=
si u 6= 0 avec sg n(0) := 0.
|u|
Z
Z n 0 t
sin tu
dt = 2sg n(u)S(n|u|) et que In =
fn d o, pour
Montrer que, pour tout u R,
t
R
n
tout x R, fn (x) := 2sg n(x a)S(n|x a|) 2sg n(x b)S(n|x b|). Montrer que la suite
(fn )N converge vers 1l{a,b} + 21l]a,b[ et quil existe M > 0 tel que, pour tout n N, |fn | M.
Conclure laide du thorme de convergence domine.
Second item : Utiliser une dmarche analogue. 2
Dans le cas o la f.c. est intgrable au sens de Lebesgue sur R, on peut prciser la connaissance
de :
Proposition 3.30.
Soit une probabilit sur R de f.c. . Si est intgrable au sens de Lebesgue sur R, alors
admet une densit f par rapport la mesure de Lebesgue sur R. Lapplication f est une
fonction valeurs relles, positive, borne, continue sur R et, pourZ tout x R, f (x) sexprime
+
1
laide de lintgrale gnralise au sens de Riemann f (x) =
e itx (t)dt.
2
Dmonstration : Remarquons que, pour tous rels a et b avec a < b,
Z b
e ita e itb Z b
itx
itx
e
d(x) |b a|.
e
d(x)
=
it
a
a
CT U
Besancon
Z n ita
e itb
e
(t) dt est absolument convergente. On a donc daprs la proposition 3.7,
it
n
page 35,
Z
lim
n+
e ita e itb
(t) dt =
it
e ita e itb
(t) dt =
it
Z
R
e ita e itb
(t)d(t).
it
Z
R
e ita e itb
(t)d(t).
it
positive et que cest bien une densit de probabilit sur R. Comme la fonction sous lintgrale
t 7 e itx (t) est elle-mme continue et borne et intgrable au sens de Lebesgue, lintgrale
Z
1
au sens de Lebesgue
e itx (t) d(t) peut scrire sous la forme dune intgrale gnral2 R
ise au sens de Riemann (cf. proposition 3.7, page 35).
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
56
(k1)
Z
(x) =
iux (k1)
i
(x)dx =
u
n Z +
i
En dduire que (u) =
e iux f (n) (x)dx. Conclure. 2
u
Avec les notations de Landau, le rsultat dmontr peut scrire (u) = o
au voisiu n1
nage de +. En fait, si f a ses n drives premires qui existent et sont intgrables au sens
de Lebesgue sur R, en utilisant
le lemme de Riemann-Lebesgue (cf [4], exercice VI-30), on
1
dmontre que (u) = o
au voisinage de +.
un
Passons maintenant au second point dintrt de la notion de f.c.. Les propositions ci-dessous,
3.33, 3.34 et 3.35, donnent un procd de calcul des moments dune variable alatoire relle
laide de sa fonction caractristique.
Ces rsultats se dmontrent en utilisant le thorme de
Z
drivation sous le signe
vu en thorie de lintgration, que nous rappelons sans le dmontrer
dans le cas particulier qui nous intresse (cf. [8], page 105) :
CT U
Besancon
57
Proposition 3.32.
Z
Thorme de drivation sous le signe
Soit (E , E, ) un espace de probabilit, f une application de E R dans R (ou C). Si f vrifie
les trois hypothses suivantes :
1. pour -presque-tout x E , t R 7 f (x, t) R est drivable sur R,
2. pour tout t R, x E 7 f (x, t) R est intgrable par rapport ,
3. il existe une application g , intgrable
par rapport , telle que, pour -presque-tout
f
x E et pour tout t R, (x, t) g (x),
t
alors,
Z
1. Lapplication F : t R 7 F (t) :=
f (x, t)d(x) R est drivable sur R,
E
f
2. Pour tout t R, x E 7
(x, t) R est intgrable par rapport ,
Z t
f
3. Pour tout t R, F 0 (t) =
(x, t)d(x).
E t
En particulier
(n)
X (0)
=i
x n dPX (x) = i n E (X n ) .
Pour le calcul des moments dune variable alatoire relle, la proposition suivante est parfois
utile :
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
58
Indications pour la dmonstration (laisse en exercice non corrig) : Supposons que X soit
n-fois drivable en 0. Faisons un raisonnement par rcurrence finie sur k tel que 2k n, en
prenant pour proprit de rcurrence lordre k, ( P k ) : "M2k < +."
Montrons dabord ( P 1 ).
Pour simplifier notons f la partie-relle de X et g sa partie-imaginaire. Montrer que g
(2n)
(2n)
est
(0). Montrer que la suite de fonctions
impaire et fpaire. En dduire X (0) = f
1
2n2 (1 f ( )) converge dans R vers f 00 (0). En appliquant le lemme de Fatou (proposition
n
N
x
3.12, page 38) la suite de fonctions 2n2 (1 cos ) , prouver que M2 f 00 (0) < +.
n N
Montrons lhrdit de la proprit.
Supposons ( P k1 ), pour un entier naturel k tel que 2k n, et montrons
Z ( Pk) :
(2k2)
Notons h la partie-relle de X
(2k)
et que h00 (0) =X (0). En dduire,Zen utilisant la convergence de la suite de fonctions
x
1
(2k)
2n2 (1 h( )) , que lim (1)k1 2n2 x 2k2 (1 cos )dPX (x) = X (0). En applin+
n
n
R
N
k (2k)
quant le lemme de Fatou, prouver que M2k (1) X (0) < +. Appliquer le thorme de
rcurrence finie sur k pour conclure.
La deuxime partie rsulte de la proposition 3.33 prcdente.2
On notera que la connaissance des moments ne dtermine pas en gnral la probabilit
(cf. [14], page 89, exemple 11.1). Cependant, sous certaines hypothses, la connaissance des
moments dtermine la probabilit . Cest le cas notamment dans le cas prcis par le rsultat
suivant :
Proposition 3.36.
Soit une probabilit
sur R de f.c. . Supposons quil existe un rel > 0 tel que, pour tout
Z
n
entier naturel n,
|x |d(x) n . Alors la f.c. est dveloppable en srie entire sur R au
vosinage de 0.
CT U
Besancon
59
Proposition 3.37.
Soit uneZprobabilit sur R. Supposons quil existe un rel > 0 tel que, pour tout entier
|x n |d(x) n . Si est une probabilit sur R ayant les mmes moments que ,
naturel n,
R
alors = .
3.4
0
sinon
o a est un nombre rel.
1. Calculer a et dterminer la fonction de rpartition F de X .
2. Calculer lesprance de la variable alatoire X .
Exercice 3.17. (Corrig de lexercice : page 162)
Soit X une variable alatoire normale centre rduite. Prciser, dans chacun des cas cidessous, la loi de probabilit de la variable alatoire Y dfinie en fonction de X
1. Y = X 3 .
2. Y = F (X ) o F est la fonction de rpartition de la variable X .
CT U
Besancon
60
CT U
Besancon
61
Chapitre 4
Indpendance stochastique
Dans la suite, si A et B sont respectivement des parties de Rn et Rp , on posera avec un lger
abus,
AB := {(x1 , , xn+p ) Rn+p /(x1 , , xn ) A et (xn+1 , , xn+p ) B},
c--d AB := (ARp ) (Rn B). De mme, si a := (a1 , , an ) Rn et b := (b1 , , bp )
Rp , on notera (a, b) := (a1 , , an , b1 , , bp ) considr comme lment de Rn+p . On dit que
(a, b) est obtenu par concatnation de a et b.
4.1
Pour introduire la problmatique de lintgration sur Rn+p , commenons par considrer les deux
situations suivantes :
1) Soient a := (a1 , , an ) Rn et b := (b1 , , bp ) Rp . On remarque quavec les notations
prcises en prliminaires on peut crire, pour tous borliens A et B respectivement de Rn et
Rp ,
(a,b) (AB) = 1lAB (a, b) = 1lA (a)1lB (b) = a (A)b (B).
2) De mme, considrons la mesure de Lebesgue sur R2 . Par dfinition pour tous rels
a, b, c, d, avec a < b et c < d, (2) (]a, b]]c, d]) = (]a, b])(]c, d]) o dsigne la mesure
de Lebesgue sur R. Plus gnralement on montre que, pour tous borliens A et B de R,
(2) (AB) = (A)(B).
Gnralisons ces situations en considrant le problme suivant : tant donn deux mesures et
respectivement sur Rn et Rp , existe-t-il une mesure sur Rn+p telle que, pour tous borliens A
et B respectivement de Rn et Rp , (AB) = (A)(B) ? Si oui, y a-t-il unicit de la mesure ?
On montre que dans le cas o et sont des probabilits la rponse est positive. Dans le cas
des mesures plus gnrales ce nest plus ncessairement vrai, cependant cest encore vrai pour
les mesures de Lebesgue. Plus prcisment, on admettra le rsultat suivant :
Proposition 4.1.
Soit (respectivement ) une probabilit ou la mesure de Lebesgue sur Rn (respectivement
sur Rp ) alors il existe une unique mesure sur Rn+p , note , telle que, pour tous borliens
A et B respectivement de Rn et Rp , (AB) = (A)(B).
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
62
Rn
Rp
Le thorme de Tonelli permet en pratique de ramener le calcul dune intgrale multiple, i.e.
sur Rd , au calcul dune succession de d intgrales simples, i.e. sur R, pour lesquelles on
peut appliquer sparment les rgles dintgration dj vues au chapitre III.
Ce rsultat est encore vrai pour les applications f de signe quelconque condition quelles
soient supposes intgrables sur Rn+p suivant la mesure-produit . Il est alors connu sous
le nom de thorme de Fubini :
CT U
Besancon
63
Proposition 4.3.
Thorme de Fubini
Soient une probabilit ou la mesure de Lebesgue sur Rn , une probabilit ou la mesure de
Lebesgue sur Rp et f une application ( )-intgrable de Rn+p dans R, alors,
1. Pour -presque-tout x Rn , lapplication y Rp 7 f (x, y ) R est -intgrable, et,
pour -presque-tout y Rp , lapplication x Rn 7 f (x, y ) R est -intgrable.
Z
p
2. Lapplication y R 7
f (x, y )d(x) R est dfinie -presque-partout et Rn
Z
n
intgrable, et lapplication x R 7
f (x, y )d(y ) R est dfinie -presque-partout
Rp
et -intgrable.
3. Lintgrale de fZ par rapport la mesure-produit
est donne par :
Z Z
f d( ) =
f (x, y )d(y ) d(x)
Rn+p
ZRn ZRp
f (x, y )d(x) d(y ).
=
Rp
Rn
Dautres notations sont utilises dans les ouvrages pour noter une intgrale suivant une mesureproduit. On trouvera indiffremment
Z
Z
Z
f d( ) =
f (x, y ) d( )(x, y ) =
f (x, y ) d(x) d(y )
n+p
Rn+p
Rn+p
ZR
f (x, y ) d(x)d(y ).
=
Rn+p
Exemples 4.2.
Considrons lapplication f dfinie sur R2 par f (x, y ) := 1l]0,+[ (x)1l]a,b[ (y )e xy o a et b
sont des rels tels que 0 < a < b. Cest une fonction borlienne positive sur R2 . Appliquons
le thorme de Tonelli f et la mesure (2) = ,
Z
Z
Z
xy
(2)
f d
=
1l]0,+[ (x)
1l]a,b[ (y )e d(y ) d(x)
R
R2
R
Z
Z
xy
=
1l]a,b[ (y )
1l]0,+[ (x)e d(x) d(y ).
R
Ce qui donne en utilisant la rgle dintgration suivant la mesure de Lebesgue sur R des
fonctions borliennes positives,
Z
Z + ax
e
e bx
(2)
dx
f d
=
x
R2
0
Z
Z b
1
1
b
=
1l]a,b[ (y ) d(y ) =
dy = ln
.
y
a
R
a y
On a ainsi par la mme occasion tabli la valeur de lintgrale gnralise au sens de
Riemann
Z + ax
e
e bx
b
dx = ln
.2
x
a
0
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
64
Proposition 4.4.
Thorme de changement de variable dans Rd (admis)
Soient T un diffomorphisme de classe C 1 dun ouvert U sur un ouvert V de Rd et f une
application borlienne de Rd dans R. Notons J(v ) le jacobien de T 1 au point v V .
1. Si f est valeurs dans [0, +], alors x Rd 7 1lV (x)f (T 1 (x))|J(x)| est une
application borlienne positive.
2. Si lapplication x Rd 7 1lU (x)f (x) est (d) -intgrable sur Rd , alors lapplication
x Rd 7 1lV (x)f (T 1 (x))|J(x)| est (d) -intgrable sur Rd .
De plus, dans les deux cas ci-dessus
Z
Z
(d)
1lU (u)f (u)d (u) =
1lV (v )f T 1 (v ) |J(v )| d(d) (v ),
Rd
Rd
(d)
Z
(u) =
f T 1 (v ) |J(v )| d(d) (v ).
1l]0,+[2 (x, y )e (x
2 +y 2 )
d(2) (x, y ) =
.
4
CT U
Besancon
65
2
r 2
r
=
1l]0,+[ (r )e r d(r )
1l]0, 2 [ ()d() =
e r dr
= .
2
4
R
R
0
Dans le calcul prcdent on a utilis le thorme de Tonelli et la rgle dintgration suivant
la mesure de Lebesgue sur R. 2
Exercice 4.1. (Corrig de lexercice : page 165)
1) Dduire du rsultat de lexemple prcdent les deux relations
Z +
Z +
1 2
1
1
x 2
e dx =
et
e 2 x dx = 1.
2
2
0
2
2
2
2
2) En
Z remarquant que x + 2xy + 2y = (x + y ) + y , dduire de la question prcdente
2
2
e (x +2xy +2y ) d(2) (x, y ) = .
que
R2
Le thorme de Fubini ou de Tonelli sont en particulier trs utiles dans les calculs faisant
intervenir des probabilits densit dfinies sur Rd . Donnons un exemple dutilisation de la
proposition 3.8, page 35, dans le calcul de lois de probabilit sur R2 .
Exemples 4.4.
Soit (X , Y ) un vecteur alatoire de R2 dont la loi admet pour densit la fonction dfinie sur
R2 := 21 1l o := {(x, y ) R2 /|x| + |y | 1}. Cherchons la loi de la variable alatoire
relle X .
Soit A un borlien de R. Calculons PX (A). Par dfinition de la notion de loi et comme
{X A} = {(X , Y ) AR},
PX (A) = P(X A) = P ((X , Y ) AR)
Z
= P(X ,Y ) (AR) =
1lA (x)1lR (y )dP(X ,Y ) (x, y ).
R2
Daprs la rgle dintgration des mesures densit sur R2 puis par application du thorme
de Tonelli (2) = ,
Z
Z
1
1lA (x)1lR (y )dP(X ,Y ) (x, y ) =
1lA (x)1lR (y ) 1l (x, y )d(2) (x, y )
2
2
R2
Z
ZR
1
=
1lA (x)
1l (x, y )d(y ) d(x)
R
R 2
Z
=
1lA (x)(x)d(x)
R
CT U
Besancon
66
4.2
4.2.1
Exemples 4.5.
Revenons lexemple 4.4 de la page 65 pour montrer que, dans ce cas, P(X ,Y ) 6= PX PY .
En effet, considrons le borlien de R2 , G :=] 21 , 1[] 12 , 1[, et comparons P(X ,Y ) (G ) avec
PX PY (G ). Il vient dune part,
Z
Z
1
P(X ,Y ) (G ) =
1lG (x, y )dP(X ,Y ) (x, y ) =
1lG (x, y ) 1l (x, y )d(2) (x, y ) = 0
2
R2
R2
CT U
Besancon
67
CT U
Besancon
68
4.2.2
Les propositions qui suivent ont pour but de donner des critres permettant de reconnatre si
une suite finie de vecteurs alatoires est indpendante.
Proposition 4.6.
Soit (X1 , , Xn ) une suite de vecteurs alatoires de dimensions respectives d1 , , dn . Les
assertions suivantes sont quivalentes :
1. La suite (X1 , , Xn ) est indpendante.
2. Pour tout entier 1 k n et tout borlien Bk de Rdk ,
P(X1 , ,Xn ) (B1 B2 Bn ) = PX1 (B1 )PX2 (B2 ) PXn (Bn ).
3. Pour tout entier 1 k n et tout borlien Bk de Rdk ,
P [X1 , , Xn ) B1 Bn ] = P(X1 B1 ) P(Xn Bn ).
4. Pour tout entier 1 k n et tout borlien Bk de Rdk ,
P [{X1 B1 } {Xn Bn }] = P(X1 B1 ) P(Xn Bn ).
Dmonstration : "(1) implique (2)" rsulte de la dfinition des produits de lois. "(2) implique
(3)" rsulte de la dfinition de la notion de loi et des notations. "(3) implique (4)" rsulte de
la relation ensembliste immdiate vrifier :
{(X1 , , Xn ) B1 Bn } = {X1 B1 } {X2 B2 } {Xn Bn }.
Limplication " (4) implique (1) " rsulte de ce que la probabilit P(X1 , ,Xn ) vrifie la proprit
caractristique des mesures-produits : Pour tout entier 1 k n et tout borlien Bk de Rdk ,
P(X1 , ,Xn ) (B1 B2 Bn ) = PX1 (B1 )PX2 (B2 ) PXn (Bn ). Par unicit de la mesure-produit,
on en dduit que P(X1 , ,Xn ) = PX1 PX2 PXn . Ce qui prouve (1). 2
CT U
Besancon
69
Dans les cas o on manipule des variables alatoires relles discrtes la proposition prcdente
a pour corollaire le critre dindpendance ci-dessous. Pour simplifier on supposera que les
variables alatoires relles sont portes par N mais le rsultat se gnralise aux variables
alatoires relles portes par un ensemble dnombrable quelconque de R, notamment Z.
Proposition 4.7.
Critre des v.a.r. discrtes
Soit (X1 , , Xn ) une suite de variables alatoires relles discrtes portes par N, alors la suite
(X1 , , Xn ) est indpendante si, et seulement si, pour tout (k1 , , kn ) Nn ,
P ({X1 = k1 } {Xn = kn }) = P(X1 = k1 ) P(Xn = kn ).
Dmonstration : La condition ncessaire rsulte de limplication "(1) implique (4)" de la
proposition prcdente o on a pris Bi := {ki }, i = 1, , n, qui sont bien des borliens
de R.
La condition suffisante rsulte du fait que P(X1 , ,Xn ) est une probabilit discrte sur Rn , elle est
donc entirement dtermine par la connaissance des nombres
P(X1 , ,Xn ) ({k1 }{k2 } {kn })
qui sont, par hypothse, gaux
P(X1 = k1 )P(X2 = k2 ) P(Xn = kn ).
De mme on vrifie que PX1 PXn est une probabilits porte par Nn donc discrte. Elle
est donc entirement dtermine par la connaissance des nombres
PX1 PXn ({k1 }{k2 } {kn }) = P(X1 = k1 )P(X2 = k2 ) P(Xn = kn ).
Par suite
P(X1 , ,Xn ) = PX1 PXn .
Ce qui prouve lindpendance de la suite (X1 , , Xn ). 2
Exemples 4.7.
Reprenons les notations de lexemple 3.12, page 42. X := (X1 , X2 ) est un vecteur alatoire
de dimension 2 de loi
X 1
.
PX :=
k+l (k,l)
2
k1,l1
Par suite, pour tous k N et l N ,
P[{X1 = k} {X2 = l}] =
1
2k+l
et P(X1 = k) = P(X2 = k) =
1
.
2k
CT U
Besancon
70
gk (t)
[0, +].
g d
R k
Ce qui prouve que la loi du vecteur alatoire (X , Y , Z ) admet pour densit sur R3 lapplication
dfinie par (u, v , w ) := 1 (u)2 (v )3 (w ).
2) Supposons que le vecteur alatoire (X , Y , Z ) admette pour densit sur R3 lapplication
dfinie par (u, v , w ) := g1 (u)g2 (v )g3 (w ).
Commenons par tudier la loi de la premire composante X .
Daprs la proposition 4.5,Rla variable alatoire relle X admet pour densit sur R lapplication
1 dfinie par 1 (t) := R2 (t, u, v )d(2) (u, v ). Par application du thorme de Tonelli
CT U
Besancon
71
(2) = , il vient
Z
Z
Z
(2)
1 (t) =
g1 (t)g2 (u)g3 (v )d (u, v ) = g1 (t)
g2 (u) g3 (v )d(v ) d(u)
R2
R
R
Z
Z
g1 (t)
= g1 (t)
g2 d
g3 d = R
,
g d
R
R
R 1
car, comme est une densit de probabilit,
Z
Z
(3)
1=
(t, u, v )d (t, u, v ) =
g1 (t)g2 (u)g3 (v )d(3) (t, u, v )
3
3
R
RZ
Z
Z
=
g1 d
g2 d
g3 d .
R
De plus, comme les variables alatoires relles X , Y , et Z ont pour densits respectives 1 , 2 ,
et 3 ,
Z
Z
Z
1lA 1 d
1lB 2 d
1lC 3 d
PX (A)PY (B)PZ (C ) =
R
R
R
Z
Z
Z
g1 (t)
g2 (t)
g3 (t)
=
1lA (t) R
d(t)
1lB (t) R
d(t)
1lC (t) R
d(t)
g
d
g
d
g d
1
2
R
R
R
R
R
R 3
Z
Z
Z
=
1lA g1 d
1lB g2 d
1lC g3 d ,
R
toujours en vertu de
Z
R
Z
Z
g1 d
g2 d
g3 d = 1.
R
CT U
Besancon
72
Exemples 4.8.
1) Reprenons les notations de lexercice 4.5, page 68. On y tablit que le vecteur alatoire
1 x 2 +y 2
e 2 et
(X , Y ) de dimension 2 admet pour densit sur R2 lapplication (x, y ) :=
2
que les variables alatoires relles X et Y suivent la mme loi N 1 (0, 1). Leurs densits
t2
1
X et Y sur R sont dfinies sur R par X (t) = Y (t) = e 2 et vrifient la rela2
tion (x, y ) = X (x)Y (y ), ce qui prouve lindpendance de la suite de variables alatoires
relles (X , Y ) en vertu de la proposition prcdente.
2) Dans lexemple 4.4, page 65, on vrifie aisment que (x, y ) 6= (x)(y ), ce qui est une
autre faon de prouver que la suite de variables alatoires relles (X , Y ) nest pas indpendante. 2
Donnons un critre valable pour des vecteurs alatoires gnraux sans hypothses sur le type
de loi quils satisfont.
Proposition 4.10.
Critre des fonctions positives
Soit (X1 , , Xn ) une suite de vecteurs alatoires de dimensions respectives d1 , , dn . Alors,
la suite (X1 , , Xn ) est indpendante si, et seulement si, pour tout entier 1 k n et toute
application borlienne positive fk de Rdk dans [0, +],
E [f1 (X1 )f2 (X2 ) fn (Xn )] = E [f1 (X1 )] E [f2 (X2 )] E [fn (Xn )] .
CT U
Besancon
73
Rd2
CT U
Besancon
74
Rd2
CT U
Besancon
75
CT U
Besancon
76
k =1
Dmonstration : - C.N. Supposons que les vecteurs alatoires (X1 , , Xn ) sont indpendants.
Alors, pour tout u1 Rd1 , , un Rdn ,
(X1 , ,Xn ) (u1 , , un ) = E e
i[<u1 ,X1 >+<u2 ,X2 >++<un ,Xn >]
=E
k=n
Y
!
e i<uk ,Xk >
k=1
Daprs la proprit 4.12, page 74, applique aux fonctions borliennes bornes e i<u1 ,x1 > ,
e i<u2 ,x2 > , , e i<un ,xn > , on a
(X1 , ,Xn ) (u1 , , un ) =
k=n
Y
E e i<uk ,Xk > = X1 (u1 ) Xn (un ).
k=1
Ce qui prouve que les probabilits PX1 PX2 PXn et P(X1 , ,Xn ) ont les mmes fonctions
caractristiques, donc sont gales en vertu du critre didentification des lois par les fonctions
caractristiques. 2
CT U
Besancon
4.2.3
77
iK
Dfinition 4.6.
Une famille quelconque ( F i )I de sous-tribus de F, est dite (mutuellement) indpendante
pour P si toute famille dvnements (Ai )I avec Ai F i , pour tout i I , est indpendante
pour P.
On dit aussi plus frquemment, et par abus de langage, que les vnements (Ai )I , sont indpendants (resp. les tribus ( F i )I , sont indpendantes).
On remarquera bien que la notion dindpendance dpend de la probabilit P choisie sur (, F).
De plus si lindpendance mutuelle dune famille dvnements entrane leur indpendance deux
deux, il faut noter que la rciproque est fausse (cf. [14] ex. 3-1 3-3).
La preuve de lindpendance de tribus peut stablir en considrant des -systmes de
gnrateurs daprs la proposition :
Proposition 4.17.
Soient C et D deux familles dvnements stables par intersection finie (-systmes). Si, pour
tout (A, B) C D, les vnements A et B sont indpendants, alors les sous-tribus engendres
respectivement par C et D sont indpendantes.
Dmonstration : Il suffit de montrer que, pour tout (A, B) ( C) ( D), P(A B) =
P(A)P(B).
Montrons dabord que, pour tout B D et pour tout A ( C), on a P(AB) = P(A)P(B).
Soit B D fix.
Si P(B) = 0, alors pour tout A ( C), A B B et par suite P(A B) P(B) = 0. Donc,
dans ce cas, pour tout A ( C), on a bien P(A B) = 0 = P(A)P(B).
P(A B)
[0, 1]. On vrifie
Si P(B) > 0, Considrons lapplication A ( C) 7 PB (A) =
P(B)
aisment que cest une probabilit sur (, ( C)). De plus la probabilit PB , concide avec la
probabilit P sur le -systme C, car en vertu de lhypothse, pour tout (A, B) C D,
les vnements A et B sont indpendants, on a bien P(A B) = P(A)P(B), cest--dire
PB (A) = P(A). Donc daprs le thorme dunicit pour les probabilits (cf. proposition 1.11,
page 14) on en dduit que la probabilit PB concide avec la probabilit P sur la tribu ( C)
engendre par le -systme C cest--dire que, pour tout A ( C), PB (A) = P(A), ou encore
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
78
k=1
k=1
k=1
k=n
Y
k=1
la proposition pour n = 2 en raisonnant comme dans la proposition 4.17, puis on gnralise par
rcurrence au cas n quelconque. 2
En particulier, la proposition prcdente 4.17 a pour corollaire le thorme :
Proposition 4.19.
Soit ( F i )I une famille indpendante de sous-tribus de F. Si K et J sont deux [
parties disjointes
[
et non vides de I , alors les tribus engendres respectivement par les familles
F i et
Fi
iJ
sont indpendantes.
CT U
Besancon
iK
79
Fi.
iJ
iJ 0
Ai F i .
[
On dfinit de mme C K la famille des intersections de familles finies dvnements de
Fi.
iK
iK 0
Ai F i .
On a ( C J ) =
Fi
!
et ( C K ) =
iJ
Fi
iK
[
En effet, en considrant les familles un seul lment, on a facilement linclusion
F i CJ ,
iJ
!
[
do linclusion des tribus engendres correspondantes
F i ( C J ). RciproqueiJ
!
[
ment, par la stabilit de lintersection finie dans les tribus, on a C J
F i , et
iJ
!
[
F i . Do lgalit. On montre de la mme faon la relation
par suite ( C J )
! iJ
[
( C K ) =
F i . De plus, on vrifie aisment que les familles C J et C K sont des iK
systmes.
Montrons que, pour tout (A, B) C J C K , \
les vnements A et B sont indpendants.
En effet, soit A C J et B C K . Alors A =
Ai o J 0 est une partie finie de J et, pour
iJ 0
tout i J 0 , Ai F i , et B =
iK 0
\
Ai F i . Par suite, comme J K = , on a J 0 K 0 = , et A B =
Ai . Il vient alors,
0
0
iJ K
!
\
Y
P(A B) = P
Ai =
P (Ai ) , car la suite ( F i )I est une famille indpendante de
iJ 0 K 0
iJ 0 K 0
iJ 0
iK 0
Ce qui prouve que, pour tout (A, B) C J C K , les vnements A et B sont indpendants.
On peut alors appliquer la proposition 4.17 aux -systmes C J et C K pour obtenir le rsultat
recherch. 2
Comme corollaire, nous avons un rsultat similaire avec les vnements :
Proposition 4.20.
Soit (Ai )I une famille indpendante dvnements de F. Si K et J sont deux parties disjointes
et non vides de I , alors les tribus engendres ((Ai )iJ ) et ((Ai )iK ) sont indpendantes.
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
80
iK
4.3
CT U
Besancon
81
Dfinition 4.8.
Un vnement A de F est dit vnement asymptotique (relativement la suite
dvnements (An )N ) si A est mesurable par rapport toutes les tribus de la suite ( An )N . Cela
\
quivaut dire que A est mesurable par rapport la tribu
An appele tribu asymptotique
n=0
\
0
An := (A0 , A1 , A2 , , An ). On note A la tribu asymptotique
An .
n=0
Lide de la dmonstration est de montrer que la tribu asymptotique A est indpendante dellemme.
Montrons que, pour tout entier naturel n, An+1 = (An+1 , An+2 , , An+k , ), et
A0n := (A0 , A1 , A2 , , An ) sont des tribus indpendantes.
Pour cela il suffit dappliquer la proposition 4.20, en reprenant ses notations, au cas o I = N
avec J = {0, 1, , n} et K = {n + 1, n + 2, , n + k, }.
Montrons que, pour tout A A et pour tout B A0 , on a P(A B) =
P(A)P(B) (ce qui exprime que la tribu asymptotique A est indpendante de la tribu A0 :=
(A0 , A1 , A2 , , Ak , ).)
Remarquons tout dabord que, suivant une dmarche dj utilise dans la dmonstration de la
proposition 4.19,
\ A0 est galement engendre par le -systme C constitu des intersections
de la forme
Bi o I est une partie finie de N avec, pour tout i I , Bi (Ai ). Donc
iI
A0 = ( C).
Il reste montrer que, pour tout A A et pour tout B A0 , on a P(A B) = P(A)P(B).
Raisonnons comme dans la dmonstration de la proposition 4.18.
Soit A A fix.
Si P(A) = 0, alors pour tout B A0 , A B A et par suite P(A B) P(A) = 0. Donc,
dans ce cas, pour tout B A0 , on a bien P(A B) = 0 = P(A)P(B).
P(A B)
[0, 1]. Cest une
Si P(A) > 0, considrons lapplication B A0 7 PA (B) =
P(A)
probabilit sur (, A0 ).
La probabilit
\ PA , concide avec la probabilit P sur le -systme C. En effet, soit B C,
alors B =
Bi o I est une partie finie de N avec, pour tout i I , Bi (Ai ). Posons
iI
CT U
Besancon
82
\
[
Ak .
2. lim sup An =
p=0
3. lim inf An =
k=p
p=0
k=p
Ak
!
.
4. lim sup An et lim inf An sont des vnements asymptotiques relativement la suite
dvnements (An )N .
Dmonstration : Les proprits 1), 2) et 3) rsultent directement des dfinitions de lim sup An
et lim inf An .
Montrons la proprit 4) pour lvnement lim sup An . Le raisonnement est analogue pour
[
lim inf An . Posons, pour tout entier naturel p, Bp =
Ak . La suite (Bn )N est une suite dcroisk=p
\
k=0
Bk =
k=p
( An := (An , An+1 , ..., An+k , ...))N est une suite dcroissante, donc pour tout entier naturel p
et pour tout entier naturel k p, Bk Ak Ap , ce qui implique que, pour tout entier naturel
\
\
\
Bk Ap . Par suite, pour tout entier naturel p, lim sup An =
Bk =
Bk Ap . Ce
p,
k=p
CT U
Besancon
k=0
k=p
83
Ap . 2
p=0
k=+
[
k=m
est une suite dcroissante (au sens de linclusion). Daprs le thorme de continuit
monotone des probabilits (cf. proposition 1.9, page 12), P(lim sup An ) = lim P(Bm ).
m+
!
k=+
k=+
X
[
Or P(Bm ) = P
Ak
P(Ak ), en vertu de lingalit de Bonferroni. Mais
k=m
k=m
+
X
k=m
lim
m+
+
X
k=m
m+
fallait dmontrer.
p=+
k=+
\
k=+
\
p=0
k=p
k=+
[
p=0
k=p
!
Ak
!
Ack
k=p
m=+
\
k=m
\
m=p
k=p
!
Ack
CT U
Besancon
84
k=p
k=p
est
mN
k=p
m+
k=m
Y
m+
k=p
(1 P(Ak )) . La srie
k=p
k=p
k=p
p=+
P(Bpc )
[
p=0
Bpc
4.4
CT U
Besancon
85
Proposition 4.30.
Si (X1 , X2 , , Xn ) est une suite indpendante de variables alatoires relles de carr intgrable,
alors
!2
!
n
n
n
X
X
X
E
Xk
< + et Var
Xk =
Var(Xk ).
k=1
k=1
k=1
!2
Xk
k=1
n
X
!2
|Xk |
k=1
n
X
n
X
|Xk | + 2
k=1
|Xk ||Xl |.
1k<ln
|Xk | + 2
n
X
|Xk ||Xl | K
n
X
k=1
1k<ln
k=1
|Xk |2
o K est une constante. Par suite, grce aux hypothses dintgrabilit sur les variables alatoires
relles
!2
!
n
n
n
X
X
X
2
E |Xk |2 < +.
KE
|Xk | = K
E
Xk
k=1
k=1
k=1
n
X
k=1
!
Xk
n
X
k=1
Var(Xk ) + 2
Cov(Xi , Xj )
1i<jn
et on conclut en remarquant que, par indpendance des v.a.r. , Cov(Xi , Xj ) = 0 pour tout
couple dentiers (i, j) tel que i 6= j. 2
Exercice 4.8. (Corrig de lexercice : page 169)
Trouver, parmi les exercices ou exemples dj proposs, un contre-exemple prouvant que
la rciproque de limplication prcdente est fausse.
On peut gnraliser la proposition 4.30 aux vecteurs alatoires en montrant que, si (X , Y )
est un couple indpendant de vecteurs alatoires de dimension d et de carr intgrable, alors
DX +Y = DX + DY , o DX dsigne la matrice de dispersion de X .
Nous allons maintenant donner quelques rsultats sur la somme de v.a.r. indpendantes suivant
des lois classiques. Auparavant nonons un corollaire du critre des fonctions caractristiques
qui sera commode dans la recherche des lois de sommes de variables alatoires relles
indpendantes.
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
86
k =1
CT U
Besancon
87
dfinie sur R par (x) := e x 1l[0,+[ (x) o > 0. Pour tout , on range les
nombres rels X1 (), , Xn () dans lordre dcroissant et on note X(k) () le k ime de ces
nombres ainsi rangs o k = 1, , n.
1. Vrifier que X(1) = max(X1 , , Xn ) et calculer sa fonction de rpartition.
2. Que reprsente la variable alatoire relle X(n) ? Calculer sa fonction de rpartition.
3. Soit t > 0. Pour tout k = 1, , n, on pose Yk := 1l]t,+[ (Xk ).
(a) Prouver que la loi de la variable alatoire relle Yk est PYk = e t 1 +(1e t )0 .
Quelle est la loi de la variable alatoire relle Y1 + Y2 + + Yn ?
(b) Comparer les vnements {X(k) t} et {Y1 + Y2 + + Yn k 1}.
4. Dterminer, pour tout k = 1, , n, la fonction de rpartition de la variable alatoire
relle X(k) .
Dans certains cas on peut directement calculer la loi de la variable alatoire relle "somme".
En voici deux exemples noncs sous forme de propositions 4.34 et 4.36, la dmonstration de
la seconde proposition 4.36 est laisse en exercice.
Proposition 4.34.
Stabilit des lois binomiales
Si (X , Y ) est un couple indpendant de variables alatoires relles de lois binomiales respectives
B(n, p) et B(m, p) de mme paramtre p ]0, 1[, alors la variable alatoire relle X + Y suit
la loi binomiale B(n + m, p).
Dmonstration : Dans ce qui suit on adoptera la convention dcriture : Cnj := 0 pour tout
entier j > n ou j < 0. X et Y sont des lois discrtes portes respectivement par {0, 1, , n}
et {0, 1, , m}. La loi de la variable alatoire relle X + Y sera aussi discrte et porte par
{0, 1, , n + m}. Daprs la proposition 2.10, page 27, il suffit de calculer, pour tout entier
0 k n + m, le nombre P(X + Y = k). Par lgalit ensembliste facile vrifier
j=k
{X + Y = k} =
({X = j} {Y = k j})
j=0
et comme lunion est deux deux disjointe il vient, en appliquant le critre dindpendance des
variables alatoires relles discrtes au couple (X , Y ),
P(X + Y = k) =
j=k
X
P(X = j)P(Y = k j) =
j=0
j=k
X
j=0
k
Cn+m
p k (1
n+mk
p)
n+m
X
k
Cn+m
p k (1 p)n+mk k .
k=0
CT U
Besancon
88
avec la convention habituelle sur les Cni (cf. formulaire de lannexe A, page 205)
Dmonstration : Il suffit de dvelopper de deux manires diffrentes lgalit (1 + X )n+m =
(1 + X )n (1 + X )m et dgaler le coefficient de X k des deux expressions, o 0 k n + m. 2
Proposition 4.36.
Stabilit des lois de Poisson
Si (X , Y ) est un couple indpendant de variables alatoires relles de lois de Poisson respectives
P() et P(), o les rels et sont strictement positifs, alors la variable alatoire relle
X + Y suit la loi de Poisson P( + ).
Voici quelques rsultats plus gnraux sur les sommes de variables alatoires relles indpendantes. Plus que de retenir des formules, Il faut surtout tre capable de refaire directement les
calculs dans chaque cas particulier.
Dans la proposition suivante la notation dsigne le produit de convolution de deux
fonctions f et g positives borliennes de R dans R dfini comme lapplication
Z
f g : x R 7 f g (x) :=
Proposition 4.37.
Soit (X , Y ) un couple indpendant de variables alatoires relles admettant pour densits
respectives X et Y , alors la variable alatoire relle X + Y , admet pour densit lapplication
X +Y := X Y .
Dmonstration : Soit h une application positive borlienne dfinie sur R. Par les thormes de
CT U
Besancon
89
=
=
=
=
R2
E[h(X + Y )] =
R2
Rd
Ce qui aprs le calcul de lintgrale donne X +Y (t) = 1 e t 1l[0,1] (t) + e t (e
1)1l]1,+[ (t).2
Proposition 4.38.
Soit (X , Y ) un couple indpendant de v.a.r. . On suppose que X admet une densit X et
+
X
que Y est une variable discrte porte par N de loi
pk k . Alors la variable alatoire relle
k=0
+
X
pk X (x k) [0, +].
k=0
CT U
Besancon
90
+
X
k=0
Z
pk
k=0
Z
h(x + k)X (x)d(x) le changement de variable dfini sur R, pour k N
Appliquons alors
R
+
X
k=0
Z
=
R
Z
pk
+
X
+
X
k=0
Z
h(u)X (u k)d(u)
pk
R
!
pk X (u k) h(u)d(u)
k=0
La dernire galit se justifie par la proprit de Beppo-Lvi vue au chapitre III. Do le rsultat.
2
Exemples 4.12.
Soit (X , Y ) un couple indpendant de v.a.r. . On suppose que la v.a.r. X suit la loi de
Gauss-Laplace N 1 (0, 1), et Y suit la loi de Poisson de paramtre > 0. Alors la densit
de la v.a.r. X + Y est dfinie sur R par
+
+ k
X
1
e X k
1
e
2
2
exp (t k) =
exp (t k) .2
X +Y (t) :=
2
k!
2
k!
2
2
k=0
k=0
4.5
CT U
Besancon
91
Ckr 1 x kr +1 =
k=r 1
1
.
(1 x)r
2. Montrer que la variable alatoire relle r est une variable alatoire relle discrte de
loi (dite loi de Pascal de paramtres r et p )
P(r , p) :=
+
X
r 1 r
Ck1
p (1 p)kr k .
k=r
+
X
r 1
r
k
Ck+r
1 p (1 p) k .
k=0
CT U
Besancon
92
avec la convention inf = +. Montrer que T est une v.a. valeurs dans N , dterminer
sa loi et calculer son esprance.
Exercice 4.19. (Corrig de lexercice : page 178)
Le but de cet exercice est de montrer quil nexiste pas de probabilit P sur lespace
1
(N , P(N ) telle que, pour tout n 1, P(nN ) = o nN = {nk, k N }.
n
Supposons quune telle probabilit existe. Soit (pk )N la suite des nombres entiers premiers
rangs en ordre croissant.
1. Par un raisonnement simple montrer que P(lim sup(pk N )) = 0.
k
2. Montrer que la suite (pk N )N est indpendante. En dduire, en utilisant le fait que la
X 1
srie
= +, une autre valeur de P(lim sup(pk N )). Conclure que la probabilit
pk
k
k
P nexiste pas.
CT U
Besancon
93
Z () :=
Xj ().
j=1
X
PX = PY :=
pq k1 k o q := 1 p.
k=1
p
p2
q |i| et P(M = j) = 2 q 2j (q + 1).
2
1q
q
CT U
Besancon
94
CT U
Besancon
95
Chapitre 5
5.1
Vecteur gaussien
Dfinition 5.1.
Une variable alatoire relle de loi N 1 (m, 2 ), o m est un rel et un rel positif ou nul, est
dite gaussienne.
En clair, une variable alatoire relle gaussienne (de loi N 1 (m, 2 )) est soit une variable alatoire relle normale desprance m et de variance 2 > 0, soit une variable alatoire relle de
Dirac au point m (constante dterministe gale m, cest le cas o 2 = 0).
Dfinition 5.2.
Soient X un vecteur alatoire de dimension d et (X1 , X2 , ..., Xd ) ses composantes dans la base
canonique de Rd . On dit que X est un vecteur (alatoire) gaussien de dimension d si,
pour tous rels a1 , a2 , ..., ad , la variable alatoire relle a1 X1 + a2 X2 + ... + ad Xd est une variable
alatoire relle gaussienne.
CT U
Besancon
96
CT U
Besancon
97
1i,jd
CT U
Besancon
98
5.2
La dernire proposition 5.1 a pour consquence que la loi dun vecteur gaussien X de dimension
d est entirement dtermine par la connaissance des deux paramtres que sont lesprance m
et la matrice de dispersion D du vecteur gaussien X .
Lexistence de vecteurs gaussiens desprance m et de matrice de dispersion D donnes a priori
est affirme par le rsultat suivant que nous admettrons (pour la dmonstration consulter [3]
exercice VII-11) :
Proposition 5.4.
Si m Rd et D est une matrice carre dordre d coefficients rels, symtrique et de type
positif, il existe un espace de probabilit (, F, P) et un vecteur gaussien de dimension d sur
(, F, P) desprance m et de matrice de dispersion D.
Les rsultats prcdents autorisent la dfinition suivante :
Dfinition 5.3.
On appelle loi de Gauss-Laplace ou loi normale sur Rd de paramtres m et D la loi
de probabilit dun vecteur gaussien de dimension d desprance m et de matrice de dispersion
D. Dans ce cas on note N d (m, D) cette probabilit.
La proposition ci-dessous sera souvent utilise pour prouver que certains vecteurs sont
gaussiens :
Proposition 5.5.
Si X est un vecteur gaussien de dimension d, A une matrice rectangulaire kd coefficients
rels et b un vecteur de dimension k, alors le vecteur alatoire Y := AX + b est un
vecteur gaussien de dimension k. De plus si N d (m, D) est la loi de X , la loi de Y est
N k (Am + b, ADA ) ,
Dmonstration : Il suffit de remarquer que les composantes de AX sont des combinaisons
linaires des composantes de X . Donc toute combinaison linaire des composantes de Y est
une combinaison linaire des composantes de X (qui est une v.a.r. gaussienne car X est suppos
gaussien) laquelle on ajoute une constante, dont la somme est encore une v.a.r. gaussienne.
Y suit donc une loi normale de dimension k. Il reste en prciser les paramtres : esprance et
matrice de dispersion. On applique alors litem 2 de la proposition 3.24, page 48, pour prciser
les paramtres de la loi normale de dimmension k. 2
CT U
Besancon
99
pour i = 2, , n,
pour j = 1, , n 1,
dans les autres cas.
1X 2
uk E(Xk )
X (u1 , , un ) = exp i
uk Var(Xk )
2
k=1
k=1
!
= X1 (u1 ) Xd (ud ),
CT U
Besancon
100
Proposition 5.7.
Si X et Y sont deux vecteurs alatoires de dimensions respectives d et k, DZ la matrice de
dispersion du vecteur concatn Z := (X , Y ) de dimension d + k, DX et DY les matrices de
dispersion de X et Y , alors :
1. La matrice dintercorrlation IX ,Y est une matrice rectangulaire d lignes et k colonnes
dont le coefficient gnral dindice (i, j), o 1 i d et 1 j k, est Cov(Xi , Yj ).
2. IY ,X = IX ,Y , DX = IX ,X et DZ est la matrice par blocs
DX IX ,Y
DZ =
.
IY ,X DY
Do une version plus gnrale de la proposition 5.6 :
Proposition 5.8.
Soient X := (X1 , X2 , ..., Xd ) un vecteur alatoire de dimension d et Y := (Y1 , Y2 , ..., Yk ) un
vecteur alatoire de dimension k.
Supposons que le vecteur concatn Z := (X1 , X2 , ..., Xd , Y1 , Y2 , ..., Yk ) soit gaussien de
dimension d + k. Alors le couple de vecteurs alatoires (X , Y ) est indpendant si, et seulement
si, les vecteurs X et Y sont non-corrls.
Dmonstration : La condition ncessaire rsulte du fait que, si le couple de vecteurs alatoires
(X , Y ) est indpendant, alors, pour tout (i, j) avec 1 i d et 1 j k, le couple de
variable alatoire relle (Xi , Yj ) est indpendant et par suite le coefficient gnral de la matrice
dintercorrlation Cov(Xi , Yj ) = 0.
Rciproquement,
si IX ,Y = 0, alors, daprs la proposition 5.7, IY ,X = 0, et DZ =
DX 0
o Z est le vecteur concatn (X , Y ). On vrifie alors que, pour tout vecteur
0 DY
w := (u1 , , ud , v1 , , vk ) Rd+k , si on considre les vecteurs u := (u1 , , ud ),
v := (v1 , , vk ), mX := E(X ) et mY := E(Y ),
w DZ w = u DX u + v DY v et w E(Z ) = u mX + v mY .
La fonction caractristique du vecteur Z est alors dfinie sur Rd+k par
1
1
CT U
Besancon
101
Pd
1 2
k=1 k2 tk
f (t) = f (t1 , , td ) =
= t 1 t, o t := (t1 , , td ), on obtient
d
1 1
p
exp t t .
2
det(D)
1
Montrons que la loi de X admet une densit. Soit h une application borlienne positive de Rd
dans [0, +]. Comme X = A Z + m, en appliquant le thorme du transfert Z ,
Z
Z
E[h(X )] =
h(A z + m)dPZ (z) =
h(A z + m)f (z)d(d) (z).
Rd
Rd
CT U
Besancon
102
Le vecteur X admet donc la densit dfinie sur Rd par (x) := f (A(x m)). Par suite,
d
1
1
1
1
p
(x) =
exp (x m) A A(x m)
2
2
det(D)
d
1
1
1
1
p
=
exp (x m) D (x m) ,
2
2
det(D)
do le rsultat cherch. 2
On admettra que si la matrice D nest pas inversible, la loi de Gauss na pas de densit par
rapport la mesure de Lebesgue sur Rd car on montre quelle est porte par un sous-espace
affine de Rd de dimension strictement infrieure d.
Dfinition 5.5.
Si la matrice D est inversible, on dira que la loi de Gauss (ou le vecteur gaussien) N d (m, D)
est non-dgnre. Dans le cas contraire on dira quelle est dgnre.
Exemples 5.3.
1) Une variable alatoire relle gaussienne est non-dgnre si, et seulement si, sa loi
est une loi normale de variance non nulle. Donc une variable alatoire relle gaussienne
dgnre est une variable de loi m o m est un rel quelconque.
2) Soit (X , Y ) un couple de variables
alatoires relles admettant pour densit lapplication
1 2
3
2
2
exp (x xy + y ) . On vrifie alors que
dfinie sur R par (x, y ) :=
4
2
1 x
1
1/2
x
2
2
x xy + y = x y
= x y D
1/2
1
y
y
4/3 2/3
o D :=
est la matrice de dispersion du vecteur (X , Y ). On en dduit que
2/3 4/3
(X , Y ) est un vecteur gaussien de loi N 2 (0, D). On peut aussi affirmer que X et Y suivent
la loi N 1 (0, 43 ) et, puisque D nest pas diagonale, que le couple de variables alatoires
relles (X , Y ) nest pas indpendant. 2
Exercice 5.4. (Corrig de lexercice : page 185)
Soit X un vecteur alatoire
de dimension 3. On suppose que la loi de X est N 3 (0, ) o
3 1 0
3 0 . Trouver une matrice A carre dordre 3 telle que les composantes
:= 1
0
0 2
du vecteur AX soient indpendantes et non dgnres.
CT U
Besancon
5.3
103
CT U
Besancon
104
X1 + + Xn
1 X
X :=
et S 2 :=
(Xk X )2 .
n
n 1 k=1
1. Montrer que la v.a.r. X12 suit la loi ( 21 , 12 ) aussi appele loi du Khi-deux 1 degr
de libert et note 2 (1).
2. En utilisant la fonction caractristique des lois Gamma, en dduire que la loi de la
n
X
v.a.r.
Xk2 est ( 12 , n2 ) aussi appele loi du Khi-deux n degrs de libert note
k=1
2 (n).
3. Montrer quil existe une matrice orthogonale
c1,1
c1,2
c2,1
c2,2
..
..
C = .
.
cn1,1 cn1,2
1
n
1
n
C de la forme
c1,n
c2,n
..
...
. .
cn1,n
1
1 X 2
S =
Y .
n 1 k=1 k
2
6. Dmontrer le thorme de Fisher-Cochran : Soit (X1 , , Xn ) une suite indpendante de v.a.r. de mme loi N 1 (0, 1). Alors (X , S 2 ) est indpendant, X suit la loi
N 1 (0, n1 ) et (n 1)S 2 suit la loi 2 (n 1).
Exercice 5.10. (Corrig de lexercice : page 189)
Soit (i )i1 une suite indpendante de v.a.r. de mme loi N 1 (0, 1) et X0 une v.a.r. indpendante de la suite (i )i1 et de loi PX0 = N 1 (m, 2 ). On dfinit la suite de v.a.r. (Xn )n1
de la faon suivante : Xn := ln (X0 , . . . , Xn1 ) + bn n o (bn )n1 est une suite de rels et
(ln )n1 une suite de formes linaires sur Rn . Montrer que, pour tout n 1, il existe une
forme linaire Ln sur Rn+1 telle que Xn = Ln (X0 , 1 , , n ) et en dduire que le vecteur
(X0 , . . . , Xn ) est gaussien.
CT U
Besancon
105
Chapitre 6
\
p1
Lp 6= L et
p1
6.1
6.1.1
CT U
Besancon
106
Proposition 6.1.
Ingalit de Markov
Soient X une variable alatoire relle et une application borlienne de R dans [0, +], alors
pour tout rel a > 0,
E[(X )]
P [(X ) a]
.
a
Dmonstration : Posons A := {(X ) a}. Puisque est positive, on peut crire :
E[(X )] = E[(X )1lA ] + E[(X )1lAc ] E[(X )1lA ] aE(1lA ) = aP(A). 2
Proposition 6.2.
Ingalit de Bienaym-Tchbycheff
Soit X une v.a.r. telle que E(X 2 ) < +. Alors pour tout rel > 0,
P [|X E(X )| ]
1
Var(X ).
2
0
C10
1
C10
9
C10
10
C10
10
1
0, 021,
2
2, 5
0, 156.
42
2
Z +
1
t
exp
= 2
dt 0, 3174,
2
2
1
et par suite P (m < X < m + ) 0, 6826. 2
CT U
Besancon
107
3
8
et P (m 2 < X < m + 2) .
9
4
b) Comparer les valeurs obtenues dans la question prcdente avec celles donnes par le
calcul dans le cas o X est une variable alatoire relle de loi N 1 (m, 2 ).
p
a E (a X )1l],a] (X ) P(X a) 2 + a2 .
En dduire que
P(X > a)
2
.
2 + a2
CT U
Besancon
108
CT U
Besancon
109
6.1.2
Convergence en probabilit
Lnonc de la loi faible des grands nombres suggre alors la dfinition suivante :
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
110
Dfinition 6.3.
On dit quune suite de variables alatoires relles (Xn )N converge en probabilit vers une
variable alatoire relle Y si, pour tout rel a > 0,
lim P (|Xn Y | a) = 0.
n+
On retrouve ici la traduction de la "convergence en mesure" dans le cas o la mesure est une
probabilit.
Avec cette nouvelle dfinition, la loi faible snonce :
Proposition 6.7.
Loi faible des grands nombres (2ime nonc)
Si (Xn )N est une suite indpendante et identiquement distribue de variables alatoires
relles
de carr intgrable
et desprance m, alors la suite des moyennes empiriques
X1 + X2 + ... + Xn
converge en probabilit vers la variable alatoire relle constante m.
n
N
Exemples 6.3.
n
1
n +
1 ,
n+1
n+1 n
alors la suite (Xn )N converge en probabilit vers la variable alatoire relle constante 0.
En effet, soit a > 0 et n un entier tel que n > a > n1 . Comme la variable alatoire relle Xn
est discrte porte par lensemble {n, n1 },
Si, pour tout entier n 1, Xn est une variable alatoire relle de loi
P(|Xn | a) = P(Xn = n) =
1
.
n+1
CT U
Besancon
n
ao n
ao
{|X Y | a} |X Xn |
|Xn Y |
.
2
2
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
111
X
1
P(X =
6 Y)
P |X Y |
= 0.2
n
n1
) = 0.
P b
cn )N
b = P-limn (X
cn ).
On note alors (X
X ou X
On montre (cf. [2] p. 86 ex V-9), et nous ladmettrons, le rsultat suivant :
Proposition 6.9.
(Hors programme)
Lapplication
b, Y
b ) L0 L0 7 (X
b, Y
b ) := inf{ > 0, P(|X Y | ) }
: (X
dfinit une mtrique sur L0 appele mtrique de Ky-Fan. De plus (L0 , ) est complet et
cn )N converge en probabilit vers X
b si, et seulement si, lim (X
cn , X
b) = 0 .
(X
n
La proposition suivante permet deffectuer des calculs sur les limites en probabilit.
Proposition 6.10.
Soient f une application continue de R2 dans R, (Xn )N et (Yn )N deux suites de variables
alatoires relles convergeant en probabilit respectivement vers les variables alatoires relles
X et Y , alors la suite de variables alatoires relles (f (Xn , Yn ))N converge en probabilit vers
la variable alatoire relle f (X , Y ).
Dmonstration : Nous allons dmontrer cette proposition dans le cadre plus restrictif des applications f uniformment continues sur R2 . On admettra le rsultat pour les fonctions seulement
continues.
Comme f est uniformment continues sur R2 , pour tout rel > 0, il existe un rel > 0
(dpendant de ), tel que, pour tout (x, y ) R2 et (x 0 , y 0 ) R2 , |x x 0 | + |y y 0 | <
implique |f (x, y ) f (x 0 , y 0 )| < .
Soit > 0 fix. Pour tout entier naturel n, on a alors
{|f (Xn , Yn ) f (X , Y )| } n
{|Xn X | + |Yno Yn| }
o
|Xn X |
|Yn Y |
.
2
2
CT U
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
Besancon
112
que la suite de variables alatoires relles (f (Xn , Yn ))N converge en probabilit vers la variable
alatoire relle f (X , Y ). 2
On admettra galement que cette proposition devient fausse si lapplication f nest plus suppose continue.
Un corollaire immdiat, et trs utilis en pratique, de la proposition prcdente est :
Proposition 6.11.
Si (Xn )N et (Yn )N sont deux suites de variables alatoires relles convergeant en probabilit
respectivement vers les variables alatoires relles X et Y , alors les suites de variables alatoires
relles (Xn + Yn )N et (Xn Yn )N convergent en probabilit respectivement vers les v.a.r. X + Y
et X Y .
Exercice 6.5. (Corrig de lexercice : page 191)
Trouver, parmi les exercices ou exemples dj proposs dans ce cours, un contre-exemple
prouvant que si la suite de variables alatoires relles (Xn )N converge en probabilit vers la
variable alatoire relle X , cela nentrane pas ncessairement que la suite des esprances
(si elles existent) (E(Xn ))N converge vers le rel E(X ) (sil existe).
6.2
6.2.1
CT U
Besancon
6.2.2
113
Convergence presque-sre
On peut noncer la loi forte sous sa forme classique en introduisant un autre mode de convergence pour les suites de variables alatoires.
Auparavant remarquons que :
Proposition 6.13.
Si (Xn )N est une suite de variables alatoires relles et Y une v.a.r., alors lensemble Y des
tels que la suite relle (Xn ())N ne converge pas vers Y () est un vnement de lespace
de probabilit (, F, P), i.e. Y F.
Dmonstration : Vrifions au pralable que
Y =
+
[ +
\ +
[
n=1 k=0 l=k
1
|Xl Y | >
n
.
CT U
Besancon
114
b . On peut montrer quil existe une topologie associe la convergence presque-sre si,
vers X
et seulement si, la probabilit P est discrte (cf. [2] p. 86 ex V-10).
La proposition suivante permet deffectuer des calculs sur les limites presque-sres.
Proposition 6.15.
Soit f une application continue de R2 dans R, (Xn )N et (Yn )N deux suites de variables alatoires
relles convergeant presque-srement respectivement vers les variables alatoires relles X et
Y , alors la suite de variables alatoires relles (f (Xn , Yn ))N converge presque-srement vers la
variable alatoire relle f (X , Y ).
Cette proposition devient fausse si lapplication f nest plus suppose continue (cf. [14] ex
14-11).
Un corollaire immdiat de la proposition prcdente est :
Proposition 6.16.
Si (Xn )N et (Yn )N sont deux suites de variables alatoires relles convergeant presque-srement
respectivement vers les variables alatoires relles X et Y , alors les suites de variables alatoires
relles (Xn + Yn )N et (Xn Yn )N convergent presque-srement respectivement vers les variables
alatoires relles X + Y et X Y .
CT U
Besancon
115
Proposition 6.17.
1. La suite (Xn )N converge p.s. vers la v.a.r. X si, et seulement si, pour tout > 0,
P(lim sup{|Xn X | }) = 0.
n
X
2. Si pour tout > 0, la srie
P({|Xn X | }) converge dans R, alors la suite (Xn )N
n
converge dans R.
Dmonstration de 6.17 :
1. (Xn ())N converge vers X () si, et seulement si, pour tout > 0, il existe un
entier naturel N tel que, pour tout n N, n > N implique |Xn () X ()| .
En prenant la ngation, (Xn ())N ne converge pas vers X () si, et seulement si, il
existe > 0, tel que, pour tout entier naturel N, il existe n N, vrifiant n > N et
|Xn () X ()| > . La dernire partie de la phrase peut aussi snoncer : il existe > 0,
tel que appartienne une infinit dvnements de la suite ({|Xn X | > })N ; ou
encore par dfinition de la limite-suprieure dune suite dvnements : il existe > 0, tel
que lim sup{|Xn X | > }. Par suite,
n
]0,[
En remarquant que (Xn ())N converge vers X () si, et seulement si, pour tout p N , il
1
existe un entier naturel N tel que, pour tout n N, n > N implique |Xn ()X ()| ,
p
et en raisonnant comme prcdemment on obtient lgalit
[
1
{ /(Xn ())N ne converge pas vers X ()} =
lim sup{|Xn X | > }.
p
n
pN
Si la suite (Xn )N converge presque-srement vers X , alors
P ({(Xn )N ne converge pas vers X }) = 0.
Comme, pour tout > 0,
lim sup{|Xn X | > } { /(Xn ())N ne converge pas vers X ()}
on en dduit que, pour tout > 0, P (lim sup{|Xn X | > }) = 0.
Rciproquement, supposons que, pour tout > 0, P (lim sup{|Xn X | > }) = 0, alors
!
[
X
1
1
P
P lim sup{|Xn X | > } = 0.
lim sup{|Xn X | > }
p
p
pN
pN
Daprs la premire partie on obtient
P ({(Xn )N ne converge pas vers X }) = 0
cest--dire que (Xn )N converge presque-srement vers X .
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
116
On remarquera que dans le troisime item lindpendance est une hypothse essentielle ; on
trouvera un contre-exemple dans ([14] ex 14-4). Le premier item souligne le lien existant entre
les convergences p.s. et en probabilit en snonant :
Proposition 6.18.
La suite (Xn )N converge presque-srement vers X si, et seulement si, la suite (Mn )N , dfinie
pour tout n N par Mn := sup |Xk X |, converge en probabilit vers 0.
kn
n=0
k=n
!
{|Xk X | } . En utilisant
De plus,
!
{|Xk X | } .
k=n
k=n
item de la proposition 6.17 : (Xn )N converge p.s. vers la v.a.r. X si, et seulement si, pour
tout > 0, P(lim sup{|Xn X | }) = 0, ou encore (Xn )N converge p.s. vers la v.a.r. X
n
si, et seulement si, pour tout > 0, lim P sup |Xk X | = 0, ou encore (Xn )N conn+
kn
verge p.s. vers la v.a.r. X si, et seulement si, pour tout > 0, lim P (Mn }) = 0, o on a
n+
pos Mn = sup |Xk X |. Ce qui traduit la convergence en probabilit vers 0 de la suite (Mn )N . 2
kn
Sn2 :=
2
1 X
Xk X (n) ,
n 1 k=1
Sn2
2
1 X 2
n
=
Xk
X (n)
n 1 k=1
n1
(Formule de Steiner)
CT U
Besancon
117
Proposition 6.19.
Loi forte des grands nombres de Kolmogorov (2ime nonc)
Si (Xn )N est une suite indpendante et identiquement distribue de variables
alatoires relles
X1 + X2 + ... + Xn
intgrables et desprance m, alors la suite des moyennes empiriques
n
N
converge presque-srement vers la variable alatoire relle constante m.
Dmonstration : Conformment au programme de lunit, on ne fera la dmonstration de ce
thorme que dans le cadre plus restreint des variables de carr intgrable seulement. Remarquons quen posant, pour tout entier naturel n, Yn = Xn m, on peut se ramener, sans perte
de gnralit, ne faire la dmonstration que dans le cas dune suite de variables alatoires
centres. On notera 2 la variance commune des variables Xn .
Soit (Xn )N une suite indpendante et identiquement distribue de variables alatoires relles
centres de carr intgrable.
tout entier naturel non nul n, posons Sn = X1 +X2 + +Xn .
Pour
Sn2
converge presque-srement vers 0.
Montrons que la suite
n2 nN
En effet, pour tout > 0, nous avons,
de lingalit de Bienaym-Tchebychev,
par
application
Sn2
2
en tenant compte de lgalit V ar
= 2 (vrifier le calcul),
n2
n
V ar Sn2
Sn2
n2
2
P 2
=
.
n
2
n 2 2
X Sn2
Ce qui prouve que la srie numrique termes positifs
P 2 est convergente, car
n
n
son terme gnral est majore par le terme gnral dune srie de Riemann
On
convergente.
Sn2
conclut alors, en appliquant litem 2) de la proposition 6.17, que la suite
converge
n2 nN
presque-srement vers 0.
Pour tout entier naturel non nul n, notons pn la partie entire de n, i.e. pn est
lunique
Spn2
p2
pn2 n, ce qui implique lim n = 1 et n pn2 2 n. Comme, daprs ce qui vient dtre
n+ n
Spn2
Sn2
vu, la suite
converge
presque-srement
vers
0,
la
suite
converge aussi
n2 nN
pn2 nN
Sp2
Sp 2 p 2
presque-srement vers 0. De la relation, pour tout entier naturel non nul n, n = 2n n , on
n
pn n
2
Spn
peut conclure, en passant la limite presque-sre, que
converge presque-srement
n nN
vers 0.
Pour conclure la dmonstration du thorme, utilisons nouveau lingalit de BienaymTchebychev.
Pour
0,
tout
>
2
2
2
Sn Spn2
1
(n
p
)
2
n
n
= P
Xp2 +1 + Xp2 +2 + + Xn
P
,
n
n
n
n
n
n 2 2
n 2 2
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
118
car ona vu que n pn2 2 n. Ce qui prouve que la srie numrique termes positifs
X
Sn Sp2
P n est convergente, car son terme gnral est majore par le terme
n
n
n
gnral dune srie de Riemannconvergente.
Toujours en appliquant litem 2) de la propoSn Spn2
6.3
CT U
Besancon
119
Dfinition 6.7.
Si p [1, +], on dit que la suite de v.a.r. (Xn )N converge en moyenne dordre p vers
b Lp et pour tout
la v.a.r. X ou plus simplement converge dans Lp vers la v.a.r. X si X
p
c
c
b
n N, Xn L avec lim kXn X kLp = 0. Si p = 2 on parle aussi de convergence en
n
moyenne quadratique.
Lp
On note alors (Xn )N X ou X = Lp -limn (Xn ).
On ne confondra pas la convergence dans Lp avec la convergence de la suite des esprances
mathmatiques. Plus prcisment :
Proposition 6.22.
Si la suite (Xn )N converge dans Lp vers la v.a.r. X , alors la suite des esprances (E(Xn ))N
converge dans R vers E(X ).
La rciproque est fausse.
Concernant la rciproque on a cependant le rsultat suivant :
Proposition 6.23.
Si la suite (Xn )N converge p.s. vers la v.a.r. X et si, pour tout entier naturel n, Xn 0, alors
(Xn )N converge dans L1 vers la v.a.r. X si, et seulement si, (E(Xn ))N converge dans R vers
E(X ).
6.4
Il existe des relations entre les diffrents modes de convergence de suites de variables alatoires.
Ces relations sont la traduction en langage probabiliste des relations entre les modes de convergence vus en thorie de la mesure. Rappelons-les pour mmoire :
La convergence presque-sre est plus forte que la convergence en probabilit comme le prcise
la proposition :
Proposition 6.24.
Si (Xn )N est une suite de variables alatoires relles convergeant presque-srement vers la
variable alatoire relle Y , alors la suite (Xn )N converge en probabilit vers la variable alatoire
relle Y .
La rciproque est fausse.
Dmonstration : En partant de la dfinition de la convergence des suites, on vrifie dabord
que, pour tout rel a > 0,
\ [
{|Xn Y | a} Y .
mN nm
\ [
mN nm
{|Xn Y | a}
!
= lim P
m+
{|Xn Y | a} .
nm
CT U
Besancon
120
{|Xn Y | a}
P ({|Xm Y | a}) ,
nm
on obtient
!
0 P(Y ) P
\ [
mN nm
{|Xn Y | a}
m+
CT U
Besancon
121
Proposition 6.29.
Si (Xn )N converge dans Lp vers X , 1 p < +, alors il existe une sous-suite convergeant
presque-srement vers X .
Concernant le lien entre les convergences dans Lp et en probabilit, on a :
Proposition 6.30.
Si (Xn )N converge dans Lp vers X , 1 p < +, alors elle converge en probabilit vers X .
La rciproque est fausse, la convergence en probabilit nentrane pas la convergence dans Lp
(cf. [14] ex 14-6, [2] p. 83 ex V-1-(5)).
6.5
CT U
Besancon
122
2. Soit (Xn )N une suite indpendante de v.a.r. de mme loi. On pose, pour tout n N ,
Sn := X1 + X2 + ... + Xn . En utilisant la relation
Sn+1
Sn
Xn+1
Sn
,
n
n+1
n(n + 1) n + 1
Montrer que
1
{( Sn )N converge dans R} [lim sup{|Xn | n}]c .
n
n+
3. On suppose de plus que X1 nest pas intgrable. A laide du lemme de Borel-Cantelli,
1
montrer que la suite de v.a.r. ( Sn )N ne converge pas presque-srement dans R.
n
Exercice 6.13. (Corrig de lexercice : page 196)
Soit (Xn )N une suite indpendante de v.a.r. intgrables, de mme loi et desprance m 6= 0.
On note, pour tout entier n 1, Sn := X1 + X2 + ... + Xn . Soit I un intervalle born de R.
1. Montrer linclusion
c
1
Sn
converge vers m lim sup{Sn I } .
n
n
N
2. En dduire que presque-srement seulement un nombre fini des vnements {Sn I }
sont raliss.
CT U
Besancon
123
Chapitre 7
Thorme-limite central et
convergence de lois
Dans ce chapitre, sauf indication contraire, toutes les variables alatoires considres seront
relles et dfinies sur un mme espace de probabilit (, F, P). On notera M1 (R), ou plus
simplement M1 , lensemble des mesures de probabilit sur R. On se propose de munir cet
ensemble dune structure topologique appele topologie de la convergence troite . La
notation Cb (Rd ) dsignera lespace fonctionnel des applications, appeles fonctions-test ,
continues et bornes de Rd dans R.
7.1
7.1.1
Pour introduire lnonc du TLC, commenons par une proposition lmentaire trs utilise en
statistique infrentielle.
Proposition 7.1.
Si (Xn )N est une suite indpendante et identiquement distribue (i.i.d.) de variables alatoires
relles gaussiennes desprance m et de variance 2 > 0, alors, pour tout entier n > 0, la
variable alatoire relle
X1 + + Xn
m
n
2
est une variable alatoire normale centre de variance
.
n
Dmonstration : Soit n N fix. Comme (X1 , , Xn ) est une suite indpendante de variables
alatoires relles gaussiennes, la somme X1 + +Xn est une variable alatoire relle gaussienne
de loi N 1 (nm, n 2 ). Par suite la v.a.r.
X1 + + Xn
m
n
est de loi N 1 (0,
2
). 2
n
CT U
Besancon
124
En particulier, pour tout x R, on peut crire avec les notations de la proposition prcdente,
X1 + + Xn
m x
n
2
n
1
=
2
u2
e 2 du.
X1 + + Xn
m x
n
CT U
Besancon
X1 + + Xn
m x
n
Z x
n
2
t2
e 2 dt
2
,
n
q
2
2 n
u2
2
2 n
du.
125
X1 + + Xn
n
2
X1 + + Xn
m suit la loi normale N 1 (0, ) ou encore que la moyenne empirique
suit approxn
n
2
imativement la loi N 1 (m, ). Cela signifie quasymptotiquement la v.a.r. Sn = X1 + + Xn
n
peut tre approxime par une variable alatoire normale desprance nm et de variance n 2 .
On peut dire quasymptotiquement, i.e. pour tout entier n assez grand, lerreur
On peut alors donner une autre forme quivalente du TLC qui porte sur la somme de n v.a.r
i.i.d. :
Proposition 7.4.
Thorme-limite central (version "somme de n v.a.r.")
Si (Xn )N est une suite indpendante et identiquement distribue de variables alatoires relles
de carr intgrable, desprance m et de variance 2 > 0, alors, pour tout rel x,
Z x
t2
1
Sn nm
x =
e 22 dt.
lim P
n+
n
2
On peut aussi exprimer le TCL sous une forme plus intuitive, calque sur lnonc de la
proposition 7.2 mais cette fois sans lhypothse de normalit des variables, ce qui conduit
un rsultat analogue vrai seulement asymptotiquement sur n, au lieu de ltre pour tout n.
Cest dailleurs souvent sous cette dernire forme que le TLC est nonc et utilis dans les
applications pratiques en statistique.
Proposition 7.5.
Approximation dune somme de v.a.r. par la loi normale
Si (Xn )N est une suite indpendante et identiquement distribue de variables alatoires relles
de carr intgrable, desprance m et de variance 2 > 0, alors, pour tout entier naturel n 1
suffisamment grand (en pratique n 30), la variable alatoire relle Sn := X1 + + Xn
se comporte approximativement comme une variable alatoire normale desprance nm et de
variance n 2 .
Exemples 7.1.
Considrons une suite i.i.d. (Xn )N de variables alatoires relles de loi uniforme sur
365
X
1 1
Xk . Alors P(|S| 15) 0, 99.
lintervalle [ 2 , 2 ]. Posons S :=
k=1
En effet, en gardant les mmes notations que plus haut, un calcul desprance et de variance
pour la variable alatoire relle X1 de loi uniforme sur lintervalle [ 12 , 21 ] on obtient,
1
m = E(X1 ) = 0 et 2 = Var(X1 ) = 12
. Par suite E(S) = 0 et, en vertu de lidentit
des lois et de lindpendance de la suite (Xn )N ,
!
365
365
X
X
365
Var(S) = Var
Xk =
Var(Xk ) =
.
12
k=1
k=1
Comme daprs ce qui a t crit plus haut, S est pratiquement une variable alatoire
relle normale car n peut tre considr comme grand, on en dduit que la loi
qde S est
pratiquement N 1 (0, 365
). Cela signifie aussi que la variable alatoire relle
12
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
12
S
365
est
CT U
Besancon
126
En utilisant la table de la loi normale centre rduite de lannexe B, page 211, on trouve
P(|S| 15) 0, 99.
Comparons ce rsultat ce que donnerait lingalit de Bienaym-Tchbychev. Par application de cette ingalit,
P(|S| > 15) = P(|S E(S)| > 15)
Var(S)
0, 135,
152
7.1.2
X1 + + Xn np
p
np(1 p)
CT U
Besancon
127
la suite (Xn )N . 2
Le thorme de De Moivre-Laplace exprime que dans la pratique, pour n assez grand, une
variable alatoire relle X binomiale de taille n peut tre approxime par une variable alatoire
relle normale X 0 . Plus prcisment, si a et b sont des rels avec a < b, alors
!
X np
b np
a np
<p
p
.
P (a < X b) = P p
np(1 p)
np(1 p)
np(1 p)
Do pour un entier n assez grand,
1
P (a < X b)
2
bnp
np(1p)
t2
e 2 dt
anp
np(1p)
u np
c--d avec le changement de variable t = p
,
np(1 p)
Z b
1
(u np)2
P (a < X b) p
exp
du = P (a < X 0 b)
2np(1 p)
2np(1 p) a
o X 0 est une variable alatoire relle normale desprance np et de variance np(1 p).
En conclusion, on peut dire quasymptotiquement, i.e. pour n assez grand, la v.a.r. X
binomiale B(n, p), peut tre approxime par une variable alatoire normale X 0 desprance np
et de variance np(1 p). Dans la pratique cette approximation est considre satisfaisante si
n 20 et p 12 .
Exercice 7.1. (Corrig de lexercice : page 196)
Un cinma comporte deux salles contenant chacune n places. N personnes se prsentent
lentre de ce cinma. On admet que les choix des spectateurs sont indpendants les uns
des autres et quun spectateur quelconque a une chance sur deux daller dans la premire
salle.
1. Quelle est la probabilit P que tous les spectateurs ne puissent pas voir le film quils
ont choisi ?
2. Comment le constructeur aurait-il d choisir n si on sait que N = 1000 et si on veut
que P 0, 01 ?
On peut faire, pour les variables alatoires relles de Poisson, un raisonnement analogue celui
fait pour les variables binomiales pour obtenir la proposition suivante :
Proposition 7.7.
Approximation dune loi de Poisson par une loi normale
Soient un rel > 0 et, pour tout entier n 1, Zn une variable alatoire relle de loi de
Poisson P(n), alors pour tout rel x,
Z x
t2
Zn n
1
lim P
x =
e 2 dt.
n+
n
2
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
128
7.1.3
Correction de continuit
Prenons le cas de lapproximation dune variable alatoire relle X binomiale B(n, p), par une
variable alatoire relle X 0 normale N 1 [np, np(1 p)]. Si on remplace "brutalement" X par X 0
dans les calculs, on aura, pour tout entier 0 k n, P(X = k) P(X 0 = k) = 0 car X 0 tant
une variable alatoire relle densit, P(X 0 = x) = 0 pour tout rel x. Ce qui na aucun intrt.
En gnral pour viter cet inconvnient, quand on veut approximer dans un calcul pratique une
variable alatoire relle X discrte porte par N par une variable alatoire relle X 0 admettant
une densit sur R de fonction de rpartition F , on effectue une correction appele correction
de continuit.
Les corrections de continuit sont donnes par :
1. Pour tout entier 0 k n, on approxime P(X = k) de la faon suivante :
1
1
1
1
0
P k X k+
P(X = k) = P k X k +
2
2
2
2
cest--dire
Z
P(X = k)
k+ 12
(t)d(t) = F
k 12
1
k+
2
F
1
k
2
.
2. Plus gnralement, si a et b sont des rels avec a < b, on approxime P(a < X < b) de
la faon suivante (mmes critures avec les ingalits larges) :
1
1
1
1
0
P(a < X < b) = P a X b +
P a X b+
2
2
2
2
cest--dire
Z
P(a < X < b)
b+ 21
(t)d(t) = F
a 12
1
b+
2
1
F a
.
2
3. On crit, pour tout rel b, (mmes critures avec les ingalits larges) :
Z b+ 1
2
1
1
1
0
P(X < b) = P X b +
(t)d(t) = F b +
P X b+
=
.
2
2
2
4. On crit, pour tout rel a, (mmes critures avec les ingalits larges) :
Z +
1
1
1
0
P(a < X ) = P a X P a X =
(t)d(t) = 1F a
.
2
2
2
a 12
CT U
Besancon
7.2
129
1
x R / ({x}) >
k
.
1
Mais, pour tout entier k 1, {x R/({x}) > } contient au plus k lments. Par suite
k
lensemble des discontinuits de la fonction de rpartition dune probabilit est une runion
dnombrable densembles dnombrables, donc est un ensemble dnombrable. 2
On prendra garde que, si une suite de fonctions de rpartition de probabilits converge, sa
limite nest pas ncessairement la fonction de rpartition dune probabilit, comme le montre
lexercice 7.2 ci-dessous. En revanche, on admettra que :
Proposition 7.9.
La limite, si elle existe, dune suite de fonctions de rpartition est une application de R dans
[0, 1] continue droite et croissante.
Exercice 7.2. (Corrig de lexercice : page 197)
En considrant la suite de probabilits de Dirac au point n sur R, (n )N , montrer que la
limite, si elle existe, dune suite de fonctions de rpartition nest pas ncessairement une
fonction de rpartition et quon peut avoir la convergence simple de la suite (Fn )N sans
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
130
CT U
Besancon
131
Proposition 7.12.
Thorme-limite central (version relle)
Soient (Xn )N une suite indpendante et identiquement distribue de variables alatoires relles
de carr intgrable (i.e. E(|X0 |2 ) < +), desprance m R et de variance 2 . On pose, pour
tout entier
naturelnon nul n, Sn = X1 + X2 + + Xn . Alors, la suite de variables alatoires
Sn nm
suite relle
e n
k=n k
X
n
k=0
k!
!
.
n1
Dans le cas o la suite de probabilits est compose de probabilits discrtes portes par N, on
utilise le critre de convergence suivant :
Proposition 7.13.
Critre de convergence pour les probabilits discrtes
Soient, pour tout n N, n et des probabilits discrtes portes par N. Alors la suite (n )N
converge vers si, et seulement si, pour tout k N, la suite de rels (n ({k}))N converge vers
({k}).
Dmonstration : Montrons la condition ncessaire. Comme est une probabilit discrte porte
par N, sa fonction de rpartition est dfinie sur R par
F (x) =
+
X
({k})1l[k,+[ (x).
k=0
On a une criture analogue pour les fonctions de rpartition des probabilits n . Lensemble des
points de discontinuit de F est inclus dans N. Par suite, pour tout entier k, k + 21 et k 21
sont des points de continuit de F et Fn . Comme ({k}) = F (k + 12 ) F (k 12 ), il vient
en utilisant le fait que, pour tout point de continuit x de F , F (x) = limn Fn (x),
1
1
({k}) = lim Fn k +
lim Fn k
n
n
2
2
1
1
= lim Fn k +
Fn k
n
2
2
= lim n ({k}).
n
CT U
Besancon
132
n(n 1)...(n k + 1) k
pn (1 pn )nk .
k!
nk
() ,
n
et par quivalence
lim B(n, pn )({k}) =
n+
k
e = P()({k}),
k!
CT U
Besancon
133
Dfinition 7.3.
On appelle loi hypergomtrique de paramtres N, n, p, la probabilit sur R dfinie par
H(N, n, p) :=
n
nk
k
X
CNp
CNq
k=0
CNn
k ,
f d.
R
nonc en terme de convergence en loi de v.a.r. cette dernire proposition devient, par
application du thorme du transfert :
Proposition 7.17.
Critre de convergence en loi par les fonctions continues bornes
Soient (Xn )N une suite de v.a.r. et X une v.a.r.. La suite de v.a.r. (Xn )N converge en loi vers la
v.a.r. X si, et seulement si, pour tout f Cb (R), la suite de rels (E(f (Xn ))N converge dans
R vers E(f (X )).
A titre dapplication de ce rsultat, prouvons la proposition suivante :
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
134
Proposition 7.18.
Soit (Xn )nN une suite de v.a.r. et f une application continue de R dans R. Si la suite de v.a.r.
(Xn )N converge en loi vers une v.a.r. X , alors la suite de v.a.r. (f (Xn ))N converge en loi vers
f (X ).
Dmonstration : On remarque tout dabord que, pour tout n N, lapplication f (Xn ) de
dans R est bien une variable alatoire puisquelle est la compose de lapplication Xn
qui est ( F, B(R))-mesurable et de lapplication f qui est continue donc ( B(R), B(R))mesurable. Si est une application de R dans R continue borne alors f est galement continue borne. Lhypothse de convergence en loi de la suite (Xn )N vers X entrane, compte tenu deZ la proposition 7.16
Z applique f et du thorme de transfert,
lim E[ f (Xn )] = lim f (x)dPXn =
f (x)dPX = E[ f (X )] que lon peut crire
n
lim E[(f (Xn ))] = E[(f (X ))]. Ceci tant valable pour toute application continue borne ,
n
Rd
f dn )N converge dans
C.S. -
On
que, pour toute fonctionZ f continue et support compact sur R, la suite
Z suppose
de rels
f dn
converge dans R vers
f d.
R
Considrons, pour tout entier naturel non nul k, la fonction k , dfinie, pour tout rel x, par
0,
si x < (k + 1) ou x > k + 1 ;
1,
si k x k ;
(x) =
x + k + 1, si k x k + 1 ;
x + k + 1,
si (k + 1) x k.
CT U
Besancon
135
Pour tout entier naturel non nul k, la fonction k , est une fonction continue support compact
telle que 0 k 1 et la suite de fonctions (k )N converge simplement sur R vers la
fonction constante gale 1. Donc, la suite (1 k )N converge simplement sur R vers la
fonction nulle et cette suite de fonctions est domine par la fonction -intgrable 1lR , car
est par
Z hypothse une Zprobabilit. Donc par le thorme de convergence domine, on obtient
lim
(1 k )d =
lim (1 k )d = 0.
k
R k
Soit h une fonction continue, borne sur R par M. On a, pour tout entier naturel non nul k,
et tout entier naturel n,
Z
Z
Z
Z
Z
Z
hdn hd (h hk )dn + hk dn hk d + (hk h)d
R
R
RZ
R
Z R
ZR
Z
M (1 k )dn + hk dn hk d + M (1 k )d,
R
R
RZ
ZR
Z
M (1 k )d + M (1 k )dn (1 k )d +
R
Z R
R
Z
Z
+ hk dn hk d + M (1 k )d,
RZ
R
R Z
Z
M (1 k )d + M k dn k d +
R
Z R
R
Z
Z
+ hk dn hk d + M (1 k )d,
R
(1 k )dn (1 k )d =
k d
k dn , puisque, et n tant des
R
R
ZR
Z
1ldn = 1. Or les fonctions k et hk sont continues support
1ld =
probabilits,
car
On peut remplacer dans la proposition prcdente les fonctions continues support compact
par les fonctions continues "nulles linfini".
Dfinition 7.4.
Une application f de Rd dans R est dite nulle linfini si, pour tout > 0, il existe un
compact K Rd tel que, pour tout x K c , |f (x)| .
On note souvent C0 (Rd ) lensemble des applications de Rd dans R continues et nulles linfini.
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
136
Rd
f dn )N converge dans R
1
(f fn ) d = (f fn ) d =
2
R
R
+
Z
|f fn |d
R
],t]
quand n tend vers linfini. On a montr que, pour tout t R, la suite (Fn (t))N converge vers
F (t) o Fn est la fonction de rpartition de n et F celle de . Do la convergence troite de
(n )N vers . 2
La rciproque est fausse comme le prouve lexercice suivant :
Exercice 7.6. (Corrig de lexercice : page 198)
En considrant, pour tout entier n 1, les applications dfinies, pour tout rel x, par
CT U
Besancon
137
fn (x) := [1 cos(2nx)]1l[0,1] (x), montrer quil existe une suite de probabilits qui converge troitement vers une probabilit sans que la suite des densits associes converge
-presque-partout vers la densit de .
Les fonctions caractristiques (f.c.) sont aussi un outil extrmement commode dans ltude
des convergences troites, grce au rsultat suivant quon admettra (on pourra en trouver une
dmonstration dans [4], pages 179-181) :
Proposition 7.22.
Thorme de continuit de Paul Lvy
Soit (n )N une suite de probabilits sur Rd . La suite des f.c. (n )N converge simplement sur Rd
vers une application de Rd dans C continue en 0 si, et seulement si, il existe une probabilit
sur Rd , de fonction caractristique = , telle que la suite (n )N converge troitement vers .
Lhypothse de la continuit de en 0 est essentielle. Dans la proposition 7.22, le fait que
(n )N converge vers une limite qui est une probabilit fait partie du rsultat de la proposition,
contrairement la proposition 7.23 qui suit, o le fait que soit une probabilit fait partie des
hypothses de la proposition.
Le thorme de continuit de Lvy a pour corollaire un critre pratique de convergence troite
utilisant les fonctions caractristiques.
Proposition 7.23.
Critre de convergence troite par les f.c.
Soient (n )N une suite de probabilits sur Rd et une probabilit sur Rd . La suite de
probabilits (n )N converge troitement vers la probabilit si, et seulement si, la suite des
f.c. (n )N converge simplement sur Rd vers la f.c. .
ou encore, nonc avec les v.a.r. :
Proposition 7.24.
Critre de convergence en loi par les f.c.
Soient (Xn )N une suite de v.a.r. et X une v.a.r.. La suite (Xn )N converge en loi vers X si, et
seulement si, la suite des f.c. (Xn )N converge simplement sur R vers la f.c. X .
Dmonstration : C.N. - Supposons que (n )N converge troitement vers la probabilit . Les
fonctions eu : x Rd 7 e i<x,u> C, o u Rd , sont continues et bornes sur Rd . Par
application du critre de convergence troite par les fonctions continues et bornes (proposition 7.16) appliqu aux parties relles et imaginaires
u , on en conclut que, pour
Z des fonctions e
tout u Rd , la suite de nombres complexes
e i<x,u> dn (x)
converge dans C vers
Rd
N
Z
e i<x,u> d(x), donc la suite des f.c. (n )N converge simplement sur Rd vers la f.c. .
Rd
C.S. - Supposons que la suite des f.c. (n )N converge simplement sur Rd vers la f.c. .
Prenons, avec les notations du thorme de continuit de Lvy, = . Alors, la suite des
f.c. (n )N converge simplement sur Rd vers une application de Rd dans C continue en 0.
Par le thorme de continuit de Lvy, on en conclut quil existe une probabilit sur Rd , de
fonction caractristique = , et que la suite (n )N converge troitement vers . Comme
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
138
est la suite stationnaire nulle. Elle converge troitement vers la loi gaussienne
n
N
dgnre de dimension N 1 (0, 0) = 0 . Ce qui prouve le thorme dans le cas 2 = 0.
Plaons-nous maintenant dans le cas 2 > 0.
Soit la fonction caractristique de la v.a.r. X1 m. Daprs la proposition 3.33, page 57,
comme les variables sont de carr intgrable, la f.c. est de classe C 2 . De plus, on a (0) = 1,
0 (0) = E(X1 m) = 0 et 00 (0) = i 2 E[(X1 m)2 ] = Var(X1 ) = 2 . La fonction admet
2
un dveloppement limit en 0 lordre 2 donn, pour tout rel t, par (t) = 1 t 2 + t 2 (t)
2
Sn nm
CT U
Besancon
2 t 2
2
2
t2
1 t2 +
2n
n
n
2
k
k=n
X
Cnk t 2k
t
=
+
.
nk
2
n
k=0
k
2
k
t
Cnk t 2k
uk (n) =
nk
2
n
Mk
constante M telle que, pour tout entier naturel non nul n, |uk (n)|
. Donc la srie
k!
+
X
X
uk (n) converge normalement. On peut donc intervertir les symboles lim et
, on obn+
tient lim
n+
+
X
k=0
uk (n) =
+
X
k=0
lim uk (n) =
n+
+
X
2 t 2k
k=0
2(k!)
=e
2 2
2t
k=0
Sn nm
Pour complter ltude des liens, commence au chapitre prcdent, entre les divers modes
de convergences, signalons le rsultat suivant qui prouve que la convergence en probabilit,
et a fortiori la convergence presque-sre, dune suite de variables alatoires relles implique la
convergence de la suite des lois de ces v.a.r. :
Proposition 7.26.
Si (Xn )N est une suite de variables alatoires relles convergeant en probabilit vers la variable
alatoire relle Y , alors la suite des lois (PXn )N converge vers la loi PY de la variable alatoire
relle Y .
La rciproque est fausse.
Dmonstration : Soit h une fonction numrique positive dfinie sur Rd , continue et support
compact. La fonction h est donc uniformment continue sur Rd . Fixons > 0. Il existe donc
un rel > 0, tel que, pour tout x, y Rd , |x y | implique |h(x) h(y )| .
Comme la suite (Xn )N converge en probabilit vers la variable alatoire relle Y , il existe un
entier naturel N tel que, pour tout entier n N , P(|Xn Y | > ) . Alors, pour tout
entier naturel n N , on a
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
140
h(Y
)|
1
l
+
E
|h(X
)
h(Y
)|
1
l
n
n
{|X
Y
|
}
{|X
Y
|>
}
n
E 1l{|Xn Y | } + 2||h|| E 1l{|Xn Y |> }
E 1l{|Xn Y | } + 2||h|| P(|Xn Y | > )
+ 2||h|| = (1 + 2||h|| ).
Ce qui prouve que lim E [h(Xn )] = E [h(Y )] , pour toute fonction numrique h positive dfinie
n
f est continue borne donc la suite (E[f (Xn )])n1 converge vers E[f (a)] = 0, daprs la
proposition 7.17 . Comme
P(|Xn a| ) = E[1l]a,a+[c (Xn )] E[f (Xn )],
on conclut que la suite (Xn )n1 converge en probabilit vers a. On remarque que, lorsque la
limite est une v.a.r. presque-srement constante, il y a quivalence entre la convergence en loi
et la convergence en probabilit.2
Notons que, dans le cas gnral, on ne peut pas effectuer doprations lmentaires sur les
limites-en-loi. Cependant on admettra (pour une dmonstration de la premire assertion on
pourra se reporter lexercice 7.10, page 142) :
Proposition 7.29.
Thorme de Slutsky
Soient (Xn )N une suite de v.a.r. convergeant en loi vers une v.a.r. X et (Yn )N une suite de v.a.r.
convergeant en loi vers 0, alors
1. la suite de v.a.r. (Xn + Yn )N converge en loi vers X ,
2. la suite de v.a.r. (Xn Yn )N converge en loi (et aussi en probabilit) vers 0.
CT U
Besancon
141
(n)
(n)
(n)
(n)
(n)
(n)
Alors la suite de v.a.r. (X1 + X2 + ... + Xn(n) )N converge en loi vers une v.a.r. de loi P().
En remarquant quune v.a.r. de loi binomiale B(n, p) a mme loi que la somme de n v.a.r.
indpendantes de loi B(p), la proposition 7.14 est un cas particulier de la loi des vnements
rares (cf. [3], exercice V-16).
Notons que les thormes-limites jouent un rle thorique important en statistique dans la
vrification des modles probabilistes de phnomnes alatoires. En particulier celui-ci (cf. [3],
problme V-1) :
Proposition 7.31.
Thorme fondamental de la statistique (Hors programme)
Soit (Xn )N une suite de v.a.r. indpendantes et de mme loi. Alors, pour P-presque-tout ,
la suite des lois empiriques de (X1 , X2 , ..., Xn )
!
k=n
1X
X ()
n k=1 k
nN
7.3
CT U
Besancon
142
CT U
Besancon
143
CT U
Besancon
144
CT U
Besancon
145
Chapitre 8
Si vous ntes pas sr de vous lors de lcriture dune quivalence, vrifiez rapidement les deux implications
pour vous en persuader
CT U
Besancon
146
1l[n,+[ :
n0
6
r
n+1
1 r
n+1
1l[0,n] :
n0
+ r
(n + 1)1l[n,n+1[ :
n0
CT U
Besancon
147
6
r
n+1
1 r
n+1
CT U
Besancon
148
n X
n
X
X
1
1
=
(
)=
(Ai ).
k2
k2
1 kA
1
i
S
S
P
Si n1 Ai est infini, alors il existe un Aio infini et on a ( n1 Ai ) = + = n1 (Ai ).
Lapplication est donc additive.
2. Cependant que nest pas -additiveS(et donc ce nest pas une mesure). En effet,
considrons N , (N ) = + et NP= +
1 {k}. Comme
P la suite ({k})N est forme de
parties deux deux disjointes on a k1 ({k}) = k1 k12 < +. Ainsi
!
{k}
k1
CT U
Besancon
6=
({k}) .
k1
149
k=
X
n=0
P
a (Ak ),
a (An ) = a (A0 ) + ... + a (An0 1 ) + a (An0 ) +
{z
} | {z } | k =n0 +1
|
{z
}
=0
=1
=0
P
do lgalit a (nN An ) = nN a (An ).
Si
/ nN An , alors n N ; a
/ An et par suite a (nN An ) = 0 et
P maintenant a
(A
)
=
0
donc
on
a
encore
lgalit.
n
nN a
Ainsi a est une mesure et comme a (R) = 1, cest aussi une probabilit.
Corrig de lexercice 1.12, page 9
Avec les notations de la proposition 1.4, page 8, il suffit de prendre k = k , pour tout k N
et, suivant le cas,
1. pour la probabilit binomiale :
k = Cnk p k (1 p)nk pour 0 6 k 6 n
k = 0 pour k > n + 1.
k
2. pour la probabilit de Poisson : k = e k! , pour tout k N.
3. pour la probabilit gomtrique : 0 = 0, et k = p(1 p)k1 pour k > 1.
4. pour la probabilit uniforme-discrte :
k = n1 pour 1 6 k 6 n
0 = 0 et k = 0 pour k > n + 1.
Corrig de lexercice
P 1.13, page 9
1) B(n; p)({i}) = nk=0 Cnk p k (1 p)nk k ({i}) o k ({i}) = 1 si i = k et 0 sinon. On a donc
B(n; p)({i}) = Cni p i (1 p)ni .
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
150
Comme Bn An ,
n=0 Bn n=0 An . Montrons linclusion inverse. Soit x n=0 An , il existe
n0 tel que x An0 et pour tout k < n0 , x
/ Ak (cet indice n0 peut tre 0), donc x Bn0
et ainsi x
B
.
On
vient
de
montrer
linclusion
n=0 n
n=0 An n=0 Bn et on en dduit donc
lgalit souhaite.
n=K
Soit K un entier naturel. Comme Bn An , n=K
n=0 Bn n=0 An . Montrons linclusion inverse.
n=K
/ Ak (cet indice n0 peut
Soit x n=0 An , il existe n0 tel que x An0 et pour tout k < n0 , x
n=K
n=K
tre 0), donc x Bn0 et ainsi x n=0 Bn . On vient de montrer linclusion n=K
n=0 An n=0 Bn
et on en dduit donc lgalit souhaite.
Corrig de lexercice 1.15, page 15
Rx
On doit trouver une fonction f de R dans R intgrable telle que F (x) = f (t)dt. Comme
F est drivable drive continue sur R, il suffit de prendre f = F 0 cest--dire
1 +x
e , si x 6 0 ;
2
f (x) =
1 x
e , si x > 0.
2
Ainsi F est la fonction de rpartition dune probabilit densit f dfinie par f (x) = 12 e |x| .
Corrig de lexercice 1.16, page 16
La f.r. de N1 (0; 1) est lapplication de R dans [0,1] dfinie par
Z x
t2
1
e 2 dt
(x) =
2
cest donc une application continue sur R. Par suite daprs la proposition 1.14 2.(c), page 15,
on en dduit que pour tout rel x, N1 (0;P
1)({x}) = 0.
SupposonsPmaintenant que N1 (0; 1) =
k=0 pk k o (pk )kN est une suite de rels positifs
telle que
p
=
1
et
(
)
est
une
suite de nombres rels, deux deux distincts. On
k kN
k=0 k
aPalors, pour tout entier naturel k, N1 (0; 1)({k }) = pk = 0 ; ce qui contredit le fait que
CT U
Besancon
151
Rx
1. Cela rsulte de la continuit de la fonction de rpartition x 7 (t)dt et de la
proposition 1.14, 2.(c), page 15.
2. On a (]a,b[) = (]a,b]) ({b}) = (F (b) F (a)) (F (b) F (b)) = F (b) F (a).
De mme ([a,b[) = (]a,b[) + ({a}) = (F (b) F (a)) + (F (a) F (a)) =
F (b) F (a).
Corrig de lexercice 1.18, page 17
La fonction de rpartition F de U([0,1]) est continue sur R et est donne par
0, si x < 0 ;
x, si 0 6 x 6 1 ;
F (x) =
1, si x > 1.
On a donc U([0,1])([1/6,4/3]) = F (4/3) F (1/6) = F (4/3) F (1/6) = 1 1/6 = 5/6.
Comme Q = qQ {q} (union de singletons disjoints deux deux), on a par continuit de la
f.r.,
X
U([0,1])(Q) =
U([0,1])({q}) = 0 .
{z
}
|
qQ
=0
1
3/4 r
1/2 b
r
1/4
-2
-1
0,
x+2
,
4
F (x) =
3
,
4
1,
x < 1 ;
1 6 x < 0 ou 1 6 x 6 2 ;
0 6 x 6 1;
x > 2.
CT U
Besancon
152
La fonction F prsente des sauts ce qui est rvlateur de la prsence de Dirac dans lexpression
de la probabilit.
Par ailleurs, F est bien une fonction de rpartition car elle est croissante, continue droite et
limx F (x) = 0 et limx+ F (x) = 1.
La mesure sera la somme dune mesure densit et dune variable discrte. A priori
on ne dispose pas de rsultat dans le cours pour conjecturer ce fait mais en pratique (en
refaisant dautres exercices de ce type) la mthode dcrite ci-aprs permet de conclure. On
peut considrer que pour tout x R, F (x) = F1 (x) + F2 (x) o
0,
si x < 1 ;
x+1
4 , si 1 6 x < 0 ;
1
,
si 0 6 x 6 1 ;
F1 (x) =
4
,
si 1 6 x 6 2 ;
14
,
si x > 2.
2
et
0, si x < 1 ;
1
, si 1 6 x < 0 ;
F2 (x) =
14
, si x > 0.
2
On remarque
R x que F1 est continue et F2 permet de prendre en compte les sauts. On peut crire
F1 (x) = f1 (t)dt o
f1 (t) =
1
,
4
si 1 6 t < 0 ou 1 6 t 6 2 ;
0, sinon.
8.2
CT U
Besancon
153
Supposons maintenant
t > 0. On rappelle que X tant une v.a.r. de loi N1 (0; 1),
R x que
u 2 /2
FX (x) = (1/ 2) e
du. On a donc
FY (t) = P(Y 6 t) = P(e X 6 t) = P(X 6 ln t) = FX (ln t)
Z ln t
1
2
=
e u /2 du
2
et en faisant le changement de variable u = ln x (en remarquant que < u 6 ln t
0 < x < t) on obtient
Z t (ln x)2 /2
1
e
dx.
FY (t) =
x
2 0
Il reste faire apparatre une densit ce qui revient crire FY (t) sous forme dune intgrale
entre et t :
Z t
FY (t) =
(x)dx
o on a pos
(x) =
1
1
2
e 2 (ln x) 1l]0,+[ (x)
2x
do le rsultat cherch.
Corrig de lexercice 2.3, page 25
Dterminons la fonction de rpartition de la v.a.r. Y .
0
si t < 0
FY (t) = P(Y t) =
P(t X t) si t 0
Puisque FX est continue, on peut crire P(t X t) = FX (t) FX (t) = 12 (2 e t )
1 t
e = 1 e t . On reconnat la fonction de rpartitiondune v.a. de loi exponentielle E(1).
2
Corrig de lexercice 2.4, page 26
On crit les quivalences suivantes :
Y = X + m
t
(xm)2
1
Z t
(xm)2
t m
1
t R ; P X 6
=
e 22 dx
Z x
v2
1
e 22 dv ,
x R ; P (X 6 x) =
2
p k k .
kN
CT U
Besancon
154
Fixons n N, il vient
PX ({n}) :=
pk k ({n}).
kN
kN
pk k ({n}) = pn et PX ({n}) = pn .
x+
3. Soit n > 1 un entier naturel. Daprs le cours, pour tout rel x, P(X = x) est gal la
valeur du saut de F au point dabscisse x. Cest--dire
1
2
1
.
1
=
P(X = n) = F (n) F (n) = 1
2
n(n + 1)
n(n 1)
n(n 1)
1
On a de mme P(X = 0) = 0 et P(X = 1) = .
2
4. Par dfinition, comme X est une variable discrte valeurs dans N,
E(X ) :=
nP(X = n)
n=1
E(X ) =
E(X ) =
E(X ) =
E(X ) =
1 X
2
+
2 n=2 (n 1)(n + 1)
1
1 X
+
2 n=2 n 1 n + 1
1
1
1 1
1 1
1
1
+ 1
+
+ +
+
2
3
2 3
3 4
n1 n+1
1
1
+ 1 + = 2.
2
2
n2 P(X = n) =
n=1
X
n=2
CT U
Besancon
1 X
2n
+
.
2 n=2 (n 1)(n + 1)
2n
ne converge pas. En effet, son
(n 1)(n + 1)
1
terme gnral est quivalent , terme gnral dune srie divergente (srie harmonique).
n
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
155
Daprs le critre de lquivalence pour les sries terme gnral positif, la srie
X
2n
diverge. Donc la variable alatoire X nadmet pas de variance.
(n
1)(n
+
1)
n=2
8.3
=0
=1/30
De mme
([6,10]) = 0 ([6,10]) + 5 ([6,10]) + ([6,10]) = 4 et
| {z } | {z } | {z }
=0
=0
=106
=1
=0
Par suite E (f ) = 34 + 7.
Corrig de lexercice 3.2, page 33
1. On introduit lapplication I : M+ [0,] dfinie pour f M+ (E , A) par
I(f ) = E (f ) + E (f ). On montre aisment que I vrifie les conditions 1.(a), 1(b)
et 1.(c) de la proposition 3.1, page 30, cest--dire :
(a) Pour tout A A, I(1lA ) = ( + )(A).
(b) Pour tous f et g appartenant M+ (E , A) et tout rel 0.
I(f + g ) = I(f ) + I(g ) et I(f ) = I(f ).
(c) Pour toute suite croissante (fn )nN dlments de M+ (E , A),
lim I(fn ) = I
lim fn .
n+
n+
On conclut alors par lunicit de loprateur que I = E+ , cest--dire que pour tout
f M+ (E , A), I(f ) = E+ (f ) ou encore E (f ) + E (f ) = E+ (f ).
2. Daprs la question prcdente, E (f ) + E (f ) = E+ (f ) or
E (f ) = E (f ) daprs la proposition 3.1, page 30,
Z +
=
(x)f (x)dx daprs la proposition 3.2, page 31,
Z 1
=
e x e x dx = ,
0
CT U
Besancon
156
E (f ) =
e x e x dx = 2
E (f ) =
X
k
k=0
k!
f (k) =
X
k
k=0
k!
X
(e )k
k=0
k!
= exp(e ) .
dx +
X
k
k=0
k!
e e
+ e > 1
X
i=0
i |f |(ai ) =
i |f (ai )|.
i=0
P
Ainsi f sera intgrable
par rapport =
i=0 i i si, et seulement si, la srie numrique
P
termes positifs i=0
Pi |f (ai )| est convergente ce qui est quivalent labsolue convergence de
la srie numrique
i=0 i f (ai ).
Corrig de lexercice 3.5, page
p36
Soit x = (x1 , ..., xd ) Rd , |x| = x12p
+ ... + xd2 . Lapplication f sera intgrable pour si, et
seulement si, E (|f |) < , c--d E ( f12 + ... + fd2 ) < . Or pour tout i = 1, ..., d on a
|fi | 6
Do par la croissance de loprateur E pour les fonctions positives (proposition 3.1, assertion
2, page 30),
d
X
E (|fi |) 6 E (|f |) 6
E (|fi |)
i=1
CT U
Besancon
157
Or x x 2 /2 = (x 1)2 /2 + 1/2 do
Z +
1
e
2
X
E(e ) =
e 2 (x1) dx = e .
2
Mthode 2) : On a vu au chapitre II, exercice 2.3, page 22, que la v.a.r. Y = e X est une
v.a.r. densit donne par
1
1
2
(x) := exp (ln x) 1l]0,+[ (x).
2
x 2
On a alors E(e X ) = E(Y ) = E (f ) o f (y ) = y et est la probabilit de densit .
Ainsi
Z +
Z
y
1
2
X
exp (ln y ) 1l]0,+[ (y )
y (y )d(y ) =
E(e ) =
2
y 2
R
Z +
Z
1
1
1
2
2
e u /2 e u du
=
e 2 (ln y ) dy =
2 0
2
R +
2
o on a effectu le changement de variables u = ln y . Do E(e X ) = 12 e uu /2 du
et on est ramen la mme intgrale que dans la premire mthode.
2. En effectuant le changement de variable u = x 2 et en faisant une intgration par parties
on crit
Z +
Z +
1
2
2
3 x 2 /2
3
|x| e
dx =
|x|3 e x /2 dx
E(|X | ) =
2
2 0
Z +
2
du
=
u ue u/2
2 u
2 0
Z +
1
1
u /2
= (2u)e
(2)e u/2 du ,
2
2
0
0 |
{z
}
{z
}
|
=0
=4/ 2
2 /2
CT U
Besancon
158
E(X1 ) = E(h(X )) =
par h(x, y ) = x. Do
R2
Z
h(x, y )d
E(X1 ) =
k ,l =1 2k+l (k ,l )
R2
X
X
1
k
(x, y ) =
h(k, l) =
.
k+l
k+l
| {z }
2
2
k=1 l=1
k=1 l=1
=k
Par suite
X
k
E(X1 ) =
2k
k=1
!
k
X
X
1
1
=
k
l
2
2
| l=1{z } k=1
=1
et comme en drivant terme terme une srie gomtrique on montre facilement que
X
1/2
x
pour
0
<
x
<
1,
on
dduit
que
E(X
)
=
= 2. On
x
kx k1 =
1
2
2
(x
1)
(1
1/2)
k=1
raisonne de mme pour montrer que E(X2 ) = 2.
On dtermine la loi de la v.a.r. Z = X1 + X2 . On applique le critre didentification des lois
par les fonctions borliennes positives. Soit h de R [0,] borlienne. En posant (x, y ) =
h(x + y ) (qui est borlienne positive car h lest), on a E(h(Z )) = E(h(X1 + X2 )) = E((Z )).
Par le thorme du transfert,
Z
E(h(Z )) =
=
Z
(x, y )dPX (x, y ) =
R2
XX
k=1 l=1
h(k + l) =
2k+l
h(x + y )d
R2
i=2 (k,l)/k+l=i
k ,l =1
1
2k+l
(k ,l ) (x, y )
1
h(i) .
2i
X
(k,l)/k+l=i
1
h(i) =
2i
(i 1) h(i)/2i . Do
Z
X
i 1
E(h(Z )) =
h(i) =
h(x)d(x)
i
2
R
i=2
X
X
i 1
i 1
avec =
i =
i car i 1 = 0 pour i = 1.
i
i
2
2
i=2
i=1
CT U
Besancon
159
E(X ) =
x dPX (x) =
R
r +1 x 2 /2
Z
1lR+ (x)d(x) =
x r +1 e x
2 /2
dx .
Par des techniques dintgration par parties successives, on recherche une relation de rcurrence
sur lentier r > 2 :
Z
Z
x
0
r +1 x 2 /2
x r 1 e x
dx = r
2 /2
dx
r 2
cest--dire E(X r ) =
). Enpdistinguant les cas o r = 2k et r = 2k 1, et en
R r E(X
2
tenant compte que 0 e x /2 dx = /2, on trouve les relations demandes. En particulier
p
E(X ) = /2 et E(X 2 ) = 2 do V ar (X ) = 2 /2.
CT U
Besancon
160
Montrons que DMX = MDX M t . Soit i, j = 1, ..., c, le coefficient (i, j) de DMX est
C ov (MX )i ,(MX )j = E[(MX )i (MX )j ] E[(MX )i ]E[(MX )j ]
" d
#
" d
# " d
#
d
X
X
X
X
=E
aik Xk
ajl Xl E
aik Xk E
ajl Xl
=
k=1
d
d
XX
k=1 l=1
d X
d
X
l=1
k=1
l=1
=C ov (Xk ,Xl )
k=1 l=1
CT U
Besancon
161
Y =
n
X
i=1
n
X
Xi X j
16i6=j6n
Xi2 +
i=1
E(Y 2 ) 6
Xi2 +
n
X
16i6=j6n
E(Xi2 )
|i=1 {z
E(|Xi X j|)
16i6=j6n
Pn
k=1
{z
!2
n
X
V ar (Y ) = E[(Y E(Y ))2 ] = E
(Xi E(Xi ))
i=1
n
X
i=1
X
16i6=j6n
16i6=j6n
CT U
Besancon
162
0
si x 6 e ;
1,
si x > 0.
2. Pour calculer E(X ) on crit que
Z +
Z
E(X ) =
xf (x)dx =
x
dx +
4x
| 2
{z
}
1/3
y 1/3
)=
1
2
e t /2 dt
2
:=f (z)
Ry
o on a effectu le changement de variables t = z 1/3 . Par suite FY (y ) = f (z)dz et
X 3 est une v.a.r. de densit f donne ci-dessus.
2. La fonction de rpartition de la loi normale centre rduite est une application continue,
strictement croissante donc bijective de R sur ]0,1[. Ainsi F 1 existe bien et on peut
crire pour tout y ]0,1[
P(Y 6 y ) = P(F (X ) 6 y ) = P(X 6 F 1 (y )) = F (F 1 (y )) = y .
Comme F prend ses valeurs dans lintervalle ]0,1[, lensemble {F (X ) 6 y } = ds que
y 6 0 et donc FY (y ) = P(F (X ) 6 y ) = 0 quand y 6 0.
Pour la mme raison, {F (X ) 6 y } = ds que y > 1 et dans ce cas FY (y ) = P() = 1.
En conclusion on a
0, si y 6 0 ;
y , si 0 < y < 1 ;
FY (y ) =
1, si y > 1.
donc Y est une v.a.r. uniforme sur [0,1].
CT U
Besancon
163
de standardisation. Do, pour tout rel u, X (u) = E[e iu(Y +m) ] = e ium (u) avec
Z
Z
x2
1
iY t
ixt
(t) = E(e ) =
e dPY (x) =
e 2 e ixt d(x).
2 R
R
Pour calculer cette intgrale, on va montrer que vrifie une quation diffrentielle.
Z
x2
1
(t) =
e 2 (cos(tx) + i sin(tx))d(x)
2 ZR
x2
1
=
e 2 cos(tx)d(x).
2 R
x2
x2
Comme xe 2 cos(tx) |x|e 2 et que cette dernire fonction est intgrable sur R pour la
R
mesure de Lebesgue, par le thorme de drivation sous le signe de la thorie de Lebesgue,
on en dduit que est drivable et que
Z
x2
1
0
(t) =
xe 2 sin(tx)d(x)
2 R
Z
i+
x2
1
1 h x2
2
e
te 2 cos(tx)d(x)
=
sin(tx)
2
2 R
= t(t).
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
164
x2
Car
R
un intervalle centr en 0 dune fonction impaire. Comme est une f.c., elle prend ncessairement la valeur 1 au point 0. Donc est la solution particulire de lquation diffrentielle y 0 + ty = 0 telle que y (0) = 1. La solution particulire de cette quation diffrentielle
t2
R
Z +
Z +
x2
1
t2
1
1lA (t) exp( )dt
=
1lA (x) exp( )dx =
2
2
2
2
= P(X A).
X et Y ont donc la mme loi, bien quelles ne soient pas presque-srement-gales car
P(X = Y ) = P(X = X ) = P(X = 0) = 0.
2. Soit h une application positive borlienne de R dans R.
Z
Z
E[h(g (X ))] =
h(g (X ))dP =
h(g (x))dPX (x)
R Z
Z
=
h(g (x))dPY (x) =
h(g (Y ))dP = E[h(g (Y ))],
R
do le rsultat cherch. On peut aussi remarquer que h g est une application positive
borlienne de R dans R. On applique alors lquivalence PX = PY si, et seulement si,
pour toute application k positive borlienne de R dans R, E(k(X )) = E(k(Y )) avec
k = h g.
Montrons par un contre-exemple quon peut avoir PX = PY et PX Z 6= PY Z . Considrons
le jeu de Pile-ou-Face prcdent et avec les notations prcdentes posons Z = X . On a
alors X Z = X 2 = X et Y Z = Y X = 0. Par suite PX = PX Z 6= PY Z = 0 bien que
PX = PY .
CT U
Besancon
165
itx
x
(1)
(it)x
=
3. Z (t) =
e e
1l[0,+[ (x)d (x) =
e
.
it
it
R
0
Corrig de lexercice 3.23, page 60
Montrons que, pour tout t R, F (t) {0, 1}. En effet, par densit de D dans R si t R, il
existe une suite dcroissante (tn )N de rels de D convergeant vers t. Par continuit droite de
la fonction de rpartition F , la suite (F (tn ))N converge vers F (t). Comme pour tout n N
F (tn ) {0, 1}, par passage la limite F (t) {0, 1}.
Considrons a := inf{t R/F (t) = 1}. On ne peut pas avoir a = + sinon, pour tout
t R, F (t) = 0, ce qui contredirait le fait que lim F (t) = 1. De mme on ne peut pas
t+
avoir a = sinon, pour tout t R, F (t) = 1, ce qui contredirait le fait que lim F (t) = 0.
t
a est donc un rel et la continuit droite de F implique que F (a) = 1. Enfin la proprit
de croissance des fonctions de rpartition implique que F = 1l[a,+[ , cest--dire que est la
mesure de Dirac au point a.
Ce rsultat sapplique en particulier lensemble D des points o la fonction de rpartition est
continue, puisque son complmentaire dans R est un ensemble dnombrable.
8.4
(2)
g (y )
h(x)d(x) d(y )
f (x, y )d (x, y ) =
=
4
R
R2
R
Z
Z
=
g (y )d(y )
h(x)d(x)
R
R
Z
Z
y 2
x 2
=
e dy
e dx .
0
2
Comme les deux intgrales ci-dessus sont gales, on obtient 0 e x dx = /2. Lautre
galit est immdiate aprs un changement de variable.
2. Daprs la remarque de lnonc,
Z
Z
2
2
(x 2 +2xy +2y 2 )
(2)
e
d (x, y ) =
e (x+y ) +y d(2) (x, y )
R2
R2
CT U
Besancon
166
Z
R
+
x 2
2
dx
Z
= 2
x 2
2
dx
2
=4
= ,
2
disjoints. Alors si on note A = k=1 Ak , 1lA = k=0 1lAk car les Ak sont deux deux
disjoints. On a alors en utilisant le thorme de Beppo-Levi
Z
Z
X
X
X
(d)
(d)
d =
1lAk d(d) =
(Ak ) ,
1lA d =
(A) =
Rd
Rd
k=0
k=0
Rd
k=0
et par application des rgles dintgration des mesures densit (proposition 3.8, page 35,) et
du thorme de Tonelli, on obtient comme dans lexemple 4.4, page 65, que
Z
Z
Z
(2)
PY (A) =
1lA (y )
1lR (x)1lR (z)(x, y , z)d (x, z) d(x) =
1lA (y )(y )d(y )
R
R2
R
|
{z
}
:=(y )
CT U
Besancon
167
ce qui prouve que la v.a.r. Y admet pour densit la fonction dfinie ci-dessus.
Corrig de lexercice 4.1, page 66
Tout dabord, comme lvnement {(X , X ) } est certain, on a P((X , X ) ) = 1.
Supposons que soit une densit pour le vecteur (X , X ). Un autre calcul donnerait alors :
Z
P((X , X ) ) = P(X ,X ) () =
1l (x, y )(x, y )d(2) (x, y )
R2
Z
=
1l (x, y )(x, x)d(2) (x, y )
2
Z
ZR
=
(x, x)
1l (x, y )d(y ) d(x) .
R
R
R
Or R 1l (x, y )d(y ) = R 1l{x} (y )d(y ) = ({x}) = 0 pour tout x R. Par suite
P((X , X ) ) = 0 ce qui contredit le premier calcul et fournit ainsi un contre-exemple
pour la rciproque de la proposition 4.5, page 66.
Corrig de lexercice 4.5, page 68
1. Soit h une application borlienne positive de R2 dans R+ . En utilisant successivement le
thorme du transfert, lindpendance de U et V , les rgles dintgration par rapport
des mesures densit, on obtient :
E(h(X , Y )) = E h 2 ln U cos(2V ), 2 ln U sin(2V )
Z
=
h 2 ln u cos(2v ), 2 ln u sin(2v ) dP(U,V ) (u, v )
2
ZR
h 2 ln u cos(2v ), 2 ln u sin(2v ) dPU dPV (u, v )
=
2
ZR
=
h 2 ln u cos(2v ), 2 ln u sin(2v ) 1l]0,1[ (u)1l]0,1[ (v )d(2) (u, v ) .
R2
x = 2 ln u cos(2v )
y = 2 ln u sin(2v )
u = exp((x 2 + y 2 )/2)
1
v = 2
arctan(y /x)
Le jacobien de T 1 est
x
JT 1 = det
2 +y 2
xe 2
y
1
2
x 2 +y 2
ye
2 +y 2
2
1
x
2 x 2 +y 2
!
=
1 x 2 +y 2
e 2 .
2
CT U
Besancon
168
= 2
CT U
Besancon
169
1 2
x 4 e 2 x d(1) (x) = 3 ,
o la dernire intgrale est calcule par une intgration par parties ; ce qui montre une contradiction. Le couple de v.a.r. (X , Y ) nest donc pas indpendant.
Corrig de lexercice 4.7, page 74
Daprs les formules de Knig-Huygens (Proposition 3.22, page 46), V ar (X ) = E(X 2 )
(E(X ))2 . Do E(X 2 ) = V ar (X ) + (E(X ))2 = 2 + m2 (idem pour Y ). Par indpendance de
(X , Y ), E(X Y ) = E(X )E(Y ) et donc on a
E((X + Y )2 ) = E(X 2 + 2X Y + Y 2 ) = E(X 2 ) + 2E(X Y ) + E(Y 2 )
== E(X 2 ) + 2E(X )E(Y ) + E(Y 2 ) = 4m2 + 2 2 .
= V ar (X ) + V ar (Y )
bien que (X , Y ) ne soit pas indpendant.
Corrig de lexercice 4.9, page 86
On a X +Y (t) = 2X (t) = E[e 2itX ] = e 2|t| = (e |t| )2 = (X (t))2 = X (t) Y (t).
Pour montrer que (X , Y ) est non indpendant, on prend (comme le recommande
lnonc) A = [1 , 1] et on calcule
Z
PX (A) =
1
1 1
1 1
1
1
dx = [arctan(x)]1 =
+
= .
1 + x2
4
4
2
CT U
Besancon
170
P (nk=1 {Xk
> x}) = 1
n
Y
P(Xk > x)
k=1
=1
n
Y
(1 P(Xk 6 x)) = 1
k=1
nx
= (1 e
n
Y
[1 F (x)] = 1 [1 F (x)]n
k=1
)1l]0,[ (x) .
3. (a) La v.a.r. Yk ne prend que deux valeurs, 0 et 1. Cest donc une v.a.r. de Bernoulli
de paramtre
p = P(Yk = 1) = P(Xk > t) = 1 P(Xk 6 t) = 1 F (t) = 1 (1 e t )
do p = e t et donc PYk = e t 1 + (1 e t )0 , pour k = 1, ..., n. Par suite
Y1 + ... + Yn est une somme de v.a.r. de Bernoulli de mme paramtre p. Ces v.a.r.
sont indpendantes car elles sont de la formes f1 (X1 ), ..., fn (Xn ) avec fk = 1l]t,[ (on
utilise la proposition 4.15, page 76). La v.a.r. Y1 + ... + Yn est donc une v.a.r. de
loi B(n; p).
(b) On remarque que Yk = 1 signifie que Xk est strictement suprieur t. Ainsi
Y1 + ... + Yk est gal au nombre de v.a.r. Xi qui sont strictement suprieure
t. Ceci entrane que {Y1 + ... + Yn 6 k 1} = {X(k) 6 t}.
4. Soit t R, daprs ce qui prcde on a :
FX(k) (t) = P(X(k) 6 t) = P(Y1 + ... + Yn 6 k 1) =
k1
X
Cnj p j (1 p)nj
j=0
k1
X
Cnj e jt (1 e t )nj .
j=0
CT U
Besancon
171
]0,1[2
U :=
{(t, z) R2 / z [0, 1[, t ] z, 1[}
S
{(t, z) R2 / z ] 1, 0[, t ]0, 1 + z[}.
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
172
=
h(z) 1l]0,1[ (z) 1l] z,1[ (t)d(t) + 1l]1,0[ (z) 1l]0, 1+z[ (t)d(t) d(z)
R
ZR
R
=
h(z) 1l]0,1[ (z)(1 z) + 1l]1,0[ (z) 1 + z d(z).
R
=
1l]0,+[ (z)(1l]0,1[ (z)(1 z) + 1l]1,0[ (z) 1 + z)d(z)
R
Z 1
2
1
=
1 zdz = 1 = ,
3
3
0
Z
1l{<0} ()dP()
P( < 0) =
=
1l],0[ (z)(1l]0,1[ (z)(1 z) + 1l]1,0[ (z) 1 + z)d(z)
R
0
Z 0
2
2
3/2
=
1 + zdz = (1 + z)
= ,
3
3
1
1
P( = 0) = 1 P( > 0) P( < 0) = 0.
CT U
Besancon
173
Comme P(X ,Y ) est une mesure de probabilit sur R2 , on a P(X ,Y ) (R2 ) = 1 do on dduit
= 27
.
2
2. En utilisant le rsultat de lexercice I-9, on sait que X et Y admettent des densits fX et
fY dtermines par :
Z
3
1
fX (x) :=
f (x, y )d(y ) = (1 x 2 )1l[0,1] (x) = (1 x 2 )1l[0,1] (x)
9
2
ZR
f (x, y )d(x) = 9ye 3y 1l[0,+[ (y ).
fY (y ) :=
R
0
64
.
D=
2
0 9
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
174
n
X
P {X = k} {Y = k}
k=0
n
X
P(X = k) P(Y = k)
par indpendance de X et Y
k=0
n
X
m
n
1
1
k
Cm
=
2
2
k=0
!
n+m X
n
n+m
1
1
k k
=
Cn Cm =
2
2
k=0
Cnk
n
X
!
Cnk Cmmk
k=0
1
Cm .
2n+m n+m
k0
= P({
Xi = r 1})P({Xk = 1}).
i=1
CT U
Besancon
Remarquons que
+
X
P{r = k} =
k=0
r 1 r kr
Ck1
pq
=
kr
1
pr = 1
(1 q)r
+
X
P{r = k} = 1.
k=0
o
r 1
r k
P{r = k} = P{r = k + r } = Ck+r
1 p q ,
CT U
Besancon
176
R+
R+
Z
(X ())n dP()
=
Z
=
X n dP = E[X n ]
et
Z
Z
Hd(P ) =
R+
nt
R+
Z
=
n1
1l{X >t} ()dP() d(t)
R+
Comme lapplication t 7 P(X > t) est monotone, son ensemble des points de
discontinuits est dnombrable donc de mesure de Lebesgue nulle. Par suite lapplication
t 7 nt n1 P(X > t) est intgrable au sens de Riemann sur tout compact de R+ (cf [2]
proposition 0-6 p.9). On obtient le rsultat en remarquant que P(X > t) = 1 FX (t).
1
2. Considrons maintenant une v.a. dont la loi est donne par PX := (1 + 1 ). Sa
2
1
fonction de rpartition est FX (t) = (1l[1,+[ (t) + 1l[1,+[ (t)) et
2
Z +
Z
1 1 n1
1
n1
nt (1 F (t))dt =
nt dt =
2 0
2
0
CT U
Besancon
177
alors que E[X n ] = 12 ((1)n + 1). La formule nest vrifie pour aucune valeur de n 1.
La condition X positive est bien ncessaire. On peut videment calculer les esprances
E[|X |n ] par la formule dmontre ici mais en prenant la fonction de rpartition de |X |.
3. Comme les trois variables sont positives presque-srement, on peut utiliser la relation
de la question 1) avec n = 1 pour lesprance et n = 2 pour E[X 2 ], puis on calcule
X2 = E[X 2 ] (E[X ])2 .
(a) Pour la variable X on obtient :
Z 1
Z +
Z +
1
(1 FX (t))dt =
(1 t)dt +
0dt =
E[X ] =
2
0
0
1
Z +
Z 1
1
2
E[X 2 ] =
2t(1 FX (t))dt =
2t(1 t)dt = [t 2 t 3 ]10 =
3
3
0
0
1 1
1
X2 = E[X 2 ] (E[X ])2 = = .
3 4
12
(b) Pour la variable Y on obtient :
Z +
Z +
1
e t dt =
(1 FY (t))dt =
E[Y ] =
0
Z +
Z0 +
2te t dt
2t(1 FY (t))dt =
E[Y 2 ] =
0
0
Z +
t +
2te
2 t
2
=
+
e dt = 2
0
0
2
1
1
Y2 = E[Y 2 ] (E[Y ])2 = 2 2 = 2 .
+
X
k
1l],k[ (t). Comme 1 FZ (t) est la somme dune srie
k!
k=0
R
P
de fonctions positives mesurables, on peut intervertir et .
(c) On a 1 FZ (t) =
(1 FZ (t))dt =
E[Z ] =
0
k=0
+
X
k=1
2
2t(1 FX (t))dt =
0
= e [
k
dt
k!
k
=
(k 1)!
E[Z ] =
+
X
k=2
Z2
+ Z
X
+ Z
X
k=0 0
+
k1
X
k!
2tdt =
+
X
k=1
k
k
(k 1)!
k2
+
] = 2 +
(k 2)! k=1 (k 1)!
CT U
Besancon
178
{T = +} = +
i=1 {Xi = 0} F. T est bien une variable alatoire valeurs dans N .
Calculons la loi de T . Pour k 1 on a, en utilisant lindpendance des variables (X1 , ..., Xk ),
P(T = k) = P({Xk = 1}
k1
\
{Xi = 0})
i=1
E[T ] =
R
+
X
k1
p(1 p)
tdk (t) =
R
k=1
+
X
p(1 p)k1 k.
k=1
P+ k
On
reconnat
la
drive
terme
terme
de
la
srie
k=1 px calcule pour x = p 1. De plus
P+ k
1
1
et
sa
drive
est
.
En
conclusion
E[T ] = p1 .
x
=
k=1
1x
(1x)2
Corrig de lexercice 4.19, page 92
1. On a
\
\[
pn N [pk , +[= ,
lim sup(pk N ) =
k
k nk
2. Montrons que la suite (pk N )kN est indpendante. Soit {pk1 , ..., pkn } des entiers
premiers, comme pk1 N ... pkn N = (pk1 ...pkn )N , il vient
P(pk1 N ... pkn N ) = P ((pk1 ...pkn )N )
1
=
pk1 ...pkn
= P(pk1 N )...P(pkn N ).
Ce qui prouve lindpendance de la suite (pk N )kN . Daprs un rsultat darithmtique
+
X
1
la srie
= +, et comme les pk N sont indpendants par rapport P, en applip
k
k=1
quant le thorme de Borel-Cantelli on dduit que P(lim sup(pk N )) = 1. La contradiction
k
CT U
Besancon
179
itZ
]=E e
it
PY
j=1 Xj
=E
" +
X
#
e
it
Pn
j=1 Xj
1l(Y =n) .
n=1
k
X
Pn
Or la suite de v.a.r. (
e it j=1 Xj 1l(Y =n) )k1 est borne en module par 1, une seule des
n=1
indicatrices 1l(Y =n) est ventuellement non nulle. On obtient donc en utilisant le thorme
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
180
+
X
n=1
j=1
n=1
Lapplication qui est aussi dfinie par (t) = E[t Y ] est appele fonction gnratrice de
la variable discrte Y .
Corrig de lexercice 4.23, page 93
D est une v.a.r. valeurs Z et M valeurs N . De plus, les v.a.r. tant discrtes, le couple
(D, M) est indpendant si, et seulement si, pour tout (i, j) Z N , P({D = i} {M =
j}) = P(D = i)P(M = j).
1. Supposons que X et Y suivent la loi gomtrique de paramtre p ]0, 1[.
On vrifie aisment que, pour j N fix,
{X = i + j} {Y = j} si i 0,
{D = i} {M = j} =
{X = j} {Y = j i} si i < 0.
Par suite en vertu de lindpendance du couple (X , Y ) il vient
si i 0, P({D = i} {M = j}) = P({X = i + j} {Y = j})
= P(X = i + j)P(Y = j) = p 2 q i+j1 q j1 = p 2 q i+2j2
si i < 0, P({D = i} {M = j}) = P({X = j} {Y = j i})
= P(X = j)P(Y = j i) = p 2 q ji1 q j1 = p 2 q 2ji2
p2
On peut rassembler ces deux critures sous la forme P({D = i} {M = j}) = 2 q 2j+|i| .
q
[
Calculons, pour tout i Z fix, P(D = i). Comme {D = i} =
({D = i} {M = j})
jN
X p2
p2
2j+|i|
q
=
q |i| .
2
2
q
1
q
jN
X p2
iZ
CT U
Besancon
q2
q 2j+|i| =
p 2j
q (q + 1).
q2
181
Comparant les trois valeurs trouves, on vrifie aisment que P({D = i} {M = j}) =
P(D = i)P(M = j), ce qui prouve lindpendance du couple (D, M).
2. Rciproquement, supposons les v.a.r. D et M indpendantes. Soit n N , fix. Par
lindpendance du couple (X , Y ), il vient
P(X = n + 1)P(Y = n)
P(X = n + 1)
P ((X = n + 1) (Y = n))
=
=
,
P ((X = n) (Y = n))
P(Y = n)P(X = n)
P(X = n)
ce qui donne la premire galit.
De plus (X = n + 1) (Y = n) = (D = 1) (M = n) et (X = n) (Y = n) = (D =
0) (M = n). Par lindpendance du couple (M, D), il vient
P ((X = n + 1) (Y = n))
P(D = 1)P(M = n)
P(D = 1)
==
=
P ((X = n) (Y = n))
P(D = 0)P(M = n)
P(D = 0)
do la deuxime galit.
On remarque que le rapport ne dpend pas de lentier n. Soit sa valeur. On a la relation
de rcurrence, pour tout n N , P(X = n + 1) = P(X = n).
P
Par suite, pour tout n N , P(X = n) = n1 P(X = 1). De la relation k1 P(X =
X
1
k1 P(X = 1) =
k) = 1 on dduit que
P(X = 1) = 1, et par suite que
1
k1
P(X = 1) = 1 .
X
k1 (1 )k . Les v.a.r. X et Y suivent
La loi de X et Y scrit alors : PX = PY =
k1
CT U
Besancon
182
En rsum, la fonction de rpartition de la variable alatoire Z est donne, pour tout rel
z, par :
si z < 0,
0
2
z
F (z) =
1 1
si 0 z < ,
1
si z .
Comme la fonction de rpartition est de classe C 1 sur les trois intervalles ] , 0[, ]0, [
et ], +[, une densit f vrifiera lquation F 0 = f sur chacun de ces intervalles. Les
valeurs de f aux bornes, f (0) et f (), peuvent tre choisies arbitrairement (on rappelle
quune densit nest dfinie que presque-partout pour la mesure de Lebesgue).
En conclusion, la variable alatoire Z admet pour densit, la fonction f dfinie pour tout
rel z, par :
(
f (z) =
0
z
2
1
si z < 0 ou si z > ,
si 0 z ,
Loi de T
Remarquons que la variable T est une variable alatoire positive qui prend ses valeurs dans
lintervalle [0, 1].
tudions la fonction de rpartition G de T . Soit z rel fix. Cela revient tudier la probabilit
G (z) = P(T z) de lvnement {T z}.
Si z < 0, comme T est positive, lvnement {T z} = (vnement impossible). Par
suite G (z) = 0.
Si z 1, comme T prend ses valeurs dans [0, 1], lvnement {T z} = (vnement
certain). Par suite G (z) = 1.
Il reste tudier le cas 0 z < 1. Supposons 0 z < 1 fix. On peut
crire
{T z} = {(X , Y ) 0 ]0, [2 } o 0 = 1 2 avec 1 =
n
o
x
y
(x, y ) R2 / 0 < x < y et
z et 2 = (x, y ) R2 / 0 < y < x et
z .
y
x
0 est le complmentaire (dans ]0, +[2 ) du secteur angulaire dfini par les points de
x
]0, +[2 contenus entre les deux droites dquations respectives y = et y = zx dans
z
un systme daxes orthonorm. Un raisonnement gomtrique lmentaire
montre que la
0
2
2
0
2
mesure de laire de lintersection ]0, [ est : a ]0, [ = z .
CT U
Besancon
183
En rsum, la fonction de rpartition de la variable alatoire T est donne, pour tout rel
z, par :
si z < 0,
0
z
si 0 z < 1,
G (z) =
1
si z 1.
On reconnat la fonction de rpartition de la loi uniforme sur lintervalle [0, 1]. La variable
alatoire T suit donc la loi uniforme sur lintervalle [0, 1].
8.5
ai,i = 1
aj+1,j =
ai,j = 0
Par suite toute combinaison linaire des variables alatoires X1 , X2 , , Xn est une combinaison
linaire des variables alatoires U1 , U2 , , Un . Comme (U1 , U2 , , Un ) est une suite indpendante de variable alatoire relle gaussiennes, le vecteur U est gaussien. Par suite toute combinaison linaire des variables alatoires U1 , U2 , , Un est une variable alatoire gaussienne.
Il en est donc de mme de toute combinaison linaire des variables alatoires X1 , X2 , , Xn .
Ce qui prouve, par dfinition des vecteurs gaussiens, que le vecteur X = AU est lui-mme un
vecteur gaussien.
Corrig de lexercice 5.2, page 98
1. Dterminons la loi de X par le critre didentification des lois par les fonctions positives.
Soit h une application borlienne positive de Rd dans [0, +[. Reprenons les notations
du corrig 8.5, page 183, de lexercice 5.1, page 97. Par application du thorme du
transfert au vecteur U, par indpendance de la suite (U1 , U2 , , Un ) en notant f (t) la
densit de N 1 (0, 2 ) et x = (x1 , x2 , , xn ), il vient
Z
E(h(X )) = E(h(AU)) =
h(Ax)dPU (x)
Rn
Z
=
h(Ax)f (x1 )f (x2 ) f (xn )d(n) (x).
Rn
CT U
Besancon
184
Pk1
j
j=0 () ykj
Z
h(y )f (y1 )f (y2 y1 ) f
E(h(X )) =
Rn
!
d(n) (y )
j=0
Z
h(y )
n1
X
()j ynj
Rn
n
n
k1
1 X X
exp 2
()j ykj
2 k=1 j=0
!2
d(n) (y ).
Ce qui prouve que X est un vecteur alatoire de densit dfinie, pour tout
x = (x1 , x2 , , xn ) Rn , par
fX (x) =
n
n
k1
1 X X
exp 2
()j xkj
2 k=1 j=0
!2
.
pour i = 2, , n,
pour j = 1, , n 1,
dans les autres cas.
2 21 x 2
x e
a
2
dx, E[X 1l{|X |>a} ] =
2
2
1 2
x 2 e 2 x dx.
E[X Xa ] est donc gale la diffrence de deux fonctions de la variable a relle positive,
continues sur R+ , dont la premire est strictement croissante de 0 E[X 2 ] = 1 et la
seconde strictement dcroissante de E[X 2 ] = 1 0. Il existe donc une unique valeur de
a0 pour laquelle E[X Xa0 ] = 0 cest--dire (X , Xa0 ) est non-corrl.
2. Comme, pour tout rel a > 0, X + Xa = 2X 1l{|X |a} nest pas une v.a.r. gaussienne car
X + Xa est une variable alatoire borne par 2a, le vecteur (X , Xa ) nest gaussien pour
aucune valeur de a.
3. Si le couple (X , Xa ) tait indpendant, le vecteur (X , Xa ) serait gaussien car ses composantes seraient des v.a.r. gaussiennes indpendantes. Daprs la question prcdente, il
y aurait contradiction. Pour tout rel a > 0, le couple (X , Xa ) nest donc pas indpendant.
CT U
Besancon
185
Z 3 y 2 (1)
4
83 y 2
(1)
= e
2d (y ) = 2 e 8 d (y ) = .
3
R
R
R (xm)2 (1)
2 2 d
(x)
=
2. Par suite
O on
a
utilis
la
valeur
de
lintgrale
de
Gauss
e
R
3
= 4 .
2. On rappelle que la loi N 2 (m, D) admet une densit par rapport la mesure de Lebesgue
(2) si et seulement si la matrice D est inversible (cf cours). Dans ce cas la densit scrit,
pour tout t R2 ,
1
1
1
p
exp (t m) D (t m) .
2
2 det(D)
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
186
CT U
Besancon
187
aussi gaussien
de
loi N 2 (0, AI A ). La matrice de dispersion de (U, X Y ) est donc
3 0
AA =
. Cette matrice tant diagonale, le couple de variables alatoires relles
0 2
(U, X Y ) est indpendant.
On procde de faon analogue pour les couples (U, Y Z ) et (U, Z X ).
3. On remarque que le vecteur (X + Y + Z , 2X Y Z , Y Z ) est limage du vecteur
3
3
gaussien
(X , Y , Z ) parlendomorphisme de R de matrice (dans la base canonique de R )
1
1
1
B := 2 1 1 . Le vecteur alatoire (U, V , W ) est donc un vecteur gaussien de
0
1 1
3 0 0
loi N 3 (0, BI B ) = N 3 (0, BB ) o BB = 0 6 0 .
0 0 2
4. La matrice des covariances du vecteur (U, V , W ), BB , est diagonale et le vecteur
(U, V , W ) gaussien, le triplet des variables alatoires relles (U, V , W ) est donc indpendant.
5. La fonction caractristique du couple (U, T ) est dfinie, pour tout (u, t) R2 , par
(U ,T ) (u, t)
= E [exp (i(uU + v T ))]
3
1
2
2
,
= E exp iu(X + Y + Z ) + it(2X Y Z ) + it(Y Z )
2
2
o on a utilis lidentit vrifier. Comme la famille des v.a.r. (U, 2X Y Z , Y Z )
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
188
Comme (2X Y Z ) suit la loi N 1 (0, 6) et que (Y Z ) suit la loi N 1 (0, 2),
1
1
(2X Y Z ) et (Y Z ) suivent la loi N 1 (0, 1). On conclut lgalit des
6
2
fonctions caractristiques 1 (2X Y Z )2 = 1 (Y Z )2 = . Il vient alors
6
3 2
3 2
1
.
1 6it
1
n
3. On considre lespace vectoriel euclidien R et on pose Vn := n ... . Daprs les
1
thormes dalgbre linaire, il est possible de construire une base B orthomorme qui
complte la famille libre (Vn ), B = (V1 , , Vn ). La matrice de passage de la base
canonique B est la matrice orthogonale ( i.e. sa transpose est gale son inverse)
forme des vecteurs colonnes de B. Sa transpose, que lon note C , est aussi orthogonale
et de la forme
c1,1
c1,2 c1,n
c2,1
c2,2 c2,n
..
..
..
.
.
C = .
.
.
. .
n
n
n
CT U
Besancon
189
4. En utilisant la proposition 5.5, page 98, comme X suit la loi N n (0, In ), Y = C X suit la
loi N n (0, C In C ) = N n (0, In ), o C dsigne la transpose de C , et C = C 1 puisque
C est orthogonale.
n
1 X
5. De Y = C X , on dduit facilement que Yn =
Xk = n X . Avec les rgles du
n k=1
calcul matriciel, on remarque que
n
X
Yk2
= Y Y = (C X ) (C X ) = X (C C )X = X X =
k=1
n
X
Xk2 .
k=1
De plus,
(n 1)S 2 =
n
X
(Xk X )2 =
k=1
n
X
(Xk2 2X Xk + X )
k=1
k=1
n
X
n
X
Xk2
2X
n
X
Xk + nX =
k=1
2
Xk2 nX =
k=1
n
X
n
X
k=1
n1
X
Yk2 Yn2 =
k=1
Xk2 + n(2X + X )
Yk2 .
k=1
n1
1
1 X 2
Y . Le vecteur Y est gaussien et sa matrice
Ainsi X = Yn et S 2 =
n 1 k=1 k
n
de dispersion est diagonale donc (Y1 , , Yn ) est indpendant. Par suite X et S 2 sont
indpendantes en vertu du thorme dindpendance des fonctions de v.a.r. (cf proposition
4.14, page 75).
6. La fonction caractristique de X est
X (t) = E[e itX ] = E[e
i t n Yn
1 2
t
] = Yn ( ) = e 2n t .
n
1
Donc PX = N 1 (0, ). Enfin, daprs la deuxime question, le vecteur alatoire
n
(Y1 , , Yn1 ) suit la loi N n1 (0, In1 ), la v.a.r. (n 1)S 2 suit la loi 2 (n 1).
Corrig de lexercice 5.10, page 104
Montrons que, pour tout entier n 1, il existe une forme linaire Ln sur Rn+1 telle que
Xn = Ln (X0 , 1 , . . . , n ). Pour n = 1, posons L1 (x0 , x1 ) := l1 (x0 ) + b1 x1 et remarquons que
X1 = L1 (X0 , 1 ). Supposons construites les formes linaires Li pour i = 1, , n et construisons
Ln+1 . On a
Xn+1 = ln+1 (X0 , X1 , . . . , Xn ) + bn+1 n+1
= ln+1 (X0 , L1 (X0 , 1 ), . . . , Ln (X0 , 1 , . . . , n )) + bn+1 n+1 .
Posons
Ln+1 (x0 , . . . , xn+1 ) := ln+1 (x0 , L1 (x0 , x1 ), . . . , Ln (x0 , x1 , . . . , xn )) + bn+1 xn+1 .
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
190
Ln+1 est bien une forme linaire sur Rn+2 et Xn+1 = Ln+1 (X0 , 1 , . . . , n+1 ), ce qui prouve
lexistence de la suite (Ln )n1 .
Maintenant, pour tout n 0, construisons lendomorphisme An de Rn+1 en posant, pour tout
(x0 , x1 , , xn ) Rn+1 ,
An+1 (x0 , . . . , xn ) := (x0 , L1 (x0 , x1 ), . . . , Ln (x0 , . . . , xn )) .
Avec ces notations,
(X0 , X1 , . . . , Xn ) = An (X0 , 1 , . . . , n ).
Comme les composantes de (X0 , 1 , . . . , n ) sont gaussiennes et mutuellement indpendantes,
ce vecteur est gaussien. Par suite le vecteur (X0 , X1 , . . . , Xn ) est galement gaussien comme
image dun vecteur gaussien par une application linaire.
8.6
Dans ce paragraphe, toutes les variables alatoires considres sont supposes dfinies sur un
mme espace de probabilit (, F, P).
Corrig de lexercice 6.1, page 107
1. Daprs lingalit de Bienaym-Tchbycheff, P(|X m| > 3) 6
P(m 3 < X < m + 3) = 1 P(|X m| > )
1
2
=
et donc
9 2
9
8
' 0.88 .
9
CT U
Besancon
191
400
1
= .
+ 400
2
202
400
=1
202
a
=0 sur ] , a[
=0 sur [a, + [
do pour tout a > 0, limn P(|Xn 0| > a) = 0 ce qui prouve que (Xn )nN converge en
probabilit vers 0.
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
192
lim Xn () = X (). De mme il existe Y de probabilit nulle tel que pour tout cY ,
limn Yn () = Y (). Comme la fonction f est continue sur R2 , la suite (f (Xn (), Yn ()))nN
converge vers f (X (), Y ()). De plus, 0 6 P() 6 P(X ) + P(Y ) et donc P() = 0 ce qui
prouve la convergence presque-sre de (f (Xn , Yn ))nN vers f (X , Y ).
2) Il suffit dappliquer le premier point avec f : (x, y ) x + y et g : (x, y ) xy qui sont
des applications continues sur R2 .
Corrig de lexercice 6.7, page 116
n
X
Xk = nX n et on a
On commence par remarquer que
k=1
n
X
n
X
2
(Xk X n ) =
(Xk2 2Xk X n + X n )
2
k=1
k=1
n
X
!
Xk2
n
X
2X n
k=1
n
X
!
2
Xk
+ nX n
k=1
!
Xk2
2
2nX n
2
nX n
n
X
!
Xk2
nX n
k=1
k=1
X n m
n
p.s.
et X n m2 .
n
De mme la suite (Xk2 )kN est une suite i.i.d. et on peut donc lui appliquer la loi forte des
grands nombres qui prouve que
n
1 X 2 p.s.
X E(X02 ) .
n k=1 k n
Ainsi
Sn2 =
n
1X 2
n
2
p.s.
Xk
X n E(X02 ) m2 = 2 .
|{z} n
n
1
n
n
1
| {z }
| {z } m2
| k=1
{z }
1
1
E(X02 )
CT U
Besancon
193
On a donc la convergence vers dans L2 , et par consquent en probabilit, de la suite ( Snn )n1 .
Corrig de lexercice 6.9, page 121
n
X
1
Posons, pour tout entier n 1, In :=
f (Uk ) et remarquons que
n
k=1
!
n
X
1
1
E(In ) = E(f (U1 )), Var(In ) = 2 Var
f (Uk ) = Var (f (U1 )) .
n
n
k=1
Pour obtenir ces deux rsultats, on utilise lindpendance et lidentit des lois des v.a.r. f (Uk ).
De plus comme f est une application de carr intgrable, la constante C := Var (f (U1 )) est
finie.
Soit > 0, appliquons lingalit de Bienaym-Tchebycheff la v.a.r. In L2 . Il vient, pour
tout entier n 1,
P (|In E(In )| )
C
Var(In )
do P (|In E(f (U1 ))| ) 2
2
en reportant les expressions trouves ci-dessus. Cela prouve que, pour tout > 0,
lim P (|In E(In )| ) = 0, cest--dire que la suite de v.a.r. (In )N converge en probabiln
[0,1]
1
1X
p.s.
Xi E[X1 ] = ,
n i=1
2
do, comme f est continue,
n
1X
1
p.s.
f(
Xi ) f ( ).
n i=1
2
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
194
Comme f est borne, il existe une constante M telle que, pour tout n 1, |f (
1X
Xi )| M.
n i=1
Z
f(
lim
n+
[0,1]n
x1 + + xn
1
)d(n) (x1 , , xn ) = f ( ).
n
2
1
est fini, de plus la v.a.r. f ( Sn ) est intgrable. Par le thorme de transfert il vient
n
!
Z
n
X
1
t
k k
nk
pn (x) := E[f ( Sn )] =
f( ) d
Cn x (1 x) k (t)
n
n
R
k=0
=
n
X
k
f ( )Cnk x k (1 x)nk .
n
k=0
2. Comme f est continue sur le compact [0, 1] elle est uniformment continue sur [0, 1].
Fixons > 0, il existe alors > 0 tel que, pour tout (x, y ) [0, 1]2 , |x y | < implique
|f (x) f (y )| < . De plus
1
1
|pn (x) f (x)| = |E f ( Sn ) f (x) | E |f ( Sn ) f (x)| .
n
n
1
Considrons lvnement An := {| Sn x| < }, il vient
n
1
1
1
E |f ( Sn ) f (x)| = E 1lAn |f ( Sn ) f (x)| + E 1lAcn |f ( Sn ) f (x)|
n
n
n
E(1lAn ) + 2E(1lAcn ) sup |f (x)|
0x1
2P(Acn )
P(An ) +
sup |f (x)|
0x1
1
+ 2P | Sn x| sup |f (x)|
n
0x1
CT U
Besancon
195
x(1 x)
sup |f (x)|.
n 2 0x1
1
sup |f (x)|
2n 2 0x1
1
(tudier la fonction numrique h(x) := x(1 x) sur
4
[0, 1]).
Par suite, pour tout > 0, il existe N N tel que, pour tout n N , n N implique
sup |pn (x) f (x)| < 2, ce qui prouve que la suite de polynmes (pn )N converge uni0x1
E(|X |) =
XZ
n0
n0
+
P(|X | n)
n0
n
n+1
n(n + 1)
n+1
et que
Sn () Sn+1 ()
Sn ()
= 0 = lim
,
lim
n+
n+ n(n + 1)
n
n+1
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
196
3. Comme les v.a.r. sont toutes de mme loi, pour tout n N, nous avons P(|X1 | n) =
P(|Xn | n) et par suite, en revenant lingalit de la premire question applique la
v.a.r. X1 ,
X
X
E(|X1 |)
P(|X1 | n) =
P(|Xn | n).
n0
n0
= 0.
lim sup{Sn I }
1
nombres, lvnement A = {( Sn )N converge vers m} est de probabilit gale 1, cestn
-dire P(A) = 1. Ce qui donne, compte-tenu de linclusion dmontre en 1), le rsultat
cherch.
8.7
Dans ce paragraphe, toutes les variables alatoires considres sont supposes dfinies sur un
mme espace de probabilit (, F, P).
Corrig de lexercice 7.1, page 127
1) Considrons pour k = 1, ..., N la v.a.r. Xk = 1 si la kime va dans la salle 1 et Xk = 0 sinon
(elle va alors dans la salle 2). La v.a.r. Xk est de loi de Bernoulli de paramtre 1/2. Comme
le choix des spectateurs est suppos indpendant, X1 , ..., XN sont des v.a.r. indpendantes. Le
nombre de spectateurs qui dsirent aller dans la salle 1 est donc S = SN = X1 + ... + XN qui
CT U
Besancon
197
est une v.a.r. B(N; 12 ). Lvnement "tous les spectateurs ne peuvent pas voir le film quils ont
choisi" se modlise par :
{S > n} {N S > n} = {S > n} {S < N n} .
On remarque que si N > 2n, on est sr quil y a au moins un spectateur qui ne verra pas son
film. Dans ce cas, P = 1. De mme, si N < n, on est sr que tous les spectateurs pourront
voir leur film. Dans ce cas, P = 0.
tudions le cas o n N 6 2n cest--dire 0 N n 6 n. Dans ce cas, {S > n} {S <
N n} = et donc P = P(S > n) + P(S 6 N n). Daprs le thorme central limite (N
est implicitement suppos grand), on a
! Z
1
S
x
1
2
e u /2 du .
lim P N 1 2 6 x =
N
2
2 N
Si on note T =
S
N
1
2
2 N
n N
P =P T > p 2
N/4
n N
= P |T | > p 2
N/4
!
N n N2
+P T < p
N/4
!
= 2 1 (2n N)/ N ,
limite de la suite de fonctions de rpartition (1l[n,[ )nN est la fonction-nulle qui nest pas une
fonction de rpartition car elle ne vrifie pas lim F (x) = 1.
x
On a donc la convergence simple de la suite de fonction de rpartitions (Fn )nN mais la suite
(n )nN ne converge pas troitement vers une limite , sinon on aurait lim Fn (x) = F (x) = 0
n
k=n k
X
n
k=0
1
= P(Sn n) et {Sn n} = { (Sn n) 0}.
k!
n
Par suite,
e
k=n k
X
n
k=0
k!
=P
1
(Sn n) 0 .
n
CT U
Besancon
198
et
[N(N 1)...(N n + 1)]
sont respectivement quivalents (Np)k , (Nq)nk et N n . Par suite, pour N voisin de linfini,
N ({k}) est quivalent Cnk p k q nk , ce qui termine la dmonstration. Ce rsultat exprime
quune loi hypergomtrique peut tre approxime par une loi binomiale.
Corrig de lexercice 7.6, page 136
Pour tout n 1, on vrifie facilement que lapplication dfinie par
1 cos(2nx) si x [0, 1]
fn (x) :=
0
si x [0, 1]c
est une densit de probabilit. La fonction de rpartition Fn associe la probabilit de densit
fn est donne par
Z
0
si t ] , 0],
1
t 2n sin(2nt) si t ]0, 1],
Fn (t) =
fn (x)d(x) =
],t]
1
si t ]1, +[.
CT U
Besancon
199
La suite (Fn )n1 converge simplement vers la fonction F dfinie par F (t) := t1l[0,1[ (t) +
1l[1,+[ (t). F est la fonction de rpartition de la loi uniforme U([0, 1]) de densit f = 1l[0,1] . On
a donc une convergence troite des probabilits de densits fn vers la loi uniforme, mais la suite
des densits na de limite en aucun point de ]0, 1[.
Corrig de lexercice 7.7, page 138
Si (an )N et (n )N convergent respectivement vers les rels a et , alors (an )N et (n2 )N con2
vergent
t R, la suite (n (t))N =
vers les rels a et , et pour tout
respectivement
1 2 2
1 2 2
converge vers exp iat t . La suite des fonctions caracexp ian t t n
2
2
N
tristiques N 1 (an ,n2 ) N converge simplement vers la fonction caractristique de la probabilit
N 1 (a, 2 ). On conclut alors en utilisant le critre des fonctions caractristiques.
Corrig de lexercice 7.8, page 141
On obtient facilement, pour tout n 1, la fonction de rpartition Fn de n : Fn (t) =
t n 1l[0,1[ (t) + 1l[1,+[ (t). Cette suite de fonctions de rpartition converge simplement vers 1l[1,+[
qui est la fonction de rpartition de 1 . La suite (n )n1 converge donc troitement vers 1 . On
remarquera quune suite de probabilits absolument continues peut converger troitement vers
une probabilit discrte.
Corrig de lexercice 7.9, page 141
On sait que la fonction caractristique de la loi de Cauchy est dfinie par (t) = e |t| .
1
Pour tout n 1, la fonction caractristique de Sn est donne par
n
n
it
it
S
X
1 Sn (t) = E[e n n ] = E[e n 1 ] = e |t| n
n
du fait de lindpendance de la suite (Xn )n1 . Comme la suite e |t| n
n1
2n
CT U
Besancon
200
|t|
1
n
1
(t)
=
e
S
est
donne
par
qui
n
S
n
n2
n2
1
converge en + vers 1, fonction caractristique de la v.a.r. 0. La suite
Sn
converge
n2
n1
donc en loi vers 0 et daprs la premire question, elle converge aussi en probabilit vers 0.
2. Remarquons que (Yn )N converge en loi vers la v.a.r. 0 si et seulement si (Yn )N converge
en probabilit vers la v.a.r. 0 (cf. exercice V-6). Soit > 0, il existe 0 > 0 tel que pour
|y | 0 on ait |e ity 1| . De plus la convergence de la suite (Yn )N en probabilit
vers 0 conduit lexistence de n0 N tel que pour n n0 , P(|Yn | > 0 ) et par
suite |Xn +Yn (t) Xn (t)| 3. La convergence en loi vers X de la suite (Xn )N entrane
lexistence dun entier n1 , que lon peut choisir plus grand que n0 , tel que, pour tout
n n1 , |Xn (t) X (t)| . On a montr que pour tout n n1 ,
|Xn +Yn (t) X (t)| |Xn +Yn (t) Xn (t)| + |Xn (t) X (t)| 4,
ce qui prouve la convergence en loi vers X de la suite (Xn + Yn )N .
3. Supposons que X soit une v.a.r. de loi symtrique , i.e. X a mme loi que X (par
exemple PX := 21 (1 + 1 ) ou PX := N 1 (0, 1)), et posons, pour tout n N, Xn := X .
Il est clair que la suite (Xn )N converge en loi vers X et que la suite (Xn X )N converge
en loi vers 2X 6= 0.
Corrig de lexercice 7.11, page 142
1. Un raisonnement par rcurrence montre facilement que, pour tout n N ,
Xn =
n
X
nk Uk .
k=1
La suite des v.a.r. (nk Uk )k=1, ,n est indpendante, car (Uk )N lest. De plus on vrifie
aisment que la loi de nk Uk est N 1 (0, 2n2k 2 ).
Xn est la somme de v.a.r. normales indpendantes centres, sa loi est donc la loi normale
centre de variance
P
2n
si || =
6 1, Var(Xn ) = nk=1 2n2k 2 = 1
2
12
si || = 1, Var(Xn ) = n 2 .
CT U
Besancon
201
1
2 2
Si || < 1, la suite (Xn (t))N converge, pour tout t R, vers exp
qui
t
2
1
1
2
est la valeur en t de la fonction caractristique de la loi N 1 0,
. Dans ce cas
1 2
1
la suite (Xk )N converge en loi vers une v.a.r. de loi N 1 0,
2 .
1 2
Si || = 1, la suite (Xn (t))N converge, pour tout t 6= 0, vers 0 et pour t = 0, vers 1. La
fonction limite ntant pas continue en 0, elle ne peut pas tre la fonction caractristique
dune probabilit. Dans ce cas la suite (Xk )N ne converge pas en loi.
Si || > 1, la suite (Xn (t))N converge, pour tout t R, vers 0. La fonction limite
ne prenant pas la valeur 1 en 0, elle ne peut pas tre la fonction caractristique dune
probabilit. Dans ce cas la suite (Xk )N ne converge pas en loi.
Corrig de lexercice 7.12, page 142
1. Supposons que la suite (Xn )N converge en loi vers X et considrons lapplication continue
borne f , > 0, dfinie par
f (t) := (x )1l],x[ (t) + t1l[x,x+[ (t) + (x + )1l[x+,+[ (t).
Comme E[f (Xn )] = f (xn ), pour tout n N, la suite (f (xn ))N converge vers f (x) = x. Il
existe un entier n0 tel que, pour tout entier n n0 ,, |f (xn ) x| < , par suite f (xn ) = xn
et |xn x| < . La suite (xn )N converge vers x.
Rciproquement si la suite (xn )N converge vers x alors, pour toute application f de R
dans R continue borne et tout n N, E[f (Xn )] = f (xn ). Comme E[f (X )] = f (x), on
en dduit que la suite (E[f (Xn )])N converge vers E[f (X )], do la convergence en loi de
la suite (Xn )N vers X .
2. Soit FX la fonction de rpartition de la v.a.r. X et FXn celle de Xn , n N. Par hypothse,
en dehors de lensemble D des points de discontinuit de F , la suite (Fn )N converge
simplement vers FX . Comme, pour tous n N et t 6 D, FXn (t) = 1l[xn ,+[ (t), il vient
FX (t) {0, 1}. On peut alors utiliser le rsultat de lexercice 3.23, page 60, puisque
D := Dc est partout dense comme complmentaire dun ensemble dnombrable dans
R (cf. proposition 7.8, page 129). Donc il existe x R tel que PX = x et daprs la
question prcdente on peut ajouter que la suite (xn )N converge vers x.
Corrig de lexercice 7.12, page 142
2
On rappelle que
la f.c. de la probabilit de Gauss N 1 (a, ) est lapplication dfinie sur R par
1
(t) = exp iat t 2 2 .
2
C entre de Tele-enseignement U niversitaireFranche-ComteBesancon
CT U
Besancon
202
On en dduit que, pour tout t C , F (t) {0, 1}, mais C est une partie partout
dense de R, ce qui implique que est la mesure de Dirac en un point a R. On
conclut alors que la suite (an )N converge dans R vers le rel a.
Revenant la fonction caractristique de , on peut crire, pour tout t R,
1 2 2
1 2 2
(t) = lim exp ian t t n = exp iat t ,
n
2
2
CT U
Besancon
203
CT U
Besancon
204
CT U
Besancon
Annexe A. Formulaire
205
Annexe A
Formulaire
Ce formulaire sera fourni avec les sujets lors des preuves terminales.
A.1
Rappels de notations
probabilit hypergomtrique) ;
Z
A.2
CT U
Besancon
206
kx k1 =
k=1
+
X
1
(1 x)2
k(k 1)x k2 =
k=2
2
(1 x)3
k=p
p!
.
(1 x)p+1
1 2
e 2 t dt =
(a + b) =
k=n
X
Cnk ak b nk
k=0
Relation de Vandermonde
Pour tous entiers naturels n, m, et N tels que 0 N n + m,
k=N
X
N
Cnk CmNk = Cn+m
k=0
Relation de Pascal
Pour tous entiers naturels n, k tels que 0 k n,
k
Cn+1
= Cnk + Cnk1
n+1
Ckn = Cn+p+1
k=n
CT U
Besancon
Annexe A. Formulaire
A.3
207
1. Dirac : a , a R
F (x) = 1l[a,+[ (x) et (t) = e ita
m = a et 2 = 0
2. Bernoulli : B(p) := p1 + (1 p)0 , p ]0, 1[
F (x) = (1 p)1l[0,1[ (x) + 1l[1,+[ (x) et (t) = 1 p + pe it
m = p et 2 = p(1 p)
3. Bernoulli-symtrique : B s (p) := (1 p)1 + p1 , p ]0, 1[
F (x) = (1 p)1l[1,1[ (x) + 1l[1,+[ (x) et (t) = (1 p)e it + pe it
m = 2p 1 et 2 = 4p(1 p)
k=n
X
Cnk p k (1 p)nk k , p ]0, 1[ et n N
4. Binomiale : B(n, p) :=
k=0
F (x) =
k=n
X
k=0
m = np et 2 = np(1 p)
5. Binomiale-ngative : I(r , p) :=
r 1
r
k
Ck+r
1 p (1 p) k , p ]0, 1[ et r N
k0
F (x) =
+
X
r 1
r
Ck+r
1 p (1
k=0
p
1 (1 p)e it
r
r (1 p)
r (1 p)
et 2 =
p
p2
+
X
6. Gomtrique : G(p) :=
p(1 p)k1 k , p ]0, 1[
m=
k=1
F (x) =
+
X
k1
p(1 p)
k=1
m=
pe it
1l[k,+[ (x) et (t) =
1 (1 p)e it
1
1p
et 2 =
p
p2
7. Hypergomtrique : H(n1 , n2 , n) :=
k=n
X
Cnk Cnnk
1
k=0
k=0
avec n n1 + n2
F (x) =
k=n
X
Cnk Cnnk
Cnn1 +n2
Cnn1 +n2
k , n N , n1 N et n2 N
1l[k,+[ (x)
CT U
Besancon
208
F (x) =
+
X
k=0
k
1l[k,+[ (x) et (t) = exp (e it 1)
k!
m = et 2 =
k=n
1X
9. Uniforme-discrte : U(n) :=
k , n N
n k=1
k=n
k=n
1X
1 X itk
F (x) =
1l[k,+[ (x) et (t) =
e
n k=1
n k=1
m=
A.4
n+1
n2 1
et 2 =
2
12
a+b
(b a)2
et 2 =
2
12
a x a1 x
e 1l]0,+[ (x)
(a)
a
a t a1
F (x) =
e t 1l]0,+[ (t)dt et (t) =
it
(a)
a
a
m = et 2 = 2
it
1
1
et 2 = 2
n 1
x 2 1 x
n e 2 1l]0,+[ (x)
4. Khi-deux : (n) := ( , ) = , n N avec (x) :=
2 2
n2 2 2
n2
Z x
1
F (x) =
(t)dt et (t) =
1 2it
m = n et 2 = 2n
CT U
Besancon
Annexe A. Formulaire
a
5. Cauchy : C(a) := , a > 0 avec (x) :=
2
(a + x 2 )
x i
1 h
+ arctan
et (t) = e a|t|
F (x) =
2
a
209
e 2b
2b
Z x
(ua)2
bt 2
1
2b
e
du et (t) = exp iat
F (x) =
2
2b
m = a et 2 = b
7. Normale d-dimensionnelle : N d (m, D) := d , o d N , m Rd , D matrice carre dordre d coefficients
rels, symtrique, inversible, de type positif, et
1
1
(x) := p
exp (x m) D 1 (x m) , o x Rd ;
d
2
(2) det(D)
1
X (u) = exp iu m u Du , o u Rd et lopration dsigne la transposition ;
2
m est le vecteur-esprance et D la matrice de dispersion de N d (m, D)
CT U
Besancon
210
CT U
Besancon
211
Annexe B
B.1
CT U
Besancon
212
B.2
Pour ce qui est du calcul de probabilit dans le cas de v.a.r. normales quelconques, on rappelle
la proposition suivante, qui est une rcriture avec le langage des v.a.r. de la proposition 2.9,
page 26 :
Proposition B.1.
Procd de standardisation
Une v.a.r. X est normale desprance m et de variance 2 > 0 si, et seulement, si la v.a.r.
X m
est une v.a.r. normale centre-rduite.
Z :=
am
bm
<Z <
},
!
bm
am
<Z <
.
Ainsi tout vnement faisant intervenir dans sa formulation une v.a.r. X normale desprance m
X m
et de variance 2 > 0 peut donc tre exprim avec la v.a.r. Z :=
de loi normale centre
rduite. Le procd de standardisation permet de ramener tout calcul de probabilit relatif
une loi normale quelconque un calcul de probabilit relatif la loi normale centre-rduite, et
donc lutilisation uniquement de la table statistique de la loi normale centre-rduite.
CT U
Besancon
213
u
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
0
0,5000
0,5398
0,5793
0,6179
0,6554
0,6915
0,7257
0,7580
0,7881
0,8159
0,8413
0,8643
0,8849
0,9032
0,9192
0,9332
0,9452
0,9554
0,9641
0,9713
0,9772
0,9821
0,9861
0,9893
0,9918
0,9938
0,9953
0,9965
0,9974
0,9981
0,01
0,5040
0,5438
0,5832
0,6217
0,6591
0,6950
0,7291
0,7611
0,7910
0,8186
0,8438
0,8665
0,8869
0,9049
0,9207
0,9345
0,9463
0,9564
0,9649
0,9719
0,9778
0,9826
0,9864
0,9896
0,9920
0,9940
0,9955
0,9966
0,9975
0,9982
0,02
0,5080
0,5478
0,5871
0,6255
0,6628
0,6985
0,7324
0,7642
0,7939
0,8212
0,8461
0,8686
0,8888
0,9066
0,9222
0,9357
0,9474
0,9573
0,9656
0,9726
0,9783
0,9830
0,9868
0,9898
0,9922
0,9941
0,9956
0,9967
0,9976
0,9982
0,03
0,5120
0,5517
0,5910
0,6293
0,6664
0,7019
0,7357
0,7673
0,7967
0,8238
0,8485
0,8708
0,8907
0,9082
0,9236
0,9370
0,9484
0,9582
0,9664
0,9732
0,9788
0,9834
0,9871
0,9901
0,9925
0,9943
0,9957
0,9968
0,9977
0,9983
0,04
0,5160
0,5557
0,5948
0,6331
0,6700
0,7054
0,7389
0,7704
0,7995
0,8264
0,8508
0,8729
0,8925
0,9099
0,9251
0,9382
0,9495
0,9591
0,9671
0,9738
0,9793
0,9838
0,9875
0,9904
0,9927
0,9945
0,9959
0,9969
0,9977
0,9984
0,05
0,5199
0,5596
0,5987
0,6368
0,6736
0,7088
0,7422
0,7734
0,8023
0,8289
0,8531
0,8749
0,8944
0,9115
0,9265
0,9394
0,9505
0,9599
0,9678
0,9744
0,9798
0,9842
0,9878
0,9906
0,9929
0,9946
0,9960
0,9970
0,9978
0,9984
0,06
0,5239
0,5636
0,6026
0,6406
0,6772
0,7123
0,7454
0,7764
0,8051
0,8315
0,8554
0,8770
0,8962
0,9131
0,9279
0,9406
0,9515
0,9608
0,9686
0,9750
0,9803
0,9846
0,9881
0,9909
0,9931
0,9948
0,9961
0,9971
0,9979
0,9985
0,07
0,5279
0,5675
0,6064
0,6443
0,6808
0,7157
0,7486
0,7794
0,8078
0,8340
0,8577
0,8790
0,8980
0,9147
0,9292
0,9418
0,9525
0,9616
0,9693
0,9756
0,9808
0,9850
0,9884
0,9911
0,9932
0,9949
0,9962
0,9972
0,9979
0,9985
0,08
0,5319
0,5714
0,6103
0,6480
0,6844
0,7190
0,7517
0,7823
0,8106
0,8365
0,8599
0,8810
0,8997
0,9162
0,9306
0,9429
0,9535
0,9625
0,9699
0,9761
0,9812
0,9854
0,9887
0,9913
0,9934
0,9951
0,9963
0,9973
0,9980
0,9986
0,09
0,5359
0,5753
0,6141
0,6517
0,6879
0,7224
0,7549
0,7852
0,8133
0,8389
0,8621
0,8830
0,9015
0,9177
0,9319
0,9441
0,9545
0,9633
0,9706
0,9767
0,9817
0,9857
0,9890
0,9916
0,9936
0,9952
0,9964
0,9974
0,9981
0,9986
3
0,99865
3,1
0,99903
3,2
0,99931
3,3
0,99952
3,4
0,99966
3,5
0,99977
4
0,99997
4,5
0,999997
CT U
Besancon
214
CT U
Besancon
215
Annexe C
Devoirs envoyer la
correction
Les trois devoirs ci-dessous sont renvoyer pour leur correction, au plus tard la date indique,
ladresse suivante :
Bruno Saussereau,
Laboratoire de Mathmatiques de Besanon,
UFR Sciences et Techniques,
16, route de Gray,
25030 Besanon cedex, FRANCE
Le but premier dun devoir est de montrer au correcteur que vous avez compris le cours, que
vous connaissez les rsultats vus en cours et les hypothses qui les commandent, et que vous
savez les mobiliser pour rpondre une question ou dmontrer un rsultat nouveau. Il est donc
recommander de tout mettre en oeuvre pour atteindre cet objectif.
En particulier :
Un devoir de mathmatiques est un devoir de franais qui traite de mathmatiques, cest
donc avant tout un texte de franais. Il doit donc tre rdige de faon correcte en franais.
Les hypothses spcifiques justifiant lutilisation de chaque thorme doivent tre correctement
explicites et le rsultat du cours utilis doit tre clairement identifi voire explicitement nonc.
Les rsultats intermdiaires et les conclusions obtenues doivent tre mis en vidence. Les
notations utilises ou introduites, surtout si elles sont nouvelles par rapport au cours, doivent
tre clairement annonces. La rdaction du cours peut tre considre comme un guide de
rdaction dun texte mathmatique.
CT U
Besancon
216
C.1
Exercice II
Soit X une v.a.r. normale de loi N (m, 2 ), o m et sont des rels avec > 0.
1. Montrer que la fonction caractristique de X peut sexprimer laide de la fonction
caractristique de la loi de Gauss-Laplace standard N (0, 1).
Z
2. En utilisant le thorme de drivation sous le signe , montrer que est une solution
particulire de lquation diffrentielle du premier ordre y 0 (t) + ty (t) = 0. En dduire
lexpression analytique de la fonction , puis celle de la fonction caractristique de la
variable X .
Exercice III
Soit (Xk )kN une suite indpendante de v.a.r. de Bernoulli toutes de mme paramtre 0 < p <
1. Soit un entier r 1, on dfinit deux nouvelles v.a.r. , en posant pour tout ,
r () := inf{n N /X1 () + X2 () + ... + Xn () = r }
et
r () := inf{n N /X1 () + X2 () + ... + Xn+r () = r }
avec la convention inf := +.
1. Montrer, pour tout x ]0, 1[, la relation
+
X
Ckr 1 x kr +1 =
k=r 1
1
.
(1 x)r
2. Montrer que la variable alatoire relle r est une variable alatoire relle discrte de loi
(dite loi de Pascal de paramtres r et p )
P(r , p) :=
+
X
r 1 r
Ck1
p (1 p)kr k .
k=r
CT U
Besancon
217
3. Montrer que la variable alatoire relle r est une variable alatoire relle discrte de loi
(dite loi binomiale-ngative de paramtres r et p )
I(r , p) :=
+
X
r 1
r
k
Ck+r
1 p (1 p) k .
k=0
Exercice IV
Le but de cet exercice est de montrer quil nexiste pas de probabilit P sur lespace (N , P(N )
1
telle que, pour tout n 1, P(nN ) = o nN = {nk, k N }.
n
Supposons quune telle probabilit existe. Soit (pk )N la suite des nombres entiers premiers rangs
en ordre croissant.
1. Par un raisonnement simple montrer que P(lim sup(pk N )) = 0.
k
2. Montrer que la suite (pk N )N est indpendante. En dduire, en utilisant le fait que la
X 1
srie
= +, une autre valeur de P(lim sup(pk N )). Conclure que la probabilit P
p
k
k
k
nexiste pas.
CT U
Besancon
218
C.2
Exercice II
Thorme de Fisher-Cochran
Soit n N et (X1 , , Xn ) une suite indpendante de v.a.r. toutes de mme loi N 1 (0, 1).
On dfinit respectivement les v.a.r. moyenne empirique et variance empirique par
n
X1 + + Xn
1 X
(Xk X )2 .
X :=
et S 2 :=
n
n 1 k=1
1. Montrer que la v.a.r. X12 suit la loi ( 12 , 12 ) aussi appele loi du Khi-deux 1 degr de
libert et note 2 (1).
2. En utilisant la fonction caractristique des lois Gamma, en dduire que la loi de la v.a.r.
n
X
Xk2 est ( 12 , n2 ) aussi appele loi du Khi-deux n degrs de libert note 2 (n).
k=1
c1,1
c1,2
c2,1
c2,2
..
..
C = .
.
cn1,1 cn1,2
1
n
1
n
de la forme
..
.
c1,n
c2,n
..
.
cn1,n
1
n
1 X 2
Y .
n 1 k=1 k
6. Dmontrer le thorme de Fisher-Cochran : Soit (X1 , , Xn ) une suite indpendante
de v.a.r. de mme loi N 1 (0, 1). Alors (X , S 2 ) est indpendant, X suit la loi N 1 (0, n1 ) et
(n 1)S 2 suit la loi 2 (n 1).
Exercice III
CT U
Besancon
219
Soit (i )i1 une suite indpendante de v.a.r. de mme loi N 1 (0, 1) et X0 une v.a.r. indpendante de la suite (i )i1 et de loi PX0 = N 1 (m, 2 ). On dfinit la suite de v.a.r. (Xn )n1 de
la faon suivante : Xn := ln (X0 , . . . , Xn1 ) + bn n o (bn )n1 est une suite de rels et (ln )n1
une suite de formes linaires sur Rn . Montrer que, pour tout n 1, il existe une forme linaire
Ln sur Rn+1 telle que Xn = Ln (X0 , 1 , , n ) et en dduire que le vecteur (X0 , . . . , Xn ) est
gaussien.
CT U
Besancon
220
C.3
Exercice II
Soit (Xn )n1 une suite indpendante de v.a.r. de mme loi de Cauchy C(1) (Pour la dfinition,
k=n
X
cf. formulaire de lannexe A, page 205). Pour tout n 1, on pose Sn :=
Xk . tudier les con
k=1
1
1
1
vergences en probabilit et en loi des suites de v.a.r. Sn
,
Sn
et
Sn
.
n
n2
n
n1
n1
n1
Exercice III
Soit (Uk )N une suite indpendante de v.a.r. de loi normale centre et de variance 2 > 0. Pour
tout R, on dfinit la suite (Xk )N par la relation de rcurrence Xn = Xn1 + Un , pour tout
n 1, avec X0 = 0.
1. Dterminer, pour tout n N, la loi de la v.a.r. Xn .
2. tudier la convergence en loi de la suite de v.a.r. (Xk )N .
CT U
Besancon
Bibliographie.
[1] Lelong-Ferrand J. - Arnaudis J.M., Cours de mathmatiques, Dunod, 1977.
[2] Ansel J.P.- Ducel Y., Exercices corrigs en thorie de la mesure et de lintgration, Ellipses,
1995.
[3] Ansel J.P.- Ducel Y., Exercices corrigs en thorie des probabilits, Ellipses, 1996.
[4] Bouleau N., Probabilits de lingnieur : variables alatoires et simulation, Hermann, 1986.
[5] Brmaud P., Introduction aux probabilits : modlisation des phnomnes alatoires,
Springer-Verlag, 1988.
[6] Commission inter-IREM "Statistique et Probabilits" (coordination M. Henry), Autour
de la modlisation en probabilits, Presses universitaires de Franche-Comt, collection
"Didactiques", Besanon, 2001
[7] Ducel Y., Introduction la thorie mathmatique des probabilits, Ellipses, 1998.
[8] Gramain A., Intgration, Hermann, coll. Mthodes, 1994.
[9] Guinot M., Le paradoxe de Banach-Tarski, Alas, 1991.
[10] Hennequin P.L., Pourquoi des tribus ?, Bulletin APMEP n 303, pp 183-195.
[11] Leboeuf C.- Roque J.L.- Guegand J., Cours de probabilits et de statistiques, Ellipses,
2me dition 1983.
[12] Leboeuf C.- Roque J.L.- Guegand J., Exercices corrigs de probabilits, Ellipses, 1987.
[13] Revuz D., Mesure et intgration, Hermann, coll. Mthodes, 1994.
[14] Stoyanov J., Counterexamples in probability, John Wiley and Sons, 1989.