Explorer les Livres électroniques
Catégories
Explorer les Livres audio
Catégories
Explorer les Magazines
Catégories
Explorer les Documents
Catégories
L. Decreusefond
2009
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
5 Indpendance et conditionnement 5.1 Indpendance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Conditionnement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 Transformes intgrales 6.1 Fonctions gnratrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2 Fonctions caractristiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Vecteurs gaussiens 7.1 Dnition et premires proprits 7.2 Reprsentation canonique . . . . 7.3 Gaussiennes et indpendance . . 7.4 Exercices . . . . . . . . . . . . .
L. Decreusefond Contexte public } sans modications Voir page 83 1/83
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
Cours de probabilits
8 Convergences 8.1 Loi des grands nombres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.2 Limit centre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.3 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Construction de variables alatoires 9.1 Tribu, mesures, etc. . . . . . . . . . . . . . . . . 9.2 Fonctions mesurables . . . . . . . . . . . . . . . . 9.3 Construction de variables alatoires et simulation 9.4 Exercices . . . . . . . . . . . . . . . . . . . . . . 10 Intgration 10.1 Principe de construction 10.2 Proprits et notations . 10.3 Thorme de Riesz . . . 10.4 Espaces L1 et L2 . . . . 10.5 Exercices . . . . . . . . Notations . . . . . . . . . . . Index alphabtique . . . . . . de lintgrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
59 59 59 60 63 64 66 67 68 71 71 73 76 76 78 82 83
Prolgomnes
Il existe autant de faon de prsenter les probabilits que denseignants. Chacun en fonction de son parcours personnel, de ses anits, orientera sa prsentation qui vers le formalisme abstrait de la thorie de la mesure, qui vers des calculs lmentaires, qui vers la modlisation des phnomnes, etc. Lapproche adopte ici ne se veut pas radicalement dirente de celles existantes par ailleurs mais, peuttre, plus quilibre entre les dirents points de vue. Les notions de thorie de la mesure, mme si elles eraient, ne sont pas si abominablement complexes que lon doive les viter. Historiquement, ce sont elles qui ont permis de dpasser les apparents paradoxes des probabilits telles quon les pratiquait jusquau dbut du xxe sicle. Elles sous-tendent maintenant les avances profondes dans le domaine, mme dans les applications telles que les, si allchantes, mathmatiques nancires. Lobjectif de ce cours est de comprendre ce quest une loi. Cela signie en connatre la dnition mais aussi comment et pourquoi on manipule cet objet et sa relation avec la notion plus immdiate de variable alatoire. La lecture de cet ouvrage nest pas suppose tre linaire : le parcours suppos est celui du cours. Nous commenons par introduire, dans le cas des espaces de probabilits dnombrables, les concepts fondamentaux : variable alatoire, vnement, esprance, fonction gnratrice, probabilit conditionnelle, etc. Lutilisation des notions de thorie de la mesure permet ensuite de donner les dnitions gnrales des concepts vus prcdemment. Nous esprons que le cas des espaces dnombrables servira alors de support lintuition pour apprhender ces concepts dans toute leur gnralit. La consquence principale de ce parti pris est la multiplicit des dnitions de certaines notions. Ainsi, la notion de variable alatoire se rduit celle dapplication dans le cas dun espace dtats dnombrables, do la premire dnition 3.1, ensuite, une fois apprhends les lments de thorie de la mesure, on donne la dnition gnrale 3.8. Cet ouvrage est aussi conu pour rendre la e-lecture la plus agrable possible. chaque fois que cela nous semblait pertinent et que nous y avons pens, un hyperlien renvoie aux parties A pertinentes mais peut-tre lointaines du texte. La magie de L TEXet de ses extensions permet de se promener erratiquement dans le chier pdf. Tout ce qui est dans cet ouvrage est au programme du contrle de connaissances nal . . . sauf en ce qui concerne les deux derniers chapitres. Comme il a t dit ci-dessus, ces chapitres ont pour unique but de donner les ides et les concepts ncessaires la bonne comprhension de ce quest une loi . De cette partie, seuls les thormes fondamentaux seront donc susceptibles dapparatre aux contrles : Fubini, convergences monotone et domine, continuit et drivabilit sous le signe somme. Ce document est le fruit des cours donns lENST. Il a bnci des remarques constructives de mes collgues et plus particulirement Gersende Fort et Olivier Hudry. Quils en soient ici chaudement remercis.
Cours de probabilits
Chapitre 1
Conventions et notations
1.1 Conventions
Nous serons amens faire de larithmtique dans R+ = R+ {+} selon les conventions suivantes. a + (+) = +, pour tout a R+ , .0 = 0, toute srie termes positifs converge dans R+ , cest--dire vers ventuellement +. On note aussi R la droite numrique acheve, R = R {}.
1.2
Notations
Pour deux ensembles A et B , A B reprsente leur runion, A B leur intersection et A B leur dirence symtrique, cest--dire A B = A\(A B ) B \(A B ) = (A B )\(A B ). On rappelle que lintersection est distributive sur la runion : A (B C ) = (A B ) (A C ), A (B C ) = (A B ) (A C ) et que AB
c
= Ac B c .
On note P (E ), lensemble des parties de lensemble E . Nous aurons rgulirement besoin de la notion de fonction indicatrice. Pour un ensemble A, 1A est sa fonction indicatrice. Elle est dnie par 1A (x) = Il est immdiat que 1A B = 1A .1B 1A B = 1A + 1B , si A B = . 1 0 si x A, si x A.
et 1A B = 1A + 1B 1A B dans le cas gnral. Les notions de parties positives et ngatives sont aussi fort utiles : pour tout rel x,
L. Decreusefond
Cours de probabilits
On se convainc aisment que On prendra garde ne pas confondre cette notation avec la suivante. Pour une fonction f dnie sur R on introduit f (x ) = lim f (y ) et f (x+ ) = lim f (y ),
y x y x
x = x+ x et |x| = x+ + x .
ds que ces limites existent. La continuit de f en x quivaut lgalit f (x ) = f (x+ ) = f (x). Dans le cas contraire, on note f (x) = f (x+ ) f (x ). Pour les suites de nombres rels, la limite suprieure et la limite infrieure sont respectivement la plus grande et la plus petite des valeurs dadhrence : lim sup un = inf sup un
n k nk k
Comme les suites (supnk uk , k 1) et (inf nk uk , k 1) sont monotones donc convergentes dans R, les limites suprieure et infrieure existent toujours dans R. Pour une suite (fn , n 1) de fonctions valeurs relles, les fonctions lim inf n fn et lim supn fn sont naturellement dnies par : (lim inf fn )(x) = lim inf fn (x)
n n
Pour une suite (An , n 1) densembles, on introduit les mmes concepts de limites suprieure et infrieure. lim sup An =
n n k=1 nk
An An .
k=1 nk
Lemme 1.1. Un lment b appartient lim supn An si et seulement si b appartient une innit de An . Un lment b appartient lim inf n An si et seulement si b appartient tous les An sauf un nombre ni dentre eux. Dmonstration. Dire que B appartient lim supn An quivaut dire que k 1, n k tel que B An . Traduit en franais, cela quivaut exactement dire que B appartient une innit de An . Le mme raisonnement sapplique pour la limite infrieure. En ce qui concerne les fonctions, nous aurons souvent besoin de parler dimage inverse dun ensemble par une fonction. Rappelons-en la dnition et les premires proprits. Soit f : E F une application, pour une partie A de F , son image inverse est dnie par : f 1 (A) = {x E : f (x) A}. Dire que f est injective quivaut dire que f 1 ({x}) contient au plus un lment pour tout x F . Lapplication f est surjective si et seulement si f 1 ({x}) contient au moins un lment pour tout x F . Un
Contexte public } sans modications Voir page 83 6/83
L. Decreusefond
Cours de probabilits
= f 1 (Ac ).
Par abus de notation, on omettra souvent la variable x et on notera souvent f 1 (A) = (f A).
Cours de probabilits
Chapitre 2
vnements
2.1 Introduction
Motivons la ncessit dune formalisation prcise des probabilits par deux paradoxes, dits de Bertrand, remontant au xixe sicle.
Figure 2.1 J. Bertrand (1822-1900) (DR). Premier paradoxe de Bertrand : on dispose de trois botes deux tiroirs chacune. Chacun des tiroirs de la bote A contient une mdaille en or, chacun des tiroirs de la bote B contient une mdaille en argent, lun des tiroirs de la bote C contient une mdaille en or et lautre une mdaille en argent. Le joueur ouvre un tiroir au hasard et essaie de dterminer sil a ouvert la bote C . Avant douvrir le tiroir, il a une chance sur 3 davoir choisi la bote C . Sil trouve une mdaille en or, alors cest que la bote quil avait ouverte ne pouvait tre que la bote A ou la bote C donc il a en fait une chance sur 2 davoir ouvert la bote C . Le mme raisonnement sapplique aussi sil trouve une mdaille en argent. Conclusion, quel que soit ce quil trouve dans le tiroir, il en conclut quil a une chance sur 2 davoir ouvert la bote C . Mais puisque ce raisonnement ne dpend pas de ce quil a trouv dans le tiroir ouvert, autant ne pas louvrir et dcrter avant lexprience quil a une chance sur 2 de choisir la bote C ... (voir exercice 1). Deuxime paradoxe de Bertrand : quelle est la probabilit que deux points choisis au hasard sur la sphre de R3 fasse un angle de moins de 10 = 1 /6. Par symtrie, on peut toujours supposer que lun des points est le ple nord. Dans ce cas, la probabilit que lvnement voulu soit ralis est le rapport de la surface de la calotte concerne sur la surface de la sphre, on trouve 2,1.106. Mais Bertrand remarqua que si lon connat les deux points, on connat aussi le grand cercle qui passe par eux deux. Pour trouver la probabilit recherche, il sut donc de calculer le rapport dun arc de grand cercle damplitude angulaire de 1 /3 au primtre dun grand cercle soit 1/(3.360) = 9,26. 104. La solution est ici plus sophistique (et due Borel), il faut remarquer quun grand cercle est de surface nulle. En consquence, on est oblig de considrer une tranche de largeur innitsimale quand on choisit M et la gure 2.2 montre quon a alors plus de chance de choisir un point proche de lquateur quun point proche du ple. La probabilit induite sur le grand cercle nest donc pas la probabilit uniforme et le deuxime raisonnement est donc faux.
L. Decreusefond Contexte public } sans modications Voir page 83 9/83
Cours de probabilits
2.2
Dnition 2.1. Un ensemble E est dit dnombrable sil est en bijection avec N, lensemble des entiers naturels. Il est dit au plus dnombrable sil est inclus dans un ensemble dnombrable. Quelques exemples : Les ensembles de cardinal ni sont videmment au plus dnombrables. Ceci recouvre non seulement les ensembles de la forme {1, , n} mais aussi des produits cartsiens densembles de cette forme ou des ensembles comme celui des permutations sur un ensemble n lments. Lensemble des entiers relatifs, lensemble des rationnels sont des ensembles dnombrables. La runion et le produit cartsien de deux ensembles dnombrables sont dnombrables. Dnition 2.2. Une mesure , sur un ensemble E au plus dnombrable, est une application de P (E ), lensemble des parties de E , dans R+ qui satisfait les deux proprits suivantes : () = 0, pour toute famille (Aj , j N ) de parties deux deux disjointes de E , ( Aj ) =
j =1 +
(Aj ).
j =1
(2.1)
Les parties de E sappellent plus souvent des vnements . Dnition 2.3. Une mesure est dite mesure de probabilit (ou probabilit) lorsque (E ) = 1. Dans ce cas, on la note usuellement P et non . Thorme 2.4. Pour caractriser une mesure, il faut et il sut de connatre la mesure des singletons. Dmonstration. Si on connat la mesure , on connat en particulier sa valeur sur les singletons. Rciproquement, toute partie dun ensemble dnombrable est runion au plus dnombrable des singletons qui la composent : A = {i}. Comme lintersection de deux singletons distincts est vide, le deuxime axiome
L. Decreusefond
iA
10/83
Cours de probabilits
({i}).
Il sut donc de connatre ({i}) pour tout i pour savoir calculer (A). Mesure (de probabilit) uniforme Si E est ni n lments, la mesure uniforme est caractrise par P({i}) = 1 pour tout i E. n
Dans ces conditions, daprs (2.1), il est clair que P(A) = |A| . n
Lorsquon lance un d non pip , cela revient dire que lon munit lespace dtats E = {1, , 6} de la mesure uniforme. Lorsque lon dispose de N ds non pips , lespace dtat est E = {1, , 6}N et il est naturellement quip de la mesure uniforme dnie par P({(n1 , , nN )}) = 1 6N
pour tout (n1 , , nN ) E . Ce qui signie que la probabilit que le d 1 indique n1 , le d 2 indique n2 , etc. est exactement 6N . Ltat dun jeu de n cartes peut se reprsenter par les permutations : les cartes sont numrotes de 1 n ainsi que les positions dans le paquet. Lapplication qui, un numro de carte i associe la position (i) de la carte i dans le paquet, est en fait une bijection de {1, , n} dans lui-mme, cest--dire une permutation. Choisir un mlange au hasard revient dire que P(tat du paquet = ) = pour toute permutation . Mesure non uniforme On peut tout aussi bien tre amen considrer des mesures non uniformes. Par exemple sur E = {2, , 12}, la mesure dnie par P(i) = 6 |7 i| 36 1 , n!
est une bonne mesure de probabilit. vous de dterminer quel phnomne physique elle correspond. Lquation (2.1) dcrit ce que vaut la probabilit dune runion disjointe dvnements. Le crible de Poincar permet daner ce rsultat quand les parties ne sont plus disjointes deux deux. Thorme 2.5 (Crible de Poincar). Soit A1 , , An des vnements. P( Aj ) =
j =1 n n j =1
P(Aj )
j1 <j2
j1 <j2 <...<jk
Dmonstration. On procde par rcurrence sur n, le nombre densembles. Pour n = 2, on crit A B comme la runion disjointe de A B , de la partie de A qui nest pas dans B et de la partie de B qui nest pas dans A: A B = A\(A B ) B \(A B ) A B .
L. Decreusefond Contexte public } sans modications Voir page 83 11/83
Cours de probabilits
Dautre part, A est la runion disjointe de A B et A\(A B ), le deuxime axiome de la dnition dune probabilit donne P(A) = P(A\(A B )) + P(A B ), do P(A B ) = P(A) P(A B ) + P(B ) P(A B ) + P(A B ) La proprit est donc tablie pour n = 2. Si elle est vraie au rang n, on applique la proprit au rang 2 n A = Aj et B = An+1 . Le calcul de P(A) sexplicite par la formule au rang n et on obtient la relation dsire au rang n + 1.
j =1
Cette formule illustre au passage lintrt de savoir calculer la probabilit dune intersection dvnements. Dnition 2.6. Deux vnements A et B sont indpendants lorsque P(A B ) = P(A)P(B ). (2.2)
Les vnements (Aj , j N ) sont dits indpendants dans leur ensemble lorsque pour toute sous-famille nie Aj1 , , Ajl , P( Ajk ) =
k=1 l l
P(Ajk ).
k=1
Remarque 1. Des vnements peuvent tre indpendants deux deux sans tre indpendants dans leur ensemble, cf. exercice 10. Sil existe, en quelque sorte, une seule faon dtre indpendant, deux vnements dpendants peuvent ltre plus ou moins. Ceci est ret par la notion de conditionnement. Dnition 2.7. Soit B un vnement tel que P(B ) dnie par P(A | B ) = 0, la probabilit de A sachant B , note P(A | B ) est P(A B ) . P(B )
Si on associe probabilit et poids , la probabilit dun ensemble tant son poids relatif par rapport celui de lensemble total, la probabilit conditionnelle de A sachant B est le poids de la trace de A sur B relativement au poids total de B .
B AB
Figure 2.3 Interprtation graphique du conditionnement. Dans un grand nombre dapplications, on impose des probabilits dites a priori et lon veut faire des calculs a posteriori, cest--dire aprs observation (voir exercice 11). Loutil mathmatique est alors la formule de Bayes.
L. Decreusefond Contexte public } sans modications Voir page 83 12/83
Cours de probabilits
Thorme 2.8 (Bayes, 1763). Soit A1 , , An une famille dvnements deux deux disjoints dont la runion est E . On se donne les probabilits a priori de chaque Ai . Pour un vnement B , on suppose connues les probabilits P(B | Ai ) pour i = 1, . . . , n. Maintenant, si B se produit alors les probabilits a posteriori des Ai sont les quantits P(Ai | B ) et sont donnes par : P(Ai | B ) =
n i=1
2.3
Deux problmes se posent dans le cas des ensembles non dnombrables : est-il possible de dnir une mesure au sens de la dnition 2.2 ? Comment caractriser une mesure puisquon ne peut certainement plus crire que toute partie est runion dnombrable de ses singletons. Ces deux problmes sont rsolus dans le chapitre sur la thorie de la mesure (cf. chapitre 9). Les rsultats essentiels sont les suivants : Dans tout ce qui nous intresse, les espaces E seront R ou Rd ou des sous-parties de ceux-ci. On ne peut pas construire de mesures sur lensemble des parties de R (voir exercice 70), on est donc oblig de restreindre lensemble des parties mesurables un ensemble plus petit. Lensemble des parties mesurables, cest--dire le domaine de dnition dune mesure, est lensemble des borliens. Les parties mesurables sappellent aussi les vnements. Une mesure sur R est parfaitement dtermine ds lors que lon connat sa valeur sur les intervalles ouverts extrmits rationnelles. Cela signie que deux mesures qui concident sur les intervalles ouverts extrmits rationnelles sont gales. Les formules du crible de Poincar et de Bayes restent valables sans changement. Les notions dindpendance et de conditionnement sont galement inchanges.
2.4
Exercices
Exercice 1. Construire lespace probabilis correspondant au problme du premier paradoxe de Bertrand. Rsoudre le paradoxe. Exercice 2. Dans un lot de 20 articles, 12 sont parfaits, 6 comportent un dfaut mineur et 2 un dfaut majeur. 1. Deux articles sont choisis au hasard, calculer les probabilits suivantes : (a) Les deux sont parfaits, (b) Les deux ont un dfaut majeur, (c) Au moins lun dentre eux est parfait, (d) Au plus lun dentre eux est parfait (e) Exactement un est parfait, (f) Aucun na de dfaut majeur, (g) Aucun nest parfait. 2. Un lot de 20 articles est accept lorsque 3 lments choisis au hasard nont pas de dfaut majeur. Quelle est la probabilit que le lot dcrit ci-dessus soit accept ? Exercice 3. On lance simultanment trois ds 6 faces non pips. 1. Quel est lespace des vnements ? 2. Quelle est la probabilit davoir au moins 1 as ? 3. Montrer que les vnements la somme des faces est paire et la somme des faces est impaire ont mme probabilit. 4. Quelle est la probabilit que la somme des faces soit paire ?
L. Decreusefond Contexte public } sans modications Voir page 83 13/83
Cours de probabilits
5. Mme question si on a N ds avec N quelconque. On pourra traiter dabord le cas N impair puis le cas N pair. Exercice 4. Une bote contient 4 piles usages et 6 piles neuves. On tire deux piles au hasard. Lune dentre elles seulement est teste. Quelle est la probabilit que lautre soit bonne si la pile teste est bonne ? Mme question si la pile teste est usage. On teste lensemble de la bote par la mthode suivante : les piles sont tires les unes aprs les autres au hasard sans remise. chaque tirage, on teste la pile courante, le protocole sarrte lorsque lon a sorti les 4 piles usages. Quelle est la probabilit que le test sarrte au cinquime tirage (au dixime tirage) ? Exercice 5 (Arnaque ou pas ?). Dans le jeu Vegas , il est vendu 500 000 tickets 3 e chaque. Ces tickets sont distribus aux buralistes sous forme de bandes de 50 tickets attachs les uns aux autres. La rpartition des gains est la suivante : Nb de lots 1 1 2 5 18 800 850 2 020 4 000 9 000 28 000 25 000 47 500 1. Quel est le montant moyen des gains ? 2. Quelle est la probabilit davoir un lot suprieur 20 e ? 3. Sur 50 tickets, quelle est la probabilit (exacte et approche) davoir 0 ou 1 lot suprieur 20 e ? 4. M. R. a achet 100 bandes de 50 tickets et il a constat quaucune dentre elles ne comportait plus dun lot suprieur 20 e. Quelle est la probabilit (approche, en supposant que 5 000 est ngligeable devant 500 000) dun tel vnement ? 5. Mme question avec 25 bandes. Le montant ou la nature des gains ou lots est dtermin par le rglement du jeu ou par lintervention du hasard. Lattribution des lots aux gagnants est dtermine par le hasard. Lintervention du hasard, totale ou prpondrante, peut tre antrieure, concomitante ou postrieure la mise disposition du support. Les jeux doivent respecter le principe dgalit des chances entre les joueurs, ce qui ninterdit pas de tenir compte des dirences objectives de situations entre ceuxci.
Journal Officiel de la Rpublique Franaise, dcret 2002-651 du 29 avril 2002
40 20 10 1
Exercice 6 (Canal binaire symtrique). On considre un canal de communication qui transmet des bits avec erreur selon le modle suivant : un bit une probabilit p dtre transmis correctement et 1 p dtre invers. On suppose que n canaux de ce type sont en srie. On note Xn le bit reu en sortie du n-me canal. On note n = P(Xn = 0 | X0 = 0), P(Xn = 1 | X0 = 1) . 1. Exprimer la relation matricielle entre n et n1 pour tout n 1. On traitera part les cas p = 0 et p = 1. 2. On suppose dornavant que p ]0, 1[. Calculer la probabilit pn pour que linformation soit dlement transmise. 3. Que se passe-t-il quand n tend vers linni ?
L. Decreusefond Contexte public } sans modications Voir page 83 14/83
Cours de probabilits
Exercice 7. Un tang contient un nombre de poissons N inconnu. Pour estimer N, on prlve un chantillon de r poissons que lon marque et que lon remet dans ltang. Une semaine plus tard, un autre chantillon de s < r individus est prlev. On appelle X le nombre de poissons marqus lors du premier prlvement qui sont aussi dans le deuxime chantillon. 1. Calculer la loi de X (dite loi hypergomtrique). On note pour la suite de cet exercice pk = pour k min(r, s) et k max(s + r N, 0).
r k
N r sk N s
3. En dduire quil existe une unique valeur de k telle que pk = maxj pj . 4. Soit k0 tel cette valeur. Par dnition, pk0 +1 < pk0 et pk0 1 < pk0 . En dduire que k0 = (r + 1)(s + 1) . N +2
On pourra poser pour simplier les calculs, r = r + 1, s = s + 1, N = N + 2. 5. En dduire une estimation de N . 6. Lors du dpouillement, on pose Xi = 1 si le i-me poisson est marqu, Xi = 0 sinon. En utilisant la s relation vidente X = i=1 Xi , montrer que E [X ] = sp et var(X ) = sp(1 p) o p = r/N. Exercice 8. Dans le protocole WiMaX, la bande de frquences est dcoupe en N = 48 groupes de M = 32 frquences. Un sous-canal est constitu dune frquence dans chaque groupe. Dans une cellule donne, les algorithmes de construction des sous-canaux garantissent que deux sous-canaux ne partagent pas de frquences. On peut donc faire au maximum M sous-canaux dans une cellule. En revanche, rien ne garantit quun sous-canal dune cellule voisine nait pas de frquence commune avec un sous-canal de la cellule de rfrence. Lorsquune frquence est partage, il y a interfrence do perte du signal. On suppose que la cellule A dispose de x sous-canaux avec 0 < x M . La cellule B a construit y sous-canaux. 1. Quelle est la probabilit quil y ait c collisions dans un groupe donn ? 2. Comment calculer la probabilit davoir C collisions sur lensemble de la bande de frquences ? 3. Quel est le nombre moyen de collisions en fonction de x, y , N et M ? Exercice 9. Lors dun bal, n couples dansent. Les cavaliers ont choisi leur cavalire alatoirement. Quelle est la probabilit quaucun des couples dorigine ne soit runi ? Exercice 10. Construire un espace de probabilit et dterminer 3 vnements A, B et C indpendants deux deux mais pas dans leur ensemble. Exercice 11. On suppose que lon dispose dun test dterminant dune maladie donne. Malheureusement, comme tout test, celui-ci est faillible : 1% des individus que lon sait sains sont dclars malades et 2% des individus que lon sait malades sont dclars sains. On suppose que la maladie atteint 1% de la population teste. Quelle est la probabilit quun individu ragissant positivement au test soit eectivement malade ? Exercice 12. Un actif nancier de prix initial S0 vaut S0 .M avec probabilit p ou S0 .m (avec probabilit 1 p) (m < M ) la n de la priode dobservation. On a aussi disposition, un compte rmunr r% par priode : pour x e placs sur ce compte initialement, on rcupre (1 + r)x e en n de priode. On dispose dune fortune initiale X0 , que lon peut rpartir volont entre des actions et le compte rmunr.
L. Decreusefond Contexte public } sans modications Voir page 83 15/83
N s , N 1
Cours de probabilits
1. quelle condition sur m et M est-il possible davoir une fortune nale xe gale K ? 2. Quelle est la stratgie (dite stratgie de couverture) pour y parvenir ? Exercice 13 (Erds et Renyi (1960)). On fabrique un graphe sur n sommets en choisissant ses artes au hasard . Plus prcisment, on considre le graphe Gn,p obtenu en choisissant chacune des n 2 artes potentielles indpendamment avec probabilit p. Le but de ce problme est dtudier la probabilit que Gn,p soit connexe. On sintressera au cas o p est de la forme p = p(n) = o c est une constante xe. 1. Soit (Xi , 1 i n) un n-uple de variables alatoires valeurs dans {0, 1} et soit X = Montrer que pour tout r tel que r 1 et 2r + 1 n on a :
2r +1 2r n i=1
ln n c + n n Xi .
k=0
k=0
(1)k F (k)
P(X = 0) = E
i=1
(1 Xi ) xi ).
n i=1 (1
2. On dira quun sommet est isol sil nest lextrmit daucune arte. Dans un premier temps, on tudie n le nombre X de sommets isols. On peut crire X = i=1 Xi o Xi est la variable alatoire qui vaut 1 si le sommet i est isol, 0 sinon. Que valent E [Xi ] et E [X ] ? 3. On suppose dornavant c x. Montrer que la quantit F (k) , pour la variable X , converge, lorsque n tend vers linni, vers eck /k !. 4. Montrer que limn P(X = 0) = ee . 5. Calculer lesprance du nombre de composantes connexes 2 sommets, et constater que celle-ci tend vers zro quand n tend vers linni. 6. Plus gnralement, soit Ct le nombre de composantes connexes t sommets. Montrer que pour 2 t n/2, k t p 1 2 . E [Ct ] t! 1p k t t1k(2 ) En dduire que la probabilit que Gn,p soit connexe tend, quand n , vers ee . On admettra que 2tn/2 E [Ct ] 0 quand n . Commentaire : on pourrait montrer de la mme manire que P(X = j ) ee ecj /j !. La loi de X se rapproche dune loi de Poisson, ce qui veut dire que les Xi se comportent de manire de plus en plus indpendantes .
L. Decreusefond Contexte public } sans modications Voir page 83 16/83
c c c
Cours de probabilits
Il y a n 2 paires de sommets. la probabilit quune paire de sommets donne constitue une composante connexe vaut p(1 p)2(n2) . Lesprance du nombre de composantes connexes deux sommets vaut donc p p n p(1 p)2(n2) (nepn )2 = e2c 0 2 2 2 car p tend vers 0 quand n . On en dduit quavec probabilit tendant vers 1 le nombre de composantes connexes t lments avec 2 t n/2 tend vers 0. Or Gn,p nest pas connexe si et seulement sil existe une composante connexe t sommets pour 1 t n/2. La probabilit dtre non connexe se comporte donc comme la probabilit davoir (au moins) un point isol. Autrement dit, la probabilit c que Gn,p soit connexe tend vers ee . En particulier on en dduit que si p grandit moins vite que ln n/n + c/n pour tout c, alors Gn,p nest pas connexe avec probabilit tendant vers 1. Par contre si p grandit plus vite que ln n/n + c/n pour tout c, alors Gn,p est connexe avec probabilit tendant vers 1.
Cours de probabilits
Chapitre 3
Variables alatoires
3.1 Variables alatoires discrtes
Dnition 3.1. Soit un espace dnombrable, muni dune probabilit P sur A = P (). Une variable alatoire discrte est une application dnie sur valeurs dans un espace E , que lon peut supposer dnombrable. Dnition 3.2. La loi dune variable alatoire, valeurs dans E dnombrable, est la suite (P(X = n), n E ). Dnition 3.3. On dit quune variable alatoire X suit une loi Bernoulli de paramtre p [0, 1] lorsque On notera dornavant ceci par X B(p). P(X = j ) = P(X = 1) = p et P(X = 0) = 1 p.
Dnition 3.4. On dit quune variable alatoire X suit une loi binomiale de paramtres n et p lorsque n j p (1 p)nj , pour tout j {0, , n}. j
On notera dornavant ceci par X B(n, p). Cest la loi du nombre de succs lorsque lon fait n tentatives indpendantes avec probabilit p de succs chaque fois. Dnition 3.5. On dit quune variable alatoire X suit une loi gomtrique de paramtre p [0, 1] lorsque On notera dornavant ceci par X Geom(p). Cest la loi du nombre de tentatives indpendantes quil faut faire avant davoir un succs lorsque chaque tentative a une probabilit p de succs. Dnition 3.6. On dit quune variable alatoire X suit une loi de Poisson de paramtre > 0 lorsque P(X = j ) = e On notera dornavant ceci par X Po(). j , pour tout j N. j! P(X = j ) = (1 p)j 1 p, pour tout j N .
Dnition 3.7 (Voir Thorme 4.2). Soit X une variable alatoire discrte. Pour toute fonction h de E dans R qui vrie lune des deux hypothses suivantes h est valeurs positives, j E |h(j )| P(X = j ) est nie, on dnit lesprance de h(X ), note E [h(X )] par : E [h(X )] =
j E
h(j ) P(X = j ).
Cours de probabilits
3.2
Dnition 3.9. La loi dune variable alatoire relle (v.a.r. en abrg) X est la mesure image de P par X , cest--dire la mesure PX sur R dnie par PX (A) = P( : X ( ) A) = P(X A). Comme PX est une mesure sur R, on sait quelle est totalement caractrise (voir 9) par les valeurs de PX (] , b]) pour b parcourant R. FX : R [0, 1] x PX (] , x]) = P(X x) sappelle la fonction de rpartition de X . En vertu des proprits de monotonie des mesures (voir exercice 66), FX possde les proprits suivantes : limx FX (x) = 0, limx+ FX (x) = 1, FX est croissante, continue droite, i.e., limyx FX (y ) = FX (x). Remarque 2. Rciproquement, toute fonction satisfaisant ces proprits est la fonction de rpartition dune v.a.r., voir chapitre 9. On a, daprs les proprits de monotonie des mesures (exercice 66), FX (x ) = lim P( ] , x
n+ n=1
Dnition 3.8. Une variable alatoire X est une fonction de (, A, P) dans R telle que pour tout intervalle ]a, b[ de R, lvnement ( : X ( ) ]a, b[) est dans A.
1 ]) = PX (] , x[). n
Par consquent, FX (x ) = PX (] , x[) et donc FX (x) FX (x ) = P(X = x). En dautres termes, si FX est continue en x, P(X = x) = 0. Comme FX est borne, le nombre de ces points de discontinuit est au plus dnombrable (voir exercice 14). Soit {xn , n N } ces points. On peut alors c parler de FX , la rgularise de FX :
c FX (x) = FX (x) n=1 n=1
= FX (x)
c La fonction FX est continue et croissante par dnition. Elle est daprs un thorme de Lebesgue, drivable sauf sur un ensemble de mesure de Lebesgue nulle. Dans la suite, nous ne nous proccuperons pas de savoir ce qui se passe si elle nest pas drivable en tout point. c Thorme 3.11. Soit X une v.a.r. de fonction de rpartition FX . Si FX est drivable sur R, alors
dPX (x) =
n=1
(3.1)
Cours de probabilits
FX (x)1[xn , +[ (x)
soit
x c (FX ) (s) ds + n=1
P(X ] , x]) =
Les deux mesures de part et dautre de lgalit (3.1) concident donc sur les ensembles de la forme ] , x] pour tout x rel. Cest susant (cf. thormes de classe monotone 9.6) pour assurer que ces deux mesures sont gales.
c Remarque 3. Dans le cas o FX 0,
dPX (x) =
i=1
FX (xi )xi ,
ce qui signie que X prend un nombre dnombrable de valeurs, cest une v.a. valeurs discrtes et P(X = xi ) = FX (xi ). Thorme 3.12. Soit X une v.a. valeurs dans R telle que
dPX (x) =
i=1
i xi + fX (x) dx,
avec 1 , , n des rels strictement positifs. Soit h une fonction mesurable de R dans R. Si h vrie lune des deux proprits suivantes : h est valeurs positives, E [|h(X )|] est nie, alors E [h(X )] =
i=1
i h(xi ) +
(3.2)
Dnition 3.13. Une v.a.r. X est dite de loi exponentielle de paramtre > 0 lorsque dPX (x) = exp(x)1R+ (x) dx ou de manire quivalente On notera dornavant ceci par X E (). FX (x) = 1 exp(x).
Dnition 3.14. Une v.a.r. X est dite de loi uniforme sur [a, b] lorsque dPX (x) = 1 1[a, b] (x) dx. ba
Dnition 3.15. Une v.a.r. X est dite de loi gaussienne (ou normale) de paramtres m et 2 lorsque dPX (x) = (x m)2 1 exp 2 2 2 dx.
Cours de probabilits
Dnition 3.16. Une v.a.r. X est dite de loi de Cauchy de paramtre c lorsque dPX (x) = On notera dornavant ceci par X C (c). Exemple 3.17. Soit Z une v.a.r. de loi exponentielle de paramtre et T un rel x. Soit X = min(Z, T ), on veut calculer la loi de X . Il est clair que X est positive et majore par T donc P(X T ) = 0 et P(X < 0) = 0. Pour 0 x < T , X ne peut tre infrieure x que si X = Z donc P(X x) = P(Z T, Z x) = P(Z x), puisque x < T . Par consquent, pour x [0, T [, P(X x) = 1 ex . En particulier, FX (T ) = 1 exp(T ). Comme P(X T ) = 1, on a P(X = T ) = exp(T ). Le tout se rsume dans le graphique 3.1. c dx. (c2 + x2 )
1 eT
c FX
3.3
Vecteurs alatoires
Dnition 3.18. Un vecteur alatoire (ou variable alatoire vectorielle) est une application mesurable de (, A, P) dans Rn , cest--dire telle que (X ] , x1 ] . . . ] , xn ]) A, pour tout n-uple (x1 , , xn ). Sa loi est la mesure image de P par X et sa fonction de rpartition est donne par FX (x1 , , xn ) = P(X ] , x1 ] . . . ] , xn ])
L. Decreusefond Contexte public } sans modications Voir page 83
= P(X1 x1 , , Xn xn )
22/83
Cours de probabilits
o lon a not X1 , , Xn les composantes de X , qui sont bien videmment des v.a. relles. La loi dun vecteur n composantes est une mesure sur Rn . Cette loi est dite densit lorsquil existe fX : Rn R+ telle que pour toute h continue born de Rn dans R, E [h(X1 , , Xn )] = h(x1 , , xn )fX (x1 , , xn ) dx1 . . . dxn .
Rn
Dnition 3.19. Les lois des Xi pour chaque i {1, , n} sont appeles les lois marginales. Remarque 4. Si lon connat la loi dun vecteur alatoire X valeurs dans Rn , on peut calculer toutes les lois marginales, car P(Xi ] , b]) = P(X1 +, , Xi b, , Xn +). Rciproquement, on ne peut pas, sans hypothse supplmentaire, dterminer la loi dun vecteur partir de la seule connaissance des marginales. Le seul cas o cest possible est lorsque les composantes de X sont supposes tre indpendantes. Dans ce cas, par dnition de lindpendance 5.4, P(X ] , x1 ] . . . ] , xn ]) = P(X1 x1 ) . . . P(Xn xn ). La loi de X est alors bien entirement caractrise par les lois PXi .
3.4
Changement de variables
Lun des types de calcul qui revient rgulirement dans la pratique des probabilits est celui du calcul de la loi de la tranformation dun vecteur alatoire de loi connue. Loutil principal pour ces calculs est la formule de changement de variables dans les intgrales multiples. Dnition 3.20. Soit T : O Rn Rn dont toutes les drives partielles existent sur O, la jacobienne de T au point x, est la matrice JT (x) o JT (x) = Ti (x), 1 i n, 1 j n xj T1 (x) x1 . . . Ti (x) ... . = ... xj . . . Tn (x) xn
Dnition 3.21. Soit O un ouvert de Rn , T : O Rn Rn , T est un C 1 -diomorphisme de O sur Rn , lorsque les drives partielles de T existent et sont continues sur O, T est une bijection de O sur , le jacobien de T ne sannule pas sur O. Thorme 3.22. Soit O un ouvert de Rn , T : O Rn Rn un C 1 -diomorphisme de T sur . Pour tout fonction continue borne, f (T (x)) dx =
O
f (y )
Cours de probabilits
Exemple 3.23. Soit (X1 , X2 ) deux variables alatoires relles indpendantes, de mme loi dP(x) = 1[1,[ (x) On pose U = X1 .X2 et V = X1 /X2 . 1. Calculer la loi du vecteur (U, V ). 2. Calculer la loi de U et celle de V . 3. U et V sont-elles indpendantes ? On part de lhypothse que la loi du couple (U, V ) a une densit par rapport la mesure de Lebesgue, ce qui en utilisant la caractrisation des mesures induites par le thorme de Riesz 10.17, revient trouver h : R2 R+ telle que que pour toute fonction f continue borne de R2 dans R, on ait E [f (U, V )] =
R2
1 dx. x2
o la deuxime galit dcoule du thorme de transfert. Maintenant, les v.a. X et Y sont indpendantes, ce qui quivaut (cf. (5.4)) dire que dPX, Y (x, y ) = dPX (x) dPY (y ). Par hypothse, dPX (x) = 1[1,[ (x) donc dPX, Y (x, y ) = 1[1,[ (x) On a donc obtenu E [f (U, V )] =
[1, +[2
(f T )(x, y )
On est naturellement enclin utilise le thorme de changement de variables 3.22, pour cela, il nous faut calculer , lensemble image de [1, +[2 par T et le jacobien de T . Posons u = xy et v = x/y , detJT (x, y ) = det 1 y u v
L. Decreusefond Contexte public } sans modications Voir page 83 24/83
Si x et y sont tous deux plus grands que 1 alors u lest, et v est strictement positif. Par ailleurs, = xy = x/y x2 y2 = uv . = u/v
x x = 2 y = 2v. 2 y
Cours de probabilits
v=u
v v = 1/u 1 u
Figure 3.2 Le domaine dans le plan (u, v ). On dduit de ces dernires quations que u v et uv 1. On vrie alors facilement que T est une bijection de [1, +[2 sur = {(u, v ), u v 0 et uv 1}. On tire du thorme de changement de variables que (f T )(x, y ) 1 dx dy = x2 y 2 1 1 du dv uv.u/v 2v 1 = f (u, v ) 2 du dv, 2u v f (u, v )
[1, +[2
1 1 (u, v ) du dv. 2 u2 v Pour calculer la loi de U , on veut exprimer E [f (U )] pour toute fonction continue borne de R dans R. On (x, y ) = f (x) est continue borne de R2 dans R donc remarque alors que lapplication f dP(U, V ) (u, v ) = (U, V ) = E [f (U )] = E f =
1
do par identication,
f (u)
+
1 du dv 2 u2 v 1 2u2
u 1/u
f (u)
1 dv v
du,
1 dv 1[1, +[ (u) du v
dv,
Cours de probabilits
[1/v, +[ [v, +[
si 0 v 1 si v 1.
1 du 1[0, 1] (v ) + u2
+ v
1 du 1]v, +[ (v ) u2
1 1 = v 1[0, 1] (v ) + 1]1, +[ (v ) . 2v v Comme dP(U, V ) les v.a. U et V ne sont pas indpendantes. dPU dPV ,
3.5
Exercices
Exercice 14. Soit f une fonction de R dans R borne, croissante, continue droite. On peut sans restreindre la gnralit supposer que f prend ses valeurs dans [0, 1]. Pour n 1, montrer que lensemble {x : f (x) f (x ) + 1/n} est de cardinal ni. En dduire que lensemble des points de discontinuit de f est au plus dnombrable. Exercice 15. Soit (X1 , X2 ), une variable alatoire valeurs dans R2 et N une deuxime variable alatoire indpendante de (X1 , X2 ) et de loi 1 + (1 )2 , o ]0, 1[.
2 1. Calculer E [XN ], X en termes de celles de X1 et de X2 . N
2. On suppose que X1 et X2 sont indpendantes et de mme loi, calculer la loi de XN . Exercice 16. En codage correcteur derreurs, les erreurs interviennent au hasard sur lun quelconque des bits. Si on transmet des mots de n bits, on pose = {0, 1}n , que lon munit de la loi uniforme. On introduit Xi ( ) = i pour i = 1, , n. La distande de Hamming entre mots de code x = (x1 , , xn ) et y = (y1 , , yn ), est dnie par :
n
d(x, y ) =
i=1
1 {x i
yi } .
On appelle longueur dun mot x, sa distance au mot nul 0 = (0, , 0). 1. Quelle est la longueur moyenne dun mot ? 2. Quelle est la variance de la longueur dun mot ? 3. On choisit deux mots au hasard indpendamment lun de lautre, soit X et Y les variables alatoires correspondantes. Calculer E d(X, Y )2 . Exercice 17. Trois personnes A, B et C arrivent la poste en mme temps pour tlphoner. Il y a deux cabines tlphoniques quoccupent A et B tout de suite. C remplace le premier sorti. On dsigne par X1 , X2 , X3 les temps doccupation de la cabine par A, B et C respectivement. On suppose que (X1 , X2 , X3 ) sont indpendantes, de mme loi exponentielle de paramtre . 1. Calculer la probabilit que C sorte le dernier. 2. Donner la loi du temps T pass par C la poste. 3. Donner la loi de probabilit de linstant du dernier dpart ; linstant 0 tant linstant darrive des trois personnes la poste.
L. Decreusefond Contexte public } sans modications Voir page 83 26/83
Cours de probabilits
Exercice 18 (Castor et Pollux). Castor et Pollux se sont donns rendez-vous en convenant de ne pas attendre lautre plus de dix minutes. Ils arrivent tous les deux indpendamment un instant au hasard entre midi et 13 heures. On note X , respectivement Y , lheure darrive de Castor, respectivement celle de Pollux. On note W le temps dattente de Castor. 1. Quelle est la probabilit quils se rencontrent ? 2. Exprimer en fonction de X et Y , la valeur du temps dattente de Castor. On pourra utilement faire un dessin en identiant dans le pav [0, 1] [0, 1], direntes zones o lexpression de W est simple voir Figure 3.3. 6 5 4 3 2 1 0 0 1 2 3 4 5 6
Figure 3.3 Castor et Pollux 3. Quelle est la loi du temps dattente de Castor ? 4. Quel est le temps dattente moyen de Castor ? 5. Quelle est la loi du temps dattente de Castor sachant quil y a rencontre ? Exercice 19. Soit dP(x, y ) = c exp une mesure sur le plan R2 . 1. Trouver la constante c pour que P soit une probabilit. 2. Soit (, F , P) un espace de probabilit et (X, Y ) : R2 une variable alatoire de loi P. Trouver la loi de X et celle de Y . 3. Sont-elles indpendantes ? 4. On dnit les nouvelles variables alatoires U = X 2 + Y 2 et V = Y . Calculer la loi du vecteur (U, V ). 5. Les variables U et V sont-elles indpendantes ? Exercice 20. Soient X et Y deux v.a. relles indpendantes sur (, F , P), de mme loi uniforme sur [0, a] (a > 0 rel, x). On note par R = X 2 + Y 2 , Z = Y /X et par Pa une nouvelle probabilit dnie par Pa (A) = P(A | R < a), pour tout A F .
L. Decreusefond
x2 + y 2 2
1{x>y} dx dy
Cours de probabilits
2. Montrer que R et Z sont indpendantes pour la probabilit Pa mais pas pour P. 3. Trouver deux fonctions simples f et g telles que pour Pa , f (R) et g (Z ) soient uniformes ; sont-elles indpendantes ? Exercice 21. Soient X et Y deux v.a. indpendantes de loi uniforme sur [0, 1]. 1. Quelle est la loi du couple (X, Y ) ? 2. Quelle est la loi du couple (min(X, Y ), max(X, Y )) ? Exercice 22. Soient Z = (X, Y ) la loi de densit 1 1D (x, y ) o est D est le disque unit de R2 . 1. Calculer les lois marginales de X et Y. 2. Ces deux variables sont-elles indpendantes ? 3. Calculer la loi du couple (min(X, Y ), max(X, Y )). Exercice 23. Comment simuler le tirage de points uniformment rpartis dans un triangle scalne en utilisant le moins possible le gnrateur de nombres pseudo-alatoires. Mme question avec un disque. Exercice 24. Soit D une variable alatoire de loi uniforme sur [0, 3], cest--dire dPD (x) = 1 1[0,3] (x) dx. 3
Exercice 25 (Statistiques dordre). Soit (X1 , , Xn ) des v.a. i.i.d. de loi P et de fonction de rpartition F . On dnit par rcurrence sur p, la suite de v.a. X(p) par X(1) = min Xj
1j n
1 , Xj = X(2) }
n = max{j, Xj = X(n) }. 1. Montrer que presque srement, Xi Xj pour i j. 2. Calculer la fonction de rpartition de X(1) et de X(n) . 3. Soit la permutation dnie par (i) = i . Calculer la loi de . 4. Calculer la loi de X(k) .
n 5. Soit ]0, 1[ et F (x) = P(X([n]) x). On dnit x par
1 0
si x x sinon.
Cours de probabilits
Exercice 26 (Recouvrement dun cercle, cf. [1]). Soit U = (U1 , , Un ) des v.a. i.i.d. de loi uniforme sur [0, 1]. Soit W = (W1 , , Wn ) la statistique dordre (cf. exercice 25) associe U , i.e., Wi = U(i) , pour tout i = 1, , n. On pose On considre aussi X1 , , Xn des v.a. indpendantes de loi exponentielle de paramtre 1. On pose Sn = n n1 j =1 Xj . 1. Montrer que la loi de W est donne par dPW (w1 , , wn ) = n!1A (w1 , , wn ) dw1 . . . dwn , o A = {(x1 , , xn ), 0 x1 x2 . . . xn 1}. 2. Calculer la loi de V = (nV1 , , nVn1 ). 3. Calculer la loi de (X1 , , Xn1 , Sn ). 4. Montrer que la loi de X1 Xn1 , , Sn Sn est la mme que celle de V . 5. Soit N le nombre minimum darcs de longueur ncessaires pour recouvrir la circonfrence du cercle unite. Montrer que (N n) = (max Vk ).
k n
V1 = 1 + W1 Wn , V2 = W2 W1 , . . . , Wn = Wn Wn1 .
Exercice 27. Soient P et Q deux mesures de probabilit sur N. On note pi = P({i}) et qi = Q({i}). On dnit la distance en variation totale entre P et Q par dT V (P, Q) = sup |P(A) Q(A)|.
A N
1. Montrer que
+ i=0
(pi qi )+ = = 1.
1 2
+ i=0
|pi qi |.
pi =
i qi
|P(A) Q(A)|
i=0
(pi qi )+ .
|pi qi |.
4. On suppose maintenant que P est donne par P({0}) = p = 1 P({1}) et que Q est une mesure de Poisson de paramtre = ln(p), cest--dire que qi = e Calculer dT V (P, Q).
L. Decreusefond Contexte public } sans modications Voir page 83 29/83
i . i!
Cours de probabilits
Exercice 28. Un nombre est choisi au hasard dans lintervalle [0, 10] suivant une loi P donne par dP(t) = K t 1[0,10] (t) dt , o K est une constante calculer. On note par X sa partie entire et par Y sa partie fractionnaire. 1. Calculer la loi du vecteur (X, Y ). Est-ce que les composantes sont indpendantes ? 2. Calculer la matrice de covariance de (X, Y ). Exercice 29. Pour a > 0, on dnit (a) =
0
et ta1 dt .
Une v.a.r. X est dite de loi gamma de paramtres a et > 0 si sa loi est donne par dPX (t) = 1[0,[ (t) note par X G(a, ). a t a1 e t dt , (a)
2. Soit Y une autre v.a.r. indpendante de X , de loi G(b, ). Montrer que X + Y et 3. En dduire que
1
(a, b) =
0
ta1 (1 t)b1 dt =
(a)(b) . (a + b)
2 Exercice 30. On considre E = {x = (x1 , x2 ) R2 , x2 1 + x2 1} et on considre lensemble des familles nies de points de E, cest--dire quun est une famille nie de points de E. On munit E de la tribu borlienne et dune probabilit P. Pour toute partie A de E on dnit la variable alatoire N (A)( ) qui reprsente le nombre de points de qui sont dans A. Les seules hypothses que lon fait sur P sont : Pour toute partie borlienne A de E,
o m est la mesure de Lebesgue sur R2 . Si (Ai , i N) sont des borliens disjoints deux deux, les v.a. (N (Ai ), i N) sont indpendantes dans leur ensemble. On appelle le triplet (E, P, N ) un processus de Poisson ponctuel dintensit m. 1. Calculer la moyenne et la variance de N (A) pour A borlien de E. Calculer la probabilit que A ne contienne pas de points de . 2. Soient A B deux borliens, calculer la loi de la variable alatoire (N (A), N (B )). 4. On pose U ( ) = inf {, N (B (0, ))( ) > 0} o B (0, ) est la boule ferme de centre O et de rayon r. Calculer P(U > x) pour tout x. 5. On xe r > 0, on considre Ar le secteur angulaire compos des points distants de O de moins de r r et dargument compris entre 0 et . On pose V r = inf {, N (Ar ) > 0} avec la convention V = 0 si B (0, r) ne contient pas de point de . Calculer P(V > x) pour tout x [0, 2 [.
2 2 3. Pour C = {x, a2 < x2 1 + x2 b }, calculer la loi de N (C ).
r 7. On suppose n x, pour k {0, . . . , n 1}, on appelle Bk,n le secteur angulaire des lments de E de module infrieur r et dargument suprieur 2k/n et strictement infrieur 2(k + 1)/n. Calculer 1 1 la loi de (N (B1 ,n ), . . . , N (Bn1,n )) conditionnellement N (E ) = k.
Cours de probabilits
8. On admet que les secteurs angulaires dnis prcdemment engendrent la tribu borlienne de E quand r parcourt [0, 1] et n dcrit N. Montrer que si on met k points rpartis uniformment dans E la loi de
1 1 (N (B1 ,n ), . . . , N (Bn1,n ))
est celle que lon vient de trouver. En dduire (en utilisant lexercice 23) une faon de simuler un processus Poisson ponctuel dintensit m. 9. Dans lavant-dernire question, que se passe-t-il si on change m en une constante fois m ? 10. Calculer E esN (A) pour tout borlien. Pour f fonction mesurable positive de E dans R+ , on pose N (f )( ) =
f ( ).
Calculer E esN (f ) . 11. Chaque point de est eac avec probabilit p et conserv avec probabilit 1 p et ce indpendamment des autres. On appelle Np (A) le nombre de points qui restent dans A aprs lopration deacement. Montrer que (E, P, Np ) est un processus de Poisson ponctuel dintensit (1 p)m. Calculer E esN (A) pour tout borlien.
1 Exercice 31. Soit X une v.a. relle de fonction de rpartition FX et FX linverse droite de FX dni par : 1 FX (y ) = inf {u; FX (u) y }. 1 Soit U une v.a. de loi uniforme sur [0, 1], montrer que FX (U ) a la loi de X. Cette relation permet de gnrer des v.a. de loi arbitraire partir de variables de loi uniforme sur [0, 1]. Ceci est trs frquemment utilis en simulation et connu sous le nom de mthode dinversion.Trouver comment gnrer des variables de loi exponentielle et de Cauchy avec cette mthode.
Exercice 32. La dicult qui apparat lors de la mise en oeuvre de la mthode prcdente est linversion de la fonction de rpartition. On a frquemment la densit de faon explicite mais pas la fonction de rpartition. Dans ce cas, on applique la mthode de rejet. Soit fX la densit de X et g une densit qui majore une constante prs fX et pour laquelle on sait facilement gnrer des v.a. dont la loi a pour densit g. On procde de la manire suivante : soit a tel que fX (u) ag (u) pour tout u, on tire une v.a. de loi de densit g, soit Y le rsultat de ce tirage, on tire une v.a. de loi uniforme sur [0, ag (y )] et on note Z le rsultat de ce tirage. Si Z f (Y ) alors le rsultat est Y sinon on recommence au dbut. 1. Quel est lespace de probabilit sous-jacent sur lequel sont dnies les v.a. Z et Y. 2. Montrer que P(Y t | Z fX (Y )) = FX (t).
3. Soit X et Y deux v.a. indpendantes de loi exponentielle de paramtre . Calculer la densit de la loi de Z = X Y. 4. En dduire une faon dengendrer des v.a. de loi de densit : exp(|x| ) 2 (1 + 1/) o 1 et > 0.
Exercice 33. Soit U et V deux v.a. indpendantes de loi uniforme sur [0, 1]. Posons : X= 2 ln(U ) cos(2V ) et Y = 2 ln(U ) sin(2V ).
Montrer que X et Y sont des v.a. gaussiennes centres, rduites, indpendantes. Exercice 34 (Processus de Poisson). Lun des modles stochastiques les plus utiliss est le processus de Poisson. Nous allons ici le dcrire et exhiber quelques unes de ses proprits. Soit (Sn , n 1) une suite de v.a.r. indpendantes, identiquement distribues, de loi exponentielle de paramtre . On note T1 = S1 et Tn+1 = Tn + Sn+1 .
L. Decreusefond Contexte public } sans modications Voir page 83 31/83
Cours de probabilits
Les instants (Tn , n 1) sont usuellement vus comme des instants darrive. Les dures Sn sappellent logiquement inter-arrives. On pose
+
Nt =
n=1
1[0,t] (Tn ).
1. Calculer la loi de (T1 , , Tn ). 2. Calculer la loi de Tn . 3. Montrer que (Nt = k ) = (Tn t < Tn+1 ). 4. Calculer la loi de Nt . 5. Soit Wt = t TNt et Zt = TNt +1 t. Calculer la loi de (Wt , Zt ). 7. En quoi, ce rsultat est-il surprenant ? Exercice 35. Soit W une v.a. de loi de Poisson de paramtre > 0 : P(W = k ) = e 1. Montrer que pour toute fonction positive f : E [f (W + 1)] = E [W f (W )] . (3.3) k . k!
6. Montrer que Wt et Zt sont indpendantes et que Zt suit une loi exponentielle de paramtre .
2. Rciproquement, soit W une v.a. discrte, valeurs dans N, telle que pour toute fonction positive, lidentit 3.3 soit satisfaite. En appliquant 3.3 des fonctions f judicieusement choisies, montrer que P(W = j ) = pour tout j 1. P(W = j 1), j
3. En dduire la loi de W . Exercice 36. On tire un nombre X uniformment sur [0, 1]. On tire ensuite des nombres Y1 , Y2 , indpendamment les uns des autres et indpendamment de X , uniformment sur [0, 1]. Le jeu sarrte ds que Yi > X . Vous gagnez alors (i 1)e. On appelle G le gain. Pour k entier, on dnit k (x, y1 , , yk+1 ) = 1. Pour k entier, montrer que k (x, y1 , , yk+1 ) dy1 dy2 . . . dyk+1 dx = 1 1 k+1 k+2 1{y1 >x} 1{y1 x,..., yk x, yk+1 >x} si k = 0 si k > 0.
[0, 1]k+2
On traitera sparment les cas k = 0 et k > 0. 2. Calculer la loi de G. 3. Calculer lesprance de G. Exercice 37. Pour tout a rel strictement positif, Ga dsigne une variable alatoire de loi gamma de paramtres (a, 1) : la densit ga de sa loi est donne par ga (x) = o (a) =
L. Decreusefond Contexte public } sans modications Voir page 83
0
xa1 ex dx.
32/83
Cours de probabilits
En particulier, G1 suit une loi exponentielle de paramtre 1. On admet que E [eitGa ] = (1 it)a , pour tout t R. De plus, pour a, b rels strictement positifs, Ba, b dsigne une variable alatoire de loi bta de paramtres (a, b) : la densit ha, b de sa loi est donne par ha, b (y ) = (a + b) a1 y (1 y )b1 1[0,1] (y ). (a)(b)
1. Calculer la loi du couple (Ga+b Ba, b , Ga+b ) lorsque les v.a. Ga+b et Ba,b sont indpendantes. 2. En dduire que pour deux variables Ga+b , Ba,b indpendantes, la loi de Ba, b Ga+b est identique celle de Ga . 3. Soit n 0. Montrer par rcurrence, que lorsque les variables alatoires Ba,1 , , Ba+n,1 , Ga+n+1 sont indpendantes, la loi de
n
Pn = Ga+n+1
j =0
Ba+j, 1
est la mme que celle de Ga . On utilisera la question prcdente et les hypothses dindpendance. On vitera les longs calculs. 4. Soit X une v.a. de loi exponentielle de paramtre 1 indpendante de Ga , montrer que Ga + X a la mme loi que Ga+1 . 5. En dduire que pour tout entier n, Ga+n a mme loi que Hn = Ga + X1 + X2 + . . . + Xn , o les Xi sont des v.a. dont on prcisera les proprits. On pose Wn = Ga + X1 + X2 + . . . + Xn o les Xi sont indpendantes, identiquement distribues de loi exponentielle de paramtre 1. On suppose de plus que les v.a. Ga et {Xk , k 1} sont dnies sur le mme espace de probabilit. 6. Quelle est la limite presque-sre de (n1 Wn , n 1) ? 7. Montrer que la suite (n1 Ga+n , n 1) converge en loi, vers une loi que lon prcisera.
1 0
u1/2 (1 u)1/2 du = .
Soit X = (X1 , X2 ) un vecteur gaussien de R2 , centr, de matrice de covariance (ou dispersion) = Id. On pose X2 2 2 U = 2 1 2 et V = X1 + X2 . X1 + X2 1. Calculer la densit de la loi de (U, V ). 2. Donner les densits marginales de U et V . On prcisera les constantes de normalisation. X2 3. Soit Z = 2 2 . Exprimer Z en fonction de U puis calculer la densit de la loi de Z . X1 On note R la rotation dangle dans R2 . Si x R2 , R x = x1 cos x2 sin x1 sin + x2 cos = cos sin sin cos x1 , x2
o x1 et x2 sont les composantes de x dans la base canonique de R2 . Soit X = (X1 , X2 ) une v.a. valeurs dans R2 telle que pour tout [, ], R X a mme loi que X . Cest--dire que E [g (R X )] = E [g (X )] , (3.4) pour toute fonction g mesurable borne de R2 dans R. On suppose que la loi de X a une densit par rapport la mesure de Lebesgue, note v .
L. Decreusefond Contexte public } sans modications Voir page 83 33/83
Cours de probabilits
4. Montrer que pour toute fonction g mesurable borne de R2 dans R, pour tout [, ], g (x)v (x) dx =
R2 R2
g (y )v (R y ) dy.
On admet qualors il existe w : R+ R+ , mesurable, telle que v (x) = w( x ) pour tout x R2 . 5. Montrer que dans ce cas,
0 +
w(r) r dr =
1 . 2
On suppose maintenant que X = (X1 , X2 ) est un vecteur gaussien centr de matrice de covariance (ou dispersion) . 6. Soit [, ], quelle est la loi de R X ?
7. Montrer que R X a mme loi que X pour tout si et seulement si R = R . 8. Supposons que R = R pour tout [, ]. En crivant les quations satisfaites par les coecients de , montrer que est la matrice dune homothtie positive (cest--dire quil existe 2 tel que = 2 Id).
Cours de probabilits
3.6
Formulaire
Distribution B(n, p) Geom(p) P() U ([a, b]) E () N (m, 2 ) C (c) Esprance np 1 p a+b 2 1 m non dnie Variance np(1 p) 1p p2 (b a)2 12 1 2 2 non dnie
n n j =0 j
+ j =1 (1
j + j =0 e
c dx (c2 + x2 )
Cours de probabilits
Chapitre 4
Moments
4.1 Esprance
Considrons un paquet de N copies toutes notes de 0 20 dont on veut calculer la moyenne. On note xi la note de la copie numro i. Deux solutions sorent nous. La premire consiste sommer toutes les notes et diviser le rsultat par N : 1 N
N
xj .
j =1
Lautre solution consiste classer les copies par note obtenue, on note alors Pn le nombre de copies ayant obtenue la note n. La moyenne se calcule alors par 1 N
20
nPn .
n=0
Les deux mthodes donnent (esprons-le) un rsultat identique. On passe de la premire la deuxime en rordonnant les xi de sorte que ceux qui sont gaux soient numrots conscutivement. Si on reprsente les notes dans un graphique avec en abscisse, le numro de la copie et en ordonne, la note attribue. Dans la premire mthode, on lit le diagramme le long de laxe des abscisses et pour chaque valeur, on regarde la note. Cest exactement ce que lon fait dans la dnition de lintgrale de Riemann. Dans la deuxime mthode, on lit le diagramme le long de laxe des ordonnes et pour chaque note, on regarde le nombre de copies qui ont eu cette note. Cest cette approche qui est la base de lintgrale de Lebesgue. Apparemment, il y a peu de dirences entre les deux mthodes. En fait, lintgration la Lebesgue ncessite moins dinformations sur les notes que lintgration la Riemann : dans la premire mthode, on doit connatre la note de chaque copie, dans la deuxime, on se contente de savoir juste le nombre de copies qui ont une note donne sans se proccuper de savoir lesquelles car cela ne compte pas dans le calcul de la moyenne. Il se trouve quen probabilits, cest exactement ce qui se passe : on ne connat pas le rsultat dune exprience a priori, on connat juste la probabilit quun vnement donn a de se produire. Par exemple, avant de lancer un d, on sait juste que la probabilit davoir un 5 (ou nimporte quel autre chire) est dun-sixime. En utilisant la deuxime approche, la moyenne dun lancer de d est donc
6
j
j =1
1 6.7 1 = = 3,5. 6 6 2
On verra dans le chapitre 8 que cette moyenne signie que si lon lance le mme d, un grand nombre de fois, la moyenne des lancers sera approximativement 3,5. On traduit ceci en disant que lesprance dun lancer de d est 3,5.
L. Decreusefond Contexte public } sans modications Voir page 83 37/83
Cours de probabilits
Dnition 4.1. Soit (, A, P) un espace probabilis et X une variable alatoire valeurs dans Rk . On appelle esprance de X , note E [X ] la quantit E [X ] =
X ( ) dP( ).
Remarque 5. Retrouvons lesprance dun lancer de d avec cette dnition. Ici, = {1, , 6} et P({ }) = 1/6. La v.a. X qui reprsente le rsultat du lancer dun d est dnie par X ( ) = . Par consquent,
6 6
E [X ] =
=1
P({ }) =
=1
1 = 3,5. 6
Thorme 4.2 (Thorme de transfert). Soit (, A, P) un espace probabilis et X une variable alatoire valeurs dans Rk de loi PX . Pour toute fonction f : Rk R+ , E [f (X )] =
Rk
(4.1)
On note L1 (PX ) lensemble des fonctions (mesurables) f : Rk R telles que E [|f (X )|] < +. Pour toute fonction f L1 (PX ), E [f (X )] =
Rk
Preuve (Hors programme). Par dnition de la loi dune v.a. P(X A) = PX (A). En termes dintgrales, cela signie 1A X ( ) dP( ) =
Rk
Ce qui signie que la relation (4.1) est vraie pour f = 1A . Par linarit, cette relation est donc satisfaite pour les fonctions tages. Par convergence monotone, elle est satisfaite pour les fonctions mesurables positives. En prenant les parties positives et ngatives de f X , elle lest aussi ds que f appartient L1 (PX ). Remarque 6. On ralise que pour calculer lesprance de f (X ) on ne travaille que sur lespace des valeurs de la variable alatoire X : on na pas besoin de rellement prciser lespace de dpart, do le ou systmatique qui entoure cet objet. Remarque 7. On remarque que deux v.a. qui ont la mme loi, ont mmes esprances. Rciproquement, daprs le thorme de Riesz 10.17, si E [f (X )] = E [f (Y )] pour toute fonction f continue borne alors X et Y ont la mme loi. Remarque 8. Connaissant PX , on peut donc calculer lesprance de f (X ). Pour les cas particuliers, voir les thormes 3.7 et 3.12. On peut aussi quelquefois, calculer lesprance de X sans connatre sa loi, voir exercice 45.
4.2
Si lesprance indique la valeur moyenne dune variable alatoire, on peut sintresser mesurer les carts moyens de ces valeurs par rapport la moyenne. On introduit ce que lon appelle la variance : var(X ) = E |X E [X ] |2 = E X 2 E [X ] . Remarque 9. Si var(X ) = 0 alors X est p.s. constante, autrement dit, X est dterministe.
L. Decreusefond
2
Plus gnralement, le moment dordre p dune v.a.r. X est dni par E [|X |p ].
Contexte public } sans modications Voir page 83 38/83
Cours de probabilits
4.3
Ingalits
|E [XY ]| E X 2
1/2
Corollaire 4.3.1. Si X est de carr intgrable alors X est intgrable. Lingalit de Cauchy-Schwarz peut se dmontrer en recopiant la dmonstration qui existe pour lintgrale de Riemann mais elle peut aussi se voir comme un cas particulier des ingalits de Hlder. Thorme 4.4 (Ingalits de Hlder). Soit X et Y deux v.a. relles. Soit p 1 et q tel que 1/p + 1/q = 1. |E [XY ]| E [|X |p ]
1/p
E [|Y |q ]
1/q
Thorme 4.5 (Ingalit de Jensen). Soit X une v.a. relle et une fonction convexe dnie sur R alors (E [X ]) E [(X )] . En particulier, pour (x) = |x|, on obtient |E [X ] | E [|X |] . Thorme 4.6 (Ingalit de Bienaym-Tcebycev). Soit X une v.a.r. de variance nie, pour tout rel > 0, P(|X E [X ] | ) Ce thorme est un cas particulier de lidentit suivante. Thorme 4.7 (Ingalit de Markov). Soit p 1 et X une v.a.r. de moment dordre p ni, pour tout rel > 0, 1 P(|X | ) p E [|X |p ] . Dmonstration. En dcoupant lintgrale, on obtient E [|X |p ] = E |X |p 1{|X |} + E |X |p 1{|X |<} p P(|X | ) + 0. Le rsultat sobtient en divisant les deux membres de lingalit par p . 1 var[X ]. 2
4.4
Exercices
P(X = n) = 6 1 , pour n 1. 2 n2
Exercice 40. On veut calculer les moments dune v.a. de uj]loi hypergomtriqueloi hypergomtrique. On se donne donc une urne contenant r boules rouges et b boules blanches de sorte que N = r + b. Muni dune puisette boules, on tire m boules parmi les N prsentes. On range ces boules dans des cases numrotes de 1 m. On note X le nombre de boules rouges ressorties et Xi = On a donc X =
L. Decreusefond Contexte public } sans modications Voir page 83 39/83
m i=1
1 0
Xi .
Cours de probabilits
1. Pourquoi les vecteurs alatoires (X1 , , Xm ) et (X(1) , , X(n) ) ont-ils la mme loi ? 2. Calculer P(Xi = 1) et P(Xi Xj = 1) pour i 3. En dduire E [X ] et var(X ). Exercice 41. Calculer la moyenne et la variance des loi usuelles : binomiale, gomtrique, Poisson, exponentielle, normale, Cauchy, gamma. Exercice 42. On dit quune suite de variables alatoires (Xn , n N) converge en probabilit vers la variable alatoire X si et seulement si pour tout > 0,
n+
j.
lim P(|Xn X | ) = 0.
1. Soit X une v.a. discrte valeurs positives. Montrer lingalit dite de Markov : pour tout p 1, pour tout > 0, 1 P(X ) p E [X p ] .
2 2. Soit (Xn , n N) une suite de v.a. de moyenne n et de variance n . Soit (bn , n N) une suite de 2 2 rels positifs tels que n /bn tende vers 0. Montrer que
Xn n tend vers 0 en probabilit. bn Exercice 43 (Borne de Cherno). Soit X une v.a. de loi de Poisson de paramtre . 1. Montrer que X = exp(X ) exp( ) . 2. Montrer que, pour tout 0, P(X K) eK E [exp(X )] . 3. Calculer E [exp(X )]. 4. Trouver qui minimise le terme de droite de (4.2). 5. Trouver K tel que P(X K) 0, 001. Exercice 44 (Diusion de gaz). Un modle simple de diusion de deux gaz d Ehrenfest est le suivant. On considre deux urnes A et B qui contiennent respectivement n boules blanches et n boules noires. chaque tape, on choisit une boule dans chacune des urnes et on permute la position de ces deux boules : celle qui tait en A passe en B et rciproquement. On note Xk le nombre de boules blanches dans A aprs le k -me mlange. 1. Pour k 1, calculer la loi de Xk sachant Xk1 . 2. Calculer E [Xk ]. 3. Quelle est la limite de E [Xk ] quand k tend vers linni ? Exercice 45. Dans le tri rapide (quicksort), on note Mn le nombre de comparaisons ncessaires pour ordonner un tableau de n nombres. Montrer que E [Mn ] vrie la relation E [Mn ] = n 1 + En dduire que
n1
(4.2)
2 n
n1
E [Mk ] .
k=1
E [Mn ] = 2(n + 1)
i=1
i (i + 1)(i + 2)
Cours de probabilits
Exercice 46. On veut collectionner N images dont une et une seule apparat dans chaque tablette de chocolat achete. Les images sont mises au hasard dans les tablettes. On appelle Ti le nombre de tablettes ncessaires avant davoir i images distinctes. On pose T0 = 0. 1. Montrer que Ti+1 Ti suit une loi gomtrique de paramtre 1 i/N. 2. Montrer que les variables alatoires T0 , T1 T0 , . . . , TN TN 1 sont indpendantes dans leur ensemble.
3. Calculer lesprance et la variance de TN . Trouver un quivalent de lesprance et montrer que la variance est un O(N ) quand N tend vers +. 4. En utilisant lexercice 42, montrer que TN /(N log N ) tend vers 1 en probabilit. Exercice 47. Soit N un processus de Poisson (cf. exercice 34) dintensit , on note Tn le n-ime instant de saut. Par convention, T0 = 0. Soit (Zn , n 1), une suite de variables alatoires de mme loi telles que pour tout n, Tn et Zn sont indpendantes. Soit g la densit de la loi commune aux Zn . 1. Montrer que pour toute fonction f,
+
E [f (Tn , Zn )] =
0
f (t, z )g (z )et
2. En dduire que E[
n1
f (Tn , Zn )] =
0
f (t, z )g (z ) dz dt.
3. On suppose que les communications tlphoniques dun abonn durent un temps alatoire de loi exponentielle de moyenne 3 minutes. Ces dures sont indpendantes entre elles. Au sicle dernier, le cot dune communication tait fonction de sa dure t selon la formule suivante : c(t) = si t t0 , et c(t) = + (t t0 ) si t t0 . Dduire de ce qui prcde que le cot moyen dune heure totale de communication est donn par :
1
c(t)et dt
avec = 20. (Indication : Considrer Zn = Tn+1 Tn et expliquer pourquoi on peut appliquer le rsultat prcdent.) Exercice 48. Soit N un processus de Poisson sur R+ . Soit f : R+ R+ . Considrons f (s) dNs =
n1
f (Tn ).
1. Montrer que Nt Ns a mme loi que Nts pour tout couple (t, s) avec t s. 2. Montrer que E exp( 3. En dduire E exp(
+
1 e1]a, b](s) ds .
Cours de probabilits
Chapitre 5
Indpendance et conditionnement
5.1 Indpendance
On travaille ici sur un espace probabilis (, A, P). Au dpart, la notion dindpendance sapplique deux vnements. Rappelons la dnition dj vue dans le chapitre 2. Dnition 5.1. Deux vnements A et B sont indpendants lorsque P(A B ) = P(A)P(B ). (5.1)
Les vnements (Aj , j N ) sont dits indpendants dans leur ensemble lorsque pour toute sous-famille nie Aj1 , , Ajl , P( Ajk ) =
k=1 l l
P(Ajk ).
k=1
Thorme 5.3. Soit X et Y deux v.a. valeurs discrtes. Les v.a. X et Y sont indpendantes si et seulement si P(X = i, Y = j ) = P(X = i)P(Y = j ) (5.2) pour tout (i, j ) E F . Dmonstration. Si X et Y sont indpendantes alors il sut de considrer A = {i} et B = {j }, lquation (5.2) dcoule de la dnition. Rciproquement, si lquation (5.2) est vrie, P(X A, Y B ) = P (X = i) (Y = j )
iA j B
Dnition 5.2. Soit X : (E, E ) et Y : (F, F ) deux variables alatoires. Les v.a. X et Y sont indpendantes lorsque les vnements (X A) et (Y B ) sont indpendants au sens de la dnition 5.1 pour tout A E et tout B F .
Pour des variables alatoires X et Y , dire quelles sont indpendantes revient exiger que les vnements de la forme (X A) sont indpendants des vnements de la forme (Y B ). Formellement, cela donne :
=P =
iA, j B
(X = i, Y = j )
P(X = i, Y = j )
iA, j B
=
iA, j B
P(Y = j )
= P(X A)P(Y B ),
43/83
Cours de probabilits
pour tous les vnements A et B . Malheureusement, le thorme 5.3 nest pas intressant pour les variables alatoires non discrtes. Le critre gnral valable dans tous les cas est le suivant. Thorme 5.4. Deux variables alatoires X : (E, E ) et Y : (F, F ) sont indpendantes si et seulement pour toutes les fonctions mesurables bornes f : E R et g : F R, E [f (X )g (Y )] = E [f (X )] E [g (Y ]). Si E = F = R, X et Y sont indpendantes si et seulement si P(X a, Y b) = P(X a)P(Y b), pour tout rel a et b. Dmonstration. La preuve du cas gnral repose sur la thorie de la mesure. En revanche, dans le cas o E et F sont dnombrables, on peut dmontrer ce rsultat comme suit. Pour X et Y indpendantes, calculons E [f (X )g (Y )] . E [f (X )g (Y )] =
i, j
(5.3)
= =
i
f (i)P(X = i)
j
g (j )P(Y = j )
= E [f (X )] E [g (Y )] . Rciproquement, si lquation (5.3) est vrie, on obtient (5.2) en spcialisant (5.3) pour f = 1{i} et g = 1 {j } . Avec un langage de thorie de la mesure (voir la section 9.1.1 et la remarque 19), lquation (5.3) scrit f (x)g (y ) dP(X, Y ) (x, y ) =
X Y X
g (y ) dPY (y ) =
X Y
soit Thorme 5.5. Deux v.a. X et Y sont indpendantes si et seulement si La consquence pratique de cette formulation est que si les lois des v.a. X et Y ont des densits alors la loi du couple (X, Y ) a une densit qui est le produit des densits marginales. Rciproquement, si la densit de la loi du couple (X, Y ) scrit comme le produit tensoriel de deux fonctions alors les deux v.a. sont indpendantes et leur loi sont les composantes du produit tensoriel : On admettra enn le thorme suivant. f(X, Y ) (x, y ) = f1 (x)f2 (y ) = dPX (x) = f1 (x) dx et dPY (y ) = f2 (y ) dy. dP(X, Y ) (x, y ) = dPX (x) dPY (y ). dP(X, Y ) (x, y ) = dPX (x) dPY (y ).
Thorme 5.6. Soit X : Rn et Y : Rm . Pour t = (t1 , , tn ) Rn , on note t.X = n i=1 ti Xi le produit scalaire des vecteurs t et X . Lesprance dune v.a. complexe Z est dnie comme le nombre complexe dont la partie relle, respectivement imaginaire, est lesprance de la partie relle de Z , respectivement lesprance de la partie imaginaire de Z . Les v.a. sont indpendantes si et seulement si E ei(t.X +s.Y ) = E eit.X E eis.Y pour tout t Rn et s Rm .
L. Decreusefond Contexte public } sans modications Voir page 83 44/83
(5.5)
Cours de probabilits
5.2
Conditionnement
Il nest pas dicile de montrer que PB satisfait tous les axiomes qui font delle une mesure de probabilit voir la dnition 9.2. Paralllement, quand deux v.a. ne sont pas indpendantes, on peut considrer la notion de loi conditionnelle. Le cas le plus simple est quand la variable par rapport laquelle on veut conditionner est valeurs dans un espace dnombrable. Dnition 5.7 (Cas o Y est valeurs discrtes). Soit Y une v.a. valeurs dans un espace au plus dnombrable E et E = {i : P(Y = i) 0} (en dautres termes, E est le support de la mesure PY ). Soit X une v.a., la loi de X conditionnellement (Y = i), pour tout i E , note par PX | Y =i est la mesure image de PB par X . Cela signie que PX | Y =i (A) = P(X A | Y = i). Thorme 5.8. Si X est aussi valeurs discrtes et si pi, j = P(X = i, Y = j ), on a PX | Y =i ({j }) = Dmonstration. Par dnition de la loi conditionnelle, on a PX | Y =i ({j }) = P(X = j | Y = i) pj, i = P(Y = i) pj, i , = j pj, i do le rsultat. Dnition 5.9. Lesprance conditionnelle de X sachant Y = i, que lon note E [X | Y = i], est dnie par E [X | Y = i] = x dPX | Y =i . pj, i . j pj, i
Quand deux vnements ne sont pas indpendants, on a dj introduit la notion de probabilit conditionnelle. En particulier, pour un vnement B de probabilit non nulle, on peut considrer la probabilit PB dnie par PB (A) = P(A | B ).
On note E [X | Y ] la variable alatoire qui vaut E [X | Y = i] sur lvnement (Y = i). Dans le cas o X est discrte, on obtient, pour toute fonction mesurable borne, E [f (X ) | Y = i] = On remarque alors que Thorme 5.10. Pour toute fonction mesurable borne g E [f (X )g (Y )] = E [E [f (X ) | Y ] g (Y )] , en particulier pour g 1, E [f (X )] = E [E [f (X ) | Y ]] . f (j )
j
pj, i . j pj, i
(5.6)
Dans le cas o la variable de conditionnement nest pas valeurs dnombrables, la situation est plus complique parce quil est frquent que P(Y = i) soit nul. Nous ne rentrerons pas dans la thorie gnrale de ce cas, nous donnons juste la dnition de la loi conditionnelle et de lesprance conditionnelle.
L. Decreusefond Contexte public } sans modications Voir page 83 45/83
Cours de probabilits
Dnition 5.11. Soit (X, Y ) un couple de v.a. dont la loi a pour densit f , cest--dire dP(X, Y ) (x, y ) = f (x, y ) dx dy , la loi conditionnelle de X sachant Y = y est la loi de densit f (x, y ) , f (x, y ) dx cest--dire que dPX | Y =y (x) = f (x, y ) dx. f (x, y ) dx (5.7)
Lesprance conditionnelle de h(X ) sachant Y sexprime alors par E [h(X ) | Y = y ] = On pose E [h(X ) | Y ] = h(x) h(x) f (x, y ) dx. f (x, y ) dx f (x, Y ) dx f (x, Y ) dx
5.3
Exercices
Exercice 49. Les rgles du jeu du not-seven sont les suivantes : on part dun score X0 = 0. chaque coup, on lance deux ds non pips, si la somme des faces gale 7, le score retourne 0 et la partie est termine. Sinon, le score augmente de la somme des faces et on a le droit de rejouer ou pas. Si lon ne rejoue pas, le score est acquis et la partie est termine. Si lon rejoue, on relance les deux ds avec la mme rgle. 1. Calculer la loi de la somme S des deux faces. Calculer son esprance. On considre une suite (Sn , n N) de variables alatoires indpendantes de mme loi que S. 2. Soit = inf {n 1, Sn = 7}, trouver la loi de . 3. Calculer la moyenne de .
4. Quelle est la stratgie dun Initi (celui qui sait le rsultat du prochain lancer de ds) ? 5. Calculer son gain moyen. 6. On appelle Xn le score au n-ime coup en labsence de stratgie darrt. Montrer que E [Xn+1 | Xn = i] = 35 5 i+ . 6 6
7. En dduire que la stratgie optimale consiste jouer tant que lon na pas atteint 35 et sarrter immdiatement aprs avoir franchi ce seuil. 8. Calculer par simulation le gain moyen avec cette stratgie. Exercice 50. En radio-mobiles, on est souvent amen simuler des usagers rpartis de faon uniforme dans une cellule hexagonale (voir la gure 5.1 pour les lments caractristiques dune telle cellule). Comment faire en utilisant un minimum dappels au gnrateur de nombres alatoires ? On rappelle pour simplier les calculs que pour un hexagone de longueur de ct 1, laire est A = 3 3/2. Exercice 51. Soient (X1 , X2 , X3 ) des variables alatoires indpendantes de mme loi valeurs dans N. On note pi = P(Xl = i), l = 1, 2, 3. On introduit Z de loi uniforme sur {1, 2}. 1. Quelle est la loi de Y = (XZ , X3Z ) ? 2. Soit W le vecteur alatoire dni par : W = (X1 , X3 ) si Z = 2 et W = (X3 , X2 ) si Z = 1. Quelle est la loi de W ?
L. Decreusefond Contexte public } sans modications Voir page 83 46/83
Cours de probabilits
y =1
x 1+ 3
/6
Figure 5.1 Hexagone rgulier. Exercice 52. Soient 1 n N deux entiers. Soit M une v.a. de loi binomiale (N, ) et X une v.a. dont la loi est donne par P(X = k | M = m) = 2. Pour k = 0, identier cette loi.
m k N m nk N n
Cours de probabilits
Chapitre 6
Transformes intgrales
6.1 Fonctions gnratrices
X (s) = E sX , pour s [1, 1]. Comme X (s) =
n=0 +
Dnition 6.1. Soit X une v.a. valeurs dans N, sa fonction gnratrice X est dnie par :
P(X = n)sn
et que n P(X = n) = 1, on voit que X est dveloppable en srie entire de rayon de convergence suprieur ou gal 1. La thorie des sries entires permetw de montrer les proprits suivantes : X (1) = 1, pour tout entier n, (n) (0) , P(X = n) = X n! si X Y alors X et Y ont mme loi. Soit k N , si E X k < + alors X est k -fois drivable gauche en 1 et X (1) = E [X (X 1) . . . (X k + 1)] . Thorme 6.2. Si X et Y sont deux v.a. discrtes indpendantes, alors X +Y (t) = X (t)Y (t). Dmonstration. Dcoule immdiatement de la caractrisation de lindpendance du thorme 5.4.
(k )
6.2
Fonctions caractristiques
La fonction caractristique a des proprits similaires celles des fonctions gnratrices mais elle existe pour toutes les variables alatoires, mme vectorielles. Dnition 6.3. Soit X une v.a.r., on note X sa fonction caractristique dnie par X (t) = E eitX , pour tout t R. Pour X = (X1 , , Xn ) vecteur alatoire, sa fonction caractristique est dnie par X (t1 , , tn ) = E e
L. Decreusefond Contexte public } sans modications Voir page 83 49/83
i
n j =1
tj Xj
Cours de probabilits
Remarque 10. La fonction caractristique peut scrire X (t) = eitx dPX (x),
ce nest donc rien dautre que la transforme de Fourier de la mesure PX . ce titre, elle jouit des mmes proprits formelles que la transforme de Fourier des fonctions. Thorme 6.4. Soit X une v.a.r. et X sa fonction caractristique. Les proprits suivantes sont vries : 1. X (0) = 1. 2. la fonction X est continue sur R. 3. Si X Y alors X et Y ont mme loi. 4. Si, pour un entier k 1, E |X |k < alors X est k -fois continment direntiable et d X (t) = ik E X k eitX , dt en particulier, E X k = ik (k) (0). Dmonstration. Le premier point est immdiat. Les proprits 2 et 4 dcoulent respectivement des thormes 10.15 et 10.16. Le point 2 qui traduit linjectivit de la transforme de Fourier dans les mesures est admis. Il repose sur la formule dinversion de Fourier. Thorme 6.5. Soient X et Y deux vecteurs alatoires indpendants valeurs dans Rn et Rm respectivement, E ei(t.X +s.Y ) = X (t)Y (s), pour tout t Rn , s Rm . Dmonstration. Dcoule immdiatement de la caractrisation de lindpendance du thorme 5.4. Remarque 11. On a admis dans le thorme 5.6 que la rciproque tait vraie. Thorme 6.6. Soit X une v.a.r. de loi gaussienne de paramtre m et 2 , E eitX = exp itm 1 E eitX = 2 2 t2 . 2 (6.1)
dx
u2 2
ei(t)u e
R
du.
eitu e
R
u2 2
du, (6.2)
on a alors E eitX = eitm (t). Le thorme de drivation sous le signe somme (cf. thorme 10.16) permet dcrire i (t) = 2 En intgrant par parties, on obtient (t) = t(t) do (t) = e 2 . En reportant cette expression dans (6.2), on obtient (6.1).
L. Decreusefond Contexte public } sans modications Voir page 83 50/83
t2
eitu ue
R
u2 2
du.
Cours de probabilits
6.3
Exercices
Exercice 53. Soit (Xn , n 1) une suite de v.a. indpendantes, de loi exponentielle de paramtre . Soit T n = X1 + . . . + Xn . 1. Calculer la loi de (T1 , T2 , , Tn ). 2. En dduire la loi de Tn . 3. Calculer directement la fonction caractristique de Tn . Exercice 54. Dans ce qui suit, X et Y sont deux variables indpendantes, on demande de calculer la loi de leur somme. 1. X B (n, p) et Y B (m, p). 3. X Po() et Y Po(). 5. X E () et Y E (). 2. X Geom(p) et Y Geom(p ). 4. X N (m, 2 ) et Y N (r, 2 ).
Exercice 55 (Processus de branchement). Soit X0 une v.a. valeurs entires. Soit (Xn, j , n 1, 1 j n) une famille dnombrable de variables alatoires indpendantes, de loi PX0 . On note G la fonction gnratrice de PX0 . On considre un individu racine qui a un nombre X0 de descendants Chacun de ses descendants a un nombre alatoire de descendant, ce nombre est indpendant de celui des autres descendants et de loi PX0 . On pose Zn le nombre total dindividus au rang n. 1. Calculer la fonction gnratrice de Zn en fonction de celle de Zn1 . 2. Soit un = P(Zn = 0). Montrer que un = G(un1 ). 3. Trouver des conditions ncessaires et susantes sur PX0 qui garantissent que G est strictement convexe. 4. Montrer que u converge vers une limite non nulle si et seulement si E [X0 ] < 1. Ce processus reprsente tout aussi bien lvolution de la contamination par un virus ( X0 est le nombre dindividus contamins par le malade initial ), que la transmission dun nom de famille ( X0 tant alors le nombre denfants portant le nom de leur pre )et bien dautres situations. Exercice 56. Peut-on piper deux ds de sorte que la loi de leur somme soit la loi uniforme sur {2, , 12} ? Exercice 57 (Somme alatoire). Soient X = (Xn , n 1) une suite de v.a. indpendantes de loi exponentielle de paramtre . Soit N une v.a. indpendante de la suite X de loi gomtrique de paramtre . Calculer la loi de Z o
N
Z=
j =1
Xj .
Cours de probabilits
Chapitre 7
Vecteurs gaussiens
Les vecteurs gaussiens ont une importance toute particulire pour deux raisons : dune part, le thorme de la limit centre montre que la loi de Gauss est le domaine dattraction de nombreuses limites et dautre part, les calculs sur les lois normales se ramnent de lalgbre linaire. Nous aurons en particulier besoin de considrer la transpose dune matrice A, que nous noterons At . Le produit scalaire de deux vecteurs x et y de Rk est not x.y . On rappelle que x.y = j = 1k xj yj = xt y.
7.1
Rappelons dabord la dnition dune v.a. gaussienne relle. Dnition 7.1. X : R est une v.a. gaussienne relle de paramtres m et 2 lorsque dPX (x) = La fonction caractristique est donne par : E eitX = exp itm 2 t2 . 2 (x m)2 1 exp 2 2 2 dx.
En dimension suprieure, la dnition dun vecteur gaussien ne repose pas sur la densit de sa loi mais sur une caractrisation dirente. Dnition 7.2. X : Rn est un vecteur gaussien lorsque t.X est une v.a. gaussienne relle pour tout t = (t1 , , tn ) Rn . Remarque 12. En particulier, chacune des composantes est une v.a. gaussienne relle. Rciproquement, si (X1 , , Xn ) sont des v.a. gaussiennes relles indpendantes alors X = (X1 , , Xn ) est un vecteur gaussien. Thorme 7.3. Soit X = (X1 , , Xn ) un vecteur gaussien, on note m = E [X ] = (E [X1 ] , , E [Xn ]) X = cov(Xi , Xj ), 1 i, j n o cov(X, Y ) est la covariance des v.a. X et Y :
L. Decreusefond
Cours de probabilits
La fonction caractristique de X est donne par : 1 E eis.X = exp it.m st X s 2 n n 1 tj X j = exp i 2 j =1 pour tout s = (s1 , , sn ) Rn .
X (k, l)sk sl ,
k=1 l=1
Dmonstration. Par dnition, dun vecteur gaussien, s.X est une v.a. gaussienne relle dont on sait que la loi est caractrise par la moyenne et la variance. Par linarit de lesprance,
n n
E [s.X ] = E
k=1
sk X k =
k=1
sk E [Xk ] = s.m .
Dautre part,
n
var(s.X ) = E
k=1
sk (Xk mk )
= E
n k=1
n 2 s2 k (Xk mk ) + 2
k=1
1k<ln
s2 k var(Xk ) + 2
1k<ln
sk sl cov(Xk , Xl )
sk sl (Xk mk )(Xl ml )
= X s.s, do le rsultat. Thorme 7.4. Soit X un vecteur gaussien de Rn , de vecteur moyen m et matrice de covariance X , soit A une matrice r lignes et n colonnes et B un vecteur colonne de r lignes. Le vecteur alatoire Y = AX + B est un vecteur gaussien de vecteur moyen Am + B et de matrice de covariance A X At . Dmonstration. Vrions dabord que Y est un vecteur gaussien de Rr . Soit s Rr , s.Y = s.AX + s.B = At s.X + s.B est une v.a. gaussienne relle puisque X est un vecteur gaussien. Il reste calculer moyenne et variance de s.Y pour tout s Rr . Le calcul de la moyenne est immdiat. Pour la variance, remarquons dabord que var(s.Y ) = var(At s.X ), puisque la partie s.B est dterministe donc a une variance nulle. Les calculs du thorme prcdent appliqus At s montrent que var(At s.X ) = X At s.At s = AX At s.s
7.2
Reprsentation canonique
Thorme 7.5 (Reprsentation canonique). Soit X un vecteur gaussien de Rn , de vecteur moyen m et de matrice de covariance X . Il existe une matrice A symtrique, positive telle que A At = X . Si Y est un vecteur gaussien de Rn de vecteur moyen nul et de matrice de covariance lidentit alors en loi, on a lgalit suivante : X = AY + m.
L. Decreusefond Contexte public } sans modications Voir page 83 54/83
Cours de probabilits
Dmonstration. Comme X (k, l) = cov(Xk , Xl ) = cov(Xl , Xk ) = X (l, k ), X est une matrice symtrique. Comme X s.s =
k, l
X (k, l)sk sl
la forme bilinaire associe X est positive donc les valeurs propres de X sont positives ou nulles. Il existe une matrice orthogonale O telle que 0 .. . 0 1 O X O = 1 . .. r o (i , i = 1, , r) sont les valeurs propres non nulles de X . La matrice 0 .. . 0 1 O A=O 1 .. . r
= var(s.X ) 0,
satisfait AAt = x . En vertu du thorme 7.4, AY + m est bien un vecteur gaussien de vecteur moyen m et de matrice de covariance X donc a la loi de X . Remarque 13. Le thorme prcdent implique que si X est non inversible, o r < n, X prend ses valeurs dans un sous-espace ane strict (de dimension r strictement infrieure n) de Rn donc sa loi ne peut avoir de densit par rapport la mesure de Lebesgue. En revanche, si X est inversible, le thorme prcdent permet le calcul de la densit de la loi de X . Thorme 7.6. Soit X un vecteur gaussien de Rn , si sa matrice de covariance X est inversible alors dPX (x) = 1 (2 )n det X 1 1 (x m).(x m) dx. exp 2 X
7.3
Gaussiennes et indpendance
Thorme 7.7. Soit X = (Y, Z ) un vecteur gaussien de Rn avec Y RnY et Z RnZ (n = nY + nZ ). Les vecteurs gaussiens Y et Z sont indpendants si et seulement si ils sont non-corrls : cov(Yk , Zl ) = 0, pour tout k {1, , nY }, l {1, , nZ }. YZ (k, l) = cov(Yk , Zl ).
Dmonstration. Notons YZ la matrice de covariance de Y et Z , de taille nY nZ dnie par : Par dnition, la matrice de covariance de X se dcompose . . . Y X = ... ... . . .
YZ
L. Decreusefond
55/83
Cours de probabilits
En dcomposant chaque vecteur s Rn sous la forme s = (sY , sZ ) avec sY RnY et sZ RnZ , on a dune part
n nY n
s.m =
k=1
sk m k =
k=1
sk m k +
k=nY +1
sk mk = sY .mY + sZ .mZ ,
et dautre part X s. s = (Y sY + YZ sZ ).sY + (YZ sZ + Z sZ ).sZ = Y sY .sY + Z sZ .sZ + 2YZ sZ .sY . Par consquent, E eis.X = E ei(sY .Y +sZ .Z ) = exp isY .mY + isZ .mZ 1 . exp (Y sY .sY + Z sZ .sZ + 2YZ sZ .sY ) 2 = E eisY .Y E eisZ .Z exp YZ sZ .sY . Daprs la caractrisation (5.5) de lindpendance, on en dduit que Y et Z sont indpendantes si et seulement si YZ sZ .sY = 0 pour tout sY , sZ . (7.1) Soit (ek , k = 1, , nY ), respectivement (fl , l = 1, , nZ ), la base canonique de RnY , respectivement de RnZ . Comme YZ ek .fl = YZ (k, l), il sensuit que (7.1) est quivalent YZ = 0. Remarque 14. En consquence, les composantes dun vecteur gaussien sont indpendantes si et seulement si la matrice de covariance est diagonale.
7.4
Exercices
Exercice 58. Soit X et Y deux gaussiennes centres rduites indpendantes. Montrer que les v.a. X + Y et sin(X Y ) sont indpendantes.
1 (1 + 1 ). Exercice 59. Soit deux v.a. indpendantes X N (0, 1) et Y de loi dPY = 2
1. Montrer que Z = Y X est une v.a. gaussienne. 2. Montrer que X et Z sont non corrles.
3. Si (X, Z ) tait un vecteur gaussien, quelle serait sa loi ? 4. Calculer la loi de (X, Z ). 5. Est-ce que (X, Z ) est un vecteur gaussien ? 6. Est-ce que X et Z sont indpendantes ? Exercice 60. On rappelle que pour a > 0, b > 0,
1
B (a, b) =
0
ua1 (1 u)b1 du =
(a)(b) . (a + b)
On suppose que X1 , . . . , Xn sont des v.a.r., gaussiennes, indpendantes, de mme loi N (m, 2 ). On pose = 1 X n et
n
X i , 2 =
i=1 n i=1
1 n
n i=1
(Xi m)2
1 S = n
2
)2 . (Xi X
Cours de probabilits
z n/21 .
2. Soit Y1 , . . . , Yn des v.a.r., indpendantes, de mme loi gaussienne N (0, 1). Calculer la loi de
n
Z=
i=1
Yi2 .
. 3. Calculer la loi de X 4. Calculer la loi de (n/ 2 )2 . est indpendante du vecteur Z = (X1 X, . . . , Xn X ) et que X est indpendante de 5. Montrer que X 2 S . 6. Maintenant on veut calculer la loi de (n/ 2 )S 2 . Pour cela, supposer dabord que m = 0 et trouver une matrice orthogonale A telle que Y = AX et que
n
nS =
1
Yi2 Y12 .
0.
Exercice 61. Soit une matrice carre relles n lignes. Montrer quil existe un vecteur gaussien de matrice de covariance si et seulement si s.s 0 pour tout s Rn . On pourra saider de lexercice 33. Exercice 62. Dans la reprsentation canonique des vecteurs gaussiens, montrer que lon peut remplacer la matrice A par une matrice de la forme AO o O est orthogonale sans changer la loi de AY .
N Exercice 63 (Sphere hardening). Soit XN un vecteur gaussien de R , centr, rduit. Soit XN , la norme euclidienne de XN et XN = XN / N . 2 1. Calculer E (XN ) . 2 2. Calculer var[(XN ) ].
3. Montrer que, pour tout > 0, On pourra utiliser lingalit de Bienaym-Tcebycev, Thorme 4.6. Exercice 64 (Polynmes dHermite). Soit X une v.a.r. gaussienne centre, reduite et (t, x) = exp(tx). 1. Trouver g (t) telle que g (t)E [(t, X )] = 1. 2. On pose (t, x) = g (t)(t, x). Montrer que E [ (t, X ) (s, X )] = exp( 2 ts). 3. Montrer que
P(|XN 1| ) 0. N +
(t, x) =
n=0
[n/2]
k=0
xn2k ( 2 )k n t . (n 2k )! 2k k !
57/83
Cours de probabilits
4. On pose
[n/2]
Pn (x) =
k=0
xn2k ( 2 )k . (n 2k )! 2k k !
Chapitre 8
Convergences
On xe dans ce qui suit un espace probabilis (, A, P).
8.1
Dnition 8.1. On dit quune suite (Xn , n 1) de v.a. converge P-presque-srement (ou P-presquepartout) vers une v.a. X lorsquil existe un ensemble A tel que P(Ac ) = 0 et pour tout A, Xn ( ) X ( ). En dautres termes, il sagit de la convergence simple un ensemble de mesure nulle prs. Thorme 8.2 (Loi forte des grands nombres). Soit (Xn , n 1) une suite de v.a. indpendantes, identiquement distribues telles que E [|X1 |] < alors 1 n
n j =1 n+
E [X1 ] , P p.p. Xj
n+
8.2
Limit centre
A. A = A
Pour un intervalle ]a, b[, on a alors A = {a, b}. Pour un pav ouvert de Rk , la frontire au sens topologique correspond la notion intuitive de bord. Remarque 15. Si Y a mme loi que X et si (Xn , n 1) converge en loi vers X alors (Xn , n 1) converge aussi vers Y . La convergence en loi, malgr sa prsentation, nest pas une convergence de variables alatoires mais une convergence des mesures associes aux v.a.. Thorme 8.4. La convergence presque sre implique la convergence en loi mais la rciproque est fausse. Dmonstration. Si (Xn , n 1) converge p.s. vers X alors pour toute fonction continue borne, n+ f (Xn ) f (X ), presque-srement, pour tout n 1, |f (Xn )| f et E [ f ] < , donc toutes les hypothses du thorme de convergence domine sont satisfaites, do E [f (Xn )] E [f (X )] .
59/83
n+
L. Decreusefond
Cours de probabilits
Daprs la premire caractrisation de la convergence en loi, cela signie que (Xn , n 1) converge en loi vers X. Construisons un contre-exemple la rciproque. Soit X une v.a. gaussienne de moyenne nulle. Comme la densit gaussienne est paire, X suit la mme loi que X . Considrons pour tout n 1, la suite Xn = X . Il est clair que Xn converge en loi vers X donc vers X . En revanche, Xn ne converge vers X que sur lensemble (X = X ), cest--dire lensemble (X = 0), qui est de probabilit nulle puisque la loi gaussienne est absolument continue. Dnition 8.5. On dit quune suite (Xn , n 1) de v.a., valeurs dans Rk , converge en loi vers X lorsque lune des proprits quivalentes suivantes est vrie : Pour toute fonction continue borne f de Rk dans R, E [f (Xn )] E [f (X )] , pour tout ensemble ouvert A Rk tel que P(X A) = 0, P(Xn A) P(X A), pour tout t Rk , E eit.X . E eit.Xn
n+ n+ n+
Thorme 8.6. Soit (Xn , n 1) une suite de v.a. indpendantes, identiquement distribues telles que E |X1 |2 < alors n n 1 n+ Xj E [X1 ]) N (0, 1), en loi ( n j =1 o 2 = var(X1 ).
8.3
Exercices
1. Pour z rel positif, on pose
Exercice 65.
(z ) =
0
ex xz1 dx.
Soient 0 < zm < zM , montrer que pour k entier strictement positif, z ]zm , zM [, il existe une constante ck (que lon ne cherchera pas expliciter) telle que | lnk (x)xz1 ex | ck ex pour x 1
2. On admet que lnk (x)xzm 1 est intgrable sur [0, 1]. Montrer que est k fois drivable sur R+ . 3. Pour a, b des rels strictement positifs et k rel positif, montrer que b a (a)
+ 0
xk ln(x)xa1 ebx dx = bk
4. Soit X la variable alatoire dont la densit est donne par f,, (x) = Kx ex 1R+ (x). On ne demande pas de calculer K. Calculer la loi de Y = X .
L. Decreusefond Contexte public } sans modications Voir page 83 60/83
Cours de probabilits
5. Soit (X1 , , Xn ) n v.a.r. indpendantes et de mme loi que X. Quelle est la limite presque sre, note S , du couple n n 1 1 Sn = ln(Xj ), Xj . n j =1 n j =1 6. Quelle est la limite de 1 Sn S . n
Cours de probabilits
Chapitre 9
Figure 9.1 . Borel (1871-1956), M. Frchet (1878-1973), J. Hadamard (1865-1963), P. Lvy (1886-1971). (DR)
L. Decreusefond Contexte public } sans modications Voir page 83 63/83
Cours de probabilits
dites continues . Le vocabulaire de lintgration permet de simplier la prsentation des direntes notions probabilistes. Par ailleurs, ainsi que lillustre le deuxime paradoxe de Bertrand, la modlisation de certains phnomnes mme simples impose de comprendre nement les liens entre thorie et interprtation physique. Enn, la simulation, outil indispensable tellement est grande la complexit des systmes, requiert de construire des variables et des processus alatoires. Tout cela ne peut se faire sans une solide comprhension de la thorie sous-jacente. Lobjectif, ici, nest pas de donner un cours classique de thorie de la mesure[2, 3] mais plutt dnoncer les grands principes et de comprendre leur utilisation.
9.1
Comme le montre lexercice 70, on ne peut pas construire de mesure sur toutes les parties de nimporte quel espace. Il faut donc dnir lensemble des parties mesurables . Pour ce faire, on introduit la notion de tribu. Ensuite seulement, viendra la notion de mesure. Dnition 9.1. Soit un ensemble. Un sous-ensemble A de P () est une tribu lorsque les trois conditions suivantes sont vries : 2. A A = Ac A, 1. A,
Les lments dune tribu sont appels vnements en probabilits ou (ensembles) mesurables en thorie de la mesure. Les exemples suivantes sont dune utilisation constante. La tribu grossire est la tribu constitue des seuls lments et . La tribu la plus ne est la tribu P (). Si A1 et A2 sont deux tribus alors A1 A2 est encore une tribu. Pour C P (), P () est une tribu qui contient C donc lensemble des tribus qui contiennent C est non vide. Par consquent, cet ensemble a un plus petit lment,au sens de lintersection : cest la plus petite tribu qui contient C . On appelle cette tribu la tribu engendre par C , elle est note (C ). Pour un ensemble A de , ({A}) = {A, Ac , , }. Le cas qui nous proccupera est celui de R. La tribu borlienne sur R est la plus petite tribu qui contient les intervalles ouverts de la forme ]a, b[ avec a < b. De mme, sur Rk , la tribu borlienne est la plus petite tribu qui contient les pavs ]a1 , b1 [ . . . ]ak , bk [. On peut alors dnir une mesure sur un espace (, A). Dnition 9.2. Une application de A dans R+ est une mesure lorsquelle satisfait les deux proprits suivantes : () = 0, est une application pour -additive : pour toute famille (Aj , j N ) dlments de A deux deux disjoints,
+
3. Ai A pour tout i N = i Ai A.
( j =1 Aj ) =
(Aj ).
j =1
(9.1)
Une mesure est dite de probabilit lorsque la masse totale, i.e., (), vaut 1. Dans ce cas, on parle de mesure de probabilits et on la note P plutt que . Exemple 9.3. Lexemple le plus simple de mesure est donne par la mesure de Dirac en un point a : a (A) = 1 si a A, a (A) = 0 sinon. Ds que nest pas dnombrable, il est impossible de dcrire une mesure en donnant sa valeur pour tous les ensembles mesurables. Arrive notre secours le thorme de classe monotone qui nous dit, en substance, quune mesure est totalement dtermine par sa valeur sur un ensemble densembles susamment riche.
L. Decreusefond Contexte public } sans modications Voir page 83 64/83
Cours de probabilits
Dnition 9.4. Un ensemble C de parties de est une algbre sil satisfait les proprits suivantes : C, si A et B appartiennent C alors A B et A\(A B ) aussi. En particulier, on montre que R= est une algbre de P (R). Dnition 9.5. Un ensemble M de parties de est une classe monotone si toute limite dcroissante densembles de M est dans M, cest--dire si lon a une suite dcroissante, au sens de linclusion, dlments de M alors leur intersection est dans M. toute limite croissante (i.e., runion densembles inclus les uns dans les autres) dlments de M est dans M. En particulier, pour deux mesures de probabilit P et Q, lexercice 66 montre que S = {A P (R), P(A) = Q(A)} est une classe monotone. On a le rsultat pratique suivant : Thorme 9.6 (classe monotone). Soit C une algbre et M une classe monotone contenant C alors (C ) M. En consquence, on en dduit : Thorme 9.7. Deux mesures qui concident sur R sont gales. Corollaire 9.7.1. Pour identier une mesure sur R, il faut et il sut que lon connaisse P(] , x]) pour tout rel x. Remarque 16. Ce rsultat stend sans changement aux dimensions suprieures : pour identier une probabilit sur Rd , il faut et il sut que lon connaisse P(] , x1 ] . . . ] , xd ]) pour tout d-uple (x1 , , xd ). Un autre thorme fondamental de la thorie de la mesure est le suivant : Thorme 9.8. Il existe une unique mesure sur Rk , note , muni de la tribu des borliens, qui concident avec la mesure de longueur/surface/volume sur les pavs, i.e., telle que (]a1 , b1 [ . . .]ak , bk [) = (b1 a1 ) . . . (bk ak ). Cette mesure sappelle la mesure de Lebesgue.
i=1
Ii , n N , Ii =]ai , bi ]
9.1.1
Mesure produit
Si on dispose de deux espaces mesurs (1 , A1 , ) et (2 , A2 , ), on veut construire une mesure sur le produit cartsien 1 2 . La premire dicult surmonter est la dnition de la tribu sur E F . Les lments de A1 A2 sont les produits cartsiens dun lment de A1 et dun lment de A2 . Comme la runion de deux rectangles nest pas un rectangle, A1 A2 nest pas une tribu, voir gure 9.2. Qu cela ne tienne, on note A1 A2 la plus petite tribu qui contient A1 A2 et le tour est jou ! Il est alors possible de montrer quil existe une unique mesure, note , dite mesure produit de et , sur (1 2 , A1 A2 ) qui soit telle que
L. Decreusefond
(9.2)
Cours de probabilits
A2
A2 B2
B2
B1
A1 B1
A1
9.2
Fonctions mesurables
Les fonctions mesurables sont la thorie de la mesure ce que les fonctions continues sont la topologie. Dnition 9.9. Une fonction f de (1 , A1 ) dans (2 , A2 ) est mesurable lorsque f 1 (C ) A1 pour tout C A2 . Par le thorme de classe monotone, on peut se restreindre prouver cette proprit pour des lments C dune algbre engendrant la tribu A2 . Ce qui signie, que si 2 = R et que A2 est la tribu borlienne, on peut se contenter de le prouver pour les lments de R (voir ci-dessus). Une fonction continue est mesurable. La somme, le produit de deux fonctions mesurables sont mesurables. La composition de deux fonctions mesurables est mesurable. Le suprmum et linmum dune famille de fonctions mesurables sont mesurables : sup fn et inf fn sont mesurables.
n n
Par consquent, les limites infrieures et suprieures dune suite de fonctions sont mesurables. En particulier, si une suite de fonctions converge simplement, ses limites infrieures et suprieures concident donc une limite simple de fonctions mesurables est mesurable. Ce dernier rsultat est trs intressant parce que pour les fonctions continues, on est assur de la continuit dune limite de fonctions continues que si la convergence est uniforme. Dnition 9.10. Une variable alatoire est une fonction mesurable.
9.2.1
Mesure image
Partant dun espace mesur (1 , A1 , ) et dune application mesurable f de (1 , A1 , ) dans (2 , A2 ), il est naturel de se demander comment se transforme la mesure sous leet de f . Par exemple, si 1 est une plaque inhomogne laquelle, on fait subir divers traitement, on peut se demander comment seront rparties les inhomognits de la plaque transforme.
L. Decreusefond Contexte public } sans modications Voir page 83 66/83
Cours de probabilits
Dnition 9.11. Soit (1 , A1 , ) un espace mesur et dune application mesurable f de (1 , A1 , ) dans (2 , A2 ), la mesure image de par f , note f est dnie par : f (A) = (f 1 (A)) pour tout A A2 .
f 1 (A)
Figure 9.3 Principe de construction dune mesure image. Remarque 17 (Vocabulaire). La loi dune v.a. X de dans Rn , note PX , est la mesure image de P par X : PX (A) = P(X 1 (A)) = P(X A) = P( : X ( ) A), pour tout A borlien de Rn . Si on avait respect la notation de la TdM, on devrait avoir not P X au lieu de PX . Remarque 18. Peu importe lespace de dpart, la loi est une mesure sur lespace des valeurs de la v.a. considre. Comme dans tous les cas pratiques que nous tudierons, cet espace est N ou Rn , il faut et il sut que nous sachions travailler avec les mesures sur ces espaces. Remarque 19. Si et sont des lois, cest--dire si est la loi dune v.a. X et la loi dune v.a. Y , ces deux v.a. sont indpendantes si et seulement si P((X, Y ) A B ) = P(X A, Y B ) = P(X A)P(Y B ) = (A) (B ), autrement dit, daprs (9.2), si et seulement si la loi du couple (X, Y ) est la mesure produit des lois de chacune des composantes, voir (5.4).
9.3
Aprs avoir dvelopp toute une thorie, il nest que temps de sinterroger sur lexistence des objets que nous avons dni. Si on peroit bien ce quest une variable en tant que rsultat dune exprience, si on peroit bien ce quest une variable alatoire en tant que fonction dun espace dans un autre, il reste clairer
L. Decreusefond Contexte public } sans modications Voir page 83 67/83
Cours de probabilits
les liens entre ces deux notions et comment on passe dune construction phnomnologique une construction mathmatique la moins abstraite possible. Au del de lintrt intellectuel de cette question, cest tout le principe de la simulation qui est en jeu. Une variable alatoire est au dpart une fonction dun espace valeurs dans un autre espace, gnralement N, R ou Rn ou des sous-ensembles de ceux-ci. Quand on parle de fonction , on pense naturellement son graphe ou tout le moins on suppose connue pour chaque point de lespace de dpart, la valeur de la fonction en ce point. Limportant pour une variable alatoire, ce nest pas tant sa valeur en chaque point que la frquence avec laquelle elle vaut une valeur donne plus ou moins un petit quelque chose, cest--dire sa loi. En ce sens, une variable alatoire est indissociable dune probabilit de rfrence et cest tout autant la variable alatoire qui est construire que sa loi, cest--dire une mesure sur lespace darrive de la dite v.a. ! Notre objectif est donc pour toute loi sur 1 = N, R ou Rn , de construire un ensemble qui jouera le rle de , une fonction de dans 1 de sorte que la frquence avec laquelle cette fonction prendra une valeur donne concide avec la loi donne au dpart. Par construction, on entend ici, construction sur ordinateur. Cela signie que lon suppose au dpart que lon a, notre disposition, une fonction que lon peut invoquer autant de fois que ncessaire et qui retourne une suite de nombres rels pris au hasard entre 0 et 1. Le postulat, trs fort, que nous faisons est donc le suivant : on suppose que lon a construit = [0, 1]N muni de la mesure N et les variables alatoires (Un , n 1) dnies par Ui ( ) = i pour = (n , n 1). Cest--dire que le rsultat 1 , 2 , , n , des appels successifs la fonction rand (ou drand48 ) de lordinateur peut-tre considre comme les suites de valeurs U1 ( ), U2 ( ), o les Un sont des v.a. indpendantes, de loi uniforme sur [0, 1]. Lexercice 31 montre quen considrant la suite (F 1 (Un ), n 1) on obtient une suite de rels qui peuvent passer pour les tirages successifs indpendants dune v.a. de fonction de rpartition F . La construction mme dune mesure produit et son lien avec lindpendance (voir la remarque 19) montrent que pour construire deux v.a. relles indpendantes, il sut de construire chacune sparment et de les mettre en couple. Ainsi, si lon veut simuler un couple de v.a. indpendantes de loi exponentielle de paramtre , on considrera la suite de couples 1 1 ( ln U2n , ln U2n ), n 1 . Pour les cas plus compliqus, il faut recourir des mthodes ad-hoc. Par exemple, lexercice 33 montre que les v.a. X = 2 ln(U1 ) cos(2U2 ) et Y = 2 ln(U1 ) sin(2U2 ) sont indpendantes de loi normale centre, rduite. partir de (U1 , , Un ), on peut donc construire le vecteur gaussien X = (X1 , , Xn ) centr et de matrice de covariance gale lidentit. Pour construire un vecteur gaussien Y de dimension n, de matrice de covariance quelconque Y , on calcule (par la mthode de Cholesky) une matrice A symtrique telle que AAt = Y et le thorme de reprsentation canonique des vecteurs gaussiens 7.5 nous indique que AX est un vecteur gaussien centr de matrice de covariance Y .
9.4
Exercices
Exercice 66 (Monotonie des mesures). Soit une mesure quelconque. Soit (An , n N ) une suite croissante densembles mesurables, montrer que
n+
lim (An ) = ( An ).
n=1
Soit (Bn , n N ) une suite dcroissante densembles mesurables telle que (B1 ) < +, montrer que
n+
lim (Bn ) = ( Bn ).
n=1
Exercice 67. Soit n la suite de mesure sur [0, 1] donne par dn (x) =
L. Decreusefond Contexte public } sans modications Voir page 83 68/83
1 n
n1
j/n .
j =0
Cours de probabilits
Exercice 68 (Ensemble triadique de Cantor). Lobjectif est de construire un ensemble non dnombrable de mesure de Lebesgue nulle. Soit S les lments de {0, 1, 2}N qui ne se terminent pas par une innit de 2. 1. Montrer que tout nombre x de [0, 1[ scrit de manire unique sous la forme
+
x=
n=1
xn 3n o (xn , n 1) S.
On appelle la suite (xn , n 1) le dveloppement triadique de x. 2. On appelle C , lensemble de Cantor, constitu des rels de [0, 1[ qui nont pas de 1 dans leur dvelopgure 9.4). 3. Montrer que la mesure de Lebesgue de C est nulle. 4. Montrer que C est non dnombrable. 5. Montrer que C c est partout dans [0, 1[ : quel que soit > 0, pour tout x [0, 1[, il existe y C c tel que |x y | < . 6. En dduire que lintrieur de C est vide. pement triadique. Montrer que C = En o les En sont des ensembles que lon construira (voir la
n=1
Figure 9.4 Les premires tapes de la construction de lensemble de Cantor. Exercice 69 (Fonction de Cantor). partir de lensemble de Cantor, on va maintenant construire une fonction continue, croissante, nulle en 0, qui vaut 1 en 1 et dont la drive est presque-partout nulle... La fonction f0 est dnie par f0 (x) = x. c La fonction f1 est continue, ane par morceaux, est telle que f1 (0) = 0, f1 (1) = 1 et vaut 1/2 sur E1 donc 3 1 x pour x 2 3 1 1 2 f1 (x) = pour x 2 3 3 1 + 3 (x 2 ) pour x 2 . 2 2 3 3
L. Decreusefond Contexte public } sans modications Voir page 83 69/83
Cours de probabilits
2(N +1)
3(N +1)
Figure 9.5 Vue partielle de deux tapes successives dans la construction de la fonction de Cantor.
c Au rang n, fn est continue, ane par morceaux, gale j 2n sur le j -ime intervalle de En et telle que fn (0) = 0 et fn (1) = 1. 1. Montrer que fn fn+1 2(n+1) . 2. En dduire que la suite (fn , n 1) est de Cauchy dans lensemble des fonctions continues muni de la norme uniforme. Soit f sa limite. 3. Montrer que f est croissante, vaut 0 en 0 et 1 en 1, est drivable et de drive nulle sur C c .
Exercice 70 (Construction dun ensemble non-mesurable). Soit E = [0, 1] muni de la mesure de Lebesgue note . Pour A E \{1} et x R, on pose o [a] est la partie entire de a. 1. Montrer que si A est mesurable alors x (A) lest aussi et (x (A)) = (A). 2. Soit R la relation dquivalence dnie par xRy ssi x y Q. On construit F en choisissant un et un seul reprsentant de chaque classe dquivalence. Montrer que les (r (F ), r [0, 1[Q) forment une partition de [0, 1] et en dduire que F nest pas mesurable. Exercice 71. 1. Montrer 2. Montrer p.p.. 3. Montrer Soit (E, E , ) un espace mesur. que pour f mesurable positive, f d = 0 implique f = 0 p.p.. que pour f mesurable valeurs relles, si pour tout mesurable A, que pour tout f L1 , pour tout > 0, il existe tel que (A) < =
A
x (A) = {t + x [t + x], t A}
f d = 0 alors f = 0
|f | d .
4. En dduire que si la mesure sur Rn est de la forme d(x) = f (x1 , . . . , xn ) dx1 . . . dxn Exercice 72. Montrer quune fonction mesurable de (E, {, E }) dans (R, B (R)) est constante. Caractriser les fonctions mesurables de (E, {, A, Ac , E }) dans (R, B (R)) o A est un sous-ensemble propre de E.
L. Decreusefond Contexte public } sans modications Voir page 83 70/83
Chapitre 10
Intgration
10.1 Principe de construction de lintgrale
Sur un espace mesur, cest--dire un espace muni dune tribu et dune mesure , on peut dnir une notion dintgrale. Dnition 10.1. Soit (, A) un espace mesur et f une fonction mesurable de (, A) dans (R, B (R)). La fonction f est dite tage lorsquelle prend un nombre ni de valeurs, f est alors de la forme
n
f (x) =
i=1
i 1Ai (x)
o (i , i = 1, , n) est une famille de rels et (Ai , i = 1, , n) une famille dlments de A disjoints deux deux. Dnition 10.2. Pour s =
n i=1
s=
i=1
i (Ai ).
Dnition 10.3. Pour f mesurable de dans R+ , sa -intgrale est dnie par f d = sup Lemme 10.4. Si s est tage positive s d = s, 0 s f, s tage s. De plus, si f 0 alors . f d 0. t s
Dmonstration. Le deuxime point est vident. Quant au premier, si t tage est infrieure s alors donc s d = sup t s.
t
s d
s. Il sensuit que
s=
s d.
Le thorme suivant est lun des thormes principaux la fois pour ltablissement de la thorie de lintgration mais aussi pour ces applications pratiques. Thorme 10.5. Soit (fn , n 1) une suite croissante de fonctions qui converge simplement vers f 0. La fonction f est mesurable et f d = lim
n+
fn d.
Lemme 10.6. Toute fonction mesurable f valeurs dans R+ est limite croissante simple de fonctions tages positives.
L. Decreusefond Contexte public } sans modications Voir page 83 71/83
Cours de probabilits
tn ( ) =
k=0
k 1E ( ) + n1I ( ). n n, k
Il est clair que tn ( ) f ( ) et que tn converge simplement vers f . En posant, f1 = t1 , f2 = t1 t2 , fn = fn1 tn , . . . on construit une suite de fonctions qui prennent chacune un nombre ni de valeurs donc sont tages, croissante et qui converge simplement vers f .
Figure 10.1 Une fonction (en clair) et son approximation par une fonction tage. Compte-tenu de ce lemme et du thorme de convergence monotone, on aurait pu dnir lintgrale de f par f d = lim
n+
fn d,
pour une suite (fn , n 1) de fonctions tages tendant vers f en croissant. Il aurait alors fallu montrer que la limite ne dpend pas de la suite approchante, tape que lon vite avec la prsentation choisie ici. Dnition 10.7. Soit (E, E ) un espace mesur et f une fonction mesurable de (E, E ) dans (R, B (R)). On dit que f est intgrable lorsque |f | d < +. Dans ce cas, f d = Exemple 10.8 (Mesure de comptage). Si = (A) = card (A) =
L. Decreusefond Contexte public } sans modications Voir page 83
nA
f + d
nN n ,
f d.
alors 1A (n) = 1A d.
1=
nN
72/83
Cours de probabilits
f (n).
Il faut donc garder lesprit que lintgrale de Lebesgue peut se raliser en ce qui est communment appel une srie. Exemple 10.9 (Mesure de Lebesgue). La mesure de Lebesgue, que nous notons temporairement , est, par dnition, telle que (]a, b[) = b a. Rcrit dans le langage de le TdM, cela revient dire
b
1]a, b[ d = b a =
dx,
a
(10.1)
o f (x) dx reprsente lintgrale de Riemann. Pour les fonctions en escalier, qui sont des cas particuliers de fonctions tages avec des Ai qui sont ncessairement des intervalles, les intgrales de Riemann et Lebesgue concident. Lintgration la Lebesgue permet dintgrer plus de fonctions quavec lintgrale de Riemann : pour tre Riemann intgrable, une fonction (positive) se doit dtre continue sauf en un nombre dnombrable de points. Pour tre Lebesgue intgrable, une fonction positive peut se contenter dtre mesurable. La notion de mesurabilit est nettement moins contraignante que la continuit ainsi que le prouve le thorme suivant : Thorme 10.10 (Thorme de Lusin). Soit f une fonction mesurable, pour tout > 0, il existe une fonction continue f qui concide avec f sauf sur un ensemble de mesure infrieure . Il est par exemple clair que Q est mesurable (en tant que runion dnombrable de singletons, tous mesurables puisque ferms), de mesure de Lebesgue (puisque les singletons sont de mesure nulle) nulle. Par consquent, 1Q est mesurable mais discontinue en tout point irrationnel : soit r Q, il existe une suite (qn , n 1) de rationnels qui converge vers r et
n+
lim 1Q (qn ) = 1
0 = 1Q (r).
Cette fonction est donc Lebesgue intgrable mais pas Riemann intgrable. Dune manire gnrale, chaque fois quune fonction est Riemann intgrable (au sens de la convergence absolue), elle est Lebesgue intgrable et les deux intgrales concident. Cest pour cette raison que lon notera f d = f (x) dx,
mme si maintenant le terme de droite dsigne lintgrale de Lebesgue de f . Plus gnralement, lintrt de lintgrale de Lebesgue se trouve aussi dans la compltude de lespace des fonctions intgrables, voir la section 10.4.
10.2
Proprits et notations
Les proprits lmentaires sont celles que lon peut attendre naturellement dune intgrale : Si f et g sont intgrables alors f + g lest pour tout rel et et (f + g ) d = Si f est mesure positive alors
L. Decreusefond
f d +
g d. f d g d.
f d 0 en particulier si f g ,
73/83
Cours de probabilits
Remarque 20 (Notations). Les notations en thorie de lintgration sont uctuantes parce quaucune nest absolument meilleure quune autre, toutes ont leur intrt (simplicit ou clart) en fonction du contexte. Ainsi la notation f d sapplique tant que lon travaille abstraitement et avec une seule mesure. Il est parfois agrable de garder une trace de la variable muette par rapport laquelle on intgre, on utilisera alors f (x) d(x) pour f d.
Lintgrale de f par rapport f est dnie a priori sur tout lensemble de dpart de f . Si on veut restreindre un ensemble dintgration plus petit A, on intgrera f.1A , on pourra alors tout aussi bien noter f 1A d ou
A
f d.
Lorsque est la mesure de Lebesgue, on prfre souvent remplacer d par dx et lorsque A = [a, b] est un intervalle de R on crira videmment
b
f 1A d =
a
f (x) dx,
puisqu chaque fois que lintgrale de Riemann est dnie, lintgrale de Lebesgue lest aussi et elles concident. Il reste tudier le passage des notations thorie de la mesure (TdM) aux notations probabilistes . En TdM, les fonctions sont mesurables et la variable est x, en probabilit, au lieu de fonction mesurable, on parle de variables alatoires et la variable est note . La mesure lorsquelle est de probabilit, cest--dire lorsque () = 1, devient P. La mesure dun ensemble devient sa probabilit et est note P(A). Lintgrale dune fonction mesurable est, en probabilit, lesprance dune v.a. : X dP = E [X ] .
Thorme 10.11 (Convergence monotone). Soit (fn , n 1) une suite de fonctions (mesurables) positives qui converge en croissant, -p.p. vers f alors
n
lim
fn d =
lim fn d =
f d.
Si la mesure est nie, on peut videmment remplacer lhypothse de positivit par lhypothse que les fn sont infrieurement bornes. Dans le cas o toutes les fonctions ne sont pas positives, il faut une contrainte de domination. Thorme 10.12 (Convergence domine). Soit (fn , n 1) une suite de fonctions (mesurables) qui converge p.p. vers f. Si de plus, il existe g telle que |fn (x)| g (x), pour presque tout x et alors
n
g d < f d.
lim
fn d =
( lim fn ) d =
n
Le thorme de Fubini est celui qui permet de calculer des intgrales multiples en choisissant lordre des intgrations. Son nonc exige en toute rigueur de dnir proprement les notions de mesure et tribu produit, nous renvoyons pour a [3]. Thorme 10.13 (Fubini-Tonnelli). Soit (E F, E F , ) un espace mesur produit et f une fonction de E F dans R+ . On a x f (x, y ) d (y ) est E mesurable, y f (x, y ) d(x) est F mesurable,
L. Decreusefond Contexte public } sans modications Voir page 83 74/83
Cours de probabilits
f (x, y ) d (y )
E F
d(x) =
F E
f (x, y ) d(x)
d (y ).
Dans le cas o nest pas de signe constant, on vrie dabord que lintgrale double de |f | est nie (en utilisant le thorme prcdent pour la calculer) puis on applique le thorme de Fubini proprement dit. Thorme 10.14 (Fubini). Soit (E F, E F , ) un espace mesur produit et f une fonction de E F dans R. Si
E F
alors x y
d(x) =
F E
f (x, y ) d(x)
d (y ).
Thorme 10.15 (Continuit sous le signe somme). Soit I un ouvert de Rn et {f (x, t), t I } une famille de fonctions mesurables telle que pour tout t I , f (., t) soit -intgrable. Sil existe G(x) une fonction mesurable telle que d p.p., |f (x, t)| G(x), pour tout t I, et
G d < , alors lapplication I : R t est continue. Thorme 10.16. Soit I un ouvert de Rn et {f (x, t), t I } une famille de fonctions mesurables telles que pour tout t I , f (., t) soit -intgrable. Si t f (x, t) est drivable sur I , d p.p., sil existe G(x) une fonction mesurable telle que d p.p., | d f (x, t)| G(x), pour tout t I, dt G d < , alors lapplication I R t est drivable sur I et d dt f (x, t) d(x) f (x, t) d(x)
f (x, t) d =
d f (x, t) d(x). dt
Cours de probabilits
10.3
Thorme de Riesz
Une autre prsentation des mesures est souvent utile, notamment en probabilit. Soit Cb (Rd ), lensemble des fonctions numriques, continues sur Rd et bornes. On munit Cb (Rd ) de la norme uniforme : f = sup |f (x)|.
x R d
Daprs ce quon a vu sur lintgrale, pour une probabilit P, il ressort de qui prcde que lapplication : Cb (Rd ) R f f dP satisfait (10.2). En fait, toutes les applications qui satisfont (10.2) sont de ce type.
On dit quune forme linaire de Cb (Rd ) dans R est continue lorsquil existe une constante c, telle que pour tout f Cb (Rd ), |(f )| c f . (10.2)
Thorme 10.17 (Thorme de Riesz). Les mesures de probabilits sur Rd sont en bijection avec les formes linaires continues positives sur Cb (R). Cela signie que pour identier une loi P, il faut et il sut que lon sache calculer fonction continue borne, voir la partie 3.2. f dP pour toute
10.4
10.4.1
Espaces L1 et L2
Rle des ensembles de mesure nulle
Soit (, A, P) un espace probabilis. Soit X une variable alatoire positive de P-intgrale nulle. Pour tout > 0 et A = { : X ( ) > }, 0= X dP
n1 A
X dP P(A ),
donc P(A1/n ) = 0 pour tout n 1. Comme A1/n = A0 , par monotonie, on obtient P(A0 ) = 0. On a donc dmontr le thorme suivant : Thorme 10.18. Soit X v.a. positive, desprance nulle alors X est nulle P-presque partout. Mais une fonction nulle presque partout nest pas une fonction nulle. Par exemple, la fonction indicatrice de Q, lensemble des rationnels, est presque-partout nulle pour la mesure de Lebesgue mais elle est non nulle sur un ensemble dense ! En change, que lapplication X |X | dP ne soit pas une norme est trop embtant pour tre lud. La solution est de dcrter que les fonctions nulles presque partout sont indistinguables en un certain sens, de la fonction nulle. Mathmatiquement, on procde comme suit. Dnition 10.19. Soit X et Y deux variables alatoires, X est en relation dgalit p.s. avec Y lorsque P(X Y ) = 0. On note X RY .
Il est vident que X RX , si X RY alors Y RX , si X RY et Y RZ alors X RZ . Ce qui signie que R est une relation dquivalence. On peut donc considrer les classes dquivalence induites par cette relation. Comme travailler avec des classes dquivalence nest jamais facile, on peut continuer de penser les fonctions mesurables (ou variables alatoires) comme des fonctions ordinaires en prenant garde quelles ne sont dnies qu un ensemble de mesure nulle prs. Ainsi, si f est une fonction mesurable de R dans R, f (0) nest pas bien dni mais f dx lest parfaitement dans le sens o si on modie f sur un ensemble de mesure nulle, f (0) peut changer tandis que lintgrale ne sera pas modie.
L. Decreusefond Contexte public } sans modications Voir page 83 76/83
Cours de probabilits
10.4.2
Fonctions intgrables
En vertu des remarques prcdentes, ce nest pas un espace vectoriel norm puisque la nullit de lintgrale de |X | nentrane la nullit de X que P-p.p.. On introduit alors L1 = L1 /R, cest--dire lensemble des classes dquivalence dans L1 pour la relation dquivalence R. Thorme 10.20. Lespace L1 , muni de la norme X est un espace de Banach. Thorme 10.21. Soit (Xn , n 1) une suite de v.a. qui converge dans L1 vers X . Il existe une sous-suite (Xnk , k 1) qui converge presque-srement vers X : il existe A tel que P(Ac ) = 0 et Xnk ( ) X ( ) pour tout A. Remarque 21. Lorsque lon travaille avec lintgrale de Riemann sur [0, 1], on peut bien entendu considrer lanalogue de lensemble L1 en imposant de plus que f soit continue pour que son intgrale de Riemann existe. Dans ce cas, la nullit de lintgrale implique la nullit de la fonction. Toutefois, L1 nest pas un espace vectoriel complet parce quune limite simple de fonctions continues nest pas forcment continue donc pas ncessairement susamment rgulire pour que son intgrale de Riemann soit dnie. Cest l lun des points cls de lintgrale de Lebesgue. Au del de lespace L1 , il est souvent agrable de considrer lespace des v.a. de carr intgrable parce quil est naturellement quip dun produit scalaire. Thorme 10.22. Lespace des v.a. de carr intgrable, cest--dire L2 = X : R, E |X |2 < + /R muni du produit scalaire Y , X, Y = E X
k L1
|X | dP = E [|X |] ,
(respectivement Y ) est un reprsentant quelconque de la classe X (respectivement Y ), donc de la norme o X X est un espace de Hilbert. Remarque 22. Ce rsultat reste vrai mme si P nest pas de masse totale nie. En particulier, si est la mesure de comptage sur N alors les fonctions mesurables de = N dans R sont les suites et L2 est dans ce cas lensemble des suites de carr sommable :
n=1 L2
|2 = E |X
1/2
|un |2 < .
Remarque 23. Si P est la mesure de Lebesgue sur I R alors L2 est lensemble des fonctions de I dans R telles que
I
|f (x)|2 dx < +.
Cours de probabilits
10.5
Exercices
Exercice 73. Soit (E, E , ) un espace mesurable et T une application de E dans lui-mme. On dit que est invariante par T si
E
f T d =
f d
pour toute fonction f mesurable borne. 1. Montrer que la mesure de Lebesgue sur R est invariante par translation. 2. Soit E = Rn et d(x1 , . . . , xn ) = 1 1 + . . . + x2 exp (x2 n) 2 1 (2 )n/2 dx1 . . . dxn .
Montrer que est invariante par rotation. 3. Soit E = [0, 1] et T (x) = 2x [2x] (T (x) est la partie fractionnaire de x). Montrer que la mesure de Lebesgue restreinte E est invariante. Exercice 74. Montrer que toute mesure de Radon sur R (cest--dire (K ) < + quel que soit le compact K ) invariante par translation est proportionnelle la mesure de Lebesgue. Exercice 75. Soit (E, E , ) un ensemble mesur, (F, F ) un ensemble et une tribu et T une application mesurable de E dans F. On dnit la mesure T (appele mesure image de par T ) par B F , ou de manire quivalente par f d(T ) =
F E
(T )(B ) = (T 1 (B )).
f T d.
pour toute fonction f mesurable borne de F dans R. Soit E = R/Z Z/2Z, muni de la mesure uniforme. 1. Montrer que est invariante par translation. 2. Considrons lapplication T de E dans O2 (R) (le groupe des transformations orthogonales de R2 ) donne par : cos 2 sin 2 T (, ) = (1) sin 2 (1)1 cos 2 Quelle est la mesure de lensemble des symtries (respectivement des rotations dangle infrieur 0 donn) sous T ? 3. Montrer que T est invariante par translation. 4. On considre S lapplication de O2 (R) dans C qui une transformation orthogonale associe la valeur propre de plus grandes parties relle et imaginaire. Dcrire S (T ). Exercice 76. En quoi la fonction dnie sur [0, 1] [0, 1] par (x2 y 2 )/(x2 + y 2 )2 montre-t-elle que les hypothses du thorme de Fubini sont optimales ? Exercice 77. Soit (E, E , P) un espace probabilis et T une application mesurable de E dans lui-mme. On suppose que P est invariante par T, cest--dire que P(T 1 (A)) = P(A) pour tout A E . 1. Montrer que lensemble des mesurables invariants par T, cest--dire qui vrie T 1 (A) = A, est une tribu (note I par la suite).
L. Decreusefond
2. Soit f une fonction mesurable de E dans R. Montrer que si f est invariante par T (cest--dire f T = f ) alors f est mesurable de (E, I ) dans (R, B (R)).
Contexte public } sans modications Voir page 83 78/83
Cours de probabilits
3. Le systme dynamique (E, T, P) est dit ergodique lorsque I {A E , P(A) = 0 ou P(A) = 1}. Montrer que (E, T, P) est ergodique si et seulement si les fonctions invariantes par T sont constantes presque partout. 4. On dit que T est mlangeante si et seulement si pour tout couple f, g dlments de L2 (dP), lim f T n g dP = f dP
E E
n+
g dP.
(10.3)
Montrer que si T est mlangeante alors (E, T ) est ergodique. 5. Montrer que si la condition de mlange (10.3) est vrie pour f, g appartenant un sous-ensemble dense de L2 (dP) alors T est mlangeante. On veut maintenant tudier le systme dynamique donne par lquation dvolution :
a a xa n+1 = T (xn ) o T (x) = 4x(1 x), x0 = a [0, 1].
On veut montrer en particulier que pour presque tout a [0, 1], 1 n+ n lim
n
f (xa j) =
j =0
f (u)(
0
u 1 u)1 du.
f T j (x) =
f dP
E
pour presque tout x. Il nous faut donc trouver une mesure invariante par T et montrer que le systme dynamique ([0, 1], T, ) est ergodique. Pour ce faire on considre un autre systme dynamique : E1 = [0, 1[, T1 x = 2x si 0 x 1/2, T1(x) = 2 2x pour 1/2 x < 1. (o [x] est la partie entire de x) muni de la mesure de Lebesgue sur [0, 1[, note . 1. Montrer que est invariante par T1 . 2. En admettant (ou se souvenant, cf. sries de Fourier) que la famille de fonctions ek (x) = exp(2ikx) pour k Z est une famille dense de L2 (d), montrer que T1 est mlangeante. 3. Soit lapplication de E1 dans [0, 1] dnie par : (x) = sin2 (x/2). 4. Identier la mesure image de par . 5. Montrer que ([0, 1[, T, ) est ergodique et conclure.
Cours de probabilits
Bibliographie
[1] L. Holst. On multiple covering of a circle with random arcs. J. Appl. Probab., 17(1) :284290, 1980. [2] K. Kuttler. Modern analysis. Studies in Advanced Mathematics. CRC Press, Boca Raton, MA, 1998. [3] W. Rudin. Analyse relle et complexe. Masson, Paris, 1980. Translated from the rst English edition by N. Dhombres and F. Homan, Third printing.
Cours de probabilits
Notations
B(p), 19 B(n, p), 19 X , 47 C (c), 22 f , 6 A B , 5 a , 62 E [X ], 36 E (), 21 X , 47 Geom(p), 19 N (m, 2 ), 21 f 1 (A), 6 1A , 5 lim inf, 6 f (x+ ), 6 f (x ), 6 lim sup, 6 P (E ), 5 x+ , 5 x , 5 Po(), 19 x.y , 51 R, 5 R+, 5 FX , 20 At , 51 U (a, b), 21 var(X ), 36
Cours de probabilits
Index alphabtique
changement variables, 23 dirence symtrique, 5 esprance, 36 fonction tage, 69 caractristique, 47 gnratrice, 47 indicatrice, 5 mesurable, 64 rpartition, 20 image inverse, 6 injective, 6 limite infrieure, 6 suprieure, 6 loi, 65 Bernoulli, 19 binomiale, 19 Cauchy, 22 exponentielle, 21 gomtrique, 19 gaussienne, 21, 51 marginale, 23 normale, 21 Poisson, 19 uniforme, 21 v.a. discrte, 19 mesure, 62 Dirac, 62 Lebesgue, 63 probabilit, 62 parties ngatives, 5 positives, 5 Processus Poisson, 31 processus Poisson, 39 surjective, 6 transpose, 51
L. Decreusefond Contexte public } sans modications Voir page 83 83/83