Vous êtes sur la page 1sur 45

Introduction aux Probabilits

Manon Defosseux

30 dcembre 2009

Table des matires


1 Introduction 2 Rappels de thorie des ensembles 2.1 Oprations sur les ensembles . . . . . . . . . . . . . . . . . . . 2.2 Dnombrement . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Dnombrabilit . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Espaces Probabiliss discrets 3.1 Rappels sur les sries convergentes et introduction aux familles sommables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Mesure de probabilit . . . . . . . . . . . . . . . . . . . . . . 3.3 Indpendance et probabilit conditionnelle . . . . . . . . . . . 3.4 Variables alatoires discrtes et leurs lois . . . . . . . . . . . . 3.5 Variables alatoires discrtes relles . . . . . . . . . . . . . . . 3.6 Moments dune variable alatoire relle . . . . . . . . . . . . . 3.7 Lois usuelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.7.1 Cas ni . . . . . . . . . . . . . . . . . . . . . . . . . . 3.7.2 Cas dnombrable. . . . . . . . . . . . . . . . . . . . . 3.8 Couple de variables alatoires . . . . . . . . . . . . . . . . . . 3.9 Suite de variables alatoires . . . . . . . . . . . . . . . . . . . 3.9.1 Exemples . . . . . . . . . . . . . . . . . . . . . . . . . 4 Probabilits sur R 4.1 Espaces Probabiliss et variables alatoires . 4.1.1 tribus . . . . . . . . . . . . . . . . . 4.1.2 Probabilits . . . . . . . . . . . . . . 4.1.3 Evnements indpendants . . . . . . 4.1.4 Probabilits conditionnelles . . . . . 4.1.5 Variables alatoires . . . . . . . . . . 4.2 Variables alatoires relles . . . . . . . . . . 4.3 Variables alatoires densit . . . . . . . . 4.3.1 Esprance, Moments . . . . . . . . . 4.3.2 Ingalits de Markov et de Bienaym 3 5 5 6 7 8 8 10 13 15 17 18 22 22 24 25 28 29 31 31 31 32 33 33 33 34 35 36 39

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tchebitchev

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

5 Suites et sries de Variables alatoires 41 5.1 Convergence en probabilit et loi des grands nombres . . . . . 41 5.2 Convergence en loi et thorme de la limite centrale . . . . . . 42

Chapitre 1

Introduction
La thorie des probabilits dans sa forme actuelle a t dveloppe au cours du vingtime sicle (thorie de la mesure (Borel, Lebesgue), premire preuve moderne du TCL (Paul Levy), axiomatique de Kolmogorov. . .). Le dbut de la thorie des probabilits remonte cependant au XVIIme. Fermat et Pascal en sont les principaux initiateurs. Suivent ensuite aux sicles suivants, Bernoulli, de Moivre, Laplace etc. Le calcul des probabilits est une thorie mathmatique conue pour le modlisation et lanalyse dexpriences alatoires. Par exprience on entend une exprience dont le rsultat ne nous est pas connu lavance mais dont on connat tous les rsultats possibles. On associe cette exprience trois objets : 1. Lensemble de tous les rsultats possibles appel ensemble fondamental ou univers et est not . 2. Un ensemble de parties de appel tribu des vnements. Par exemple, si est lensemble des rsultats possibles dun lancer de d, "le rsultat du lancer est pair" est un vnement. Cest un lment de la tribu des vnements. 3. Une application dnie sur lensemble des vnements valeurs dans [0, 1] appele probabilit. Cette application associe chaque vnement un nombre qui mesure sa probabilit doccurrence. Exemples dunivers : Rsultat dun lancer dune pice de monnaie. = {P ile, f ace}. Rsultat dun lancer de d. = {1, 2, 3, 4, 5, 6}. Nombre de passagers du mtro en un an. = N. 3

Point dimpact dune chette sur une cible = {(x, y) R2 : x2 + y 2 r}.

Chapitre 2

Rappels de thorie des ensembles


Nous rappelons dans ce chapitre quelques notions de thorie des ensembles.

2.1

Oprations sur les ensembles

Un ensemble est intuitivement une collection dlments. Etant donn un ensemble E et un lment a, on crit a E si a appartient E. Il existe un unique ensemble ne contenant aucun lment. Il est not et appel lensemble vide. Si E et F sont deux sous ensembles on dit que F est inclus dans E ou que F est un sous ensemble de E si tout lment de F est un lment de E. On note F E. Si E est un ensemble on note P(E) lensemble des parties de E. On a F E quivalent F P(E). Pour A E, on note Ac ou A et on appelle complmentaire de A dans E lensemble {x E : x A}. / Si I est un ensemble et (Ai )iI une famille de sous ensembles de E on note iI Ai lensemble {x E : i I; x Ai } et iI Ai lensemble {x E : i I, x Ai }. On a iI Ai et iI Ai
c

= iI Ac . i = iI Ac . i

Si A et B sont des sous ensembles de E on dit que A et B sont disjoints si A B = . Pour A un sous ensemble de E on dnit la fonction indicatrice de A note 1A comme la fonction de E dans {0, 1} telle que 1A (x) = 1, si x A, 5 1A (x) = 0, sinon.

2.2

Dnombrement

On dit que E est un ensemble ni si son nombre dlments est ni. On appelle cardinal de E ce nombre. On le note card(E) ou |E|. Cardinal dune union nie Si A1 , . . . , An sont des sous ensembles de E, nis, deux deux disjoints alors |A1 A2 An | = |A1 | + + |An | Cardinal dun produit cartsien Si A1 , . . . , An sont des ensembles nis alors |A1 . . . An | = |A1 | |An | Cardinal de lensemble des applications de A dans B Si A et B sont des ensembles nis, alors |B A | = |B||A| Cardinal de lensemble des injections de A dans B Si A et B sont des ensembles nis, alors lensemble des applications injectives de A dans B n! a pour cardinal 0 si |A| > |B|, et (np)! sinon, avec p = |A| et n = |B|. Cardinal de lensemble des bijections de A dans lui mme Si A est un ensemble ni, alors lensemble des applications bijectives de A dans A (on dit aussi permutations de A) a pour cardinal n! avec n = |A|. Cardinal de lensemble des parties de P(E) Si E est de cardinal n, le cardinal de P(E) est 2n . Nombre de sous ensembles de cardinal p dun ensemble n p lments. n! n p = Cn = p p!(n p)! Exercice Une urne contient N boules noires et M boules blanches. 1. On eectue n tirages sans remise. Quel est le nombre total de tels tirages (ordre compte) ? Combien de tirages donnent x (x n) boules noires ? 2. On eectue n tirages avec remises. Quel est le nombre total de tels tirages ? Combien de tirages donnent x (x n) boules noires ?

2.3

Dnombrabilit

Dnition 1. Un ensemble est dit dnombrable sil est en bijection avec lensemble N des entiers naturels. Exercice Montrer que N, Z, N N, Q sont dnombrables, et que {0, 1}N et R ne le sont pas.

Chapitre 3

Espaces Probabiliss discrets


Dans ce chapitre, on suppose que est ni ou dnombrable. Par exemple = {1, . . . , n}, N, N N, Q. On notera = {i , i I}, I N. Soit I est de cardinal ni ( est en bijection avec un sous ensemble ni de N), soit I est en bijection avec N. Bien des notions abordes dans ce chapitre sont valables dans un cadre beaucoup plus gnral. Nous avons cependant prfr les dvelopper dans le cadre particulier des probabilits sur des espaces au plus dnombrables an de les aborder sans avoir eu introduire un formalisme trop abstrait.

3.1

Rappels sur les sries convergentes et introduction aux familles sommables

Toutes les suites que lon considre sont valeurs relles. A une suite (un )nN , on associe la suite, dite des sommes partielles, (Un )nN dnie par Un = n ui . i=0 Dnition 2. On note (Un )nN .
n un

- appele srie de terme gnral un - la suite

Dnition 3. On dit que la srie de terme gnral un est 1. convergente si la suite (Un )nN converge. On note + un sa limite. n=1 2. absolument convergente si la srie de terme gnral |un | converge. Proposition 3.1.1. Si la srie de terme gnral un est absolument convergente alors elle est convergente. Proposition 3.1.2 (Linarit de la somme pour les sries absolument convergentes). Soient n un et n vn deux sries absolument convergentes, et R. Alors la srie de terme gnral un + vn est absolument convergente, et on a
+ + +

un + vn =
n=1 n=1

un +
n=1

vn

Proposition 3.1.3 (Permutation des termes). On considre une srie absolument convergente de terme gnral un et : N I une bijection. Alors la srie de terme gnral u(n) est absolument convergente et
+ +

un =
n=1 n=1

u(n) .

Si I est un sous ensemble de N, deux cas peuvent se produire. Soit I est de cardinal ni, soit I nest pas ni. On admet que dans ce dernier cas, I est en bijection avec N. Cest dire quil existe une bijection : N I. Dans ce cas, on dit que la famille (xi )iI est sommable si la srie de terme gnral x(n) est absolument convergente. Daprs la proposition 3.1.3, la valeur limite de la srie ne dpend pas de . On note iI xi cette limite (= + x(n) ). Dans le cas o I est ni, on note iI xi la somme nie n=1 des xi , i I. On dira aussi que la famille (xi )iI est sommable. Dnition 4. K N. Une famille (Ik )kK de sous ensembles de I est une partition de I si 1. kK Ik = I 2. Ii Ij = si i = j Proposition 3.1.4 (Sommation par paquets). Soit K N au plus dnombrables. Soit (Ik )kK une partition de I. Soit (un )nI une famille termes positifs. Alors on a lquivalence 1. la famille (un )nI est sommable 2. k K la famille (un )nIk est sommable et la famille (vk )kK , avec vk = iIk ui , est sommable. En cas de sommabilit, on a ui =
iI kK iIk

ui .

Ce thorme nous dit en particulier quon peut sommer par paquets les termes dune srie termes positifs. Contre exemple pour le cas des sries termes non positifs Considrer un = (1)n et Ik = {2k, 2k + 1}, k N. Application aux sries doubles termes positifs La famille (ap,q )(p,q)N2 de rels positifs est sommable si et seulement si 1. Pour tout q N, la srie n an,q est convergente, de somme bq 2. La srie n bn est convergente. En cas de sommabilit, ap,q =
(p,q)N2 pN qN

ap,q =
qN pN

ap,q

Exemple ap,q =

1 , p2

p, q 2. On a 1 1 1 = 2 1/p2 q p p 1 1/p
1 1 p2 11/p

q2

La srie de terme gnral 1/p2 est convergente donc, la srie de terme converge et 1 1 = =1 q p p(1 p) p
q,p2

En sommant dabord sur p cest inextricable... Proposition 3.1.5 (Sommation par paquets). Soit (xi )iI une famille sommable et (Ik )kK une partition de I. Alors 1. pour tout k K la famille (xi )iIk est sommable. On note yk sa limite. 2. la famille (yk )kK est sommable. 3. On a la relation dassociativit xi =
iI kK

yk =
kK iIk

xi

Ce thorme nous dit en particulier quon peut sommer par paquet les termes dune srie absolument convergente. Application aux sries doubles absolument convergentes Si la famille de rels (ap,q )(p,q)N2 est sommable alors 1. Pour tout q N, la srie n an,q est convergente, de somme bq 2. La srie n bn est convergente. On a lidentit ap,q =
(p,q)N2 pN qN

ap,q =
qN pN

ap,q

3.2

Mesure de probabilit

Soit = {i , i I} o I N. Dnition 5. Une probabilit P sur est une application de P() dans [0, 1] telle que 1. P() = 1 2. Si (An )nN est une suite dlments de P() deux deux disjoints alors P(nN An ) =
nN

P(An )

Cette dernire proprit sappelle la proprit dadditivit dnombrable ou -additivit. 10

Dans la terminologie probabiliste, un lment de P() est appel un vnement, un lment est appel une ventualit. On dit que ralise lvnement A P() si A. On dit que deux vnements sont incompatibles sils sont disjoints. Proposition 3.2.1. 1) Si A est un vnement alors P(A) = 1 P(Ac ) 2) P() = 0 3) Si A et B sont deux vnements tels que A B alors P(A) P(B). 4) Si A et B sont deux vnements alors P(A B) = P(A) + P(B) P(A B) Dmonstration. 1) Il sut de remarquer que = A Ac . On a alors 1 = P(A Ac ) = P(A) + P(Ac ). 2) Provient du 1) et de lidentit P() = 1 et c = . 3) On a B = A (B Ac ). Donc P(B) = P(A) + P(B Ac ) P(A) 4) On a A B = A (B Ac ). Donc P(A B) = P(A) + P(B Ac ). De plus B = (B A) (B Ac ). Donc P(B) = P(B A) + P(B Ac ). Do le rsultat. 2 Proposition 3.2.2. Soit P une probabilit sur = {i , i I}. On pose pi = P({i }), i I. Alors 1. pour tout i I, pi [0, 1], et 0 pi 1 2.
iI

pi = 1

3. Pour toute partie A on a P(A) =


i:i A

pi .

Dmonstration. Le 1er point provient du fait que P est une application valeurs dans [0, 1]. Pour le second point il sut de remarquer que iI {i } = , que les vnements {i } sont deux deux disjoints et dutiliser la proprit de -additivit. Le 3ieme point sobtient de la mme faon en remarquant que A = i:i A {i } et que lensemble {i : i A} est au plus dnombrable (ni ou dnombrable). 2 Rciproquement la proposition suivante permet de dnir une probabilit partir dune famille de rels (pi )iI . Proposition 3.2.3. Soit (pi )iI une famille de rels positifs ou nuls tels que iI pi = 1. Alors lapplication Q dnie sur P() par Q(A) =
i:i A

pi

est une probabilit. 11

Dmonstration. On a Q() = i:i pi = iI pi = 1. Soit (An )nN est une suite dlments de P() deux deux disjoints. Posons A = nN An . Alors les An forment une partition de A. On a donc daprs la proprit de sommation par paquet Q(A) =
i:i A

pi pi
nN i:i An

= =
nN

Q(An ),

ce qui est la proprit de -additivit. 2 Exemples 1) Mesure de probabilit uniforme. Soit = {1 , . . . , n }. On 1 dnit la probabilit uniforme sur par pi = n , i = 1 . . . n. Par exemple, pour le lancer dun d six faces = {1, . . . , 6} et la probabilit P correspondant un d equilibr est alors donne par pi = 1/6, i = 1, . . . , 6. On a donc, P("le rsultat est pair") = P({2, 4, 6}) = p2 + p4 + p6 = 1/2. 2) Si = N N, on peut par exemple dnir une probabilit sur en posant 1 pm,n = mn 1m,n2 . Proposition 3.2.4. Soit P la probabilit uniforme sur un ensemble ni. Elle vrie pour tout A P(A) = |A| . ||

Dmonstration. On a A = i:i A {i } et P(A) =


i:i A

P({i }) =
i:i A

1 |A| = || ||

Cette proposition montre limportance de la combinatoire pour ltude des probabilits uniformes. Exemples 1) On considre n tirages sans remise parmi N boules noires et M boules blanches. Soit lensemble des n tirages possibles (n-uplets). On a vu quil y avait (N + M ) . . . (N + M n + 1) faons de faire ces n x tirages. Donc || = (N + M ) . . . (N + M n + 1). Il y a Cn N . . . (N x + 1)M . . . (M (n x) + 1) tirages possibles avec x boules noires. On munit de la probabilit uniforme car tous les tirages sont quiprobables (toutes 12

les boules ont la mme chance dtre tires). Donc la probabilit dobtenir x boules noires est
x Cn nx x CN x!CM (n x)! C x C nx = Nn M . n CN +M n! CM +N

2) On considre n tirages avec remise parmi N boules noires et M boules blanches. Soit lensemble des n tirages possibles. On a vu quil y avait (N + x M )n faons de faire ces n tirages. Donc || = (N + M )n . Il y a Cn N x M nx tirages possibles avec x boules noires. On munit de la probabilit uniforme car tous les tirages sont quiprobables. Donc la probabilit dobtenir x boules noires est
x Cn

N x M nx x = Cn px (1 p)nx , o p = N/(N + M ). (M + N )n

3.3

Indpendance et probabilit conditionnelle

Dnition 6. On dit que deux vnements A, B P() sont indpendants si P(A B) = P(A)P(B). On dit que les vnements Ai , i J, J N sont 1. deux deux indpendants si pour tout couple (i, j) J 2 , tel que i = j, Ai et Aj sont indpendants. 2. mutuellement indpendants si pour tout k-uplet (i1 , . . . , ik ) J k tel que i1 < < ik on a P(Ai1 Aik ) = P(Ai1 ) . . . P(Aik ) Exemple : Pour n tirages sans remise, les vnements "le k ieme tirage est une boule blanche", k = 1, . . . , n ne sont pas indpendants alors quils sont mutuellement indpendants si les tirages sont eectus avec remise. Remarque : La mutuelle indpendance implique videmment lindpendance deux deux. La rciproque est fausse. En labsence dindication, indpendants signie mutuellement indpendants. Dnition 7. Soit B P() tel que P(B) = 0. On dnit P(.|B) la probabilit conditionnellement B par P(A|B) = P(A B) , P(B) A P().

On dit que P(A|B) est la probabilit de lvnement A sachant B. 13

Proposition 3.3.1. Soit B tel que P(B) > 0. Alors lapplication P(.|B) est une probabilit sur . Dmonstration. On a P(|B) = P(B) = P(B) = 1. De plus, si (An )nN est P(B) P(B) une famille dvnements deux deux disjoints alors P(nN An |B) = P((nN An ) B) P(B) P(nN (An B)) = P(B) =
nN

P(An B)/P(B) =
nN

P(An |B).

2 Exercice : Je sais que mon voisin a deux enfants dont une lle. Quelle est la probabilit que lautre soit un garon ? Dnition 8 (Systeme complet dvnements). On dit que les vnements Bn , n K N, forme un systme complet dvnements sils sont deux deux disjoints, et si P(UnK Bn ) = 1. Proposition 3.3.2 (Formule des probabilits totales.). Soit (Bn )nK , K N, une famille dlments de P() formant un systme complet dvnements, tels que P(Bn ) = 0, n K, et A P(). On a la formule suivante dite des probabilits totales P(A) =
nK

P(A|Bn )P (Bn ).

Dmonstration. P(A) = P(A nK Bn ) + P(A (nK Bn )c ) Or A (nK Bn )c (nK Bn )c . Donc P(A (nK Bn )c ) = 0 et P(A) = P(nK A Bn ) =
nK

P(A Bn ) car les vnements sont disjoints P(A|Bn )P(Bn ) 2


nK

On en dduit la formule suivante.

14

Proposition 3.3.3 (Formule de Bayes). P(Bk |A) = Dmonstration. P(Bk |A) = P(Bk A) P(Bk ) P(Bk A) = P(A) P(Bk ) P(A) P(A|Bk )P(Bk ) = 2 P(A) P(A|Bk )P(Bk ) . nK P(A|Bn )P (Bn )

Exemple : Un tudiant rpond une question. Il a choisir parmi m rponses possibles (dont une seule est correcte). Soit p la probabilit que ltudiant connaisse la bonne rponse. Quelle est la probabilit quil connaisse la bonne rponse sachant quil a rpondu correctement. Notons A lvnement "il connat la bonne rponse", B lvnement "il a rpondu correctement". On cherche P(A|B). Cette quantit est gale P(B|A) cest dire P(A) P(B|A)P(A) + P(B|Ac )P(Ac ) p . p + 1/m(1 p)

On remarque que sil ny a quune rponse propose (m = 1), P(B|A) = P(B), cest--dire que le choix de ltudiant ne nous renseigne en rien sur ses connaissances...

3.4

Variables alatoires discrtes et leurs lois

Une variable alatoire est une application X sur , valeurs dans un certain ensemble E. Le plus souvent E = N, Z, R ou Nd , Zd , Rd . On note PX lapplication de P() dans [0, 1] dnie par PX (E ) = P({ : X() E }), Proposition 3.4.1. PX est une probabilit sur E. Dmonstration. On a PX (E) = P({ : X() E}) = P() = 1. De plus, si (An )nN est une famille dvnements deux deux disjoints de E E P(E).

15

alors PX (n An ) =P({ : X() n An }) = P(UnN { : X() An })


+

=
n=1 +

P({ : X() An }) car les vnements sont disjoints PX (An ) 2


n=1

Remarque 3.4.2. Nous navons pour linstant dni une probabilit que sur un espace dnombrable. Or nous avons dit que E peut tre gal R. Pour rester dans le cadre dnombrable de notre dnition il faudrait dire une probabilit sur Im(X) = {X(), } qui est un sous ensemble dnombrable de E. Nous parlerons cependant de probabilit sur E. Elle est dtermine par la probabilit des singletons de Im(X). Dnition 9. La probabilit PX est appele la loi de la variable alatoire X, ou encore sa distribution. Pour E E, x R, on note souvent P(X E ) au lieu de P({ : X() E }), P(X x) au lieu de P({ : X() x}), P(X = x) au lieu de P({ : X() = x}) etc. La loi de X est caractrise par les quantits P(X = x), x Im(X). Remarque 3.4.3. Etant donn une probabilt sur un ensemble dnombrable E, on peut toujours construire une variable alatoire dont la loi est cette probabilit. Il sut de considrer la fonction identit sur = E muni de la probabilt P = . Dans ce cas PX = . Remarque 3.4.4. Il est important de remarquer quune variable alatoire est la donne non seulement dune fonction de dans E mais aussi dune probabilit sur . Lorsquon parle de la loi dune variable alatoire, elle dpend non seulement de la fonction, mais aussi de la probabilit dont est muni. Par exemple si on considre le rsultat dun lancer de d, lunivers est = {1, . . . , 6}. On considre la fonction X : {0, 1} qui a un lancer associe 0 si le rsultat nest pas un 6, et 1 sinon. Si le d est quilibr, cest dire si est muni de la probabilit uniforme alors la loi de X est donne par PX ({0}) = 5/6 = 1 PX ({1}). Si le d est truqu et tombe toujours sur 6, alors est muni de la probabilit dnie par P({i}) = 1{i} (6) et la loi de la variable alatoire X est donne par PX ({0}) = 0 = 1 PX ({1}). Exemples 1. On considre lexprience qui consiste lancer une pice quilibre n fois. Lunivers est = {P, F }n . La fonction X de dans N qui associe n lancers le nombre de fois o la pice est tombe sur pile,

16

est une variable alatoire. La pice tant quilibre, on munit de la probabilit uniforme P. La loi de X est alors donne par P(X = k) = nombre de tirage avec k piles k 1 = Cn n , nombre total de tirages possibles 2 k {0, . . . , n}.

2. Une urne contient n boules numrotes de 1 n. On tire successivement m boules de lurne avec remise. Ici = {1, . . . , n}m et est muni de la probabilit uniforme. On appelle X la plus grande valeur inscrite sur les boules ainsi tires. La loi de X est donne par P(X = k) = P(X k) P(X k 1) k m k1 m = , k {1, . . . , n} n n

3.5

Variables alatoires discrtes relles

On suppose dsormais que E = R. Dnition 10. On appelle fonction de rpartition de X la fonction FX : R [0, 1] dnie par FX (x) = PX (] , x]) = P(X x), Proposition 3.5.1. 1. La fonction FX est croissante et
x

x R.

lim FX (x) = 0

et

x+

lim FX (x) = 1

2. La fonction FX est continue droite et constante par morceaux. Dmonstration. Si x y, alors ] , x] ] , y]. Donc { : X() ] , x]} { : X() ] , y]} puis P({ : X() ] , x]}) P({ : X() ] , y]}). Cest--dire FX (x) FX (y), ce qui montre la croissance de FX . n=[x]+1 Pour x R, FX (x) FX ([x] + 1). Donc FX (x) PX (n= ]n, n + [x]+1 1]) = n= PX (]n, n + 1]), qui est le reste dune srie convergente, donc qui converge vers zro quand x tend vers . n=[x] Pour x R, FX (x) FX ([x]). Donc FX (x) PX (n= ]n, n + 1]) = [x] + n= PX (]n, n+1]), qui converge vers n= PX (]n, n+1]) = PX (nZ ]n, n+ 1]) = PX (E) = 1. 17

Notons {xi , i J} lensemble des valeurs possibles de X. On peut toujours supposer que xi < xi+1 . Alors FX est constante sur [xi , xi+1 [, ce qui montre le deuxime point. 2 La fonction de rpartition dune variable alatoire X caractrise sa loi. Cest dire que deux variables alatoires relles ayant la mme fonction de rpartition ont mme loi. En eet, si on note {xi , i J} lensemble des valeurs possibles de X, avec xi < xi+1 , on a P(X = xi ) = PX ({xi }) = FX (xi ) FX (xi1 ). On a par ailleurs le thorme dexistence suivant. Proposition 3.5.2. Soit F , une fonction vriant les points 1 et 2 de la proposition prcdente. Alors il existe une variable alatoire X telle que F = FX . Dmonstration. La fonction F tant constante par morceaux, lensemble des points de discontinuit de F est dnombrable. On le note = {xi , i I}, avec xi < xi+1 , I N. On pose ({xi }) = F (xi ) F (xi1 ), i I. Alors le premier point montre que la mesure dnit une mesure de probabilit sur . La variable alatoire X : x x a pour loi et pour fonction de rpartition F . 2 Exemple Une urne contient n boules numrotes de 1 n. On tire successivement m boules de lurne avec remise. Ici = {1, . . . , n}m et est muni de la probabilit uniforme. On appelle X la plus grande valeur inscrite sur les boules ainsi tires. La fonction de rpartition de X est donne par FX (k) = P(X k) = k n
m

k {1, . . . , n}

3.6

Moments dune variable alatoire relle

Soit X une variable alatoire de (, P) dans E = R. On note = {i , i I}, I N. Dnition 11. Si la famille (X(i )P({i }))iI est sommable, on dit que X admet un moment dordre 1 et on pose E(X) =
iI

X(i )P({i }).

On crit aussi E(|X|) < + pour indiquer que X admet un moment dordre 1. On appelle E(X) lesprance ou la moyenne de X. Plus gnralement, pour tout rel k 1, on dit que X admet un moment dordre k, si X k admet un moment dordre 1.

18

Proposition 3.6.1. On note Im(X) = {xk , k K}, K N lensemble des valeurs possibles de X. Si X admet un moment dordre 1 alors E(X) =
kK

xk P(X = xk ).

Dmonstration. Remarquons que K est ni ou dnombrable. Posons k = { : X() = xk }, k K. La famille {k , k K} est une partition de . On obtient en appliquant la formule de sommation par paquets : X(i )P(i ) =
iI kK i:i k

X({i })P(i ) xk P({i })


kK i:i k

= =
kK

xk
i:i k

P({i })

=
kK

xk P(X = xk )

2 On remarque que la famille (X(i ))iI est sommable si et seulement si et seulement si la famille xk P(X = xk ) kK lest. Dans la pratique cest ce dernier point quon vrie pour montrer quune variable alatoire admet un moment dordre 1. Proposition 3.6.2. Pour A R, on a P(X A) = E(1A (X)). Dmonstration. 1A (X) est une variable alatoire valeur dans {0, 1}. On a E(1A (X)) = 1.P(1A (X) = 1) + 0.P(1A (X = 0)) = P(X A). 2 Proposition 3.6.3. Si X et Y sont deux variables alatoires sur qui admettent toutes les deux un moment dordre 1, alors pour tout R, cest aussi le cas de la variable X + Y et on a E(X + Y ) = E(X) + E(Y ) Dmonstration. Cest une consquence immdiate de la linarit de la somme pour les sries absolument convergente. 2 Proposition 3.6.4. Si Y admet un moment dordre 1 et |X()| |Y ()|, alors X admet un moment dordre 1 et E(|X|) E(|Y |). Si X et Y admettent un moment dordre 1 et X() Y (), alors E(X) E(Y ). 19

Dmonstration. On utilise |X()|P({}) |Y ()|P({}). Ainsi la famille (X(i )P(i ))iI tant domine par une famille sommable, elle est elle mme sommable. Le fait que le passage la limite conserve les ingalits montre le deuxime point. 2 Proposition 3.6.5. Si X admet un moment dordre k N , alors X admet un moment dordre k 1. Dmonstration. On a |X|k1 |X|k + 1 et |X|k + 1 admet un moment dordre 1, ce qui permet de conclure. 2 Proposition 3.6.6 (ingalit de Cauchy Schwartz). Si X et Y sont deux variables alatoires sur qui admettent toutes les deux un moment dordre 1, alors XY admet un moment dordre 1 et |E(XY )| E(X 2 ) E(Y 2 ).

Dmonstration. Le fait que (|X||Y |)2 0 implique |XY | 1 (|X|2 +|Y |2 ), 2 ce qui donne le premier point. On a par ailleurs, pour R, E((X + Y )2 ) = 2 E(X 2 ) + 2E(XY ) + E(Y 2 ) Posons P () = 2 E(X 2 ) + 2E(XY ) + E(Y 2 ). P () est un polynme en dont le discriminant vaut 4E(XY ) 4E(X 2 )E(X 2 ). Ce polynme ne changeant pas de signe su R, 4E(XY )2 4E(X 2 )E(X 2 ) 0, ce qui donne le rsultat. 2 On en dduit la proposition suivante. Proposition 3.6.7. Si X et Y sont deux variables alatoires sur qui admettent toutes les deux un moment dordre 2, alors pour tout , R, cest aussi le cas de la variable X + Y . Dnition 12. Soit X admettant un moment dordre 2. Alors X admet un moment dordre 1, et on pose V(X) = E (X E(X))2 . Cette quantit sappelle la variance de X. On appelle = type de X. V(X), lcart-

Dnition 13. Soit X et Y admettant un moment dordre 2. On pose Cov(X, Y ) = E (X E(X))(Y E(Y )) . Cette quantit sappelle la covariance de X et de Y . Proposition 3.6.8. On a lidentit V(X) = E(X 2 ) E(X)2 . 20

Dmonstration. On a V(X) = E (X E(X))2 = E X 2 2XE(X) + E(X)2 = E(X 2 ) E(X)2 Proposition 3.6.9. Soit X et Y admettant un moment dordre 2. On a Cov(X, Y ) = E(XY ) E(X)E(Y ). Dmonstration. idem prec. Proposition 3.6.10. Soit X et Y deux variables alatoires relles sur admettant des moments dordre 2 et , R. On a alors les identits 1. V (X + ) = 2 V(X) 2. V(X + Y ) = V(X) + V(Y ) + 2cov(X, Y ) 3. cov(X + , Y ) = cov(X, Y ) Lingalit suivante est une variation sur lingalit de Cauchy-Schwartz donne prcdemment. Proposition 3.6.11. Soit X et Y deux variables alatoires sur , valeurs relles, et admettant des moments dordre 2. On a alors lingalit suivant |cov(X, Y )| V(X)V(Y ).

Dmonstration. Il sut dappliquer lingalit de Cauchy-Schwartz X E(X) et Y E(Y ). 2 Proposition 3.6.12 (Formule de transfert). Soit X : E, une variable alatoire sur et une fonction f : E R. On note {xk , k K} lensemble des valeurs possibles de X. Alors E f (X) =
kK

f (xk )P(X = xk ).

Dmonstration. On pose k = { : X() = xk }. On a en sommant par paquets f (X)(i )P(i ) =


iI kK i:i k

f (X(i ))P(i ) f (xk )P(i )


kK i:i k

= =
kK

f (xk )
i:i k

P(i )

=
kK

f (xk )P(X = xk )

2 21

Proposition 3.6.13 (Ingalit de Markov). Soit X : R une variable alatoire relle admettant un moment dordre 1. Alors pour tout a > 0, P(|X| a) E(|X|) a

Dmonstration. On utilise lingalit a1|X|a |X| Proposition 3.6.14. Soit X : (, F, P) R une variable alatoire relle admettant un moment dordre k N. Alors pour tout a > 0, P(|X| > a) E(|X|k ) ak

Dmonstration. On utilise lingalit ak 1|X|a |X|k Proposition 3.6.15 (Ingalit de Bienaym Tchebitchev). Soit X : (, F, P) R une variable alatoire relle admettant un moment dordre 2. Alors pour tout a > 0, V(X) P(|X E(X)| > a) a2

3.7
3.7.1

Lois usuelles
Cas ni

Loi de Bernoulli On dit que X a une loi de Bernoulli de paramtre p [0, 1] si P(X = 1) = 1 P(X = 0) = p. Exemple : On lance une pice de monnaie qui tombe sur face avec une probabilit p, sur pile avec une probabilit 1 p. Lunivers = {P ile, F ace}, X(F ace) = 1, X(pile) = 0. Proposition 3.7.1. E(X) = p, V(X) = p(1 p). Loi binomiale On dit que X a une loi binomiale de paramtre (n, p) n N , p [0, 1] si
k P(X = k) = Cn pk (1 p)nk ,

k {1, . . . , n},

= 0 sinon.

Exemple : On lance n fois (les lancers tant indpendants) une pice de monnaie qui tombe sur face avec une probabilit p, sur pile avec une probabilit 1 p. Lunivers = {P ile, F ace}n , X = nombre de fois que la pice tombe sur face. Alors X a une loi binomiale de paramtre (n, p).

22

Proposition 3.7.2 (Formule du binme de Newton). Soit a, b R, n N. Alors


n

(a + b)n =
k=0

k Cn ak bnk

Dmonstration. La proprit est vraie au rang 1. Supposons la vraie au rang k k1 k n. Rappelons que Cn+1 = Cn + Cn . On a (a + b)n+1 = (a + b)n (a + b)
n n k Cn ak+1 bnk + k=0 n k=0 n k Cn ak+1 bn+1(k+1) + k=0 n+1 k=0 n k1 Cn ak bn+1k + k=1 n+1 k=0 k Cn ak bn+1k k Cn ak bn+1k k Cn ak bn+1k

= =

=
k=0

k k1 (Cn + Cn )ak bn+1k

2 Proposition 3.7.3. E(X) = np, V(X) = np(1 p). Dmonstration. E(X) =


k=0 k Posons f (x) = R. On a f (x) = n Cn xk (1 p)nk . Donc k=0 k f (x) = n(x + 1 p)n1 et f (x) = n Cn kxk1 (1 p)nk . Donc pour k=0 n k kpk (1 p)nk = np. x = p on obtient k=0 Cn n k kCn pk (1 p)nk .

(x + 1 p)n , x

V(X) = E(X 2 ) E(X)2


n n k k 2 Cn pk (1 p)nk ( k=0 n k=0 n k k(k 1)Cn pk (1 p)nk + k=0 k=0 k kCn pk (1 p)nk ( k=0 n k k 2 Cn pk (1 p)nk ) k k 2 Cn pk (1 p)nk )

= = .

k De plus f (x) = n(n1)(x+1p)n2 = n Cn k(k1)xk2 (1p)nk . k=0 2 +npn2 p2 = np(1p). Donc en prenant x = p, on obtient V(X) = n(n1)p 2

23

Loi hypergomtrique On dit que X suit une loi hypergomtrique de paramtres n, N, M N si P(X = k) =
nk k CM CN M , n CN

k {1, . . . , n}

= 0, sinon
k avec la convention Cn = 0 si k > n. Exemple : On tire sans remise n boules parmi N dont M sont rouges et N M noires. On considre X = nombre de boule rouges tires.

3.7.2

Cas dnombrable.

Loi gomtrique On dit que X suit une loi gomtrique de paramtre p ]0, 1[ si P(X = k) = p(1 p)k1 , k N

(Variante : P(X = k) = p(1 p)k , k N) Exemple : On lance la pice de monnaie jusqu ce quon tombe sur face.
1 Proposition 3.7.4. E(X) = p , V(X) = 1p p2

Dmonstration.

n k=0 pk(1

p)k1 = pfn (1 p), o


n

fn (x) =
k=0

xk =

1 xn+1 . 1x

fn (x) =

(n + 1)xn (1 x) + (1 xn+1 ) , (1 x)2

ce qui donne lexistence dun moment dordre 1 et lesprance en faisant tendre n vers +. Pour le calcul de la variance, on crit,
n n n

k 2 P(X = k) = (1 p)
k=1 k=1

k(k 1)p(1 p)k2 +


k=1

kp(1 p)k1

= p(1 p)fn (1 p) + pfn (1 p) et on obtient en faisant tendre n vers +, lexistence dun moment dordre 2 et lidentit 1 1 E(X 2 ) = 2p(1 p) 3 + , p p ce qui donne V(X) = E(X 2 ) E(X)2 = 2p(1 p) 2 24 1 1 1 1p + = . p3 p p2 p2

Loi de Poisson On dit que X suit une loi de Poisson de paramtre R + si P(X = k) = e k , k! kN

A la dirence des lois usuelles vues jusquici la loi de Poisson ne provient daucune exprience "simple". La faon la plus naturelle de la faire apparatre est comme limite du cas binomial. En eet si n p 0 et np , k k Cn pk (1 p)nk e . k! Proposition 3.7.5. E(X) = , V(X) = Dmonstration.
n

k
k=0

k e = k! =

n k=1 n k=0

k1 e (k 1)! k e k!

La srie de terme gnral e est convergente et converge vers 1. On obk! tient lesprance de X en faisant tendre n vers + dans lidentit prcdente. On a
n

k2
k=0

k e = k! 2

k(k 1)
k=0 n k k=0

k e + k!
n

k
k=0

k e k!

k!

e
k=0

k k!

3.8

Couple de variables alatoires

Soit X et Y deux variables alatoires sur valeurs respectivement dans E et F . Le vecteur Z = (X, Y ) est une variable alatoire sur valeurs dans E F . La loi du vecteur (X, Y ) est appele la loi jointe des variables alatoires X et Y . La loi jointe de X et Y est la probabilit PX,Y sur E F dnie par PX,Y (E , F ) = P({ : X() E , Y () F }), E P(E), F P(F ).

Les lois des variables alatoires X et Y sont appeles les lois marginales du vecteur Z. Elles sobtiennent facilement laide le la loi de Z. En eet,

25

en notant {xi , i J} lensemble des valeurs possibles de X et {yi , i K} lensemble des valeurs possibles de Y , on obtient P(X = x) = P(X = x, Y F ) =
iK

P(X = x, Y = yi )

Dnition 14. Soit y F tel que P(Y = y) = 0. La loi conditionnelle de X sachant Y = y est la probabilit PX|Y =y sur E dnie par PX|Y =y ({x}) = P(X = x, Y = y) , P(Y = y) x E.

Remarquons que la loi conditionnelle de X sachant Y = y est la probabilit PX conditionnellement lvnement {Y = y}, quon note aussi P(.|Y = y). Soit X et Y deux variables alatoires sur , valeurs dans E et F . On note {yi , i K}, lensemble des valeurs possibles de Y . La loi de X se dduit de la loi conditionnelle de X sachant Y = yi , pour tout i K, et de la loi de Y . En eet les vnements {Y = yi }, i K, forment un systme complet dvnements. On a donc, en appliquant la formule des probabilits totales : P(X = x) =
iK

P(X = x|Y = yi )P(Y = yi )

De mme, pour x E tel que P(X = x) = 0, y F , on dduit de la formule de Bayes lidentit suivante : P(Y = y|X = x) = P(X = x|Y = y)P(Y = y) iK P(X = x|Y = yi )P(Y = yi )

Dnition 15. Soit X et Y deux variables alatoires sur , valeurs dans E et F . On note {xi , i J}, lensemble des valeurs possibles de X et {yi , i K}, lensemble des valeurs possibles de Y . On dit que X et Y sont indpendantes si pour tout (i, j) J K P(X = xi , Y = yj ) = P(X = xi )P(Y = yj ), ou, de faon quivalente P(X = xi |Y = yj ) = P(X = xi ). Exemples 1. Soit X une variable alatoire de loi de Poisson de paramtre > 0 et Y une variable alatoire de loi de Poisson de paramtre > 0. On suppose que X et Y sont indpendantes. Quelle est la loi de X + Y ? Quelle est la loi de X sachant Y = n ? 26

2. Soit X une variable alatoire de loi binomiale de paramtre n N , p ]0, 1[ et Y une variable alatoire de loi binomiale de paramtre m N , p ]0, 1[. On suppose que X + Y sont indpendantes. Quelle est la loi de X + Y ? Quelle est la loi de X sachant Y = n ? Proposition 3.8.1. Soit X et Y deux variables alatoires sur , valeurs respectivement dans E et F . Les variables alatoires X et Y sont indpendantes si et seulement si pour toute fonction f : E R et g : E R bornes, E f (X)g(Y ) = E f (X) E g(Y ) , Dmonstration. Remarquons tout dabord que f et g tant bornes, les esprances sont bien dnies. La condition est clairement susante. En eet, si lidentit est vrie pour les fonctions bornes, elle lest pour les fonctions 1{xi } et 1{yj } . On a donc E 1{xi } (X)1{yi } (Y ) = E 1{xi } (X) E 1{xj } (Y ) , cest dire P(X = xi , Y = yj ) = P(X = xi )P(Y = yj ). Rciproquement, supposons que X et Y soient indpendantes. Considrons f : E R et g : E R bornes. On a daprs la formule de transfert, E(f (X)g(Y )) =
iJ,jK

f (xi )g(yj )P(X = xi , Y = yj ) f (xi )g(yj )P(X = xi )P(Y = yj )


iJ,jK

= =
iJ jK

f (xi )g(yj )P(X = xi )P(Y = yj ) f (xi )P(X = xi )


iJ jK

g(yj )P(X = xi )P(Y = yj )

= E(f (X))E(g(Y )) 2 Cette proposition se gnralise aux fonctions f et g telles que f (X) et g(Y ) admettent un moment dordre 2. On a alors le corollaire suivant. Corollaire 3.8.2. Si X et Y sont deux variables alatoires relles indpendantes qui admettent toutes les deux un moment dordre deux, alors cov(X, Y ) = 0, et V(X + Y ) = V(X) + V(Y ).

27

Dmonstration. On prend f = IdE , g = IdF dans la proposition prcdente gnralise. 2 Attention, la rciproque de la proposition prcdente est fausse. Considrons par exemple (X, Y ) un couple de variables alatoires de loi uniforme sur {(0, 0), (2, 0), (1, 1)}. On a E(XY ) = 1/3 et E(X)E(Y ) = (2/3 + 1/3)1/3 = 1/3. Pourtant X et Y ne sont pas indpendantes puisque P(X = 1|Y = 1) = 1 et P(X = 1) = 1/3. Construction de deux variables alatoires indpendantes Etant donnes deux probabilits 1 et 2 sur 1 et 2 , on dnit une probabilit sur = 1 2 par P({(1 ; 2 )}) = 1 (1 )2 (n ). Les variables alatoires X1 et X2 de = 1 2 dans 1 et 2 dnies par Xi ((1 ; 2 )) = i , i = 1, 2, sont indpendantes.

3.9

Suite de variables alatoires

On appelle suite (ou famille) de variables alatoires une suite (nie ou innie) de variables alatoires sur : X1 , . . . , Xn , . . . , telle que Xi : Ei . Dnition 16 (Indpendance). On dit que les variables alatoires X1 , . . . , Xn sont indpendantes si
n

P(X1 = x1 , . . . , Xn = xn ) =
i=1

P(Xi = xi )

pour tout x1 E1 , . . . , xn En Dnition 17 (Indpendance). Soit une suite de variables alatoires (Xi )iN On dit que les variables alatoires Xi , i N, sont indpendantes si pour tout n N les variables alatoires X1 , . . . , Xn le sont. Proposition 3.9.1. Soit (Xi )iN , une suite de variables alatoires sur telle que Xi est valeurs dans Ei . Alors les variables alatoires Xi , i N sont indpendantes si et seulement si pour tout n N et toutes fonctions bornes f1 , . . ., fn telles que fi : Ei R, on a lidentit,
n

E f1 (X1 ) . . . fn (Xn ) =
i=1

E fi (Xi ) ,

Dmonstration. identique celle dans le cas des couples de variables alatoires.

28

Proposition 3.9.2. Soit X1 . . . , Xn des variables alatoires sur valeurs dans R. On a lidentit
n

V(
i=1

Xi ) =
1i,jn n

cov(Xi , Xj ) V(Xi ) +
i=1 n i=j

cov(Xi , Xj )

=
i=1

V(Xi ) + 2
1i<jn

cov(Xi , Xj )

Dmonstration.
n n n

V(
i=1

Xi ) = E((
i=1 n

Xi E(
i=1 n

Xi ))2 ) E(Xi ))2 )

= E((
i=1 n

Xi
i=1

= E((
i=1 n

(Xi E(Xi )))2 ) (Xi E(Xi ))(Xj E(Xj ))) E((Xi E(Xi ))(Xj E(Xj )))

= E( =
i,j=1

i,j=1 n

2 Proposition 3.9.3. Soit X1 . . . , Xn des variables alatoires indpendantes sur valeurs dans R. On a lidentit
n n

V(
i=1

Xi ) =
i=1

V(Xi )

Dmonstration. cov(Xi , Xj ) = 0 pour i = j.

3.9.1

Exemples

Loi binomiale Soit X1 , . . . , Xn des variables alatoires ayant une loi de Bernoulli de paramtre p [0, 1]. Alors Sn = X1 + + Xn a une loi Binomiale de paramtres (n, p). Cela donne une faon plus simple de calculer

29

lesprance et la variance dune Binomiale. En eet on a par la linarit de lesprance,


n

E(Sn ) =
i=1

E(Xi ) = np.

Les variables alatoires tant indpendantes, on a


n

V(Sn ) =
i=1

V(Xi ) = np(1 p).

Exercice : Montrer que si X et Y sont deux binomiale indpendantes de paramtres respectifs (n, p) et (m, p) alors X +Y est une binomiale de paramtres (n + m, p). Loi hypergomtrique (voir TD) Loi gomtrique Soit (Xi )iN une suite de variables alatoires indpendantes ayant une loi de Bernoulli de paramtre p ]0, 1[. On pose T = min{i N : Xi = 1}. Alors T suit une loi gomtrique de paramtre p. En eet pour k N , P(T = k) = P(X1 = 0, . . . , Xk1 = 0, Xk = 1) = P(X1 = 0) . . . P(Xk1 = 0)P(Xk = 1) = (1 p)k1 p

30

Chapitre 4

Probabilits sur R
Lorsque est dnombrable, dnir une probabilit sur est quivalent se donner P({}), pour tout , car toute partie de est lunion dnombrable de ces singletons. Cela nest plus vrai pour un ensemble quelconque. En particulier ce nest plus vrai pour lensemble des rels. Comment dans ce cas construire une probabilit sur R ? En fait, la bonne notion, qui a permis de dvelopper la thorie des probabilits pour des ensembles bien plus gnraux que les seuls ensembles dnombrables, est la notion de tribu. Nous ne rentrerons pas ici dans les dtails de toutes les constructions quelle permet mais il est important de noter que cette notion est indispensable si lon veut rpondre rigoureusement certaines questions, concernant notamment lexistence et lunicit de probabilits.

4.1
4.1.1

Espaces Probabiliss et variables alatoires


tribus

Soit un ensemble x. Dnition 18. Soit F P(). On dit que F est une tribu de si 1. F 2. Si A F alors A F 3. Si (An )nN est une suite dlments de F alors nN An F On note (, F) lensemble muni de la tribu F. Proposition 4.1.1. Une intersection quelconque de tribus est une tribu. exemples : tribu triviale {, }, tribu totale P(), tribu borelienne... Il est important dintroduire la tribu borelienne pour pouvoir construire des probabilits sur R. Dnition 19. La tribu borelienne de R est la tribu engendre par les intervalles de R de la forme ] , a], a R. On la note B(R). 31

4.1.2

Probabilits

Dnition 20. Soit un ensemble muni dune tribu F P(). Une probabilit P sur (, F) est une application de F dans [0, 1] telle que 1. P() = 1 2. Si (An )nN est une suite dlments de F deux deux disjoints alors P(nN An ) =
nN

P(An )

On note (, F, P), lespace , muni dune tribu F et dune probabilit P sur (, F). On dit que (, F, P) est un espace probabilis. Proposition 4.1.2. Soit (, F, P) un espace probabilis. 1. Si A F, alors P(A) = 1 P(A) 2. P() = 0 3. Si A, B F, alors P(A B) = P(A) + P(B) P(A B) 4. Si (An )nN est une suite croissante dlments de F (cest dire An An+1 , n N), alors P(An ) = limn P(An ) 5. Si (An )nN est une suite dcroissante dlments de F (cest dire An+1 An , n N), alors P(An ) = limn P(An ) 6. Si (An )nN est une suite dlments de F alors

P(An )
n=1

P(An )

Dmonstration. 4. On pose Bn = An Ac , n 1, B0 = A0 . Les Bn sont n1 disjoints deux deux disjoints donc la proprit de -additivit entrane P(Bn ) = n P(Bn ). Or An1 tant inclus dans An , P(Bn ) = P(An ) P(An1 ), n 1. On obtient le rsultat en remarquant que Bn = An et limn+ P(An ) = n P(Bn ). 5. Passage au complmentaire dans le point 4. 6. On pose Cn = An (An1 A0 )c . Les ensembles Cn sont deux deux disjoints et n An = n Cn . On a donc P(n An ) =
n

P(Cn )
n

P(Cn ).

2 32

4.1.3

Evnements indpendants

Dnition 21. 1. Deux vnements A, B F sont dits indpendants si P(A B) = P(A)P(B). 2. Une famille dvnements (An )nN est une famille dvnements deux deux indpendants si pour tout couple dentiers distincts i, j N, Ai est indpendant de Aj . 3. Une famille dvnements (An )nN est une famille dvnements mutuellement indpendants si pour toute suite nie dentiers i1 , . . . , ik N, telle que i1 < < ik , P(Ai1 Aik ) = P(Ai1 ) . . . P(Aik )

4.1.4

Probabilits conditionnelles

Soit (, F, P) un espace probabilis. Soit B F tel que P(B) = 0. On dit que P(A|B) est la probabilit conditionnelle de lvnement A sachant B si P(A B) P(A|B) = . P(B) Formule de probabilits totales. Soit (Bn )nN une suite dlments de F formant un systme complet dvnements, telle que P(Bn ) = 0, n N, et A F. La formule des probabilits totales est

P(A) =
n=1

P(A|Bn )P (Bn ).

Formule de Bayes P(Bk |A) = P(A|Bk )P(Bk ) . n=1 P(A|Bn )P (Bn )

4.1.5

Variables alatoires

Soit (, F, P) un espace probabilis, et E un espace muni dune tribu E. Dnition 22. Une variable alatoire sur valeurs dans E est une application X : E telle que pour tout E E, X 1 (E ) F. Dnition 23. Soit X une variable alatoire sur valeurs dans E. La loi de X est la probabilit PX sur E dnie par PX (E ) = P(X E ), E E.

On vrie aisment comme dans le cas discret que PX est une probabilit. 33

4.2

Variables alatoires relles

On note B(R) la tribu des borliens, ou tribu borelienne. Cest la plus petite tribu de R contenant les intervalles de la forme ] , a], a R. Dnition 24. On appelle variable alatoire relle, une variable alatoire X : (, F, P) (R, B(R)). Si est dnombrable, on montre aisment quune variable alatoire relle sur (, P(), P) est une variable alatoire relle au sens de la dnition prcdente. Ainsi, cette dnition tend la dnition des variables alatoires relles donne au chapitre prcdent. Pour un espace probabilis quelconque (, F, P) on dira dsormais quune variable alatoire relle X : (, F, P) (R, B(R)), est discrte si lensemble de ses valeurs possibles est au plus dnombrable. Dans ce cas, pour une fonction de cet ensemble dans R telle que la famille ((xk )P(X = xk ))kN est sommable, on dnit lesprance E((X)) par k (xk )P(X = xk ). Cette quantit ne dpendant que de la loi de X, on montre facilement que les proprits de lesprance dmontres au chapitre prcdent sont conserves. Le thorme suivant (admis) montre quil sut pour montrer que X est une variable alatoire, de vrier que X 1 (I) F, pour les intervalles de la forme ] , a], en encore de le montrer pour tout intervalle I de la forme [a, b], a b. Proposition 4.2.1. Si X : R est une application alors les trois propositions suivantes sont quivalentes 1. pour tout borelien A B(R), X 1 (A) F 2. X est une v.a. 3. pour tout intervalle I de la forme ] , a], X 1 (I) F 4. pour tout intervalle I de la forme [a, b], X 1 (I) F De la mme faon, la loi PX dune variable alatoire relle, qui est une application de B(R) dans [0, 1], est en fait caractrise par sa valeur sur les intervalles ] , a] de R. On aboutit ainsi naturellement la notion de fonction de rpartition dont la dnition est donne ci-dessous. Dnition 25. Soit X une variable alatoire relle. On appelle fonction de rpartition de X, la fonction FX : R [0, 1], dnie par FX (x) = P(X x), xR

Proposition 4.2.2. Soit FX la fonction de rpartition dune variable alatoire relle. Alors 1. FX est continue droite 2. FX est croissante 34

3. FX admet une limite gauche 4. limx+ F (x) = 1 5. limx F (x) = 0 Les thormes dexistence et dunicit donns ci-dessous sont admis. Thorme 4.2.3. Soit X et Y deux variables alatoires relles ayant la mme fonction de rpartition. Alors X et Y ont la mme loi. Thorme 4.2.4. Soit F une application de R dans R continue droite, croissante et telle que limx+ F (x) = 1 et limx = 0. Alors il existe une variable alatoire X dont F est la fonction de rpartition. Un exemple fondamental est celui des variables alatoires dites " densit". Leur tude fait lobjet de la prochaine section. Mais avant, montrons une dernire proprit. Proposition 4.2.5. Soit f : R R, une fonction continue par morceaux, et X une variable alatoire relle sur . Alors Y = f (X) est une variable alatoire relle. Dmonstration.

4.3

Variables alatoires densit

On munit R de sa tribu borelienne. On rappelle quune fonction positive continue par morceaux f : R R+ est dite intgrable sur R si la limite de n n f (x) dx existe. On note cette limite f (x) dx. Une fonction continue par morceaux f : R R est dite intgrable si la fonction x R |f (x)| n est intgrable sur R. Dans ce cas la limite de n f (x) dx existe aussi et on la note f (x) dx. Nous donnons ci-dessous une dnition des variables alatoires densit. Dnition 26. On dira quune variable alatoire X : R admet une densit si il existe une fonction continue par morceaux fX , positive intgrable telle que pour tous a < b,
b

PX (]a, b[) = P(X ]a, b[) =


a

fX (x) dx.

(4.1)

Si X est une variable alatoire densit fX alors + 1. fX (x) dx = 1. 2. P(X = x) = 0, x R. 3. Lidentit (4.1) caractrise la loi de X. x 4. FX (x) = PX (] , x]) = fX (x) dx Etant donne une fonction f continue par morceaux, intgrable, dintgrale 1, il existe une variable alaoire X dont la loi vrie (4.1) 35

Exemples Loi uniforme On dit quune variable alatoire X a une loi uniforme sur [a, b] si sa densit est gale fX (x) = 1 1 (x), b a [a,b] x R.

Remarquons que si [c, d] [a, b], P(X [c, d]) = dc . ba

Loi exponentielle de paramtre > 0 On dit quune variable alatoire X suit une loi exponentielle de paramtre > 0, si sa densit est dnie par fX (x) = 1R+ (x)e , x R. Loi normale On dit quune variable alatoire X a une loi normale de moyenne m et dcart type > 0, si X a une densit fX (x) =
1 e 2
(xm)2 2 2

4.3.1

Esprance, Moments

Dnition 27. Soit X : R une variable alatoire densit fX et : R R une fonction continue par morceaux sur R. On suppose que la fonction x (x)fX (x) est intgrable sur R. On note alors
+

E((X)) =

(x)fX (x) dx.

On remarque que comme dans le cas discret on a lidentit P(X ]a, b]) = E(1]a,b] (X)). Par ailleurs, si f est une fonction continue par morceaux de dans R telle que f () est dnombrable, alors Y = f (X) est une variable alatoire discrte. On vrie aisment que la dnition de lesprance de Y donne dans le premier chapitre et celle donne ci-dessus concident. Dnition 28. Soit X : R une variable alatoire densit fX . On dit que X admet un moment dordre k N si la fonction xk fX (x) est intgrable sur R. Dans ce cas lintgrale de cette fonction existe et on a
+

E(X k ) =

xk fX (x) dx.

La quantit E(X k ) sappelle le moment dordre k de X, et lesprance de X lorsque k = 1. 36

Les proprits de lesprance dans le cas des variables densit ou dans le cas des variables discrtes sont similaires. En fait, les esprances quon a dni dans le cas discret et dans le cas densit sont toutes deux un cas particulier dune dnition de lesprance plus gnrale qui fait intervenir des lments dune thorie que lont appelle thorie de la mesure, ou thorie de lintgration (au sens de Lebesgue), et que nous ne verrons pas dans ce cours. Proposition 4.3.1. Si X est une variable alatoire densit, dont la densit est fX , et si il existe a, b R {} tel que a < b et P(X ]a, b[) = 0 alors fX est nulle sur ]a, b[ sauf peut en un nombre dnombrable de points de ]a, b[. Dmonstration. On a
b

P(X ]a, b[) =


a

fX (x) dx.

Donc
a

fX (x) dx = 0. Puisque fX est positive, on a le rsultat. 2 Proposition 4.3.2. Soit X est une variable alatoire densit. 1. Sil existe une constante a positive telle que |X| a alors X admet un moment dordre 1 et E(|X|) a. 2. Si X admet un moment dordre 1 alors X + a admet aussi un moment dordre 1 et E(X + a) = E(X) + a. Dmonstration. Puisque |X| a, on a P(|X| > a) = 0. Donc P(X > a) = 0 et P(X < a) = 0. Or P(X > a) =
a + a

fX (x) dx et P(X < a) =

fX (x) dx.

Notons fX la densit de X. La proposition prcdente montre que lon peut toujours prendre fX nulle sur ]a, +[ et ] , a]. Donc pour tout x R, |x|fX (x) afX (x). La fonction droite du signe gal est intgrable sur R dintgrale a, ce qui montre que la fonction de gauche est intgrable et que |x|fX (x) dx a, 37

et donne le rsultat puisque E(|X|) = 2 Proposition 4.3.3. Soit X une variable alatoire de densit fX et a R. Alors X + a est une variable alatoire densit et sa densit g est dnie par g(x) = fX (x a), x R. De plus si X est intgrable alors X + a lest aussi et on a E(X + a) = E(X) + a. Dmonstration. On a pour x R, P(X + a x) = P(X x a)
xa

|x|fX (x) dx.

=
x

fX (t) dt fX (u a) du,

= ce qui montre le premier point. De plus


n

|t + a|fX (t)dt
n n

|t|fX (t)dt + a,

ce qui montre lintgrabilit. On a par ailleurs,


n n n

(t + a)fX (t)dt =
n n

tfX (t)dt + a
n

fX (t)dt,

ce qui montre lgalit, E(X + a) = E(X) + a. 2 Proposition 4.3.4. Soit X une va admettant un moment dordre 2 alors X admet un moment dordre 1. Dmonstration. On a pour x R, x2 + 1 |x|. On a donc pour x R fX (x)(x2 + 1) |x|fX (x), En intgrant par rapport x on trouve que pour tout n N,
n n n

fX (x)x2 dx +
n n

fX (x) dx
n

|x|fX (x) dx,

38

puis

fX (x)x2 dx + 1
n n

|x|fX (x) dx,

ce qui montre que X admet un moment dordre 1. 2 Dnition 29. Soit X une v.a. admettant un moment dordre 2. On dnit la variance de X par V(X) = E((X E(X))2 ), ou de faon quivalente, V(X) = E(X 2 ) E(X)2 , Proposition 4.3.5. V(X + a) = V(X). Dmonstration. immdiat. 2 exemples 1. Si X a une loi exponentielle de paramtre > 0, alors X admet des 1 moments de tous les ordres (en particulier dordre 1 et 2) et E(X) = 1 et V(X) = 2 . 2. Si X a une loi uniforme sur [a, b], alors X admet des moments de tous 2 les ordres et E(X) = b+a et V(X) = (ba) . 2 12 3. Si X a une loi normale de paramtre m R et R+ , alors X admet des moments de tous les ordres et E(X) = m et V(X) = . 4. Si X a une loi de Cauchy, cest dire dont la densit est la fonction 1 x R 1R+ (x) (1+x2 ) nadmet des moments daucun ordre. La proposition suivante concerne les lois gaussiennes. Proposition 4.3.6. Si X est une gaussienne centre rduite, alors X + m est une gaussienne de variance 2 et de moyenne m. Si FX est la fonction de rpartition de X, alors FX (x) = 1 FX (x).

4.3.2

Ingalits de Markov et de Bienaym Tchebitchev

Markov Proposition 4.3.7. Soit X : (, F, P) R une variable alatoire relle densit admettant un moment dordre 1. Alors pour tout a > 0, P(|X| > a) E(|X|) a

39

Dmonstration. On a pour tout x R, a1|x|a |x|. Donc a cest--dire aE(1|X|a ) E(|X|), ce qui donne le rsultat. 2 Proposition 4.3.8. Soit X : (, F, P) R une variable alatoire relle densit admettant un moment dordre k. Alors pour tout a > 0, P(|X| > a) E(|X|k ) . ak 1|x|a fX (x) dx fX (x)|x| dx,

Dmonstration. mme preuve que la proposition prcdente. 2 Bienaym Tchebitchev Proposition 4.3.9. Soit X : (, F, P) R une variable alatoire relle densit admettant un moment dordre 2. Alors pour tout a > 0, P(|X E(X)| > a) V(X) a2

Dmonstration. On applique lingalit prcdente a la variable alatoire X E(X). 2

40

Chapitre 5

Suites et sries de Variables alatoires


Dans ce chapitre, nous nous intressons la convergence de suites de variables alatoires indpendantes. Nous considrons le cas o ces variables alatoires sont discrtes car nous navons pas vu de notion de loi jointe dans le cas gnrale.

5.1

Convergence en probabilit et loi des grands nombres

Dnition 30. Soit a R. On dit quune suite de variables alatoires (Xn )n1 converge en probabilit vers a si pour tout > 0
n

lim P(|Xn a| > ) = 0

Remarque 5.1.1. En gnral, on dnit la convergence en probabilit dune suite de variables alatoires (Xn )n1 vers une variable alatoire X. Nous ne verrons que des cas o X est une constante. Thorme 5.1.2 (Loi faible des grands nombres). Soit (Xn )nN une suite de variables alatoires indpendantes ayant la mme loi et admettant un moment 1 dordre 2. On pose Sn = n i=1 Xi . Alors Sn converge en probabilit vers E(X1 ). Dmonstration. On a P(|Sn E(X1 )| ) = P(|Sn E(Sn )| ) En utilisant lingalit de Bienaym Tchebitchev on obtient P(|Sn E(X1 )| ) 41 1 V(Sn ). 2

Or les v.a. tant indpendantes on a 1 V(Sn ) = 2 n


n

V(Xi ) =
i=1

1 V(X1 ), n

ce qui montre le thorme, cette dernire quantit convergeant vers 0. Remarque 5.1.3. Le thorme reste vrai si les variables alatoires nadmettent quun moment dordre 1. Remarque 5.1.4. Il existe une loi forte des grands nombres, que nous ne verrons pas ici. Exemple On lance n fois une pice de monnaie. On considre la frquence des piles. Alors cette frquence converge en probabilit vers 1/2 quand n tend vers +.

5.2

Convergence en loi et thorme de la limite centrale

Thorme 5.2.1 (Thorme de de Moivre-Laplace). Soit Sn une variable alatoire de loi binomiale de paramtres (n, p). Alors pour tous rels a < b xs, on a lim P(a Sn np np(1 p)
b

n+

b) =
a

1 t2 exp( ) dt. 2 2

Lapproximation de la probabilit de gauche par lintgrale est dautant meilleure que p est poche de 1/2. Si p = 1/2, il nest pas ncessaire de prendre des grandes valeurs de n pour que lapproximation soit bonne. En revanche, si p est proche de 0 ou de 1, il faut prendre de grandes valeurs de n pour que lintgrale soit une bonne approximation de la probabilit. Lintgrale de gauche est en fait la probabilit P(X [a, b]), lorsque X est une gaussienne centre rduite. Le thorme nous dit donc que
n+

lim P(a

Sn np np(1 p)

b) = P(X [a, b]).

Ce type de convergence est appele convergence en loi. On en donne la dnition ci-dessous. Dnition 31. Soit (Xn )n1 une suite de variables alatoires relles et X une variable alatoire relle. On dit que (Xn )n1 converge en loi vers X si pour tout a < b, on a
n+

lim P(Xn [a, b]) = P(X [a, b]). 42

Exemple : 1. Si (Xn )n1 une suite de variables alatoires indpendantes ayant une loi de Bernoulli de paramtre p. Alors la suite (Yn )n1 dnie par Yn =
n i=1 Xi

np

np(1 p)

converge en loi vers une variable alatoire ayant une loi gaussienne centre rduite. 2. Si (Xn )n1 une suite de variables alatoires ayant une loi binomiale de paramtres (n, 1/n). Alors Xn converge en loi vers une variable alatoire ayant une loi de Poisson de paramtre 1. Applications du thorme de de Moivre-Laplace On lance 3600 fois un d. Comment peut-on valuer la probabilit que le nombre dapparitions du 1 soit compris entre 540 et 660 ? On a S = S3600 suit une B(3600, 1/6). On cherche valuer P(540 S 660) = P( quon peut approximer par
6 5 6

540 600 S 600 660 600 ), 500 500 500

1 t2 6 6 6 exp( ) dt = 2FX ( ) FX ( ) = 2FX ( ) 1. 2 2 5 5 5

On obtient P(540 S 660) 2FX (2, 68) 1 0, 99. Il est intressant de comparer ce rsultat avec ce quaurait donn lingalit de Bienaym tchebytchev. On a P(540 S 660) 1 V 500 31 =1 2 = > 0, 86 2 60 60 36

Thorme 5.2.2 (thorme central limite). Soit (Xn )nN une suite de variables alatoires indpendantes ayant la mme loi et admettant un moment n nE(X1 ) dordre 2. On pose Sn = i=1 Xi . Alors S converge en loi vers une
nV(X1 )

gaussienne centre rduite.

43