Vous êtes sur la page 1sur 29

Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D.

Mouchiroud (5/10/2002)
......................................................................................................................................................................................................

1
Chapitre 4
Lois de Probabilit

Sommaire

1. Introduction.4
2. Lois discrtes..4
2.1. Loi uniforme..4
2.1.1. Dfinition...4
2.1.2. Esprance et variance..5
2.2. Loi de Bernoulli..5
2.2.1. Dfinition...5
2.2.2. Esprance et variance.5
2.3. Loi Binomiale.6
2.3.1. Dfinition...6
2.3.2. Esprance et variance..8
2.3.3. Symtrie et rcurrence de la loi binomiale..8
2.3.4. Stabilit de la loi binomiale9
2.4. Loi de Poisson..9
2.4.1. Approximation dune loi binomiale9
2.4.2. Loi de Poisson....10
2.4.3. Esprance et variance11
2.4.4. Stabilit de la loi de Poisson..12
2.5. Loi binomiale ngative..12
Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (5/10/2002)
......................................................................................................................................................................................................

2
2.5.1. Dfinition..12
2.5.2. Esprance et variance.13
2.6. Loi gomtrique.13
3. Lois continues14
3.1. Loi uniforme14
3.1.1. Dfinition.14
3.1.2. Esprance et variance15
3.2. Loi normale ou loi de Laplace-Gauss.16
3.2.1. Dfinition.16
3.2.2. Etude de la fonction densit de probabilit.17
3.2.3. Esprance et variance17
3.2.4. Stabilit de la loi normale.18
3.3. Loi normale rduite.18
3.3.1. Dfinition.18
3.3.2. Etude de la fonction densit de probabilit.19
3.3.3. Esprance et variance19
3.3.4. Relation avec la loi normale.20
3.3.5. Calcul des probabilits dune loi normale..20
3.4. Lois dduites de la loi normale...21
3.4.1. Loi du
2
de Pearson...21
3.4.2. Loi de Student..23
3.4.3. Loi de Fisher-Sndcor..24
4. Convergence.25
4.1. Convergence en loi25
4.2. Le thorme central limite25
4.3. Convergence vers la loi normale27
4.3.1. La loi binomiale..27
Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (5/10/2002)
......................................................................................................................................................................................................

3
4.3.2. La loi de Poisson....27
4.4. Ingalit de Bienaym-Tchbycheff....27
4.4.1. Ingalit de Markov...28
4.4.2. Ingalit de Bienaym-Tchbycheff..28
Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (5/10/2002)
......................................................................................................................................................................................................

4

1 Introduction
Il est toujours possible dassocier une variable alatoire une probabilit et dfinir ainsi une
loi de probabilit. Lorsque le nombre dpreuves augmente indfiniment, les frquences
observes pour le phnomne tudi tendent vers les probabilits et les distributions
observes vers les distributions de probabilit ou loi de probabilit.
Identifier la loi de probabilit suivie par une variable alatoire donne est essentiel car cela
conditionne le choix des mthodes employes pour rpondre une question biologique
donne (chapitre 5 et 6).

Identifier la loi de probabilit suivie par une variable alatoire donne est essentiel car cela
conditionne le choix des mthodes employes pour rpondre une question biologique
donne (chapitre 5 et 6).

2 Lois discrtes

Par dfinition, les variables alatoires discrtes prennent des valeurs entires discontinues sur
un intervalle donn. Ce sont gnralement le rsultat de dnombrement.
2.1 Loi uniforme
2.1.1 Dfinition

Une distribution de probabilit suit une loi uniforme lorsque toutes les valeurs prises par la
variable alatoire sont quiprobables. Si n est le nombre de valeurs diffrentes prises par la
variable alatoire, i, P(X = x
i
) =
n
1



Exemple :
La distribution des chiffres obtenus au lancer de d (si ce dernier est non pip) suit une loi
uniforme dont la loi de probabilit est la suivante :

X 1 2 3 4 5 6
) (
i
x X P =
1
6

1
6

1
6

1
6

1
6

1
6

Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (5/10/2002)
......................................................................................................................................................................................................

5
avec pour esprance : E(X) =
1
6
i = 3, 5
i=1
6

et pour variance V(X) =


1
6
i
2
E(X)
2
= 2, 92
i =1
6


o les valeurs x
i
correspondent au rang i de la variable X dans la srie.

2.1.2 Esprance et variance

Dans le cas particulier dune loi discrte uniforme o les valeurs de la variable alatoire
X correspondent au rang x
i
= i ( i [1, n])
E(X) =
n + 1
2
et V(X) =
n
2
1
12
Dmonstration.

2.2 Loi de Bernoulli
2.2.1 Dfinition

Soit un univers constitu de deux ventualits, S pour succs et E pour chec
= {E, S}
sur lequel on construit une variable alatoire discrte, nombre de succs telle que au cours
dune preuve, si S est ralis, X = 1
si E est ralis, X = 0

On appelle variable de Bernoulli ou variable indicatrice,
la variable alatoire X telle que : X : R
X () = {0,1}


La loi de probabilit associe la variable de Bernoulli X telle que,
P(X = 0) = q
P(X =1) = p avec p+q = 1
est appele loi de Bernoulli note B(1, p)


2.2.2 Esprance et variance
Lesprance de la variable de Bernoulli est E(X) = p
car par dfinition E(X) = x
i
i=1
2

p
i
= (0 x q) + (1 x p) = p
Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (5/10/2002)
......................................................................................................................................................................................................

6
La variance de la variable de Bernoulli est V(X) = pq

car par dfinition V(X) = x
i
2
i=1
2

p
i
- E(X)
2
= [(0 x q) + (1 x p)] p
2

do V(X) = p p
2
= p (1 p) = pq

2.3 Loi binomiale
2.3.1 Dfinition
Dcrite pour la premire fois par Isaac Newton en 1676 et dmontre pour la premire fois
par le mathmaticien suisse Jacob Bernoulli en 1713, la loi binomiale est lune des
distributions de probabilit les plus frquemment rencontres en statistique applique.

Soit lapplication S
n
:
n
R
n
avec S
n
= X
1
+ X
2
++ X
i
+ ...+ X
n
o X
i
est une variable de Bernoulli

La variable binomiale, S
n ,
reprsente le nombre de succs obtenus lors de la rptition de n
preuves identiques et indpendantes, chaque preuve ne pouvant donner que deux rsultats
possibles.

Ainsi la loi de probabilit suivie par la somme de n variables de Bernoulli o la probabilit
associe au succs est p, est la loi binomiale de paramtres n et p.
S
n
:
n
R
n
S
n
= X
i
i=1
n
B(n,p)

La probabilit que S
n
= k, cest dire lobtention de k succs au cours de n preuves
indpendantes est :


P(S
n
= k) = C
n
k
p
k
q
nk
Dmonstration

Il est facile de dmontrer que lon a bien une loi de probabilit car :
P(S
n
k=0
n
= k) = C
n
k
k=0
n
p
k
q
n k
= (p + q)
n
=1 car p+q = 1

Remarque : Le dveloppement du binme de Newton (p+q)
n
permet dobtenir lensemble
des probabilits pour une distribution binomiale avec une valeur n et p donne. Il existe
galement des tables de la loi binomiale o les probabilits sont tabules pour des valeurs n et
p donnes.


Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (5/10/2002)
......................................................................................................................................................................................................

7
Exemple :
Dans une exprience sur le comportement du rat, rattus norvegicus, on fait pntrer
successivement n rats dans un labyrinthe en forme de H. On tudie alors la probabilit que k
rats empruntent la branche suprieure droite du H.

A chaque preuve, deux vnements peuvent se produire : soit le rat suit litinraire voulu
(succs) soit il ne lemprunte pas (chec). Sachant quil y a 4 itinraires possibles (branches),
la probabilit du succs p = 1/4.

Hypothse :
- si les rats nont pas t conditionns,
- si la branche suprieure droite ne comporte aucun lment attractif ou rpulsif,
- si le choix de litinraire dun rat naffecte pas le choix du suivant (odeurs)
alors : la variable alatoire X itinraire emprunt pour x rats suit une loi binomiale

X (n,
1
4
)

dont la distribution des probabilits est la suivante si lon tudie le comportement de 5 rats :

Nombre de rats ayant emprunt la
branche suprieure droite du labyrinthe.
Distribution de probabilits
de la variable binomiale X
X B (5, 0,25)
0 1 2 3 4
P(X=k)
0, 00
0, 10
0, 20
0, 30
0, 40
5 k

k
0
1
2
3
4
5
P(X = k)
C
5
0
3
4
|
\

|
.
|
5
= 0,237
C
5
1
3
4
|
\

|
.
|
4
1
4
|
\

|
.
| = 0,395
C
5
2
3
4
|
\

|
.
|
3
1
4
|
\

|
.
|
2
= 0,264
C
5
3
3
4
|
\

|
.
|
2
1
4
|
\

|
.
|
3
= 0,088
C
5
4
3
4
|
\

|
.
|
1
4
|
\

|
.
|
4
= 0,015
C
5
5
1
4
|
\

|
.
|
5
= 0,001

Remarque : Il est possible dobtenir aisment les valeurs des combinaisons de la loi
binomiale en utilisant le triangle de Pascal. De plus on vrifie que la somme des probabilits
est bien gale 1.


Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (5/10/2002)
......................................................................................................................................................................................................

8
2.3.2 Esprance et variance
Lesprance dune variable binomiale S
n
est gale E(S
n
) = np
en effet E(S
n
) = E(X
1
+ X
2
++ X
i
+ ...+ X
n
)
or E(X
1
+ X
2
++ X
i
+ ...+ X
n
) = E(X
i
)
i=1
n
proprit de lesprance
et E(S
n
) = E(X
i
) = p
i=1
n

i=1
n

avec E(X
i
) = p variable de Bernoulli
do E(S
n
) = np


La variance dune variable binomiale S
n
est gale V(S
n
) = npq

en effet V(S
n
) = V(X
1
+ X
2
++ X
i
+ ...+ X
n
)
or V(X
1
+ X
2
++ X
i
+ ...+ X
n
) = V(X
i
)
i=1
n
proprit de la variance
et V(S
n
) = V(X
i
) = pq
i=1
n

i=1
n
avec V(X
i
) = pq car variable de Bernoulli
do V(S
n
) = npq


Exemple :
Dans le cadre de ltude de comportement du rat , quel est en moyenne le nombre attendu
de rats qui vont emprunter litinraire prvu si lexprience porte sur un lot de 20 rats ?
Donnez galement la variance et lcart type de cette variable ? Rponse.

2.3.3 Symtrie et rcurrence de la loi binomiale

La loi binomiale dpend des deux paramtres n et p. Elle est symtrique pour p = 0,5 et
dissymtrique pour les autres valeurs de p. La dissymtrie est dautant plus forte :
(1) pour n fixe, que p est diffrent de q (graphe)
(2) pour p fixe que n est plus petit.

Afin de faciliter les calculs des probabilits, il est possible dutiliser une formule de
rcurrence donnant les valeurs des probabilits successives :

P(S
n
= k) =
n k +1
k
p
q
P(S
n
= k 1) Dmonstration
Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (5/10/2002)
......................................................................................................................................................................................................

9
2.3.4 Stabilit de la loi binomiale

Thorme :
Si S
n
et S
m
sont deux variables indpendantes suivant des lois binomiales respectivement
S
n
B(n,p) et S
m
B(m,p) alors S
n
+ S
m
B(n+m,p) dmonstration


2.4 Loi de Poisson
La loi de Poisson dcouverte au dbut du XIX
e
sicle par le magistrat franais Simon-Denis
Poisson sapplique souvent aux phnomnes accidentels o la probabilit p est trs faible
(p < 0,05). Elle peut galement dans certaines conditions tre dfinie comme limite dune loi
binomiale.

2.4.1 Approximation dune loi binomiale

Lorsque n devient grand, le calcul des probabilits dune loi binomiale
P(S
n
= k) = C
n
k
p
k
q
nk

devient trs fastidieux. On va donc, sous certaines conditions, trouver une approximation de
p
k
plus maniable.


Comportement asymptotique :
si n et p 0,
alors X : B(n,p) P() avec np (voir dmonstration)

Remarque : Cette approximation est correcte si n 50 et np 5.

Exemple :
Soit une loi binomiale de paramtres (100 ; 0,01), les valeurs des probabilits pour k de 0 5
ainsi que leur approximation 10
-3
avec une loi de Poisson de paramtre (= np =1) sont
donnes dans le tableau ci-dessous :

k 0 1 2 3 4 5
P(X=k)
Approximation
0,366 0,370 0,185 0,061 0,015 0,000
0,368 0,368 0,184 0,061 0,015 0,003
Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (5/10/2002)
......................................................................................................................................................................................................

10
Dans le cas de cet exemple o n =100 et np =1, lapproximation de la loi binomiale par une
loi de poisson donne des valeurs de probabilits identiques 10
-3
prs.

2.4.2 Loi de Poisson
On appelle processus poissonnien (ou processus de Poisson), le modle probabiliste des
situations qui voient un flux dvnements se produire les uns la suite des autres de faon
alatoire (dans le temps et dans lespace), obissant aux conditions suivantes :
- la probabilit de ralisation de lvnement au cours dune petite priode ou sur une
petite portion despace t est proportionnelle t soit pt .
- elle est indpendante de ce qui sest produit antrieurement ou ct,
- la probabilit de deux apparitions sur le mme t est ngligeable.

Ainsi, des vnements qui se ralisent de faon alatoire comme des pannes de machines, des
accidents davions, des fautes dans un texte, peuvent tre considrs comme relevant dun
processus poissonnien.


Une variable alatoire X valeurs dans R suit une loi de Poisson de paramtre ( > 0) si
les rels p
k
sont donns par P(X = k) =

k
e

k!

on note : X P()

Remarque : Une loi de Poisson est donne par sa loi de probabilit :
(1) k, P(X = k) > 0
(2) P(X = k) =
e

k
k!
k0

k0

= e

k
k!
k0

or

k
k!
k0

= e


do P(X = k)
k0

= e

= 1


Exemple :

Une suspension bactrienne contient 5000 bactries/litre. On ensemence partir de cette
suspension, 50 boites de Ptri, raison d1 cm
3
par boite. Si X reprsente le nombre de
colonies par boite, alors la loi de probabilit de X est :
X P (=5)

La probabilit quil ny ait aucune colonie sur la boite de Ptri est :
Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (5/10/2002)
......................................................................................................................................................................................................

11
P(X = 0) =
5
0
e
5
0!
=0,0067 soit approximativement 0,67 % de chance.

La probabilit quil ny ait au moins une colonie sur la boite de Ptri est :

P(X > 0)=1- P(X = 0) = 1-0,0067 = 0,9933 soit 99,3 % de chance davoir au moins
une colonie bactrienne qui se dveloppe dans la boite de Ptri. (voir vnement contraire)

Comme pour la loi binomiale, il est possible dutiliser une formule de rcurrence pour
calculer les valeurs des probabilits successives :

P(X = k) =

k
P(X = k 1) Dmonstration

2.4.3 Esprance et variance

Lesprance dune variable alatoire de Poisson est E(X) =
Par dfinition E(X) = kp
k
k0

= k

k
e

k!
k0

avec k N valeurs prises par la v.a. X



avec

k
k!
= +

2
1!
+

3
2!
+ .... +

k+1
k!




(

(
(
k0

= 1 +

1!
+

2
2!
+ ... +

k
k!




(

(
(

do E(X) = e

k
k!
k>0

= e

=

La variance dune variable de Poisson est V(X) =
Par dfinition V(X) = k
2
p
k
E(X)
2
k0

= k
2

k
e

k!

2
k0


en posant k
2
= k + k(k 1) , alors
k
2

k
e

k!
=
k
k!
k0

k0

k
e

+
k(k 1)
k!
k0

k
e


do k
2

k
e

k!
=
k 0

2
1!
+

3
2!
+ ... +

k+1
k!



(

( + e

2
+

3
1!
+

4
2!
+ .... +

k+2
k!



(

(
do k
2

k
e

k!
=
2
e

k
k!
k0

k 0
+ e

k
k!
k0

Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (5/10/2002)
......................................................................................................................................................................................................

12
do V(X) =
2
e

+ e


2
=


Remarque : Il est noter que dans le cas dune variable alatoire de Poisson, lesprance
et la variance prennent la mme valeur. Ceci est un lment prendre en compte lors des
tests de conformit une loi de probabilit.


Exemples :
Dans le cadre de la culture bactrienne, le nombre moyen de colonies attendu sur la boite de
Ptri est : E(X) = = 5 colonies.

Ainsi si lon effectue plusieurs cultures bactriennes (plusieurs boites de Ptri) partir de la
mme solution initiale, on attend en moyenne cinq colonies pour lensemble des boites.

En ce qui concerne la variance et lcart-type , on aura :
V(X) = = 5 et (X) = V(X) = 2,24 colonies.

2.4.4 Stabilit de la loi de Poisson

Si X

et Y sont deux variables alatoires indpendantes suivant des lois de Poisson
respectivement
X P () et Y P () alors X

+ Y P (+) dmonstration


2.5 Loi binomiale ngative
2.5.1 Dfinition
Sous le schma de Bernoulli (preuves identiques et indpendantes), on dsire obtenir n
succs et lon considre la variable alatoire discrte X qui reprsente le nombre dpreuves
indpendantes k ncessaire lobtention des n succs.

X suit une loi binomiale ngative de paramtres n et p note BN (n,p) si :

P(X = k) = C
k1
n1
p
n
q
k n
avec k, n N et k n

Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (5/10/2002)
......................................................................................................................................................................................................

13
Remarque : Dans le cas de la loi binomiale ngative, le nombre de succs n est connu et
lon cherche le nombre dpreuves k, ncessaire pour obtenir les n succs. Ainsi le dernier
vnement est connu car les preuves cessent avec lobtention du n
ieme
succs et lon choisit
n-1 objets parmi k-1.

Exemple :
Pour tudier le domaine vital dune population de poissons, des metteurs radio sont fixs au
niveau de la nageoire dorsale aprs une lgre anesthsie locale. Suite divers alas, on
considre que 30 % des poissons quips ne sont pas reprs par la suite. Si lon considre
quun minimum de 15 poissons doivent tre suivis pour avoir des rsultats statistiquement
acceptables, la variable alatoire X nombre de poissons devant tre quips suit une loi
binomiale ngative X BN (15, 0,70)

En posant comme hypothse que les causes de pertes de liaisons radio soient suffisamment
nombreuses pour assurer lindpendance entre chaque preuve, la probabilit dtre oblig
dquiper 20 poissons est de :
P(X = 20) =
19!
14!5!
(0,70)
15
(0, 30)
5
= 0,13

2.5.2 Esprance et variance
Lesprance associe une loi binomiale ngative est : E(X) =
n
p

La variance associe une loi binomiale ngative est : V(X) = n
q
p
2


2.5.3 Loi gomtrique

Lorsque le nombre de succs n est gal 1, la loi de la variable alatoire discrte X porte
le nom de loi de Pascal ou loi gomtrique de paramtre p telle que :
P(X = k) = pq
k-1
avec k N
*


Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (5/10/2002)
......................................................................................................................................................................................................

14
Voici pourquoi :
Si lon considre la variable alatoire X nombre de naissances observes avant
lobtention dune fille avec p = 1/2 (mme probabilit de naissance dune fille ou dun
garon), la loi suivit par X est une loi gomtrique car :
X = 1 si {X= F} avec P(X = 1) = p
X = 2 si {X= GF} avec P(X = 2) = qp
X = 3 si {X= GGF} avec P(X = 3) = qqp = q
2
p
do X = k si {X=GG.GF} avec k-1 {X=G} et donc P(X = k) = pq
k-1


Do lesprance associe la loi gomtrique est : E(X) =
1
p


et la variance associe la loi gomtrique est : V(X) =
q
p
2


3 Lois continues
Par dfinition, les variables alatoires continues prennent des valeurs continues sur un
intervalle donn.
3.1 Loi uniforme
3.1.1 Dfinition
La loi uniforme est la loi exacte de phnomnes continus uniformment rpartis sur un
intervalle.

La variable alatoire X suit une loi uniforme sur le segment [a,b] avec a < b si sa
densit de probabilit est donne par :
f(x) =
1
b a
si x [a,b]
f(x) = 0 si x [a,b]

Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (5/10/2002)
......................................................................................................................................................................................................

15

Quelques commentaires :
(1) La loi uniforme continue tant une loi de probabilit, laire hachure en rouge sur la
figure ci-dessus vaut 1. Ceci implique que la valeur prise par f(x) vaut
1
b a
.
(2) La probabilit que X [a,b] avec a < b et a,b [a,b] vaut :
P( a X b ) = f (x)dx =
dx
b a
a

b

a

b

=

b

a
b a

(3) La fonction de rpartition associe la loi uniforme continue est telle que :
F
X
(x) = 0 si x < a
F
X
(x) = 1 si x > b
F
X
(x) =
x a
b a
si a x b

3.1.2 Esprance et variance
Lesprance de la loi uniforme continue vaut : E(X) =
b + a
2

En effet par dfinition E(X) = x f (x)dx


E(X) = x f (x)dx + x f (x)dx + x f (x)dx
b
+

a
b

cours analyse (Intgrale)


or x f (x)dx = 0

et x f (x)dx = 0
b
+

par dfinition de la loi uniforme continue


do E(X) = x
1
b a
a
b

dx =
1
b a
xdx =
a
b

1
b a
x
2
2



(

(
a
b

E(X) =
1
2(b a)
b
2
a
2
| |
=
1
2(b a)
b a ( ) b + a ( ) =
b + a
2


a b x
F(x)
Fonction de rpartition
1
0
a b x
f(x)
1
b-a
Fonction de densit de probabilit
0
Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (5/10/2002)
......................................................................................................................................................................................................

16
La variance de la loi uniforme continue vaut : V(X) =
b a ( )
2
12

En effet par dfinition V(X) = x
2
f (x)dx E(X)
2


V(X) = x
2
dx
b a
E(X)
2
a
b

mme simplification que pour lesprance


V(X) =
1
b a
x
3
3



(

(
a
b
E(X)
2
=
1
b a
b
3
a
3
3



(

(

b + a
2



(

(
2

or
1
b a
b
3
a
3
3



(

( =
1
3
(b
2
+ ab + a
2
)
et
(b + a)
2
4



(

( =
1
4
(b
2
+ 2ab + a
2
)

do
V(X) =
1
b a
b
3
a
3
3



(

(
(b + a)
2
4



(

( =
(b a)
2
12



3.2 Loi normale ou loi de Laplace-Gauss
3.2.1 Dfinition
On parle de loi normale lorsque lon a affaire une variable alatoire continue dpendant
dun grand nombre de causes indpendantes dont les effets sadditionnent et dont aucune nest
prpondrante (conditions de Borel). Cette loi acquiert sa forme dfinitive avec Gauss (en
1809) et Laplace (en 1812). Cest pourquoi elle porte galement les noms de : loi de
Laplace, loi de Gauss et loi de Laplace-Gauss.

Exemple :
Ainsi la taille corporelle dun animal dpend des facteurs environnementaux (disponibilit
pour la nourriture, climat, prdation, etc.) et gntiques. Dans la mesure o ces facteurs sont
indpendants et quaucun nest prpondrant, on peut supposer que la taille corporelle suit
une loi normale.


Une variable alatoire absolument continue X suit une loi normale de paramtres ( , ) si
sa densit de probabilit est donne par :
f : R R


x a f (x) =
1
2
e

1
2
x

|
\

|
.
|
2
avec R et R
+

Notation : X N( , )

Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (5/10/2002)
......................................................................................................................................................................................................

17
Remarque : On admet que f (x)dx

=1 dans la mesure o lintgration analytique est


impossible.

3.2.2 Etude de la fonction densit de probabilit
La fonction f est paire autour dun axe de symtrie x = car f(x + ) = f( - x)
do D
E
= [ , +[
La driv premire f (x) est gale : f (x) =

2
|
\

|
.
|
f(x) Dmonstration
do f (x) = 0 pour x = et f (x) < 0 pour x >
La driv seconde f (x) est gale : f (x) =

2
1
( x )
2

2
|
\

|
.
| f ( x)
Dmonstration
do f (x) = 0 pour x = + et f (x) > 0 pour x > +

x + +
f (x) - 0 +
f (x) 0 -


f(x)
1
2



1
2
e

1
2


0



Remarque : Le paramtre reprsente laxe de symtrie et le degr daplatissement de
la courbe de la loi normale dont la forme est celle dune courbe en cloche.

3.2.3 Esprance et variance

Lesprance de la loi normale vaut : E(X) =

La variance de la loi normale vaut : V(X) =
2
Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (5/10/2002)
......................................................................................................................................................................................................

18
3.2.4 Stabilit de la loi normale

Thorme :
Soient X
1
et X
2
deux variables alatoires normales indpendantes de paramtres
respectifs (
1
,
1
) , (
2
,
2
), alors leur somme X
1
+X
2
est une variable alatoire normale
de paramtres (
1
+
2
,
2 2
1 2
+ ).


Voici pourquoi :

(1) E(X
1
+X
2
) = E(X
1
) + E(X
2
) Proprit P
1
de lesprance.
or E(X
1
) =
1
et E(X
2
) =
2
do

E(X
1
+X
2
) =
1
+
2

(2) V(X
1
+X
2
) =V(X
1
) + V(X
2
) Proprit P
1
de la variance lorsque X
1
et X
2
sont
indpendantes.
or V(X
1
) =
1
2

et V(X
2
) =
2
2
do

V(X
1
+X
2
) =
1
2

+
2
2


Ce thorme se gnralise immdiatement la somme de n variables alatoires normales
indpendantes.

3.3 Loi normale rduite
3.3.1 Dfinition

Une variable alatoire continue X suit une loi normale rduite si sa densit de probabilit
est donne par :
f : R R

x a f (x) =
1
2
e

1
2
x
2



Remarque : f est bien une loi de probabilit car :
x R, f(x) 0
f est intgrable sur ]-, + [ et f (x)dx = 1



Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (5/10/2002)
......................................................................................................................................................................................................

19
3.3.2 Etude de la fonction densit de probabilit

La fonction f est paire car f(-x) = f(x) do D
E
= [0,+ [
La driv premire est f (x) = -x f(x) avec f (x) 0 pour x 0.
La drive seconde est f (x) = -f(x) + x
2
f(x) = (x
2
1) f(x) qui sannule pour x = 1 sur D
E
.

x
0 1 +
f (x) + 0 -
f (x) 0 -


f(x)
1
2


1
2e

0



Remarque : Laxe de symtrie correspond laxe des ordonnes (x = 0) et le degr
daplatissement de la courbe de la loi normale rduite est 1.

3.3.3 Esprance et variance
Lesprance dune loi normale rduite est : E(X) = 0
En effet par dfinition E(X) = x f (x)dx

.
Or la fonction intgrer est impaire do E(X)=0 (cours danalyse : intgrale)

La variance dune loi normale rduite est : V(X) = 1
En effet par dfinition V(X) = x
2
f (x)dx E(X)
2


do V(X) =
1
2
x
2
e

x
2
2
dx


En effectuant une intgration par partie :
Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (5/10/2002)
......................................................................................................................................................................................................

20
V(X) =
1
2
xe

x
2
2




(

(
(

+
e

x
2
2
dx

|
\


|
.
|
|
avec
2
2
x
xe
+

| |
(
|

(
|
(

\ .
= 0
or V(X) =
1
2
e

x
2
2
dx

=1 par dfinition dune fonction de rpartition


do V(X) = 1


3.3.4 Relation avec la loi normale

Si X suit une loi normale N (,), alors Z =
X

, une variable centre rduite suit


une la loi normale rduite N (0,1).


3.3.5 Calcul des probabilits dune loi normale

La fonction de rpartition de la loi normale rduite permet dobtenir les probabilits
associes toutes variables alatoires normales N (,) aprs transformation en variable
centre rduite.


On appelle fonction , la fonction de rpartition dune variable normale rduite X
telle que : : R R


t a(t) = P(X < t) =
1
2
e

t
2
2
dt




Les proprits associes la fonction de rpartition sont :
(P
1
) est croissante, continue et drivable sur R et vrifie :
lim
t+
(t) = 1 et lim
t
(t) = 0
(P
2
) t R (t) + (-t) = 1
t R (t) - (-t) = 2(t) - 1
Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (5/10/2002)
......................................................................................................................................................................................................

21
Une application directe de la fonction est la lecture des probabilits sur la table de la loi
normale rduite.


3.4 Lois dduites de la loi normale
3.4.1 Loi du
2
de Pearson

Dfinition
La loi de Pearson ou loi de
2
(Khi deux) trouve de nombreuses applications dans le cadre
de la comparaison de proportions, des tests de conformit dune distribution observe une
distribution thorique et le test dindpendance de deux caractres qualitatifs. Ce sont les test
du khi-deux.


Soit X
1
, X
2
,

, X
i
,, X
n,
n variables normales centres rduites, on appelle

2
la variable alatoire dfinie par :

2
= X
1
2
+ X
2
2
++ X
i
2
++ X
n
2
= X
i
2
i=1
n

On dit que
2
suit une loi de Pearson n degrs de libert (d.d.l.).


Remarque : Si n =1, la variable du
2
correspond au carr dune variable normale rduite
de loi N(0,1) (voir Rapport entre loi de probabilit).


Proprits :

(P
1
) Si X
1
, X
2
,

X
3
,

, X
i
,, X
n
sont n variables normales centres rduites et sil existe k
relations de dpendance entre ces variables alors X
1
2
+ X
2
2
+ X
3
2

++ X
i
2
++ X
n
2
suit une
loi de Pearson n - k degrs de libert.

(P
2
) Si U suit une loi de Pearson n d.d.l.,
si V suit une loi de Pearson m d.d.l.,
et si U et V sont indpendantes alors U+ V suit une loi de Pearson n+m ddl
U-V suit une loi de Pearson n-m ddl (si n<m)


Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (5/10/2002)
......................................................................................................................................................................................................

22

Pour
2
> 0, la fonction densit de probabilit
est de la forme :
f (
2
) = C(n)
2
n
2
1
e

2
2
avec C(1) =
1
2

Pour
2
0, f(
2
) = 0
Pour n > 1, on utilise la table du Khi 2


Remarque : La constante C(n) est telle que ( ) 1 f x dx
+

. La distribution du
2
est
dissymtrique et tend devenir symtrique lorsque n augmente en se rapprochant de la
distribution normale laquelle elle peut tre assimile lorsque n > 30.


Esprance et variance

Lesprance de la variable du
2
est : E(
2
) = n
car par dfinition E(
2
) = E(X
i
2
i=1
n

) avec X
i
variable normale rduite
or V(X
i
) = E(X
i
2
) - E(X
i
)
2
= 1 pour la variable normale rduite avec E(X
i
) = 0
do E(X
i
2
) = 1 et donc E(
2
) = n

La variance de la variable du
2
est : V(
2
) = 2n
car par dfinition les X
i
variables normales rduites tant indpendantes,
V(
2
) = V(X
i
2
i=1
n

) et dautre part V(X


i
2
) = E(X
i
4
) [E(X
i
2
)]
2
or E(X
i
4
) = 3 do V(X
i
2
) = 3 1 = 2
ainsi V(
2
) = V(X
i
2
i=1
n

) = 2n




Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (5/10/2002)
......................................................................................................................................................................................................

23
3.4.2 Loi de student

Dfinition

La loi de Student (ou loi de Student-Fisher) est utilise lors des tests de comparaison de
paramtres comme la moyenne et dans lestimation de paramtres de la population partir de
donnes sur un chantillon (Test de Student). Student est le pseudonyme du statisticien
anglais William Gosset qui travaillait comme conseiller la brasserie Guinness et qui publia
en 1908 sous ce nom, une tude portant sur cette variable alatoire.

Soit U une variable alatoire suivant une loi normale rduite N(0,1) et V une variable
alatoire suivant une loi de Pearson n degrs de libert
n
2
, U et V tant indpendantes, on
dit alors que T
n
=
U
V
n
suit une loi de Student n degrs de libert.


La fonction densit de
probabilit est de la forme :
f (T) = C(n) 1+
T
2
n
|
\

|
.
|

(n +1)
2

Calcul des probabilits avec la
table de la loi de Student



Remarque : La constante C(n) est telle que ( ) 1 f x dx
+

. La distribution du T de
Student est symtrique et tend vers une loi normale lorsque n augmente indfiniment.


Esprance et variance

Lesprance de la variable de Student est : E(T) = 0 si n >1

Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (5/10/2002)
......................................................................................................................................................................................................

24

La variance de la variable de Student est : V(T) =
n
n 2
si n > 2

3.4.3 Loi de Fisher-Snedecor

La loi de Fisher-Snedecor est utilise pour comparer deux variances observes et sert surtout
dans les trs nombreux tests danalyse de variance et de covariance.

Soit U et V deux variables alatoires indpendantes suivant une loi de Pearson
respectivement n et m degrs de libert.
On dit que F =
U n
V m
suit une loi de Fisher-Snedecor
n
m




`
)
degrs de libert.



Pour F > 0, la fonction densit de
probabilit est de la forme :
f (F) = C
(n,m)
F
n
2
1
(m+ nF)

n+m
2
|
\


|
.
|
|

Pour F 0, f(F) = 0
Utilisation des tables de Fisher-Snedecor
pour le calcul des probabilits.



Remarque : Si n = 1, alors on a la relation suivante : F
(1,m)
=
U
2
V m
= T
m
2
(voir Rapport
entre loi de probabilit).


Esprance et variance

Lesprance de la variable de Fisher-Sndecor est : E(F) =
m
m 2
si m >2
Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (5/10/2002)
......................................................................................................................................................................................................

25

La variance de la variable de Fisher-Sndecor est : V(F) =
2m
2
(n + m2)
n(m 2)
2
(m 4)
si m > 4

4 Convergence

Dans ce paragraphe, sont traits des lments de calcul des probabilits dont lapplication
statistique est nombreuse. La partie fondamentale est le thorme central limite. Les
lments prsents permettent de prciser ce que signifie lajustement dune loi de probabilit
par une autre (notion de convergence) et ainsi de justifier lapproximation dune distribution
observe par une loi thorique (chapitre 7). De plus ces lments permettent de donner des
limites derreurs possibles dans lestimation dun lment dune population (chapitre 6).

4.1 Convergence en loi

Soit une suite de n variables alatoires X
1
, X
2
,

X
3
,

, X
i
,, X
n
. Cette suite converge en loi
vers la variable alatoire X de fonction de rpartition F
X
quand n augmente indfiniment, si
la suite des fonctions de rpartition F
X
1
, F
X
2
, F
X
3
, ...., F
X
I
,....F
X
n
tend vers la fonction de
rpartition F
X
pour tout x pour lequel F
X
est continue.

Exemple :
Nous avons montr que la loi de probabilit dune variable binomiale tend vers une loi de
Poisson lorsque n tend vers linfini. Il en serait de mme des fonctions de rpartition
correspondantes. On peut donc dire que la loi binomiale B(n,p) converge en loi vers une loi
de Poisson de paramtres np. (voir Rapport entre loi de probabilit).

4.2 Le thorme central limite

Appel galement thorme de la limite centrale, il fut tabli par Liapounoff et Lindeberg.

On se place dans une situation dpreuves rptes, caractrises par une suite
X
1
, X
2
,

X
3
,

, X
i
,, X
n
de n variables alatoires indpendantes et de mme loi (esprance
E(X
i
) = et variance V (X
i
) =
2
). On dfinit ainsi deux nouvelles variables alatoires :

la somme S
n
= X
1
+ X
2
++ X
i
+ ...+ X
n

la moyenne M
n
=
X
1
+ X
2
+ .... + X
n
n
=
S
n
n

Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (5/10/2002)
......................................................................................................................................................................................................

26
telles que :
E(S
n
) = n
V(S
n
) = n
2

E(M
n
) =
V(M
n
) =

2
n


Voici pouquoi :
Pour les deux variables alatoires , les valeurs de lesprance et de la variance sont lies aux
proprits de linarit et dindpendance.

Ces formules sont la base des principaux estimateurs en statistique.


Thorme central limite

Soit la variable alatoire S
n
rsultant de la somme de n variables alatoires
indpendantes et de mme loi, on construit la variable centre rduite telle que :

( )
n
n
S n
Z
n

=
Alors pour tout t R, la fonction de rpartition F
n
(t)
=
P(Z
n
< t) est telle que :
F
n
(t)
1
2
e

z
2
2

dz quand n cest dire N(0,1).




Remarque : On peut calculer Z
n
aussi bien partir de S
n
que de M
n
car
Z
n
=
S
n
n
n
=
M
n

n


Une variable alatoire rsultant de la somme de plusieurs v.a. ayant mme loi et mme
paramtres est distribue suivant une loi normale rduite lorsque le nombre dpreuves n
tend vers linfini.

Le thorme central limite sapplique quelque soit la loi de probabilit suivie par les
variables alatoires discrtes ou continues, pourvu que les preuves soient indpendantes,
reproductibles et en trs grand nombre.

Grce au thorme de la limite centrale, on peut voir que des phnomnes dont la variation est
engendre par un nombre important de causes indpendantes sont gnralement susceptibles
dtre reprsents par une loi normale.
Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (5/10/2002)
......................................................................................................................................................................................................

27
A laide de la convergence en loi et du thorme central limite, il est possible de faire
lapproximation de certaines lois de probabilits par dautres (voir Rapport entre loi de
probabilit).

4.3 Convergence vers la loi normale
4.3.1 La loi binomiale

Thorme :
Soit X une variable alatoire suivant une loi binomiale de paramtres (n,p), alors
P(X = k)
1
2
e

1
2
k

|
\

|
.
|
2
quand n cest dire N(0,1)
avec = E(X) = n p et
2
= V(X) = n p q
La convergence est dautant plus rapide que p est voisin de 0,5, distribution symtrique pour
la loi binomiale.


Remarque : On considre que lapproximation est valable si on a la fois np 5 et nq 5
(voir Rapport entre loi de probabilit).

4.3.2 Loi de Poisson

Thorme :
Soit X une variable alatoire suivant une loi de Poisson de paramtre alors
P(X = k)
1
2
e

1
2
k

|
\

|
.
|
2
quand n cest dire N(0,1)
avec E(X) = et V(X) =

Remarque : On considre quon peut faire ces approximations si 20 (voir Rapport
entre loi de probabilit).

4.4 Ingalit de Bienaym-Tchbycheff

Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (5/10/2002)
......................................................................................................................................................................................................

28
Lingalit de Markov et lingalit de Bienaym-Tchbycheff sappliquent aussi bien aux
variables alatoires discrtes ou absolument continues. Elles permettent pour une variable
alatoire X desprance E(X) = et de variance
2
dvaluer la probabilit pour que X diffre
de la moyenne dune quantit infrieure une valeur h.

Le problme est de donner une consistance quantitative la remarque dj faite que, plus
lcart-type dune variable alatoire est faible, plus sa distribution de probabilit est
concentre autour de son esprance mathmatique (voir degr daplatissement de la loi
normale). Afin de dmontrer cette ingalit, nous allons prsenter tout dabord lingalit de
Markov.

4.4.1 Ingalit de Markov
Soit X une variable alatoire admettant une esprance E(X) et une variance V(X), tant donn,
un rel h>0 lingalit de Markov donne :

P( X h)
1
h
2
E(X
2
)

Voici pourquoi :
P( X h) = p
i
iI

la sommation tant tendue toutes les valeurs de i tels que ,x


i
, > h
dans ce cas :
x
i
h
1 soit 1
x
i
2
h
2
p
i
p
i
x
i
2
h
2

ainsi p
i
i I

1
h
2
p
i
x
i
2
iI

do p
i
i I

1
h
2
E(X
2
) et P( X h)
1
h
2
E(X
2
)

4.4.2 Ingalit de Bienaym-Tchbycheff

Si lon applique lingalit de Markov la variable alatoire X X, on a
P( X X h)
1
h
2
E[(X X)
2
]
or E[( X X)
2
] = V(X) =
2
et en passant lvnement contraire, on a :
P( X X h) 1

2
h
2

En posant h = t avec t > 0, on obtient lingalit suivante
P(
X X

t) 1
1
t
2
sachant que > 0

Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (5/10/2002)
......................................................................................................................................................................................................

29
qui est quivalente

t > 0 P(
X X

t)
1
t
2
ingalit de Bienaym-Tchbycheff

Remarque : Ces ingalits nont dintrt que si t est assez grand.

Vous aimerez peut-être aussi