Académique Documents
Professionnel Documents
Culture Documents
Mouchiroud (10/10/2002)
......................................................................................................................................................................................................
1
Chapitre 3
Variables alatoires
Sommaire
1. Introduction3
2. Variables alatoires discrtes4
2.1. Dfinition..4
2.2. Loi de probabilit.4
2.3. Fonction de rpartition.5
3. Variables alatoires continues7
3.1. Dfinition..7
3.2. Fonction densit de probabilit..7
3.3. Fonction de rpartition.8
4. Esprance et variance11
4.1. Esprance mathmatique11
4.1.1. Variables alatoires discrtes.12
4.1.2. Variables alatoires continues.12
4.1.3. Proprits de lesprance..13
4.2. Variance14
4.2.1. Variables alatoires discrtes.14
4.2.2. Variables alatoires continues.15
4.2.3. Proprits de la variance15
5. Couples de variables alatoires15
Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (10/10/2002)
......................................................................................................................................................................................................
2
5.1. Loi jointe15
5.2. Indpendance entre variables alatoires.17
5.3. Covariance et corrlation..18
5.4. Oprations sur les variables alatoires.19
5.5. Gnralisation n variables alatoires..20
Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (10/10/2002)
......................................................................................................................................................................................................
3
1. Introduction
Dans la plupart des phnomnes alatoires, le rsultat dune preuve peut se traduire par une
grandeur mathmatique, trs souvent reprsente par un nombre entier ou un nombre rel.
La notion mathmatique qui reprsente efficacement ce genre de situation concrte est celle
de variable alatoire (note galement v.a.). Ainsi le temps de dsintgration dun atome
radioactif, le pourcentage de rponses oui une question pose dans un sondage ou
le nombre denfants dun couple sont des exemples de variables alatoires.
Remarque : On se limitera ici au cas des variables alatoires relles (les entiers faisant bien
sr partie des rels).
Etant donn un espace probabilis despace fondamental et de mesure de probabilit P,
on appelle variable alatoire sur cet espace, toute application X de dans R telle que :
X: () R
X ()
A chaque vnement lmentaire de correspond un nombre rel x associ la variable
alatoire X. Comme lindique le graphe, il ny a pas obligatoirement autant de valeurs
possibles prises par la variable alatoire X que dvnements lmentaires. La valeur x
correspond la ralisation de la variable X pour lvnement lmentaire .
Exemple :
Si lon considre la constitution dune fratrie de deux enfants, lespace fondamental est
constitu des vnements lmentaires suivant :
= {GG, GF, FG, FF}
Les valeurs possibles prises par la variable alatoire X, nombres de fille dans la famille
sont : X () = {0, 1, 2}
Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (10/10/2002)
......................................................................................................................................................................................................
4
2 Variables alatoires discrtes
2.1 Dfinition
Une variable alatoire est dite discrte si elle ne prend que des valeurs discontinues dans un
intervalle donn (born ou non born). Lensemble des nombres entiers est discret. En rgle
gnrale, toutes les variables qui rsultent dun dnombrement ou dune numration sont
de type discrtes.
Exemples :
Les variables alatoires,
- le nombre de petits par port pour une espce animale donne (chat, marmotte, etc),
- le nombre de bactries dans 100 ml de prparation,
- le nombre de mutations dans une squence dADN de 10 kb,
etc
sont des variables alatoires discrtes.
2.2 Loi de probabilit
Une variable alatoire est caractrise par lensemble des valeurs quelle peut prendre et par
lexpression mathmatique de la probabilit de ces valeurs. Cette expression sappelle la loi
de probabilit (ou distribution de probabilit) de la variable alatoire.
Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (10/10/2002)
......................................................................................................................................................................................................
5
La loi de probabilit dune variable alatoire discrte est entirement dtermine par les
probabilits p
i
des vnements {X = x
i
}, x
i
parcourant lunivers image X(). La loi de
probabilit est donne par les (x
i
, p
i
)
i
.
Remarque : Afin de simplifier lcriture, nous noterons pour la suite du cours :
P({X = x
i
}) quivalent P(X=x
i
) ou p
i
Exemple :
Dans le cas de la constitution dune fratrie de deux enfants, si lon fait lhypothse que la
probabilit davoir un garon est gale celle davoir une fille (1/2), alors la distribution de
probabilit ou loi de probabilit du nombre de filles dans une fratrie de deux enfants est :
Ensemble des
vnements possibles
Valeurs de la
variable alatoire
X
Probabilits associes
la variable X
P(X=x
i
) ou p
i
G et G
F et G ou G et F
F et F
0
1
2
1/4
1/2
1/4
Si P(F)= P(G)=1/2, alors
(1) P[(F G) (G F)] = P(F G) + P(G F) Proprits dadditivit
avec (F G) (G F)= vnements incompatibles
(2) P(F G)= P(F)P(G) Proprit dindpendance
do P[(F G) (G F)]= P(X =1)= (1/2x1/2)+(1/2x1/2)=1/2
Remarque : Une loi de probabilit nest tablie que si p
i
i
f (x) dx existe)
x
f(x)
Soit une fonction densit de
probabilit f(x) :
(1) laire hachure en vert
correspond la probabilit
P(X < -10)
(2) laire hachure en bleu
correspond la probabilit
P(+10 <X < +15)
Remarque : Cette fonction densit de probabilit est une loi de probabilit car laire sous la
courbe est gale 1 pour toutes les valeurs de x dfinies.
Rciproquement :
Une variable alatoire X dfinie sur un univers est dite absolument continue, sil existe
une fonction densit de probabilit telle que :
t R P(X < t) =
f (x) dx
(voir graphe ci-dessus).
Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (10/10/2002)
......................................................................................................................................................................................................
9
3.3. Fonction de rpartition
Si comme pour les variables alatoires discrtes, on dfinit la fonction de rpartition de X
par :
F
X
: R R
t
a F
X
(t) = P( X < t)
alors la relation entre la fonction de rpartition F
X
et la fonction densit de probabilit
f(x) est la suivante :
t R F
X
(t) = P( X < t) =
f (x) dx
La fonction de rpartition F
X
(t) est la primitive (voir cours danalyse) de la fonction densit
de probabilit f (x), et permet dobtenir les probabilits associes la variable alatoire X, en
effet :
Soit X une variable alatoire absolument continue de densit f et de fonction de rpartition
F
X
, alors :
(P
1
)
P(a X b) = F
X
(b) - F
X
(a) =
a
b
f(x) dx -
f(x) dx =
a
b
f(x) dx
(P
2
) Si f est continue sur un intervalle de la forme [a, a+h] avec h 0
+
alors,
P(a X a+h) =
a
a+h
f (x) dx
(P
2
) F
X
= f est donc positive sur R
(P
3
) Evident
(P
4
)
avec f (t) = 2e
t
2e
2t
qui reprsente la fonction densit de probabilit.
La primitive de f (t), F
T
(t), fonction de rpartition est de la forme :
Lvolution de la recolonisation de ltang par les canards colverts en fonction du temps est
donne par la courbe rouge. On observe ainsi que plus de 50 % des canards se posent sur
ltang au cours des 2 premires minutes qui suivent lalerte. Au bout de 7 minutes, tous les
canards ont regagn ltang. La distribution des probabilits cumules est donne sur la
courbe verte.
4. Esprance et Variance
Une loi de probabilit peut tre caractrise par certaines valeurs typiques correspondant aux
notions de valeur centrale, de dispersion et de forme de distribution.
4.1. Esprance mathmatique
Lesprance dune variable alatoire E(X) correspond la moyenne des valeurs possibles de
X pondres par les probabilits associes ces valeurs. Cest un paramtre de position qui
correspond au moment dordre 1 de la variable alatoire X. Cest lquivalent de la moyenne
0
.2
.4
.6
.8
1
0 2 4 6 8
0
.1
.2
.3
.4
.5
0 2 4 6 8
(t)
t
Fonction de densit de probabilit
F(t)
t
Fonction de rpartition
Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (10/10/2002)
......................................................................................................................................................................................................
12
arithmtique X. En effet lorsque le nombre dpreuves n est grand, X tend vers E(X) (voir
estimation).
4.1.1. Variables alatoires discrtes
Si X est une variable alatoire discrte dfinie sur un univers probabilis , on appelle
esprance de X, le rel dfini par : E(X) = X()P()
Remarque : Si X() est infini, on nest pas sr que lesprance existe. Lesprance
mathmatique est galement note (X),
X
ou encore si aucune confusion nest craindre.
Nous pouvons donner une autre dfinition de lesprance dune variable alatoire discrte X
si , on associe limage x telle que X() = x.
Thorme :
Si X est une variable alatoire discrte de loi de probabilit (x
i
, p
i
)
i
dfinit sur un nombre
fini (n) dvnements lmentaires alors :
E(X) = x
i
p
i
i =1
n
Exemples :
Si lon reprend lexemple dune fratrie de deux enfants, lesprance de la variable alatoire
nombre de filles est :
E(X) = 0 * 1/4 + 1* 1/2 + 2*1/4 = 1 do E(X) = 1
Si lon observe un nombre suffisant de fratries de 2 enfants, on attend en moyenne une fille
par fratrie.
4.1.2. Variables alatoires continues
Si X est une variable alatoire absolument continue de densit , on appelle esprance de
X, le rel E(X) , dfini par : E(X) =
x f(x)dx
si cette intgrale est convergente.
Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (10/10/2002)
......................................................................................................................................................................................................
13
Exemple :
Si on reprend lexemple de la recolonisation de ltang par les canards colverts, la dure
moyenne pour la recolonisation est :
E(T) = t f (t)dt = t(2e
t
0
+
0
+
2e
2 t
)dt = 3/2 (voir Rsultat)
Sous ce modle, la dure moyenne de recolonisation pour lensemble de la population de
canards colverts est de 1,5 minutes.
Remarque : Dans cet exemple, la variable tudie t ne peut prendre que des valeurs dans
[0, +[
4.1.3. Proprits de lesprance
Les proprits de lesprance valent aussi bien pour une variable alatoire discrte ou une
variable alatoire absolument continue.
Si X et Y sont deux variables alatoires dfinies sur un mme univers , admettant une
esprance, alors :
(P
1
) E(X+Y)=E(X)+E(Y)
(P
2
) E(aX)=aE(X) a R
(P
3
) Si X 0 alors E(X) 0
(P
4
) Si X est un caractre constant tel que : X () = k alors E(X) = k
Remarque : Dans le cas continu, E (X+Y) =
Exemple :
Dans le cadre de la recolonisation de ltang par la population de canard colvert, la variance
de la loi de probabilit est :
V(T) = (t E(T)
0
+
)
2
f (t)dt = 5/4 avec = 1,12 (voir Rsultat)
4.2.3. Proprits de la variance
Si X est une variable alatoire admettant une variance alors :
(P
1
) a R, V (aX) = a
2
V (X)
(P
2
) (a, b) R, V (aX + b) = a
2
V (X)
(P
3
) V (X) = 0 X = E(X)
Il est possible dexprimer la variance en fonction du moment dordre 1 (m
1
) et du moment
dordre 2 (m
2
). La variance correspond au moment centr dordre 2.
V(X) = E([X - E(X)]
2
) = E(X
2
) E(X)
2
Dmonstration
do V(X) = E(X
2
) E(X)
2
= m
2
- m
1
2
5. Couples de variables alatoires
5.1. Loi jointe
Les dfinitions portant sur la loi jointe entre deux variables alatoires X et Y impliquent que
ces dernires soient dfinies sur le mme espace fondamental . Si X et Y sont dfinies
Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (10/10/2002)
......................................................................................................................................................................................................
16
respectivement sur les espaces fondamentaux
1
et
2
, alors il faut envisager un espace qui
englobe
1
et
2
appel espace-produit .
Il suffit alors de connatre la loi jointe des deux variables alatoires ou loi de probabilit du
couple (X,Y),la fonction dfinie par :
x,y p
xy
= P ((X = x) et (Y = y)) dans le cas discret
Dans le cas continu, p
xy
= P ((x
a
< X < x
b
) et (y
c
< Y < y
d
)) permet de dfinir la probabilit
pour que (X,Y) soit dans un rectangle.
Remarque : Ceci peut tre gnralis un nombre quelconque de variables alatoires.
Exemple :
On place au hasard deux billes rouge et verte dans deux boites A et B. On note X, la variable
alatoire nombre de billes dans la boite A et Y, la variable alatoire nombre de boites
vides .
A B A B A B A B
Les distributions de probabilits associes chacune des variables X et Y ainsi que celle de
la loi jointe sont indiques ci-dessous. Pour chaque loi, la valeur de lesprance et de la
variance est galement indique.
Variable X : X() = {0,1,2} x
i
0 1 2
E(X) = 1 V(X) = 1/2
p
i
1/4 1/2 1/4
Variable Y : Y() = {0,1} y
j
0 1
E(Y) = 1/2 V(Y) = 1/4
q
j
1/2 1/2
Variable XY : XY() = {0,1,2} x
i
y
j
0 1 2
E(XY) = 1/2 V(XY) = 3/4
ij
3/4 0 1/4
Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (10/10/2002)
......................................................................................................................................................................................................
17
5.2. Indpendance entre variables alatoires
Les proprits concernant lindpendance statistique entre deux variables alatoires
sappliquent aussi bien aux variables alatoires discrtes ou absolument continues.
Thorme :
Si X et Y sont deux variables alatoires indpendantes dfinies sur le mme univers
alors : E(XY) = E(X)E(Y)
Remarque : Lapplication rciproque nest pas vraie. La relation E(XY) = E(X)E(Y)
nimplique pas forcment lindpendance de deux variables alatoires.
Exemple :
Dans lexemple concernant la rpartition des deux billes dans les 2 boites, la relation
E(XY) = E(X)E(Y) est vrifie car : E(X) = 1 ; E(Y) = 1/2 et E(XY) = 1/2
cependant les variables alatoires X et Y ne sont pas indpendantes.
En effet
00
= P ((X = 0) (Y = 0)) = 0 car il est impossible davoir la fois aucune bille
dans la boite A et aucune boite vide. Or on attend si X et Y sont deux variables
statistiquement indpendantes, ce que
P ((X = 0) (Y = 0)) = P(X = 0)P(Y = 0) = 1/4*1/2 = 1/8 0
Thorme :
Si X et Y sont deux variables alatoires indpendantes dfinies sur le mme
univers alors V(X + Y) = V(X) + V(Y) Dmonstration
Remarque : Lapplication rciproque nest pas vraie. La relation V(X + Y) = V(X) + V(Y)
nimplique pas forcment lindpendance de deux variables.
Exemple :
Si lon reprend lexemple de la rpartition de deux billes dans deux boites, la distribution de
probabilit de la variable alatoire (X+Y) est :
Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (10/10/2002)
......................................................................................................................................................................................................
18
Variable X+Y : X+Y()={0,1,2,3}
x
i
+ y
j
0 1 2 3
E(X+Y)=3/2 V(X+Y)=3/4
ij
0 3/4 0 1/4
Comme V(X) = 1/2 et V(Y) = 1/4 alors V(X) + V(Y) = 3/4 = V(X+Y)
On retrouve ainsi la relation V(X + Y) = V(X) + V(Y) bien que X et Y ne soient pas
indpendantes (voir dmontration).
5.3. Covariance et Corrlation
Lorsque lon considre deux variables alatoires simultanment, il faut dfinir un indicateur
de leur liaison qui complte les paramtres qui les caractrisent chacune sparment
(esprance mathmatique et variance).
Si X et Y sont deux variables alatoires dfinies sur le mme univers , on appelle
covariance de ces deux variables, le rel :
cov(X,Y) = E(XY) - E(X)E(Y)
et coefficient de corrlation, le rel :
R(X, Y) =
cov( X,Y)
(X)(Y)
Il rsulte de cette dfinition, le thorme suivant :
Thorme :
Si X et Y sont deux variables alatoires dfinies sur le mme univers
et indpendantes, alors : cov(X,Y) = 0
Les proprits de la covariance sont les suivantes :
Si X et Y sont deux variables alatoires dfinies sur un mme univers , alors :
(P
1
) (a,b) R V(aX + bY) = a
2
V(X) + 2abcov(X,Y) + b
2
V(Y) }
(P
2
) [cov(X,Y)]
2
V(X) V(Y)
|cov(X,Y)(
(X) (Y)
(P
3
) -1 R (X,Y) 1
Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (10/10/2002)
......................................................................................................................................................................................................
19
Remarque : Si X et Y sont indpendantes, =0 mais la rciproque est fausse. Il peut arriver,
par hasard, que =0 sans que X et Y soient indpendantes.
5.4. Oprations sur les variables alatoires
Il arrive souvent que lon effectue des transformations sur les variables alatoires par
commodit de calcul et il est important de savoir comment se comportent les paramtres
associs cette variable.
Nous avons rsum dans le tableau ci-dessous quelques transformations possibles avec
a et b R.
Translation de lorigine seule
X X + b
Changement dunits seul
X aX
Cas gnral
X aX + b
E(X+ b) = E(X) + b
V(X + b) = V(X)
E(aX) = aE(X)
V(aX) = a
2
V(X)
E(aX + b) = aE(X) + b
V(aX + b) = a
2
V(X)
Il existe dautres transformations de variables alatoires qui conduisent des valeurs de
paramtres particulires.
Une variable alatoire X est dite centre si E(X) = 0.
Exemple :
La variable Y = X E(X) est une variable alatoire centre car
E(Y) = E[X E(X)] = E(X ) E(E(X))
or E(E(X)) = E(X ) voir proprits P
4
de
lesprance
ainsi E(Y) = E(X ) E(X) = 0
Une variable alatoire admettant une variance est dite rduite si V(X) = 1.
Exemple :
La variable Y =
X
V(X)
est une variable alatoire rduite car
Mathmatiques : Outils pour la Biologie Deug SV1 UCBL D. Mouchiroud (10/10/2002)
......................................................................................................................................................................................................
20
V(Y) = E(Y
2
) E(Y)
2
= E
X
V(X)
|
\
|
.
|
2
(
(
(
E
X
V(X)
|
\
|
.
|
(
(
2
V(Y) =
1
V(X)
E(X
2
)
1
V(X)
E(X)
(
(
2
voir proprits P
2
de
lesprance
V(Y) =
1
V(X)
[E(X
2
) E(X)
2
] do V(Y) =
V(X)
V(X)
= 1
A toute variable alatoire X desprance E(X) et de variance V(X) on peut associer
la variable alatoire
X E(X)
V(X)
dite variable alatoire centre rduite et dont lemploi est
indispensable pour utiliser la plupart des tables notamment les tables de la loi normale
rduite.
5.5. Gnralisation n variables alatoires
Si lon considre une preuve laquelle est associe un espace fondamental et une variable
alatoire X et si lon rpte n fois, de faon indpendante cette preuve, on obtient une suite
X
1
, X
2
,. X
n
variables alatoires qui sont :
- dfinies sur le mme espace fondamental
- de mme loi de probabilit
- indpendantes
alors : E(X
1
+ X
2
++ X
i
+. X
n
) = E(X
i
i=1
n
) (Proprit P
1
de lesprance que les
v.a. soient indpendantes ou non )
V(X
1
+ X
2
++ X
i
+. X
n
) = V(X
i
i=1
n