Vous êtes sur la page 1sur 34

Probabilits et Biostatistique

2 Variables alatoires
P incipales lois de probabilit
Principales
p obabilit

PAES Facult de Mdecine P. et M. Curie


V Morice
V.
M i

Variable alatoire

Une variable alatoire dsigne la grandeur


mesure lors d'une
d une exprience alatoire

Exemples : ge, couleur des yeux

Rsultats possibles de l'exprience valeurs


possibles
ibl de
d la
l variable
bl alatoire
l
Types de variables alatoires

Si rsultats numriques (variable quantitative)

V.a. continue : les valeurs couvrent ou un intervalle


V.a. discrte : les valeurs sont discontinues ()

Sinon (variable qualitative)

V.a. ordinale : les valeurs sont ordonnes


V.a. nominale ou catgorielle : valeurs sans ordre

V. Morice - Biostatistique PAES

Fonction de rpartition

Soit X une v.a. quantitative


On cherche une fonction dfinissant la
probabilit de tout intervalle [a
p
[ ; b]]
Soit lvnement [X x] o x est un
nombre
Pr ([X x]) dpend de la valeur x
FX(x)
( ) = F(
F(x)) = Pr
P ([X x])
]) =
fonction de rpartition de X
V. Morice - Biostatistique PAES

Fonction de rpartition :
premires proprits

FX(-) = 0
FX(+)
( )=1
a<b
P ([X b]) = Pr
Pr
P ([X a])
]) + Pr
P ([a
([ < X b])
car [X a] et [a < X b] = vnements exclusifs

FX(b) = FX(a) + Pr ([a < X b])

FX est monotone croissante


On trace la courbe en cumulant les probabilits rencontres
l
lorsque
x augmente
t

Pr ([a < X b]) = FX(b) - FX(a)

V. Morice - Biostatistique PAES

Fonction de rpartition :
exemple dune v.a. discrte

Jet dune pice : E = {p, f} ; Pr (p) = Pr (f) =


V.a. X : X(f) = 0 ; X(p) = 1
Fonction de rpartition

V. Morice - Biostatistique PAES

Fonction de rpartition :
exemple dune v.a. continue

Appel tlphonique dans lintervalle [0,T]


t =instant d
dappel
appel : Pr (t1 t t2)=(t2
t2)=(t2-t1)/T
t1)/T (t1 et t2 [0,T])
[0 T])
Fonction de rpartition

Si x<0, lappel na pas eu


lieu avant x : F(x)
( )=0
Si x >T, lappel a eu lieu
avant x : F(x) = 1
Sinon F(x)=Pr (0 t x)= x/T

V. Morice - Biostatistique PAES

Fonction de rpartition :
autres proprits

On sait Pr ([x - < X x]) = FX(x) - FX(x -)


Si x - x, Pr ([x
([ - < X x])
]) Pr ([X = x])
])
Si X est une v.a. continue

FX est continue (si x - x, FX(x


( -) FX(x))
( ))
Pour tout x, Pr ([X = x]) = 0
Pr ([
([a X b])
]) = Pr ([
([a < X < b])
])

Si X est une v.a. discrte

FX est discontinue
En chaque point x de discontinuit, la hauteur du saut
(FX(x) - FX(x -) lorsque x - x) est la probabilit de x

V. Morice - Biostatistique PAES

v.a. discrte : distribution des


probabilits

V. Morice - Biostatistique PAES

v.a. continue : densit de


probabilit

Densit de probabilit
fX ( x ) = f( x ) = dF X ( x )
dx

Fonction
F
ti d
de rpartition
titi
FX (x) = xfX (t)dt
Pr ([
([a X b])
])
= FX(b) FX(a)

= abfX (x)dx

f(x)0
f(
)0 (F croissante)
f(x)dx=Pr ([xXx+dx])
f(x)dx
( )
Pr ([X=x])
])

-f(x)dx = 1

V. Morice - Biostatistique PAES

Pour dfinir une v.a.


v.a. discrte
ou qualitative
Dfinition de la Tableau des
pi=Pr (X=xi)
loi de proba
Proprits

pi 0
n
i=1 pi = 1
Uniquement si
quantitative :
F(x) = xix pi

v.a. continue
Densit de proba f(x)
b
Pr ([a X b]) = f( x)d x=F(b) -F(a)
a

f(x) 0

f(x)dx = 1

F(x) = xf(tt)d
)dt

f(x)dx = Pr (xXx+dx)
f( )d Pr (X=x)
f(x)dx
(X )

V. Morice - Biostatistique PAES

10

Esprance mathmatique
[variable quantitative]
Moyenne au niveau de la population
Notation E(X) = X =
Calcul : somme de toutes les valeurs
pondres par leur probabilit
V.a. discrte :
E(X) = in=1xi pi

V a continue : E(X) =
V.a.

xf(x)dx

V. Morice - Biostatistique PAES

11

Esprance mathmatique :
proprits
Soient des v.a. X et Y et des constantes a, b, c
E(c) = c
E(X+c) = E(X)+c

Dmonstration du cas discret : Y=X+cc a pour valeurs yi=xxi+cc


E(X+c) = E(Y) = yiPr (Y=yi) = (xi+c)Pr (Y=yi)
Or Pr (Y=yi) = Pr (X+c=xi+c) = Pr (X = xi) = pi
Donc E((X+c)) = (x
( i+c)p
)pi = xipi + cppi = E((X))+c
Plus gnralement si Y=g(X), on a yiPr (Y=yi) = g(xi)pi

Si c = -E(X) E(X -E(X)) = E(X) - E(X) = 0


Une v.a.
va d
desprance
esprance nulle est dite centre

E(aX) = aE(X)
E(X +Y) = E(X) + E(Y)
V. Morice - Biostatistique PAES

12

Variance (et cart-type)


[variable quantitative]

Variance = mesure de la variabilit autour de lesprance


Notation var(X) = 2X = 2
Dfinition var(X) = E[(X -E(X))2]

Calcul

On ne peut utiliser E[X -E(X)] qui est nul

V.a. discrte var(X) = in=1(xi-E(X))2 pi

V.a. continue var(X) = -(x-E(X)) f(x)dx

A t dfi
Autre
dfinition
iti var((X) = E(X 2) -E(
E(X)2

Calcul

Car E[(X -E(X))2] = E[X 2-2X E(X)+E(X)2] = E(X 2)-2E(X)E(X)+E(X)2 = E(X 2) -E(X)2
2

V discrte
V.a.
di t

var((X) = in=1xi pi-E(X)2

V.a. continue

var(X) = - x2f(x)dx-E(X)2

Ecart-type
Ecart
type = X = = var(X)
V. Morice - Biostatistique PAES

13

Variance : proprits

Var(X) 0 (somme de carrs)


Variance nulle pour une constante.
constante
Variance faible pour une variable peu disperse

Si X possde une unit

Si c est une constante

E(X) ett ontt lla mme

unit
it
Var(X) a cette unit au carr
Var(c) = 0
Var(X +c)
c) = var(X)
Var(c X) = c2var(X)

Var(X +Y) = ?
V. Morice - Biostatistique PAES

14

Loi de 2 variables discrtes ou


qualitatives

X et Y, deux v.a. discrtes ou qualitatives mesurables


sur les mmes individus
EX = {x1, x2, , xn} ; Ey = {y1, y2, , ym}
Exemple :

X =sexe (x1=H ; x2=F)


Y =CSP (y1=agriculteur ; y2=ouvrier ; ; ym=retrait)

Pour parler simultanment de X et Y, il faut


considrer lespace produit :
EX Ey = {(x1,y1), (x1,y2), , (x1,ym), , (xn,ym)}
On doit se donner les probabilits de chaque couple :
Pr ([X = xi] [Y = yj]) = pxi,yj
V. Morice - Biostatistique PAES

15

Loi de 2 variables discrtes :


tableau des probabilits

X \ Y

y1

y2

ym

x1

px1,1 y1

px1,1 y2

px1,1 ym

px 1

x2

px2,y1

px2,y2

px2,ym

px 2

xn

pxn,y1

pxn,y2

pxn,ym

pxn

py 1

py 2

pym

p xi,yj = Pr ([X = xi] [Y = yj])


pxii = pxi,yj
i j ; pyjj = pxi,yj
i j
px et py sont souvent appeles lois marginales
Ce sont les lois des variables X et Y indpendamment lune de lautre

V. Morice - Biostatistique PAES

16

Covariance et corrlation
[variables quantitatives]

Var(X+Y) = E[((X+Y)-(X+Y))2] = E[((X -X)+(Y -Y))2]


= E[(X -X)2 +(Y -Y)2 +2(X -X)(Y -Y)] = X2+ Y2 +2cov(X,Y)
Premire dfinition : cov(X,Y) = E[(X -X)(Y -Y)]
Seconde dfinition : cov(X,Y) = E(XY)-X Y = E(XY)-E(X)E(Y)
car E[(X -X)(Y -Y)] = E(XY-XY-XY+X Y ) = E(XY)-X Y-X Y+X Y

Calculs pour deux variables discrtes :

cov(X,Y) = i,j(xi-X)(yj-Y) pxi,yj

cov(X,Y) = i,jxiyj pxi,yj - X Y


La covariance est une mesure de lintensit de la liaison linaire
entre deux variables
cov(X,Y)
Corrlation XY =
X Y
La corrlation est toujours entre -1
1 et 1
V. Morice - Biostatistique PAES

17

Indpendance de deux
variables alatoires

X et Y quantitatives sont indpendantes si et


seulement si les vnements [X x] et [Y y] sont

indpendants pour tout x et tout y


Pr ([X x][
] [Y y]) = Pr ([X x])
])Pr ([Y y])
FXY(x,y) = FX(x)FY(y)
o FX et FY sont les fonctions de rpartition de X et de Y, et FXY est la
fonction de rpartition du couple X, Y (dfinition)

Si X et Y sont des v.a. discrtes ou qualitatives,


lindpendance peut scrire (pour tout xi et tout yj)
P ([X = xi][
Pr
] [Y = yj]) = Pr
P ([X = xi])Pr
P ([Y = yj])
pxi,yj = pxi pyj
V. Morice - Biostatistique PAES

18

Consquences de lindpendance
l indpendance
de 2 variables quantitatives
Si X et Y sont indpendantes,
indpendantes alors :

cov(X, Y) = 0 et XY = 0
var(X + Y) = var(X ) + var(Y)
E(XY) = E(X)E(Y)
car cov(X, Y) = E(XY) - E(X)E(Y)

La rciproque est fausse


V. Morice - Biostatistique PAES

19

Loi normale N( ; 2)

Loi continue la plus importante


1 1 ( x )2
Densit
: f(x) =
e 2 2
2
E(X) =
var((X) = 2 (donc
(d
> 0)
Si X et Y sont N et indpendantes, alors aX+bY est N
C particulier
Cas
ti li N(0
(0 ; 1)

Loi centre ( = 0) et rduite ( = 1)

1 x2
f(x) =
e 2
2
V. Morice - Biostatistique PAES

20

Allure de la loi N(0 ; 1)

Courbe de la densit
Surface sous la courbe = 1
Loi symtrique
Axe de symtrie = esprance
Maximum sur laxe de
symtrie
Ecart-type = distance entre
axe de symtrie et point
d inflexion
dinflexion

V. Morice - Biostatistique PAES

21

Loi N(0 ; 1) et probabilits

Probabilit dun intervalle =


surface sous la courbe
Pr (0,5 X 2) = 0,312 =
surface grise
Calcul = intgration de f(x)
???
Des tables numriques
donnent les rsultats
Pr (-2 X 2) 0,95

V. Morice - Biostatistique PAES

22

Loi N( ; 2) : influence de

V. Morice - Biostatistique PAES

= 1 pour les 3 courbes


Lallure de la courbe se
conserve si on change
de moyenne
Il sagit dun simple
dcalage

23

Loi N( ; 2) : influence de

V. Morice - Biostatistique PAES

= 0 pour les 3 courbes


La courbe saplatit si
Elle se resserre si
Le maximum ssajuste
ajuste
pour que la surface = 1
Le maximum peut
dpasser 1

24

Loi N( ; 2) et probabilits
Soit X N( ; 2). On cherche Pr (a X b)
Seule
S l N(0 ; 1) estt tabule
t b l
X
Mais Y =
N(0 ; 1)

O va centrer
On
t
ett rduire
d i pour obtenir
bt i la
l probabilit
b bilit
a - X - b -

Pr(a X b) = Pr(
)

Posons c = a - et d = b -

Alors Pr (a X b) = Pr (c Y d)
La probabilit sur Y se lit dans la table de la loi
normale centre rduite
V. Morice - Biostatistique PAES

25

Loi du chi-deux

Famille de lois drives de

Si X1

2
(n)

N(0 ; 1)

N(0 ; 1), alors X = X12 2(1)


Si X1, X2, , Xn N(0 ; 1) et sont indpendantes,
alors X = X12 + X22 + + Xn2 2(n)
n est le nombre de degrs
g
de libert ((ddl))
X0
E(X) = n, var(X) = 2n
La probabilit dun intervalle est donne par une
table (qui dpend du ddl)
V. Morice - Biostatistique PAES

26

Allure de la loi du

Exemples avec un ddl n = 1, 2, et 8


Courbes = densits de probabilit
Si n > 2, la courbe prsente un maximum
en n 2
Si n augmente, la courbe se rapproche
dune loi normale

V. Morice - Biostatistique PAES

27

Loi de Bernoulli

Base des lois discrtes ou qualitatives


Exprience

deux rsultats

possibles succs
et chec

Variable de Bernoulli : X(chec) = 0, X(succs) = 1


Pr (succs)
= Pr ([X = 1]) =
Pr (chec) = Pr ([X = 0]) = 1
E(X) = 1 + (1 - ) 0 =
var(X) = E(X 2) E(X)2

E(X 2) = 12 + (1 - ) 02 =
var(X) = - 2 = (1 - )

V. Morice - Biostatistique PAES

28

Loi binomiale B(n, )

Construite sur n expriences de Bernoulli


indpendantes ( ne change pas entre les
preuves)
La variable X est le nombre de succs p
parmi les n
expriences (valeur entre 0 et n)
La p
probabilit davoir exactement k succs est
n! k(1)nk
Pr(X =k) = kn k(1)nk =
k!(nk)!

()

( kn) est le nombre de manires dobtenir k succs parmi n


k(1-)n-k est la probabilit den obtenir une

E((X) = n ; var((X) = n(1( ))

V. Morice - Biostatistique PAES

29

Loi de Poisson

Loi concernant la ralisation dvnements

Faiblement probables (loi des vnements rares)


Indpendants
Exemples : accidents, files dattente, ruptures de stock

La variable X est le nombre de ralisations de lvnement


La loi dpend dun paramtre ( > 0)
La probabilit d
davoir
avoir k ralisations de lvnement
l vnement rare est
k

Pr(X =k) = e

k!
LLe nombre
b kd
de ralisations
li ti
varie
i entre
t 0 ett ( loi
l i binomiale)
bi
i l )

E(X) = ; var(X) = ; Pr(X=0) = e


Si X1Poisson(1),
) X2Poisson(2),
) X1 et X2 indpendantes,
indpendantes
alors X=X1+X2 Poisson(1 +2)
V. Morice - Biostatistique PAES

30

Approximations d
dune
une loi
binomiale B(n, )
X B(n, )

Approximation par une loi normale

Conditions : n 5 et n(1-) 5

Variable pour llapproximation


approximation Y

N(n ; n(1
(1- ))

On a Pr ([X=k]) Pr ([k - 0,5 Y k + 0,5])


Les probabilits Pr([Y <0]) et Pr ([Y > n]) sont faibles, mais
non nulles
ll

Approximation par une loi de Poisson

Conditions : < 0,1 et n 50


Variable pour lapproximation Y Poisson( = n)
On a Pr ([X=k]) Pr ([Y=k])
L probabilit
La
b bilit Pr
P ([Y > n])
]) estt faible,
f ibl mais
i non nulle
ll
V. Morice - Biostatistique PAES

31

Approximation d
dune
une loi de
poisson par une loi normale

X Poisson()

Conditions : > 25
Variable pour lapproximation
Y N( ; )

On a Pr ([X=k]) Pr ([k - 0,5 Y k + 0,5])

V. Morice - Biostatistique PAES

32

Loi de Poisson et risque sanitaire


pas encore observ

Aprs 10.000 prescriptions d'un nouveau


mdicament pas d
mdicament,
d'effet
effet indsirable
Que se passera-t-il aprs 1.000.000
prescriptions ?
= risque individuel d'effet indsirable,
inconnu mais faible
Sur n individus, si X est le nombre d'effets
indsirables observs, X B(n, )

faible, n grand : X Poisson( = n)


Pr(X=0)
(
) = e- = e-n
V. Morice - Biostatistique PAES

33

Loi de Poisson et risque sanitaire


pas encore observ (2)

Que peut-on dire de qui soit compatible avec la non


observation d'effet indsirable sur n individus ?
Rgle : il n'est pas raisonnable d'imaginer ne pas observer
d'effet indsirable si la probabilit de cette non observation est
infrieure 5%
Si X=0
X 0 sur n individus,
i di id
Pr(X=0)=
P (X 0) e-n0,05
0 05
n 3 3/n
La non observation d'effet indsirable sur n individus est
compatible avec un risque individuel 3/n
Si n=10000 prescriptions sans effet indsirable, et
=3/n=310-4

Avec 1.000.000
1 000 000 de prescriptions on ss'attend
attend 300 effets
indsirables
Ce qui est norme

V. Morice - Biostatistique PAES

34

Vous aimerez peut-être aussi