Vous êtes sur la page 1sur 15

Mathmatiques : Outils pour la Biologie Deug SV1 UCBL

D. Mouchiroud (10/10/2002)

Analyse combinatoire
Synthse

Rangement de n objets distincts:

Pn = n!
n! k!

permutations possibles

Rangement de n objets avec k rptitions dun mme objet :

Pn =
Rangement de p objets parmi n : sans rptition avec rptitions Tirage de p objets parmi n : sans remise avec remise

permutations possibles

An =

n! (n p)!

arrangements possibles arrangements possibles

p An = n p

Cnp =

n! p!(n p)!

combinaisons possibles

p Cn+ p1 =

n + p 1! combinaisons possibles p!(n 1)!


p

Formule de PASCAL (application au triangle de Pascal) :

Cn1 + Cn1 = Cn
n

p1

Formule du binme de NEWTON (application au calcul des probabilits dune loi binomiale)

(a + b)n =

p =0

p C n a n p b p =

p =0

p a n p b p

Probabilits
Synthse
Probabilits : P :

()

[0,1] (P1) A P(A) (P2) (P3)

A () P() = 1 A, B ()

P(A) 0

si AB = si AB Probabilits combinatoires : Additivit des probabilits : Probabilits conditionnelles : Probabilits composes : Probabilits totales: Formule de Bayes :
P( A) =

P(AB) = P(A) + P(B) P(AB) = P(A) + P(B) - P(A B)

k nombredecas favorables = n nombredecas possibles


n

si Ai Aj = avec i j alors P(U Ai ) = P(Ai )


i i =1

P( A / B) =

P( A B) avec P(B) 0 P( B)

P( A B) = P( A) P( B / A) = P( B) P( A / B)

P( B ) = P ( B / Ai ) P ( Ai )
i =1

P ( Ai / B ) =

P ( B / Ai ) P ( Ai )

P( B / A ) P( A )
i =1 i i

Indpendance statistique : A et B indpendants si

P(A B) = P(A) P(B) P(A / B) = P(A)


P( A / B) = P( A / B)

Variables alatoires
Synthse
Variable alatoire discrte
Dfinition : v.a. valeurs discontinues dans un intervalle donn : dnombrement

Loi de probabilit : soit lvnement {X = xi}, xi on associe P(X=xi) ou pi alors

p =1
i i

Reprsentation : Esprance : Variance :

diagramme en btons

E(X) =

i =1
n

x i pi
2

V (X ) = (x i E (X )) pi = xi pi E(X )
2

i =1

i =1

Variable alatoire continue


Dfinition :

v.a. valeurs continues dans un intervalle donn : mesure

Densit de probabilit : x f (x) telle que

f (x)dx = 1 et

P(a < X < b) =


Fonction de rpartition : Reprsentation : Esprance : Variance :

f (x)dx

FX (t) = P( X < t) =

f (x)dx

histogramme

E(X) =

x f (x)dx
+
2

V (X ) = (x E (X)) f (x)dx =

x f (x)dx E(X)

Indpendance entre variables alatoires


Loi dun couple X,Y : Esprance :

pij = P ((X = xi ) et (Y = yj )) quelque soit les relations entre X et Y

E(X+Y) = E(X) + E(Y)

do E(X1 + X2 ++ Xi +. + Xn ) = E(X i )
i=1

Variance :

V(X + Y) = V(X) + V(Y) + 2 cov (X,Y)

Indpendance : si X et Y sont deux variables alatoires indpendantes

E(XY) = E(X)E(Y) V(X + Y) = V(X) + V(Y) do V(X1 + X2 ++ Xi +. + Xn ) = V (X i )


i=1 n

cov(X,Y) = E(XY) - E(X)E(Y) = 0


Opration :

E(aX + b) = aE(X) + b V(aX + b) = a V(X)


2

Lois de probabilits
Synthse
Quelques lois de probabilit discrtes:
Lois Notation i, Dfinition si 1 i n Esprance si xi = i, Variance si xi = i,

Uniforme

P(X = xi ) =

1 n

E(X) =

n+1 2

n 2 1 V (X ) = 12

si

succs X = 1 chec X = 0 E(X) = p V(X) = pq

Bernoulli

B(1, p)

P(X = 0) = q P(X =1) = p avec p+q = 1

Binomiale

Sn = Xi
B(n, p)
i=1

avec X variable Bernoulli


k P(Sn = k ) = Cn p kq nk

E(Sn) = np

V(Sn) = npq

P(X = k) =
Poisson

ke
k!
E(X) = V(X) =

P()

avec > 0 avec k : nbre dpreuves

Binomiale ngative

BN
(n,p)

et n : nbre de succs, k n

E(X ) =

n p

V(X ) = n

q p2

P(X = k) = Ck1 p q
avec n = 1

n 1

n kn

Gomtrique

k1 BN (1,p) P(X = k) = pq

E(X ) =

1 p

V(X ) =

q p2

Quelques lois de probabilit continues :


Lois Notation Dfinition Esprance
E(X ) = b+ a 2

Variance

Uniforme

1 si x [a,b)] ba f (x) = 0 si x [a,b)] f (x) =


2

V(X ) =

(b a)
12

Normale

N(,)

1 x a f (x) = e 2
1

1 x 2

E(X) =

V(X) = 2

Normale rduite

N(0,1)

z a f (z) = Z= X

1 2z2 e avec 2

E(Z) = 0

V(Z) = 1

et X N(,)

Khi deux

(n)

Xi2 avec
i=1

Xi N((0,1)

E( ) = n

V( ) = 2 n

x a f (x) avec n degrs de libert

n x 1 2 e 2 = C(n)x

Student

T(n)

Tn =

U avec U N((0,1) et V n
V 2(n)

E(T) = 0 si n > 1

V(T ) =

n n 2 si n > 2

Thorme central limite


Si Sn = X1 + X2 ++ Xi + ...+ Xn est la somme de n variables alatoires indpendantes et de
mme loi alors la variable alatoire Z n =

S n n

( n )

suit une loi normale rduite N(0,1) et

ceci quelque soit la loi de probabilit suivie par les variables alatoires.

Statistique descriptive
Synthse

POPULATION

ECHANTILLON

Echantillonnage alatoire

Dduction

Caractristiques de lchantillon

Caractre discret ou continu regroup en classes :


Caractre discret : Dnombrement Caractre continu : Mesure Reprsentation graphique : Moyenne arithmtique : Variance observe : Diagramme en btons pour les caractres discrets Histogramme pour les caractres continus en classe k 1 k x = ni x i avec n = ni n i=1 i=1

1 k 1 k ni ( x i x )2 ou s 2 = ni x i2 x 2 n i =1 n i =1 avec k, le nombre de modalits diffrentes observes (ou le nombre de classes) pour X,


s2 =
ni, le nombre dobservations pour la valeur xi (ou dans la classe de valeur mdiane xi)

et n la taille de lchantillon
Ecart-type observ :
s = s exprim avec les mmes units que x
2

Caractre continu non group :


Moyenne arithmtique : Variance observe :
x=
2

1 xi n i=1
n n

1 1 2 2 2 2 s = (x i x ) ou s = xi x n i =1 n i =1

avec n la taille de lchantillon

Estimation
Synthse

Les statistiques infrentielles ou inductives peuvent se rsumer par le schma suivant :

POPULATION

p, ,

ECHANTILLON

CARACTERISTIQUE

taille n Echantillonnage alatoire

DE LECHANTILLON

f, Dduction Statistique descriptive

x , s2

Infrence statistique

Distribution dchantillonnage de la moyenne :

Effectif de lchantillon

Loi de X

Ecart-type

Loi de X

Loi rduite

n 30

Quelconque

Connu

N( ,

n n

X N(0,1) / n X N(0,1) / n

Inconnu Quelconque

N( ,

Inconnue Connu N( ,

n 30
Normale

X N(0,1) / n X T (n-1 ddl) / n

Inconnu

Distribution dchantillonnage dune frquence : K pq N(p, ) si np et nq > 10 si K B(n,p) alors n n

Proprits des estimateurs : en posant estimateur de


Convergence : Sans biais Variance minimale Estimation ponctuelle : Esprance :

lorsque n . E( ) =

V( ) = E( - E( ))2 minimale

Variance 2 si connue Variance si inconnue


2

1 n = X = Xi n i=1 1 n 2 = (X i ) 2 n i=1
n 2 1 n = s = (X i X )2 n 1 n 1 i=1
2

Frquence p :

= p

K n
et

Estimation par intervalle : P( 1 < < 2 )= 1 -


IC de lesprance :

P( [ 1 , 2 ]) =

X X t
X

n n
n

< < X + < < X + t


< < X +

n n
n

n si X N( , ) et 2 est connue n si X N( , ) et 2 est inconnue la loi de X mais n est grand

IC dune proportion p :

K n

pq K < p < + n n

pq n

n est grand et np, nq > 10

K n

q p pq K < p < + n n n

si p est inconnue

Tests dhypothse
Synthse
Rgles de dcision :
Sous lhypothse H0 est vraie si Sobs > Sseuil alors lhypothse H0 est rejete au risque derreur et lhypothse H1 est accepte si Sobs Sseuil alors lhypothse H0 ne peut tre rejete. avec Sobs statistique calcule et Sseuil statistique seuil pour un seuil de signification fix

Les risques derreur :


Dcision H0 accepte H0 rejete H0 est vraie Bonne dcision Rejet tort risque de premire espce Ralit biologique H0 est fausse Manque de puissance risque de second espce Puissance du test 1-

Test de conformit :
Comparaison dune moyenne observe x une moyenne thorique 0 H0 : = 0 H1 : 0

connue et n : Z=

X 0

2
n

N(0,1)

Calcul obs =

w x 0

2
n

comparer seuil

inconnue T=

n < 30 il faut X N(,)


2

n 30

tn-1 N(0,1) comparer tseuil n-1 ddl

X 0 n

tn-1 (Student)

Calcul tobs =

x 0
2

x 0 s2 n 1

Comparaison dune frquence observe H0 : p = p0

H1 : p p0

k une moyenne thorique p0 n


k p0 n Calcul obs = p0 q0 n

np0, nq0 10

K p0 n Z= N(0,1) p0 q0 n

comparer seu

Test dhomognit ou dgalit:


Comparaison de deux variances H0 :
2 12 = 2

H1 :

2 12 2

12 Fobs. = 2 2

n1 2 s1 2 2 = n1 1 comparer Fseuil (Fisher Sndecor) n1-1, n2-1 ddl ( 1 > 2 ) n2 2 s2 n2 1


H1 : 1 2

Comparaison de deux moyennes H0 : 1 = 2

12

et

2 2

connues :

w w Z = ( X 1 X 2 ) N(0,1) :
2 1

Calcul obs =

w w x1 x2

n1

2 2

12
n1

n2
inconnues : H0 : 1
2
=

2 2

comparer seuil

n2

12

et

T=

w w ( X1 X 2 )

2 2

2 2 = 2

t n1+n2 -2

vrifie (Homoscdasticit) n1 et n2 30 t N(0,1) w w x1 x2 Calcul t = comparer tseuil n1+n2 -2 ddl

1 1 2 + n1 n2

1 1 + n1 n2
2 2 avec 2 = n1s1 + n2 s2 n1 + n2 2

12

et

2 2

inconnues :

H1 :

2 12 2 2

vrifie (pas Homoscdasticit)

n1 et n2 30

Calcul obs =

w w x1 x2 n1 +

12

2 2 n2

w w x1 x2 s12 s2 + 2 n1 1 n2 1

comparer seuil

Comparaison de deux frquences

H0 : p 1 = p 2

H1 : p1 p2

Z=

K1 K 2 n1 n2 1 1 pq ( + ) n1 n2

N(0,1)

Calcul obs =

k1 k2 n1 n2 1 1 pq + n1 n2

comparer seuil

avec

p=

k1 + k2 n1 + n2

Tests du 2
Synthse
Statistique du 2 :

2 obs. = i =1 j =1
p

(n

ij

tij ) tij

Donnes :
suit une loi de Pearson

Tableau deffectifs

Conditions : n 50 et tij 5 Degrs de libert : (conditions vrifies) Nombre de termes du 2 nombre de contraintes

avec n =

n
i =1 j =1

ij

et tij = n * pij

Test du 2 dajustement

: q = 1 et p > 2

H0 : la distribution observe est conforme la distribution thorique


Caractre A A1 . Ai . AP Echantillon
(observs)

Hypothse nulle : H0 Loi normale Loi de poisson Loi binomiale Loi uniforme Autres lois

Degrs de libert : (loi thorique inconnue)

p 3 : (n , , ) avec =
p 2 : (n et ) avec =

x et 2 =

n 2 s n 1

n1.ni np t1. ti .tp

Population
(thoriques)

p 2 : (n et p ) avec p =

n x
i =1 p i =1

i i

n ni
p 1 : (n) p c : c = nombre de contraintes entre les deux distributions

q = 1 et p = 2

H0 : Egalit entre la frquence du succs observe


Caractre A Succs Echec Echantillon
(observs)

k et la frquence thorique : p = p0 n Degrs de libert : 1 ddl

k np0

n-k nq0

Population
(thoriques)

La valeur de la statistique du 2 est gale au carr du test : 2 = 2

Test du 2 dhomognit :
Caractre A A1 .. Ai AP (observs) Echantillon 1 . Echantillon j . Echantillon q Total

q > 2 et p > 2

H0 : Egalit des distributions du caractre A dans les diffrents chantillons


Total Caractre A Ai AP A1 .. (thoriques)

n11 .

n.1 n.j n.q n..= N

n 1 . n. 1 N

nij.. ..npq
n1. ni. np.

ni . n. j N

Degrs de libert :
(conditions vrifies)

..
n p . n. q N

(p 1)(q 1)

n1.

ni.

np.

q = 2 et p = 2

H0 : Egalit entre deux frquences observes : p1 = p2


Caractre A Succs Echec (observs) Echantillon 1 Echantillon 2 Total Caractre A Succs Echec (thoriques)

Degrs de libert : 1 ddl

k1 k2

n1-k1 n2-k2

n1 n2

n1p1 n2p2

n1q1 n2q2

La valeur de la statistique du 2 est gale au carr du test : 2 = 2

Test du 2 dindpendance : q 2 et p 2

H0 : Indpendance entre le caractre A et B


Caractre B B1 . Bj . Bq Total Caractre A A i AP A1 .. (observs) Total Caractre A Ai AP A1 .. (thoriques)

n11 .

n.1 n.j n.q n..= N

n 1 . n. 1 N

Degrs de libert :
(conditions vrifies)

nij.. ..npq
n1. ni. np.

ni . n. j N

..
n p . n. q N

(p 1)(q 1)

n1.

ni.

np.

Analyse de variance
Synthse
Objectif de lanalyse de variance : Tester leffet dun facteur A (variable quantitative contrl ou qualitative) avec p modalits sur une variable alatoire Y avec ni, nombre de rptitions de yij pour chaque modalit i de A. Hypothse : Pas deffet du facteur A H0 : 1 =...= i =.. = p= Modle : yij = + eij Effet du facteur A en moyenne H1 : i j yij = + ai + eij avec les rsidus eij N(0, ) Indpendance des p distributions Normalit de la variable tudie Homoscdasticit des p distributions

Conditions dapplication :

Dcomposition de la variation totale :

( y
i =1 j =1

ni

ij y ) = ni ( yi y ) + ( yij yi ) 2 2 i =1 i =1 j =1

ni

SCEtotale Rapport de corrlation : Tableau de variation :


Sources de variation Totale Facteur Rsiduelle Degrs de libert N-1 p-1 N-p

SCEinter 2 =

SCEintra

SCEint er compris entre 0 et 1. SCEtotale

Somme des Carrs des Ecarts SCETOT SCEinter SCEintra

Carr Moyen

Test de Fisher-Sndcor

CMinter= SCEinter / (p-1) CMintra= SCEintra / (N-p)

Fobs. =

CM int er CM int ra

Fobs compare Fseuil pour p-1 et N - p degrs de libert et le risque .


Formules dveloppes : SCETOT = SCEinter = SCEintra =

( y
i =1 j =1 p i =1 p i i

ni

2 ij y ) = yij 2 i =1 j =1 p

ni

T2 N

avec T = yij et N = ni
i =1 j =1 ni i =1

ni

n ( y y) = n
2 i =1

Ti

i ni

T N

avec Ti = yij
j =1

( y
i =1 j =1

ni

ij

2 yi ) = yij 2 i =1 j =1

Ti i =1 ni

ou

SCEintra = SCETOT - SCEinter