Vous êtes sur la page 1sur 87

Principe Adequation Independance Cas part.

Test du 2 :
test dindependance et test dhomogeneite
PCEM2 Biostatistique

Pr. Nicolas MEYER


Laboratoire de Biostatistique et Informatique Medicale
Fac. de Medecine de Strasbourg

Fevrier 2011
Principe Adequation Independance Cas part.

Site internet du LBIM

http ://udsmed.u-strasbg.fr/labiostat/spip.php ?article2


Principe Adequation Independance Cas part.

Plan

1 Principe du test

2 2 dadequation
Comparaison dune proportion a une reference
Comparaison dune repartition a une repartition theorique

3 2 dindependance
Comparaison de deux proportions observees
Comparaison de plus de deux proportions
Comparaison de plusieurs multinomiales

4 Cas particuliers
Cas des series appariees
Cas des petits effectifs
Principe Adequation Independance Cas part.

Plan

1 Principe du test

2 2 dadequation

3 2 dindependance

4 Cas particuliers
Principe Adequation Independance Cas part.

Contexte

Cours precedent : comparaison de deux proportions

peut se formaliser differement


comme la comparaison de la repartition de deux distributions
binomiales
peut setendre a plus de deux proportions : comparaisons de
trois proportions de succes
peut setendre a la comparaisons de distributions
multinomiales : au moins deux groupes ayant au moins deux
modalites pour chaque variable : comparaison de la repartition
de lintensite dun symptome en 3 classes selon lexposition a
trois toxiques differents
Principe Adequation Independance Cas part.

Notion de tableau de contingence

Exemple : Comparaison de deux proportions


dans les cours precedents : pA = 110/200 et pB = 80/190 et
comparaison (( directe )) par le test z
Une autre presentation est possible :
Principe Adequation Independance Cas part.

Notion de tableau de contingence

Exemple : Comparaison de deux proportions


dans les cours precedents : pA = 110/200 et pB = 80/190 et
comparaison (( directe )) par le test z
Une autre presentation est possible :

TMT A TMT B Total


Succes 110 80 190
Echecs 90 110 200
Total 200 190 390

Soit un tableau a 4 cases.


Principe Adequation Independance Cas part.

Notion de loi multinomiale

Rappel :
la loi binomiale : B(n; p) : nombre de succes parmi n sujets
ayant chacun une probabilite p davoir un succes.
si resultat de lexperience aleatoire a plus que deux issues (donc
autre que succes-echec) loi multinomiale
Ex. : groupes sanguins : un sujet appartient a lun des 4 groupes
possibles.
modelise par la loi multinomiale
distribution multinomiale : quand les sujets peuvent etre classes
dans une parmi plus de deux modalites.
Principe Adequation Independance Cas part.

Notion de table de contingence

Forme generale : un tableau donnant le croisement de deux


variables multinomiales

F1 F2 F3 F4 F5
Gr .1 ... ... ... ... ... n1.
Gr .2 ... ... ... ... ... n2.
Gr .3 ... ... ... ... ... n3.
Gr .4 ... ... ... ... ... n4.
Total n.1 n.2 n.3 n.4 n.5 n..
Principe Adequation Independance Cas part.

Notion de table de contingence

Forme generale du tableau de contingence (TC)


I lignes et J colonnes soit I J cases ou cellules
deux marges : effectifs marginaux / distributions marginales
cellules indexees par ligne i et colonne j : cij
un effectif par case : nij
ni .
un effectif marginal en ligne :
un effectif marginal en colonne : n.j
un effectif total n..
Dans la case i ,j , il y a nij sujets ayant la caracteristique i de la
variable de ligne et la caracteristique j de la variable en colonne.
Principe Adequation Independance Cas part.

Exemple 1 : cas general

Soit un tableau de I lignes et de J colonnes.


On note nij leffectif de la cellule i ,j , avec i (1, . . . ,I ) et
j (1, . . . ,J )

1 ... j ... J
1 ... ... ... ... ... n1.
... ... ... ... ... ...
i ... ... nij ... ... ni.
... ... ... ... ... ...
I ... ... ... ... ... nI .
Total n.1 n.j n.J
Principe Adequation Independance Cas part.

Exemple 2 : cas le plus courant

Pour un tableau de deux lignes et deux colonnes :

col. 1 col. 2 total


ligne 1 n11 n12 n1.
ligne 2 n21 n22 n2.
total n.1 n.2 n..
Principe Adequation Independance Cas part.

Taille du tableau et degres de liberte

Notion de degres de liberte (ddl)

soit une table 2 2 : une fois les marges et une case connues,
on peut completer le tableau un ddl, pour la case a fixer
pour une table 3 3 : une fois les marges connues, il faut fixer
4 cases pour pouvoir determiner les 5 cases restantes : 4 ddl
loi du 2 : caracterisee par des ddl

calcul du nombre de ddl pour un tableau de taille I J :


nddl = (I 1) (J 1)
Principe Adequation Independance Cas part.

Contexte et commentaires

Utilisation du TC :
le tableau contient generalement des effectifs et pas des
proportions
comparer deux proportions comparer deux series deffectifs
dans le test du 2 , on compare des repartitions deffectifs
(entre 0 et ) et pas directement des proportions (entre 0 et
1)
une proportion = rapport de deux nombres : succes / echec
mais la question est la meme : les proportions different-elles ?
Principe Adequation Independance Cas part.

Construction du test

On souhaite comparer deux proportions observees


les effectifs observes subissent des fluctuations dechantillonnage
sous H0 la repartition des effectifs en lignes est identique dune
colonne a lautre et vice-versa.
Principe Adequation Independance Cas part.

Construction du test

On souhaite comparer deux proportions observees


les effectifs observes subissent des fluctuations dechantillonnage
sous H0 la repartition des effectifs en lignes est identique dune
colonne a lautre et vice-versa.
Par exemple, sous egalite parfaite (H0 ) on observe :

col. 1 col. 2 total


ligne 1 10 10 20
ligne 2 84 84 168
total 94 94 188
Principe Adequation Independance Cas part.

Construction du test

On souhaite comparer deux proportions observees


les effectifs observes subissent des fluctuations dechantillonnage
sous H0 la repartition des effectifs en lignes est identique dune
colonne a lautre et vice-versa.
Par exemple, sous egalite parfaite (H0 ) on observe :

dans cet exemple :


col. 1 col. 2 total
la repartition en colonne est la
ligne 1 10 10 20 meme dune ligne a lautre
ligne 2 84 84 168 la repartition en ligne est la
total 94 94 188 meme dune colonne a lautre
Principe Adequation Independance Cas part.

Attention !
Legalite des repartitions en ligne et en colonnes est une egalite en
proportion et pas en effectifs ! Par exemple :
Principe Adequation Independance Cas part.

Attention !
Legalite des repartitions en ligne et en colonnes est une egalite en
proportion et pas en effectifs ! Par exemple :

col. 1 col. 2 total


ligne 1 10 5 15
ligne 2 84 42 126
total 94 47 141
Principe Adequation Independance Cas part.

Attention !
Legalite des repartitions en ligne et en colonnes est une egalite en
proportion et pas en effectifs ! Par exemple :

col. 1 col. 2 total


0,106 0,106 0,106
0,894 0,894 0,894
col. 1 col. 2 total 1 1 1
ligne 1 10 5 15
ligne 2 84 42 126
total 94 47 141
Principe Adequation Independance Cas part.

Attention !
Legalite des repartitions en ligne et en colonnes est une egalite en
proportion et pas en effectifs ! Par exemple :

col. 1 col. 2 total


0,106 0,106 0,106
0,894 0,894 0,894
col. 1 col. 2 total 1 1 1
ligne 1 10 5 15
ligne 2 84 42 126 col. 1 col. 2 total
total 94 47 141 0,667 0,333 1
0,667 0,333 1
0,667 0,333 1
Principe Adequation Independance Cas part.

Construction du test

Sous H0 : egalite des repartitions en lignes / colonnes


Les effectifs observes sont tels que les proportions different
numeriquement
le test suppose la comparaison des effectifs observes et des
effectifs sous H0
comment obtenir les effectifs sous H0 , i.e. effectifs theoriques
(attendus) sous H0 ?
Principe Adequation Independance Cas part.

Construction du test
Comment obtenir les effectifs theoriques ?
en labsence de difference entre les repartitions entre lignes /
entre colonnes, les meilleures estimations des proportions de succes
/ echec sont obtenues a partir des effectifs marginaux.
sil ny a pas de difference entre les groupes, les repartitions en
lignes / colonnes sont en moyenne identiques entre elles et
identiques a la distribution marginale ligne/colonne
Principe Adequation Independance Cas part.

Construction du test
Comment obtenir les effectifs theoriques ?
en labsence de difference entre les repartitions entre lignes /
entre colonnes, les meilleures estimations des proportions de succes
/ echec sont obtenues a partir des effectifs marginaux.
sil ny a pas de difference entre les groupes, les repartitions en
lignes / colonnes sont en moyenne identiques entre elles et
identiques a la distribution marginale ligne/colonne

col. 1 col. 2 total


ligne 1 10 5 15
ligne 2 84 42 126
total 94 47 141
Principe Adequation Independance Cas part.

Construction du test

(.../... Comment obtenir les effectifs theoriques ?)


sous H0 , les repartitions marginales doivent etre identiques pour
chaque ligne/colonne
donc leffectif theorique dune cellule sous H0 est la valeur
attendue sous H0
les valeurs attendues obtenues sous H0 sont estimees a partir du
produit des marges
soit une repartition de chaque ligne/colonne au prorata de
chaque colonne/ligne
Principe Adequation Independance Cas part.

Construction du test

Soit sur un tableau :


Principe Adequation Independance Cas part.

Construction du test

Soit sur un tableau :

col. 1 col. 2 total


ligne 1 e11 o1.
ligne 2 o2.
total o.1 o.2 o..
Principe Adequation Independance Cas part.

Construction du test

Soit sur un tableau :

col. 1 col. 2 total sous H0 : e11 = o1. o.1 /o..


ligne 1 e11 o1. de facon generale :
ligne 2 o2. eij = oi . o.j /o..
total o.1 o.2 o..
Principe Adequation Independance Cas part.

Construction du test

Soit pour un tableau a 4 cases :

col. 1 col. 2 total


o1. o.1 o1. o.2
ligne 1 e11 = o.. e12 = o.. o1.

o2. o.1 o2. o.2


ligne 2 e21 = o.. e22 = o.. o2.
total o.1 o.2 o..
Principe Adequation Independance Cas part.

Construction du test

On se retrouve avec deux tableaux !


Principe Adequation Independance Cas part.

Construction du test

On se retrouve avec deux tableaux !


valeurs observees

col. 1 col. 2 total


ligne 1 o11 o12 o1.
ligne 2 o21 o22 o2.
total o.1 o.2 o..
Principe Adequation Independance Cas part.

Construction du test

On se retrouve avec deux tableaux !


valeurs observees valeurs theoriques

col. 1 col. 2 total col. 1 col. 2 total


ligne 1 o11 o12 o1. ligne 1 e11 e12 o1.
ligne 2 o21 o22 o2. ligne 2 e21 e22 o2.
total o.1 o.2 o.. total o.1 o.2 o..

Un tableau de valeurs observees et un tableau de valeurs theoriques


ou attendues sous H0
Principe Adequation Independance Cas part.

Construction du test

Le probleme de la comparaison de deux proportions devient le


probleme de la comparaison de deux repartitions
qui se ramene a la comparaison de deux tableaux : lun observe
et lautre theorique
Comment calculer lecart entre ces deux tableaux ?

dans une cellule ij , ecart entre obs et theo :

(oij eij )2
eij
Principe Adequation Independance Cas part.

Construction du test

cet ecart par cellule est somme sur lensemble des cellules :
X (oij eij )2

ij
eij

(oij eij )2
on montre que eij N (0 ; 1)
or une somme de N (; ) 2

test du 2
la comparaison de la repartition des lignes et des colonnes dun
tableau se fait par un test du 2 a k ddl.
Principe Adequation Independance Cas part.

Construction du test

Synthese : la logique du test :

en labsence de difference de repartition (i.e. absence de


difference de proportions), les valeurs observees sont egales
aux valeurs theoriques sur lensemble des cellules
P (oij eij )2
Donc, sous H0 : oij = eij , i ,j et ij eij =0
Si H0 est fausse :
les ecarts sont dautant plus importants que les distributions
different et donc :
plus les proportions / repartitions different
plus les ecarts oij eij augmentent
plus la valeur de 2 augmente
Principe Adequation Independance Cas part.

Construction du test
La valeur du 2obs sera comparee a une valeur seuil 2
Principe Adequation Independance Cas part.

Construction du test

Les hypotheses du test :


H0 : les repartitions en lignes / en colonnes ne different pas
H1 : les repartitions en lignes / en colonnes different
formulation generale, a adapter a chaque cas
La procedure :
remplir le tableau de contingence
calculer le nombre de degres de liberte
calculer les effectifs theoriques
calculer la valeur du 2obs
si 2obs > 2ddl;seuil : on rejette H0
sinon, on ne rejette pas H0
Principe Adequation Independance Cas part.

Remarques

(1) Conditions dapplication du test du 2 : tous les eij > 5

(2) dans le cas dune table 2 2, i.e. cas de la comparaison de


deux proportions : les deux tests sont strictements equivalents et
2obs = (zobs )2
Principe Adequation Independance Cas part.

Plan

1 Principe du test

2 2 dadequation
Comparaison dune proportion a une reference
Comparaison dune repartition a une repartition theorique

3 2 dindependance

4 Cas particuliers
Principe Adequation Independance Cas part.

Notion dadequation

comparaison dune proportion observee et dune proportion


theorique
comparaison dune distribution multinomiale observee et dune
multinomiale theorique
notion dadequation entre observation et theorie pre-existante
test dune loi de probabilite : une serie de valeur suit-elle une loi
multinomiale, une loi de Poisson, une loi de Gauss, etc ?
Principe Adequation Independance Cas part.

Notion dadequation

comparaison dune proportion observee et dune proportion


theorique
comparaison dune distribution multinomiale observee et dune
multinomiale theorique
notion dadequation entre observation et theorie pre-existante
test dune loi de probabilite : une serie de valeur suit-elle une loi
multinomiale, une loi de Poisson, une loi de Gauss, etc ?
Dans le cas dun 2 dadequation :
les effectifs theoriques sont connus par ailleurs (donnes par la
theorie) et il nest pas necessaire de les definir a partir des donnees
observees
Principe Adequation Independance Cas part.

1 prop/ref

Plan

1 Principe du test

2 2 dadequation
Comparaison dune proportion a une reference
Comparaison dune repartition a une repartition theorique

3 2 dindependance

4 Cas particuliers
Principe Adequation Independance Cas part.

1 prop/ref

Comparaison proportion observee / proportion theorique

On souhaite comparer une proportion observee et une proportion


theorique (exemple de la loi de Mendel)
Les effectifs theoriques du tableau et du test sont deja connus
par construction : la loi de Mendel fournit les valeurs attendues
il est inutile de calculer les valeurs theoriques a partir des valeurs
observees
Principe Adequation Independance Cas part.

1 prop/ref

Comparaison dune proportion a une reference

On obtient donc le tableau suivant :

Effectifs observes Effectifs Theoriques


ligne 1 130 0,75 200 = 150
ligne 2 70 0,25 200 = 50
total 200 200
Principe Adequation Independance Cas part.

1 prop/ref

Realisation du test

Les hypotheses du test :


H0 : la repartition observee des phenotypes ne differe pas de la
repartition theorique
H1 : la repartition observee des phenotypes differe de la
repartition theorique
La procedure :
remplir le tableau de contingence X
calculer le nombre de degre de liberte = 1 (I-1)
calculer les effectifs theoriques X
calculer la valeur du 2obs :

(130 150)2 (70 50)2


+ = 10,67
150 50
Principe Adequation Independance Cas part.

1 prop/ref

2obs > 2seuil au risque = 5% puisque 10,67 > 3,84 :


donc on rejette H0

Donc on rejette lhypothese dadequation des donnees a la


repartition theorique et on peut considerer que le gene etudie na
pas une transmission mendelienne.

Remarque : 10,67 = (3,27)2 , 2obs = z 2 (voir cours prop.)


Principe Adequation Independance Cas part.

1 rep/theorique

Plan

1 Principe du test

2 2 dadequation
Comparaison dune proportion a une reference
Comparaison dune repartition a une repartition theorique

3 2 dindependance

4 Cas particuliers
Principe Adequation Independance Cas part.

1 rep/theorique

Comparaison multinomiale observee / theorique


Repartition des groupes sanguins (Beuscart et al. ) dans la
population francaise : connue tres fiablement par les dons du sang.
La repartition des groupes sanguins au pays basque sur un
echantillon de 150 sujets
Frequences theoriques :

0 A B AB total
Pop. francaise 0,42 0,45 0,09 0,04

Effectifs theoriques et observes :

0 A B AB total
Eff. observes 81 64 4 0 150
Eff. attendus 63,0 67,5 13,5 6,0 150
Principe Adequation Independance Cas part.

1 rep/theorique

Comparaison multinomiale observee / theorique


H0 : la frequence des groupes sanguins ne different pas entre la
population basque et la population francaise
H1 : la frequence des groupes sanguins different entre la
population basque et la population francaise
Les effectifs theoriques > 5, ddl=3 (I-1).
le 2obs vaut :

(81 63)2 (64 67,5)2 (4 13,5)2 (0 6)2


+ + + = 17,92
63 67,5 13,5 6

pour un = 0,05 et avec 3 ddl, le 2seuil = 7,815


Donc 2obs > 23; donc rejet de H0 et on conclut que la
repartition des groupes sanguins dans la population basque differe
de celle dans la population francaise.
Principe Adequation Independance Cas part.

1 rep/theorique

Retour sur le contexte dutilisation


exemple precedent : comparaison dune distribution multinomiale
observee et dune multinomiale theorique
illustre la notion dadequation entre observation et theorie
pre-existante
applicable pour tester une loi de probabilite : une serie de valeur
suit-elle une loi multinomiale specifiee, une loi de Poisson, une loi
de Gauss, etc ?
Exemple sur une loi de Gauss : soit une concentration serique sur
n patient.
definir des intervalles dinterets, par ex. 10, 20, 30, 40, 50
UI/mL
determiner la proportion de sujets attendus ayant une
concentration entre deux valeurs, a partir dune moyenne et
dune variance theoriques
comparer les proportions theoriques et observees par un 2
Principe Adequation Independance Cas part.

Plan

1 Principe du test

2 2 dadequation

3 2 dindependance
Comparaison de deux proportions observees
Comparaison de plus de deux proportions
Comparaison de plusieurs multinomiales

4 Cas particuliers
Principe Adequation Independance Cas part.

2 prop obs.

Plan

1 Principe du test

2 2 dadequation

3 2 dindependance
Comparaison de deux proportions observees
Comparaison de plus de deux proportions
Comparaison de plusieurs multinomiales

4 Cas particuliers
Principe Adequation Independance Cas part.

2 prop obs.

Comparaison de deux proportions observees

Peut se faire par un test z (voir cours precedent)


plus frequemment realise par un test du 2

X Procedure du test :
poser les hypotheses comme avec le test z
calculer les effectifs theoriques
calculer la valeur du 2obs
comparer a la valeur seuil du 2
rejet ou non de H0 selon la comparaison
Principe Adequation Independance Cas part.

2 prop obs.

Exemple

(A partir de lexemple donne avec le test z , soit 52 et 38% de taux


de succes)

TMT A TMT B Total


Succes 26 19 45
Echecs 24 31 55
Total 50 50 100

.../...
Principe Adequation Independance Cas part.

2 prop obs.

Exemple
.../...
effectifs attendus sous H0 :

TMT A TMT B Total


Succes 22,50 22,50 45
Echecs 27,50 27,50 55
Total 50 50 100

Valeur de la statistique de test :

(26 22,50)2 (19 22,50)2 (24 27,50)2 (31 27,50)2


2obs = + + +
22,50 22,50 27,50 27,50

2obs = 0,544 + 0,544 + 0,445 + 0,445 = 1,980


Principe Adequation Independance Cas part.

2 prop obs.

Exemple

donc : 2obs < 2seuil puisque 2seuil = 3,84 pour 1 ddl


on ne rejette pas H0 et on ne met pas en evidence de difference
entre les deux traitements
Principe Adequation Independance Cas part.

> 2 proportions

Plan

1 Principe du test

2 2 dadequation

3 2 dindependance
Comparaison de deux proportions observees
Comparaison de plus de deux proportions
Comparaison de plusieurs multinomiales

4 Cas particuliers
Principe Adequation Independance Cas part.

> 2 proportions

Comparaison de plus de deux proportions

On souhaite comparer les taux de succes de trois traitements


simultanement :
On observe les donnees suivantes :

TMT A TMT B TMT C Total


Succes 26 19 32 77
Echecs 24 31 18 73
Total 50 50 50 150

Les hypotheses sont : H0 les taux de succes sont identiques dans


les trois populations et H1 au moins une des populations a un taux
de succes different des autres
Principe Adequation Independance Cas part.

> 2 proportions

Comparaison de plus de deux proportions

Les effectifs theoriques sont les suivants :

TMT A TMT B TMT C Total


Succes 25,67 25,67 25,67 77
Echecs 24,33 24,33 24,33 73
Total 50 50 50 150

La valeur du obs :
obs = 0,004 + 1,732 + 1,563 + 0,005 + 1,826 + 1,648 = 6,778
pour un seuil a 5% = 5,99 on rejette H0 et on conclut que
lun au moins des traitements differe des autres.
Principe Adequation Independance Cas part.

multinom.

Plan

1 Principe du test

2 2 dadequation

3 2 dindependance
Comparaison de deux proportions observees
Comparaison de plus de deux proportions
Comparaison de plusieurs multinomiales

4 Cas particuliers
Principe Adequation Independance Cas part.

multinom.

Comparaison de plusieurs multinomiales

Le test du 2 peut se generaliser a la comparaison de plus de


deux multinomiales (distribution a plus de deux modalites).
comparaison de levolution dune pathologie articulaire
(aggravation, amelioration, stabilite) en fonction de trois types de
traitements A, B et C.
a noter : les echantillons doivent etre independants ! On ne peut
a priori pas comparer la frequence de plusieurs effets secondaires
entre deux ou trois medicaments car un sujet peut avoir plusieurs
effets secondaires avec le meme medicament. Le cas des
echantillons non-independants sera vu plus loin dans le cas de deux
series appariees.
Principe Adequation Independance Cas part.

multinom.

Comparaison de plusieurs multinomiales

Soit le tableau suivant :

Evolution TMT A TMT B TMT C Total


Amelioration 16 20 32 68
Stabilisation 24 31 18 73
Aggravation 20 10 19 49
Total 60 61 69 190

Les hypotheses sont : H0 : levolution est identique pour les trois


traitements et H1 : au moins un des traitements se caracterise par
une evolution differente
On souhaite faire un test au risque = 0,02
Principe Adequation Independance Cas part.

multinom.

Comparaison de plusieurs multinomiales

Les valeurs theoriques sont les suivantes :

Evolutions TMT A TMT B TMT C Total


Amelioration 21,47 21,83 24,69 68
Stabilisation 23,05 23,44 26,51 73
Aggravation 15,47 15,73 17,79 49
Total 60 61 69 190

6149
Avec par exemple : e32 = 190 = 15,73
Principe Adequation Independance Cas part.

multinom.

Comparaison de plusieurs multinomiales

2obs = 1,395 + 0,154 + 2,161 + 0,039 + 2,441 + 2,732 + 1,324 +


2,088 + 0,082 = 12,416
le nombre de ddl = (3 1) (3 1) = 4
la valeur seuil du 24;=2% = 11,67
Rem : la valeur seuil du 24;=1% = 13,28
donc on rejette lH0 au seuil choisi
Principe Adequation Independance Cas part.

multinom.

Remarques diverses

Comparaisons de plusieurs multinomiales

probleme des comparaisons multiples et de localisation de la


ou des differences apres un test significatif
probleme egalement pour les comparaisons des taux de succes
de plusieurs populations
pas de solutions simples
Principe Adequation Independance Cas part.

Plan

1 Principe du test

2 2 dadequation

3 2 dindependance

4 Cas particuliers
Cas des series appariees
Cas des petits effectifs
Principe Adequation Independance Cas part.

Series appariees

Plan

1 Principe du test

2 2 dadequation

3 2 dindependance

4 Cas particuliers
Cas des series appariees
Cas des petits effectifs
Principe Adequation Independance Cas part.

Series appariees

Series appariees sur var. qualitatives

series appariees : repetition dune mesure sur un meme sujet


mesure qualitative : presence/absence dune caracteristique
a deux temps differents : avant-apres application dun
traitement
sur deux organes (paires : poumons),
sur deux prelevements sur un meme organe : deux biopsies
hepatiques
en epidemiologie : sujets apparies etude cas-temoins
Principe Adequation Independance Cas part.

Series appariees

Series appariees sur var. qualitatives

Exemple dun traitement applique sur les deux mains (pommade


corticode pour un eczema)

Gauche Droite
Amelioration O1 O3
Pas damelioration O2 O4
Total n n 2n

Les hypotheses testees sont :


D = G
D 6= G
Principe Adequation Independance Cas part.

Series appariees

Series appariees sur var. qualitatives

La comparaison de ces deux proportions (D et G ) ne peut pas


se faire avec le test du 2 indique precedemment en raison de la
non-independance des donnees
dans une serie appariee, les resultats sur lune des series
dependent des resultats sur lautre serie
les conditions dapplications (independance des mesures) ne sont
donc pas presentes
changer la presentation des donnees et tenir compte de la
dependance des donnees
Principe Adequation Independance Cas part.

Series appariees

Series appariees sur var. qualitatives

Cote Gauche
Cote Droit Amelioration Pas damelioration
Amelioration a c a +c
Pas damelioration b d
Total a +b n

Avec :
amelioration a droite : pD = (a + c)/n
amelioration a gauche : pG = (a + b)/n
Principe Adequation Independance Cas part.

Series appariees

Series appariees sur var. qualitatives

Dou la comparaison :

D = G
D 6= G
mais avec les valeurs observees suivantes :
pD = (a + c)/n
pG = (a + b)/n

La comparaison doit tenir compte des paires concordantes et des


paires discordantes
.../...
Principe Adequation Independance Cas part.

Series appariees

Series appariees sur var. qualitatives

.../...
paires concordantes : les deux cotes donnent le meme resultat
(succes-succes ou echec-echec)
paires discordantes : les deux cotes donnent un resultat
different (succes-echec ou vice-versa)
Les paires concordantes napportent pas dinformation sur la liaison
entre la maladie et le traitement : pour ces paires, le taux de
succes ne differe pas.
Principe Adequation Independance Cas part.

Series appariees

Series appariees sur var. qualitatives

Cote Droit Cote gauche nombre de paires


S S a
E S b
S E c
E E d
Total = n

Principe si H0 vraie : nb. paires (S,E) = nb paires (E,S)


tester si proportion de paires (S,E) (equiv. (E,S)) 6= 1/2
soit comparaison proportion observee et proportion theorique
Principe Adequation Independance Cas part.

Series appariees

Series appariees sur var. qualitatives

Realisation du test :

(E,S) (S,E)
Effectifs observes b c
b+c b+c
Effectifs theoriques 2 2

Total = n

Dou la valeur du 2 :

b+c 2 b+c 2 bc 2 cb 2
   
b c +
2obs;s.a. = b+c
2
+ b+c
2
= 2
b+c
2

2 2 2

.../...
Principe Adequation Independance Cas part.

Series appariees

Series appariees sur var. qualitatives

.../... et in fine :

(b c)2
2obs;s.a. =
b+c

le nombre de ddl dun test 2 pour series appariees = 1


b+c
conditions dapplication : 2 >5
Principe Adequation Independance Cas part.

Series appariees

Series appariees sur var. qualitatives

Exemple : etude epidemiologique, comparaison a lexposition a un


toxique entre cas (cancer) et temoin (meme service, pathologie
non cancereuse). On observe :

Temoins
Cas Exposes Non Exposes Total
Exposes 31 8 39
Non Exposes 10 42 52
Total 41 50 91
Principe Adequation Independance Cas part.

Series appariees

Series appariees sur var. qualitatives

Procedure du test :
on pose H0 et H1 la frequence dexposition au toxique ne
differe pas / differe entre les cas et les temoins X
on fixe le risque (par exemple 10%) X
verification des conditions dapplication : (8 + 10)/2 > 5 X
calcul de 2obs;s.a. = (8 10)2 /(8 + 10) = 0,22 X
comparaison au 2seuil pour le risque choisi : 2seuil = 2,706 X
comparaison : 2obs;s.a. < 2seuil : on ne rejette pas H0
conclusion : on ne met pas en evidence une difference de
frequence dexposition au toxique entre les cas et les temoins
Principe Adequation Independance Cas part.

Petits effectifs

Plan

1 Principe du test

2 2 dadequation

3 2 dindependance

4 Cas particuliers
Cas des series appariees
Cas des petits effectifs
Principe Adequation Independance Cas part.

Petits effectifs

Cas des petits effectifs

Dans certaines situations, effectifs tres petits :


dosage tres couteux
animaux (( particuliers ))
maladie rare
protocole complexe et long
etc
Conditions de validite du test du 2 pas toujours respectees
Principe Adequation Independance Cas part.

Petits effectifs

Cas des petits effectifs

Utilisation directe des probabilites par le test exact de Fisher

A B
Succes a b m1
Echec c d m2
Total n1 n2 n

une fois les marges fixees et une case fixee, on connait toutes les
autres valeurs du tableau
loi hypergeometrique : constitution dun echantillon sans remise
dans lurne.
Principe Adequation Independance Cas part.

Petits effectifs

Cas des petits effectifs


on peut calculer la probabilite davoir n11 = a sachant les marges
n1 !n2 !m1 !m2 !
Soit la V.A. A associee a leffectif a : Pr (A = a) = a!b!c!d!n!

Principe et procedure du test :


on test un ecart a lequirepartition des lignes/colonnes (ecart a
H0 )
lecart a lH0 est quantifie directement par la probabilite davoir
un ecart plus important que celui observe
calcul de la probabilite de Pr(A = a), a
addition de toutes les probabilites telles que
Pr(A = a ) 6 Pr(A = aobs )
Principe Adequation Independance Cas part.

Petits effectifs

Cas des petits effectifs

Soit la table :

A B Total
Succes 5 0 5
Echec 2 5 7
Total 7 5 12

Sachant les marges, la case c11 peut prendre les valeurs suivantes :
{0, 1, 2, 3, 4, 5}.
Principe Adequation Independance Cas part.

Petits effectifs

Cas des petits effectifs

dou les probabilites de chaque table :


Pr(A = 5) = 7!5!5!7!/5!0!2!5!12! = 0,0265 X
Pr(A = 4) = 7!5!5!7!/4!1!3!4!12! = 0,2210
Pr(A = 3) = 7!5!5!7!/3!2!4!3!12! = 0,4420
Pr(A = 2) = 7!5!5!7!/2!3!5!2!12! = 0,2651
Pr(A = 1) = 7!5!5!7!/1!4!6!1!12! = 0,0442
Pr(A = 0) = 7!5!5!7!/0!5!7!0!12! = 0,0013
soit valeur de test : p = 0,0265 + 0,0013 = 0,0278.
On rejette donc lH0 .
Principe Adequation Independance Cas part.

Petits effectifs

Cas des petits effectifs

Remarques :
peu commode
toujours valide, meme si effectifs grands
mais seul a etre valide si effectifs petits
Principe Adequation Independance Cas part.

Petits effectifs

Remarques diverses

Choix de la valeur de

depend du contexte et du cout du risque


risque : risque de declarer a tort comme present un effet
inexistant
si le medicament a peu deffets secondaires : (( grand ))
acceptable
si le medicament a bcp deffets secondaires : etre sur de son
efficacite avant commercialisation : prendre (( petit ))
a moduler selon la gravite de la maladie et la disponibilite
dautres medicaments
Principe Adequation Independance Cas part.

Petits effectifs

Synthese finale

Au final, nous avons vu :


dans le cas de deux proportions, le test du 2 est equivalent
au test z
le test du 2 setend a differents cas
comparaison de trois proportions ou plus
comparaison de deux ou plus de deux multinomiales
cas particulier des series appariees
cas particulier des petits effectifs