Vous êtes sur la page 1sur 56

Chapitre 7

Comparaison de pourcentages
Exercices comments
J os LABARERE
Anne universitaire 2011/2012
Universit J oseph Fourier de Grenoble - Tous droits rservs.
UE4 : Biostatistiques
Exercice I
La prvalence des infections nosocomiales estime
lors dune enqute un jour donn dans un tablissement
de sant de 200 lits est de 8%.
On souhaite dterminer si ce pourcentage diffre de la
prvalence nationale des infections nosocomiales dans les
tablissement de sant (5%).
Questions
1. De quel type de problme sagit-il ?
2. Formulez explicitement les hypothses du test
statistique
3. Quel test statistique utilisez vous ?
4. Quelles sont les conditions de validit de ce
test ?
5. Appliquez le test statistique.
6. Que concluez-vous ?
1. De quel type de problme sagit-il ?
Comparaison :
dun pourcentage observ sur un chantillon (200 patients
prsents un jour donn) issu dune population (patients
hospitaliss dans cet tablissement).
une valeur thorique (prvalence nationale
H0
= 5%).
prvalence
p
Prvalence
hpital
Prvalence
nationale

H0
2. Formulez explicitement les hypothses du test
statistique
Hypothse nulle (H0) : =
H0
La prvalence des IN dans ltablissement de sant ne
diffre pas de la prvalence nationale (5%)
Hypothse alternative bilatrale (H1) :
H0
La prvalence des IN dans ltablissement de sant
diffre de la prvalence nationale (5%)
3. Quel test statistique utilisez vous ?
Test du pour la comparaison dun pourcentage observ
une valeur thorique.

2
2
2
2 2
1
2
1 1
1ddl

T
T O
T
T O

4. Quelles sont les conditions de validit de ce test ?


Les effectifs THEORIQUES attendus sous H0 doivent
tous tre suprieurs ou gaux 5.
5. Appliquez le test statistique

3.79
190
190 184
10
10 16

2 2
2
o

IN+ IN-
Effectifs observs O
1
= 16 O
2
=184 200
Effectifs thoriques T
1
= 200 x 0.05
=10
T
2
= 200 x 0.95
= 190
200
6. Que concluez-vous ?

= 3.84

o
= 3.79
Abscisse : valeurs possibles de sous H0
+
0
= 5% (0.05)

= 3.84

(rejet de H0 = acceptation de H1)


1
(non-rejet de H0)

o
= 3.79

o
<

Non rejet de H0
Dtermination du degr de signification associ
o
(P-value)

o
= 3.79
X
0.05 < P < 0.10
Rappel : P-value = probabilit
dobserver une valeur plus grande que

o
sous lhypothse nulle H0
P non-rejet de H0
6. Que concluez-vous?
Conclusion
On ne met pas en vidence de diffrence statistiquement
significative entre la prvalence des infections
nosocomiales dans ltablissement de sant tudi (8%) et
la prvalence nationale (5%) (0.05 < P< 0,10).
Exercice II
Une tude pidmiologique a t conduite dans 6
Hpitaux des USA pour dterminer si le
pourcentage dutilisateurs de tlphones
portables diffrait entre les sujets atteints et les
sujets indemnes dune tumeur crbrale
primitive.
Les rsultats sont prsents dans le tableau
suivant.
Adapt de Muscat JE et al. JAMA 2000;284:3001-7
Tumeur crbrale
primitive
Utilisation
tlphone portable
Oui
(N = 469)
Non
(N = 422)
Oui 66 (14%) 76 (18%)
Non 403 (86%) 346 (82%)
Questions
1. De quel type de problme sagit-il ?
2. Formulez explicitement les hypothses
du test statistique
3. Quel test statistique utilisez vous ?
4. Quelles sont les conditions de validit de
ce test ?
5. Appliquez le test statistique.
6. Que concluez-vous ?
1. De quel type de problme sagit-il ?
Comparaison de 2 pourcentages observs sur 2
chantillons indpendants
chantillon
p
1
population

1
chantillon
p
2
population

2
Tumeur crbrale Pas de tumeur crbrale
2. Formulez explicitement les hypothses du test
statistique
Hypothse nulle (H0) :
1
=
2
Le pourcentage dutilisateurs de tlphones portables ne
diffre pas entre les sujets atteints de tumeur crbrale
primitive et les sujets indemnes de tumeur crbrale primitive.
Hypothse alternative (H1) :
1

2
Le pourcentage dutilisateurs de tlphones portables diffre
entre les sujets atteints de tumeur crbrale primitive et les
sujets indemnes de tumeur crbrale primitive.
3. Quel test statistique utilisez vous ?
Test du de comparaison de 2 pourcentages observs
sur 2 chantillons indpendants.

2
j i,
ij
2
ij ij
1ddl

T
T O

4. Quelles sont les conditions de validit de ce test ?


Indpendance des observations
Les effectifs THEORIQUES attendus sous H0 doivent
tous tre suprieurs ou gaux 5.
4. Quelles sont les conditions de validit de ce test ?
Utilisation
tlphone portable
Oui Non
Oui 66 (74.7) 76 (67.3) 142
Non 403 (394.3) 346 (354.7) 749
469 422 891
T
ij
= (L
i
x C
j
) /n = (142 x 422) / 891
NB : Leffectif thorique dune cellule attendu sous H0 est gal au produit des
effectifs marginaux en ligne et en colonne divis par leffectif total.
Pour vrifier que tous les effectifs thoriques sont 5, il suffit de calculer leffectif
thorique de la cellule situe en regard du plus petit effectif marginal en ligne et
du plus petit effectif marginal en colonne
5. Appliquez le test statistique
Utilisation
tlphone portable
Oui Non
Oui 66 (74.7) 76 (67.3) 142
Non 403 (394.3) 346 (354.7) 749
469 422 891

57 . 2
7 . 354
7 . 354 346
3 . 394
3 . 394 403
67.3
3 . 7 6 6 7
74.7
7 . 4 7 66

2 2 2 2
2
o

6. Que concluez-vous ?

= 3.84

o
= 2.57
Abscisse : valeurs possibles de sous H0
+
0
= 5% (0.05)

= 3.84

(rejet de H0 = acceptation de H1)


1
(non-rejet de H0)

o
= 2.57

o
<

Non rejet de H0
Dtermination du degr de signification associ
o
(P-value)

o
= 2.57
X
0.10 < P < 0.20
Rappel : P-value = probabilit
dobserver une valeur plus grande que

o
sous lhypothse nulle H0
P non-rejet de H0
6. Que concluez-vous?
Conclusion
Cette tude ne met pas en vidence de diffrence
statistiquement significative du pourcentage dutilisateurs
de tlphones portables entre les sujets atteints (14%) et
les sujets indemnes (18%) de tumeur crbrale primitive
(0.10< P <0.20).
Exercice III
La Zutphen Elderly Study est une tude portant
sur 470 sujets masculins gs de plus de 65 ans
recruts en 1985 et suivis jusquen 2000.
Les rsultats sont prsents dans le tableau
suivant.
Lobjectif de lanalyse prsente ici tait de
dterminer sil existait une association entre la
mortalit et lapport quotidien de cacao
Adapt de Buijsse B et al. Arch Intern Med 2006;166:411-7
Exercice III
Apport quotidien de cacao Effectif Dcs (%)
Faible (<0,5 g/j) 161 122 (76)
Intermdiaire (0,5 2,25 g/j) 147 100 (68)
Elev (> 2,25 g /j) 162 92 (57)
Questions
1. De quel type de problme sagit-il ?
2. Formulez explicitement les hypothses du test
statistique
3. Quel test statistique utilisez vous ?
4. Quelles sont les conditions de validit de ce
test ?
5. Appliquez le test statistique.
6. Que concluez-vous ?
1. De quel type de problme sagit-il ?
Comparaison de plusieurs pourcentages observs sur des
chantillons indpendants
(tester lindpendance entre 2 variables qualitatives dont
une est binaire et lautre polytomique)
chantillon
p
1
population

1
chantillon
p
2
population

2
chantillon
p
3
population

3
Faible Intermdiaire
Elev
2. Formulez explicitement les hypothses du test
statistique
Hypothse nulle (H0) :
1
=
2
=
3
Le pourcentage de dcs ne diffre pas chez les sujets gs de
plus de 65 ans en fonction de la consommation quotidienne faible,
intermdiaire, ou forte de cacao linclusion.
(il nexiste pas dassociation entre la mortalit et le niveau de
consommation quotidienne de cacao)
Hypothse alternative (H1)
Le pourcentage de dcs diffre dans au moins un des groupes
de sujets gs de plus de 65 ans en fonction de la consommation
quotidienne faible, intermdiaire, ou forte de cacao linclusion.
(il existe une association entre la mortalit et le niveau de
consommation quotidienne de cacao)
3. Quel test statistique utilisez vous ?
Test du pour la comparaison de plusieurs pourcentages
observs sur des chantillons indpendants

2
j i,
ij
2
ij ij
1)ddl 1)(C- - (L

T
T O

4. Quelles sont les conditions de validit de ce test ?


Indpendance des observations
Les effectifs THEORIQUES attendus sous H0 doivent
tous tre suprieurs ou gaux 5.
4. Quelles sont les conditions de validit de ce test ?
Dcs
Conso. cacao Oui Non
faible 122 (107,6) 39 (53,4) 161
intermdiaire 100 (98,2) 47 (48,8) 147
forte 92 (108,2) 70 (53,8) 162
314 156 470
T
ij
= (L
i
x C
j
) / n = (147 x 156) / 470
NB : Leffectif thorique dune cellule attendu sous H0 est gal au produit des
effectifs marginaux en ligne et en colonne divis par leffectif total.
Pour vrifier que tous les effectifs thoriques sont 5, il suffit de calculer leffectif
thorique de la cellule situe en regard du plus petit effectif marginal en ligne et
du plus petit effectif marginal en colonne
5. Appliquez le test statistique
Dcs
Conso. cacao Oui Non
faible 122 (107,6) 39 (53,4) 161
intermdiaire 100 (98,2) 47 (48,8) 147
forte 92 (108,2) 70 (53,8) 162
314 156 470

3 , 13
8 , 53
8 , 53 70
...
107,6
107,6 22 1

2 2
2
o

Comparaison de
o
calcul la valeur seuil

correspondant au
risque de la loi du
0
1
(non-rejet de H0)

(rejet de H0 )

= 5.99

o
= 13.3

, 2ddl = 5.99

o
= 13.3

o
>

rejet de H0, acceptation de H1


Dtermination du degr de signification associ
o
(P-value)

o
= 13.3
X
P < 0.01
Rappel : P-value = probabilit
dobserver une valeur plus grande que

o
sous lhypothse nulle H0
P < rejet de H0, acceptation
de H1
6. Que concluez-vous?
Conclusion
Le pourcentage de dcs diffre significativement chez les
sujets gs de plus de 65 ans en fonction de la
consommation quotidienne de cacao faible (76%),
intermdiaire (68%) et forte (57%) linclusion dans ltude
(p < 0,01).
Exercice IV
Une tude pidmiologique a t conduite pour
dterminer sil existait une association entre la prsence
dune tumeur de la vessie et la consommation de caf.
Une consommation quotidienne de caf tait retrouve
chez :
90% des 100 patients avec une tumeur de la vessie
80% des 200 patients sans tumeur de la vessie
On pose lhypothse nulle comme tant labsence
dassociation entre la prsence dune tumeur de la vessie et
la consommation quotidienne de caf.
Adapt de Simon D et al. J Natl Cancer Inst 1975;54:587-93
QCM 1
Dans cette tude :
A leffectif total de patients est gal 300
B leffectif observ de patients avec une tumeur de la
vessie et ne consommant pas de caf est gal 10
C leffectif marginal de patients consommant
quotidiennement du caf est gal 250
D sous lhypothse nulle (H0), leffectif thorique
attendu de consommateurs de caf sans tumeur de la
vessie est gal 160
E les propositions A, B, C, D sont fausses.
QCM 2
Avant dappliquer le test statistique, il faut vrifier que :
A leffectif de sujets est suprieur 30 dans chaque
groupe
B les 2 variables ont une distribution normale
C les effectifs thoriques attendus sous lhypothse
nulle (H0) sont tous suprieurs ou gaux 5
D le degr de signification (P-value) du test statistique
est infrieur 0.05
E les propositions A, B, C, D sont fausses.
QCM 3
Le nombre de degrs de libert du test statistique est gal
:
A 298
B 0.05
C 3.84
D 4
E les propositions A, B, C, D sont fausses.
QCM 4
La valeur calcule du test est gale 4.80. Le degr de
signification (P-value) correspondant :
A ne peut pas tre dtermin
B est gal 3.84
C est gal 0.05
D est compris entre 0.10 et 0.20
E les propositions A, B, C, D sont fausses.
QCM 5
La valeur calcule du test est gale 4.80. On peut conclure :
A quil existe une association statistiquement significative
entre la prsence dune tumeur de vessie et la consommation
quotidienne de caf
B que cette tude ne met pas en vidence de diffrence
statistiquement significative du pourcentage de
consommateurs de caf entre les patients avec et sans tumeur
de la vessie.
C que la consommation quotidienne de caf cause
davantage de tumeurs de la vessie
D que le pourcentage de consommateurs de caf diffre
significativement entre les patients avec et sans tumeur de la
vessie.
E les propositions A, B, C, D sont fausses.
QCM 1
Dans cette tude :
A leffectif total de patients est gal 300
B leffectif observ de patients avec une tumeur de la
vessie et ne consommant pas de caf est gal 10
C leffectif marginal de patients consommant
quotidiennement du caf est gal 250
D sous lhypothse nulle (H0), leffectif thorique
attendu de consommateurs de caf sans tumeur de la
vessie est gal 160
E les propositions A, B, C, D sont fausses.
Correction : ABC
QCM 1
Tumeur de la vessie
Consommation
quot. caf
Oui Non
Oui 90 160 250
Non 10 40 50
100 200 300
Avant de rpondre aux questions, il faut dresser le tableau de contingence
partir des donnes de lnonc :
A leffectif total de patients est gal 300 - Vrai
QCM 1
Tumeur de la vessie
Consommation
quot. caf
Oui Non
Oui 90 160 250
Non 10 40 50
100 200 300
B leffectif observ de patients avec une tumeur de la
vessie et ne consommant pas de caf est gal 10 - Vrai
QCM 1
Tumeur de la vessie
Consommation
quot. caf
Oui Non
Oui 90 160 250
Non 10 40 50
100 200 300
C leffectif marginal de patients consommant quotidiennement
du caf est gal 250 - Vrai
QCM 1
Tumeur de la vessie
Consommation
quot. caf
Oui Non
Oui 90 160 250
Non 10 40 50
100 200 300
D sous lhypothse nulle (H0), leffectif thorique attendu de
consommateurs de caf sans tumeur de la vessie est gal 160
Faux : il sagit de leffectif observ.
Leffectif thorique de cette cellule est gal (200 x 250) / 300
QCM 2
Avant dappliquer le test statistique, il faut vrifier que :
A leffectif de sujets est suprieur 30 dans chaque
groupe
B les 2 variables ont une distribution normale
C les effectifs thoriques attendus sous lhypothse
nulle (H0) sont tous suprieurs ou gaux 5
D le degr de signification (P-value) du test statistique
est infrieur 0.05
E les propositions A, B, C, D sont fausses.
Correction : C
QCM 2
Avant dappliquer le test statistique, il faut vrifier que :
A leffectif de sujets est suprieur 30 dans chaque groupe -
Faux
B les 2 variables ont une distribution normale - Faux : il sagit
ici de 2 variables qualitatives binaires
C les effectifs thoriques attendus sous lhypothse nulle (H0)
sont tous suprieurs ou gaux 5 - Vrai
D le degr de signification (P-value) du test statistique est
infrieur 0.05 - Faux : La P-value est un rsultat du test et non pas
une condition dapplication du test
Rappel : Conditions de validit du test du
Indpendance des observations
Effectif thorique T
ij
attendus sous lhypothse nulle (H0) 5 pour chaque cellule
QCM 3
Le nombre de degrs de libert du test statistique est gal
:
A 298
B 0.05
C 3.84
D 4
E les propositions A, B, C, D sont fausses.
Correction : E
QCM 3
Le nombre de degrs de libert du test statistique est gal
:
A 298 Faux : correspond (n-2)
B 0.05 - Faux : risque
C 3.84 - Faux : valeur

pour 1 ddl
D 4 Faux : nombre de cellules du tableau de
contingence
Rappel : Le nombre de degrs de libert dun test du ralis sur un tableau
de contingence L lignes et C colonnes est gal (L-1)x(C-1).
Ici : (2 - 1) x (2 - 1) = 1ddl
QCM 4
La valeur calcule du test est gale 4.80. Le degr de
signification (P-value) correspondant :
A ne peut pas tre dtermin
B est gal 3.84
C est gal 0.05
D est compris entre 0.10 et 0.20
E les propositions A, B, C, D sont fausses.
Correction : E
QCM4

o
= 4.8
X
0.02 <P < 0.05
Rappel : P-value = probabilit
dobserver une valeur plus grande que

o
sous lhypothse nulle H0
QCM 4
La valeur calcule du test est gale 4.80. Le degr de
signification (P-value) correspondant :
A ne peut pas tre dtermin - Faux
B est gal 3.84 Faux : il sagit de la valeur de

C est gal 0.05 Faux : il sagit du risque


D est compris entre 0.10 et 0.20 Faux : cf table du
QCM 5
La valeur calcule du test est gale 4.80. On peut conclure :
A quil existe une association statistiquement significative
entre la prsence dune tumeur de vessie et la consommation
quotidienne de caf
B que cette tude ne met pas en vidence de diffrence
statistiquement significative du pourcentage de
consommateurs de caf entre les patients avec et sans tumeur
de la vessie.
C que la consommation quotidienne de caf cause
davantage de tumeurs de la vessie
D que le pourcentage de consommateurs de caf diffre
significativement entre les patients avec et sans tumeur de la
vessie.
E les propositions A, B, C, D sont fausses.
Correction : AD
QCM 5
La valeur calcule du test est gale 4.80. On peut conclure :
A quil existe une association statistiquement significative
entre la prsence dune tumeur de vessie et la consommation
quotidienne de caf Vrai : P <0.05
B que cette tude ne met pas en vidence de diffrence
statistiquement significative du pourcentage de consommateurs
de caf entre les patients avec et sans tumeur de la vessie Faux :
P <0.05
C que la consommation quotidienne de caf cause davantage
de tumeurs de la vessie Faux : formulation causale. Il est
probable que la diffrence mise en vidence rsulte de laction
conjointe dautres facteurs (facteurs de confusion).
D que le pourcentage de consommateurs de caf diffre
significativement entre les patients avec et sans tumeur de la
vessie Vrai : P <0.05
Mentions lgales
Ce document a t ralis par la Cellule TICE de la Facult de Mdecine de Grenoble (Universit J oseph Fourier Grenoble 1)
en collaboration avec lEquipe Audiovisuel et Production Multimdia (EAEPM) de lUniversit Stendhal de Grenoble.
L'ensemble de cette uvre relve des lgislations franaise et internationale sur le droit d'auteur et
la proprit intellectuelle, littraire et artistique ou toute autre loi applicable.
Tous les droits de reproduction, adaptation, transformation, transcription ou traduction de tout ou
partie sont rservs pour les textes ainsi que pour l'ensemble des documents iconographiques,
photographiques, vidos et sonores.
Cette uvre est interdite la vente ou la location. Sa diffusion, duplication, mise disposition du
public (sous quelque forme ou support que ce soit), mise en rseau, partielles ou totales, sont
strictement rserves luniversit J oseph Fourier (UJ F) Grenoble 1 et ses affilis.
Lutilisation de ce document est strictement rserve lusage priv des tudiants inscrits
lUniversit J oseph Fourier (UJ F) Grenoble 1, et non destine une utilisation collective, gratuite
ou payante.