Vous êtes sur la page 1sur 66

Sommaire

Liste des tables ......................................................................................................................................... i


Liste des figures ........................................................................................................................................ii
Chapitre 1 : In rod c ion l pid miologie ............................................................................................ 6
Objectifs de la leçon ............................................................................................................................ 6
Plan de la leçon.................................................................................................................................... 6
1. Introduction ............................................................................................................................... 6
1.1. Epidémiologie : e -ce e c e ? ............................................................................... 6
1.2. Implications de la définition ............................................................................................. 6
1.3. H e de d g e ............................................................................................... 7
2. I de d g e ....................................................................................................... 11
2.1. D c e e ec e d e a ad e .................................................................................... 12
2.2. D c e h e a e ed e a ad e .................................................................... 12
2.3. Ide f e e fac e de ed e a ad e ............................................................. 12
2.4. P d e e e da ce d e maladie.............................................................................. 13
2.5. E e e ca e de a d e a ad e .......................................... 13
2.6. Favoriser les pratiques médicales basées sur des preuves ........................................... 14
2.7. E a e e g a e d e e ........................................................................ 14
2.8. Ide f e e be de a d ec a ....................................................... 14
Chapitre 2 : Mesures en épidémiologie ................................................................................................. 15
Objectifs de la leçon .......................................................................................................................... 15
Plan de la leçon.................................................................................................................................. 15
1. Rappels sur les principales mesures de morbidité et de mortalité ...................................... 15
1.1. Proportion ........................................................................................................................ 15
1.2. Ratio.................................................................................................................................. 15
1.3. Taux .................................................................................................................................. 16
1.4. Cote ................................................................................................................................... 16
1.5. Indice ................................................................................................................................ 16
2. Principales mesures épidémiologiques .................................................................................. 16
2.1. Mesures de fréquence ...................................................................................................... 17
2.2. Me e da ca ..................................................................................................... 21
2.3. Me e d ac ............................................................................................................ 25
Chapitre 3 : Intervalle de confiance....................................................................................................... 27
Objectifs de la leçon .......................................................................................................................... 27

iii
Plan de la leçon.................................................................................................................................. 27
1. Introduction .............................................................................................................................. 27
2. Fl c a i d écha ill age e em le d em e e a iable a i a i e................ 28
3. I e alle de c fia ce d em e e .................................................................................. 29
3.1. Cas des grands échantillons.............................................................................................. 29
3.2. Cas des petits échantillons ............................................................................................... 29
4. I e alle de c fia ce d e i le g a d écha ill ................................. 30
5. I e éai de l i e alle de c fia ce .............................................................................. 31
Chapitre 4 : Diff ren e pe d enq e en pid miologie ................................................................. 33
Objectifs de la leçon .......................................................................................................................... 33
Plan de la leçon.................................................................................................................................. 33
1. P c a e de e d g e .................................................................... 33
2. Distinction entre études expérimentales et non expérimentales .......................................... 33
3. Principales études non expérimentales .................................................................................. 35
3.1. Enquête transversale ....................................................................................................... 35
3.2. Enquête de cohortes ........................................................................................................ 35
3.3. Enquêtes ca-témoins ........................................................................................................ 37
3.4. Enquête écologique .......................................................................................................... 37
Chapitre 5 : Pr ci ion e alidi d ne me re en pid miologie ........................................................ 39
Objectifs de la leçon .......................................................................................................................... 39
Plan de la leçon.................................................................................................................................. 39
1. Introduction ............................................................................................................................. 39
2. P c (ab e ce d e e a a e) ................................................................................... 40
2.1. Notions générales sur la précision .................................................................................. 40
2.2. Illustration à partir de la différence des moyennes ...................................................... 41
2.3. Mesures pour améliorer la précision ............................................................................. 42
3. Validité ..................................................................................................................................... 43
3.1. Validité interne ................................................................................................................ 43
3.2. Va d e e e: e e a e e e de a a de a ............ 60
4. Moyens pour améliorer la validité ............................................................................................. 61
4.1. Prévenir les biais de sélection................................................................................................ 61
4.2. Prévenir les biais de confusion .............................................................................................. 63
4.3. Prévenir les biai d informa ion ............................................................................................ 65
Références bibliographiques ................................................................................................................. 68

iv
v
Chapitre 1 : I d c d ge
Objectifs de la leçon
e pliq er ce q e l pid miologie ;
comprendre l ol ion de pra iq e en pid miologie ;
ill rer par de e emple l in r de l pid miologie.
Plan de la leçon
Introduction
In r de l pid miologie
1. Introduction
1.1. Epidémiologie : e -ce ec e ?
L pid miologie e la science qui étudie les variations de fréquences des maladies dans
les groupes humains et recherche les déterminants de ces variations. Elle vise en
particulier à la recherche des causes des maladies e de l amélioration de leurs traitements
et moyens de prévention.»
1.2. Implications de la définition
De la définition ci-dessus découlent les notions de :

1.2.1. Distribution
Il agi de la aria ion de fréquence du problème, de sa variation en fonction de différents
param re el le emp , l e pace e la per onne no ammen e carac ri iq e
sociodémographiques, anthropométriques, cliniques et biologiques. L a i me de ba e de
l id mi l gie est que la maladie ne se distribue pas aléatoirement dans les populations
humaines. L l cida ion de rai on de ce e di rib ion non al a oire ren eignera r le
facteurs déterminants de la maladie et de la santé et les mécanismes biologiques qui y
conduisent.
1.2.2. Facteurs déterminants
Il agi elon le ca , de fac e r en ironnemen a (agen ph iq e : emp ra re,
radia ion , br i ; agen chimiq e : poll an de l air, de l ea ), de fac e r li a
habitudes de vie (vie professionnelle, alimentation, alcool, abac, loi ir, ), o de fac e r
génétiques, etc.
1.2.3. Etats ou évènements liés à la santé
il pe agi d a o nemen n ga if : ce on alor de probl me de an ,
exprimant soit un manque actuel ou potentiel de bien-être dans le domaine physique,
men al o ocial, oi n a non a i fai an de la an d n indi id . Les problèmes

6
de santé peuvent être aigus ou chroniques ; ils peuvent être des handicaps, des
traumatismes, des suicides, des indicateurs cliniques (tension artérielle, poids) ou
biologiques (hémoglobinurie, cholestérolémie)
Les états ou évènements liés à la santé peuvent également être positifs, exprimant le
bien-être physique, mental et social de base.

1.2.4. Population
L pid miologie occ pe pl de la pop la ion groupe humain q e de l indi id , ce q i
la distingue du reste des sciences médicales e fai d elle ne di cipline de ba e de la an
p bliq e. C e de ce poin de e, q e na le be oin de d crire la an e la maladie en
termes de fréquence et de distribution dans la population humaine. La population est définie
sur des critères géographique (lieu de résidence, de travail, de mouvement, etc.), temporel
(saison, années, etc.) ou sociodémographique (âge, sexe, profession, etc.).
1.2.5. Lutte contre les problèmes de santé
Elle con i e l en emble de in er en ion i an main enir l a de an de ba e, le
r ablir o l am liorer.

1.3. H e de d ge
1.3.1. Hippocrate : e de l id mi l gie ?
A la lumière de la définition ci-dessus, on peut invoquer Hippocrate comme le père de
l pid miologie, p i q il cherchai d j de d erminan en ironnemen a , e non pa
seulement individuels, aux maladies dans son Traité des airs, des eaux et des lieux (400 av. J.-
C.). Mai i l on adme ne parler d pid miologie en an q e cience q par ir d momen
où des schémas observationnels (enquêtes, registres, études), expérimentaux (essais
thérapeutiques comparés) et théoriques (modèles populationnels) sont employés, avec des
m hode de rec eil e d anal e de donn e adap e , ce n e q a XVIIe i cle q e l on
voit apparaître, en Angleterre, les premiers véritables travaux « épidémiologiques ».
1.3.2. Angleterre : berceau de l id mi l gie ?
Dès 1538, un document était rempli pour chaque décès et des statistiques de mortalité
hebdomadaire et annuelle étaient effectuées systématiquement en Angle erre. C e ce q on
appelait les « bills of mortality ». A partir de 1603, le processus fut amélioré par le recueil
ma iq e d informa ion r la ca e de mortalité. Toujours en Angleterre, apparurent les
premier ra a pid miologiq e , conn a jo rd h i o l appella ion de surveillance

7
épidémiologique «processus continu de recueil de données sanitaires au cours du temps
permettant de documenter des changements éventuels et de créer des alertes sanitaires. »
1.3.3. Epidémiologie : u e a e e de l a mie ?
En 1662, Graunt fournit une analyse en profondeur des bulletins de mortalité en évaluant
d ne par le o rce d erre r e de biai q i po aien rendre leur interprétation difficile, et
en me an d a re par en idence de r g lari dan le rie de d c e le pic
épidémiques, de taille variable, qui furent attribués à des épidémies récurrentes de peste. Ce
fut le tout premier travail épidémiologique au sens actuel du terme. Ensuite, dans le cadre
d ne collabora ion, Gra n abli a ec on ami Pe la premi re able de mor ali ,
l o il de ba e de d mographe .
Ce e able repr en e la probabili de r ie en fonc ion de l ge d ne cohorte de 100
nouveau-nés : au XVIIIe siècle, 36 meurent avant 6 ans et un seul survit à 76 ans. Christian
Huygens, mathématicien et astronome qui analyse avec son frère Lodewijk la table de vie de
Gra n , en d d i ne m hode de calc l de l e p rance de ie en fonc ion de l ge. Ain i, on
voit apparaître clairemen q e l pid miologie e l a ronomie appartiennent en effet à deux
di cipline q i, par ir de l ob er a ion, e aien d inf rer de loi .
1.3.4. Variolisation : ancêtre de la vaccination ?
En Asie mine re, de ob er a e r a cie a aien fai de l imm nologie an le savoir : ils
avaient compris q e l on ne prend jamai de foi la pe i e role . Pratiquée depuis 1721
en Angleterre, la variolisation consistait à défier « challenger » le système immunitaire grâce
ne carifica ion effec e par ir d n pr l emen r ne p le de malade. l poq e,
on e imai q ne grande par ie de la pop la ion anglai e a ai infec e par la ariole e
q n enfan q i en ai a ein a ai en re 20 et 30 chances sur 100 de mourir. En un temps
o la arioli a ion ai cependan for con ro er e car, Berno lli compri q il fallai me re
en a an ce q e l on appellerai a jo rd h i ne approche co -bénéfice.
Il construisit un modèle mathématique fondé sur des hypothèses simples. al an d ne par
le nombre o al de mor a rib able la ariole, e d a re par le nombre de mor q i
eraien ob er e i l on pra iq ai la arioli a ion, en ppo an q e celle-ci tue 1 inoculé
sur 200, Berno lli ro a q e l e p rance de ie progre erai de roi an (pa an de 26 29
an ), en effec an ne anal e de en ibili me an en ca e l e ima ion d ri q e de
l inoc la ion. Il concl q e, de de i a ion , la arioli a ion erai de loin la plus
in re an e par on b n fice r on ri q e p i q il fa drai q elle ca e 1 mor r 10
variolisés pour que les deux situations soient équivalentes. Trois critiques fondamentales
furent opposées à Bernouilli. La première, endossée par Laplace (1749-1827) dans son Essai

8
sur les probabilités, est que l e a ce de ie e e -être pas le bon critère de
comparaison e q e la pop la ion n e pa pr e changer n ri q e imm dia m me faible
(cel i de l inoc la ion) con re n ri q e loin ain. La seconde critique est que les risques
médicaux dépendent des opérateurs, et donc si l on arri e r d ire le ri q e imm dia de la
procédure (inoculation) à une valeur égale à celle du risque immédiat de contracter la variole
naturellement, il est éviden q e, d lor , la pop la ion choi ira d re arioli e. Il fa donc
propo er ce q on appellerai a jo rd h i de m hode da rance de la q ali . La
troisième critique est que, pour construire des modèles mathématiques sérieux, il faut des
données de qualité, q e ce oi r le ri q e o r l hi oire na relle de maladie : c e la
n ce i primordiale d n me d informa ion efficace q i e o lign e. Ce n e q en
1840 que la variolisation fut interdite en Angleterre au bénéfice de la vaccination.
1.3.5. XIXe : siècle des sciences
Le grand chapi re de l pid miologie moderne o ren a XIXe i cle avec la naissance
de l pid miologie cliniq e e de ce q on appelle a jo rd h i la m decine fond e r le
preuves » avec Pierre Louis et Claude Bernard, l pidémiologie sociale avec Villermé,
l pid miologie d in er en ion e la surveillance épidémiologique avec William Farr et la
ma i a ion de l informa ion rec eillie dan le pop la ion a ec Q e ele .
Épidémiologie clinique
Parmi les observations et expérimentations rigoureuses qui commencèrent à se mettre en
place au XVIIIe siècle, il est habituel de citer James Lind qui, en 1747, réalisa le premier essai
clinique randomisé et découvrit que le citron permettait de guérir le scorbut (maladie due à
une carence délétère en vitamine C qui se traduit, dans sa forme grave, par
un déchaussement des dents et la purulence des gencives, des hémorragies, puis la mort) des
marins sur le bateau desquels ils étaient embarqués. Pierre-Charles-Alexandre Louis (1787-
1872), m decin, e le co rage de con e er ne pra iq e m dicale dominan e de l poq e : la
saignée, souvent pratiquée grâce à des sangsues (en 1833, la France importait 42 millions de
ang e po r age m dical). L id e ai l poq e q e o e le fi re a aien la m me
origine, an la manife a ion d ne inflamma ion de organe , e q appliq er de ang e
était efficace. Pour la remettre en cause, Louis établit une observation rigoureuse sur un
groupe de malades ayant tous une forme bien caractérisée de pneumonie et conclut à une très
faible efficaci de la pra iq e. Si ce q on a appel la m hode n m riq e de Pierre Lo i
ai r ol ionnaire, parce q il cherchait à tirer des conclusions à partir de données
n m riq e rec eillie ma iq emen a li d malade, e non par ir d opinion , f -ce
celle de ma re , il l i manq ai le ppor de ce q on appelle a jo rd h i la a i iq e.

9
À cet égard, Jules Gavarret (1809- 1890) fut pionnier avec son livre Principes généraux de
statistique médicale.
S ma i a ion de l info ma ion m dicale
Dan le me d informa ion ani aire, la cla ifica ion e idemmen ne ape cl , e l
première classification internationale des maladies fut créée par Jacques Bertillon et que, ce
faisant, il était le lointain continuateur de François Boissier de Sauvages de Lacroix, fondateur
de la nosologie avec sa classification de 2400 maladies publiée post mortem en 1771. Claude
Bernard est souvent présenté comme un adversaire irréconciliable de la statistique et de
l pid miologie. Il a ain i o rn en d ri ion l id e d rine mo enne de l homme e rop en
obtenue en opérant des prélèvements dans les pissotières de la gare du Nord. En cela, il
n appr ciai g re le effor de ce q i, comme Adolphe Q e ele (1796-1874, statisticien,
in en e r de l inde de corp lence [poid / aille2] o jo r ili , ma h ma icien, a ronome
et naturaliste) avaient foi dans le rec eil ma iq e de l informa ion dan de grande
populations et en effet a ai d fend le concep d homme mo en (cel i don le
paramètres individuels seraient égaux à la moyenne des paramètres de la population). Mais
Claude Bernard a souligné tr clairemen la n ce i en cliniq e d e p rimen a ion
compara i e , no ammen dan l al a ion de rai emen . Il a cri , dan on Introduction à
la médecine expérimentale, de pa age o lignan clairemen la n ce i de ce q on
appellerait aujo rd h i de e ai h rape iq e con r l .
Épidémiologie sociale
Au début du XIXe siècle, contagionnistes et anticontagionnistes affron aien r le ca e
de maladie , andi q e pr alai o jo r la h orie hippocra iq e de mia me . D apr
cet e h orie, le di pari de an ob er e en re diff ren erri oire e pliq aien par de
fac e r opographiq e : diff rence d al i de, de den i de pop la ion, pro imi o non
d ne ri i re. Lo i -René Villermé (1782-1863), décidant de prendre les données à bras-le-
corp , o l e er l h po h e elon laq elle le in gali de an ob er e dan le do e
arrondissements de Paris dans la période 1817-1826 e pliq eraien e en iellemen par de
facteurs sociaux.
Il montra que des variables économiques (impôt moyen, prix moyen de location des
logements, etc.) étaient corrélées négativement à la mortalité, tandis que la densité de
pop la ion ne l ai pa . Villerm appor e de a re con rib ion maje re
l pid miologie ociale : la première concerne la santé des personnes emprisonnées, dont il
mon ra q elle ai corr l e a condi ion d empri onnemen e non pa la q ali morale
de pri onnier . Dan la econde, il fi ob er er q e l e p rance de ie ariai elon le

10
condition ociale de ra aille r de ind rie e ile . Se ra a f ren l origine de
premières lois limitant les conditions dans lesquelles on pouvait recourir au travail des enfants
ou louer des logements plus ou moins insalubres.
Surveillance épidémiologique
Dep i le ann e 1980, a ec la con cience de l impor ance de maladie mergen e , la
r eillance pid miologiq e e de en e n domaine impor an de l pid miologie, la foi
en termes de méthode (recherche de systèmes temps réel) et de résultats (découverte du sida,
par exemple). William Farr créa la surveillance épidémiologique moderne. La surveillance
épidémiologique avait pris son essor au XIXe siècle à Londres avec William Farr (1807-1883)
qui, lorsque le bureau des registres fut établi en Angleterre en 1838, devint rapidement
responsable du département statistique. Il mit en place une classification des causes des
maladies, travailla rigoureusement à la définition des dénominateurs permettant de calculer
le ri q e e compri q il n e pa de rec eil e d anal e de donn e an ne diff ion
appropri e (ce q il fi gr ce n grand nombre de b lle in hebdomadaire , eme riel ,
etc.). Il montra comment cette connaissance devait déboucher sur des méthodes de prévention
et fut le premier à décrire la chronologie et la taille des épidémies de grippe.
1.3.6. XXe siècle en épidémiologie
Le XXe i cle o re r le pri Nobel de Ro (1902), le mod li a e r pilo e de
l pid miologie d pal di me; dan le ann e 1930, la d marche d e d h po h se,
indispensable à la recherche des facteurs de risque est mise au point par Neyman et Pearson;
l apr - Seconde G erre mondiale erra na re e cro re l pid miologie anal iq e; le
années 1980 verront renaître la crainte des maladies infectieuses ; les années 1990 seront
celles des promesses du décryptage du génome. Surtout, depuis les années 1990, la puissance
de mo en de calc l e de rec eil de l informa ion perme de d elopper n o a re
niveau les recherches des causes génétiques et environnementales des maladies qui avaient été
initiées par les pionniers des siècles passés. Ses résultats concernant le choléra, obtenus au
milieu du XIXe siècle, mirent eux aussi en cause la théorie des miasmes, et soutinrent
l h po h e q e la ca e d chol ra ai dan l ea . C e n a re pid miologi e anglai ,
Snow, qui en apportera une démonstration définitive en géo-localisant les cas dans un quartier
de Londres et en identifiant la source de la contamination (une pompe à eau bien précise).

2. Intérêt de d ge
L pid miologie e la di cipline de ba e de la an p bliq e en ce q elle d cri la an e
les problèmes de santé dans la population plutôt que chez les individus. Plusieurs aspects

11
moignen de l in r de l pid miologie dan la pratique quotidienne des décideurs, des
gestionnaires, des praticiens et des agents de tous les niveaux du système de santé.
2.1. Décrire le spectre d e maladie
La maladie repr en e le r l a d n proce d al ra ion de me biologiq e de
l h e. Les grandes catégories descriptives cliniques ou pathologiques sont souvent
constituées de manifestations biologiques et cliniques diverses. Les variations observées dans
leur distribution statistique et dans leur évolution dans une population permettent de
di ing er le manife a ion d ne maladie de celle d ne a re.
Un en emble de igne , de mp me e de imili de de l hi oire na relle d ne maladie
est appelé syndrome. Par exemple, le syndrome méningé est un ensemble de signes, de
symptômes e de r l a de labora oire econdaire l infec ion o l irri a ion de m ninge .
La connaissance du spectre de la maladie permet aux professionnels de planifier des stratégies
d in er en ion efficace de l e comme l d ca ion, le con eil, le d pi age, les programmes
de pr en ion e de rai emen . De pe d de pid miologiq e perme en de d crire le
pec re d ne maladie : le enq e de cohor e e le de ca -témoins.
2.2. Décrire h e a e ed e maladie
L hi oire na relle de la maladie e r f re l ol ion de la maladie dan le emp che
l indi id . Elle comprend o le ph nom ne li la maladie dep i le d b de celle-ci
j q la fin de l pi ode (g ri on o d c ). Ce e de crip ion perme d l cider le
altération p cifiq e d me biologiq e de l h e e d am liorer la pr ci ion de
diagnostics. Par exemple, des études de cohor e on mon r q ne ch e d ni ea de
lymphocytes T possédant le marqueur de CD4 était a oci e l infec ion par le VIH e q ne
diminution importante des cellules CD4 était associée à un développement des symptômes de
l infec ion e d ida. Ce e ob er a ion a po le imm nologi e orien er le r recherche
sur une interaction du système immunitaire et le VIH.
L pid miologie pe galemen aider d crire l impac d rai emen r l hi oire na relle
de la maladie. Ain i de de de cohor e on d mon r l efficaci de HAART (higl ac i e
an ire ro iral herap ) a an r la r d c ion de l incidence d ida q e r la survie des
pa ien de ida. Le champ de l pid miologie cliniq e e cel i de la recherche appliq e
l hi oire na relle de la maladie dan le b d am liorer la pr ci ion de diagno ic de
praticiens.
2.3. Identifier les facteurs de risque d e maladie
Avoir certaines caractéristiques spécifiques peut augmenter la probabilité pour un individu de
d elopper la maladie. Le ri q e e la probabili d n nemen nocif o non o hai . En

12
pid miologie, le ri q e e la probabili d n indi id indemne d ne maladie con rac e
celle-ci il en re en con ac a ec de fac e r q i a gmen en le ri q e de ce e maladie. Le
facteurs associés à un risque élevé de développer la maladie sont appelés facteurs de risque.
Le facteur de risque peut être social (tabagisme, alcoolisme), génétique (trait drépanocytaire,
certains cancers), diététique (alimentation riche en graisse saturée, déficience en
micronutriments) etc. La connaissance des facteurs de risque permet aux professionnels de
planifier des programme d in er en ion efficace a an la r en e de la maladie. Par
exemple, des études descriptives, transversales, cas-témoins et de cohorte ont toutes montré
que le tabac est le plus grand facteur de risque de maladie : il est le principal facteur de risque
des maladies cardiovasculaires, respiratoires chroniques et de nombreux cancers (poumon,
na ophar n , e ie, e c.). Le abac e ain i la principale ca e d in alidi e de d c dan
o le pa . Le campagne d d ca ion ani aire e le a re ratégies de cessation ou de
réduction du tabagisme, basées sur ces études sont des activités majeures de santé publique
dans ces pays.
2.4. Prédire les tendances d e maladie
La po ibili de pr dire le f re pid mie offre l oppor ni a profe ionnel de santé
de mobiliser le plus efficacement possible les forces pour combattre la maladie. Les études
descriptives de nombreuses maladies infectieuses, comme la méningite cérébrospinale, la
grippe, la poliomyélite, etc., ont révélé une périodicité des épidémies et pandémies causées
par ce maladie . Le de de endance de l infec ion par le VIH che le per onne
adonnan de ac i i ha ri q e on permi a pid miologi e e a i icien de
développer des modèles de prédiction du nombre de cas de sida dans les 5-10 années à venir.
2.5. Expliquer les mécanismes de transmission d e maladie
Comprendre les mécanismes de transmission de la maladie peut suggérer les voies de protéger
le p blic en oppan la ran mi ion de l agen iologiq e. Le udes épidémiologiques de
certaines encéphalites par arboviroses ont incriminé certaines espèces de moustiques comme
vecteurs de la maladie et certains animaux comme réservoirs de « virus ». Les efforts des
professionnels ont alors été concentrés sur la lutte contre le vecteur et la vaccination des
anima , r er oir de ir . en o re, en d pi de la di ponibili d n accin efficace
contre la variole depuis près de deux siècles, Cours dispensé aux étudiants du Master des
études en bactériologie virologie m dicale de l Uni er i Ca holiq e de l Afriq e de
l O e (UCAO) Bobo-Dioulasso B rkina Fa o, ann e 2012 l radica ion de ce e maladie
na po ible q e dan le ann e 70, lor q e l on a compri q en rai on de la faible
contagiosité du vir de la ariole, e d emp d inc ba ion rela i emen long de la ariole,

13
seule une stratégie de surveillance des cas, de détection et de vaccination immédiates des
per onne con ac po ai cond ire ce e radica ion. L applica ion de ce e ra gie a
permi d radiq er la ariole dan n d lai de moin de 10 an .
2.6. Favoriser les pratiques médicales basées sur des preuves
L objec if premier de la an p bliq e e de pr enir la r en e de maladie par ne
in er en ion dan l hi oire na relle de la maladie. Mai l efficaci d n accin o de o
a re programme d in er en ion doi re pro e a an on emploi dan la pop la ion. Le
études épidémiologiques (essais cliniques contrôlés, double aveugle avec placebo) sont alors
une étape nécessaire dan le d eloppemen d programme q el q il oi (admini ra ion de
nouveaux vaccins, stratégie de changement de comportement ou autre).
2.7. Evaluer le g a e d e e
M me i l ili d n accin a d mon r e par de e ai randomi , do ble aveugle, ce
accin pe cho er dan a pro ec ion lor q il l n e pa accep par la majori d p blic
(vaccin antigrippal en France, vaccin contre la fièvre typhoïde dans le monde). Diverses
de pid miologiq e pe en re ili e po r l al ation continue des programmes
d in er en ion. De de ran er ale r p e pe en mon rer n changemen dan la
pr alence de la maladie o dan le indica e r d a de an a ec le emp . De de de
cohor e pe en comparer l incidence de la maladie dans des populations comparables
recevant et ne recevant pas le programme de prévention. Des études cas-témoins peuvent
d erminer il e i e ne diff rence en re le propor ion de ca e de moin q i on
b n fici d programme d in er en ion.
2.8. Identifier le be de a d ec a
Les professionnels de santé doivent connaître les problèmes majeurs de santé dans leur
comm na de er ie ain i q e le egmen ocia le pl affec .Ce ne condi ion
pour réussir un programme de promotion de la santé dans la communauté. Les études
transversales peuvent révéler la prévalence de la maladie dans la communauté aussi bien que
dans les sous-groupes de la population, tandis que les programmes de surveillance peuvent
mettre en évidence les endance de la maladie, de l infec ion e /o de l a de an dan le
emp . Par e emple, la pr alence de l infec ion par le VIH o d ida e faible dan le pa
européens, mais très forte chez les migrants.

14
Chapitre 2 : Mesures en épidémiologie
Objectifs de la leçon
décrire les différents outils de mesure utilisés en santé ;
citer les principales mesures (ou outils) épidémiologiques ;
d crire le me re d a ocia ion en épidémiologie ;
d crire le me re d impac en pid miologie.
Plan de la leçon
Rappels sur les outils de mesure
Principales mesures épidémiologiques
1. Rappels sur les principales mesures de morbidité et de mortalité
A côté des nombres absolus, la plupart des mesures utilisées en sciences de la santé sont des

fractions, avec un numérateur et un dénominateur : D ne fa on g n rale, on

parle de rapport.
1.1. Proportion
Le numérateur est compris dans le dénominateur. Elle e prime o la forme d n nombre
compris entre 0 et 1, o o la forme d n pourcentage si le résultat est multiplié par 100
(po r 1 000, po r 10 000, ).
En 2009, une enquête parmi 1005 femmes enceintes au Sud du Bénin a montré que 686
femmes étaient an mi e ( a d h moglobine < 110 g / L). Parmi le femme an mi e , 34
présentaient une anémie gra e ( a d h moglobine < 80 g / L)1. La proportion de femmes
enceintes anémiées parmi ces femmes était :

1.2. Ratio
Le numérateur e a c dans le d nomina e r. C e le rappor de fr q ence de
de cla e d ne m me ariable. Il e prime o la forme d n nombre compri en re 0 et
f . Dan l e emple pr c den , le ra io femme encein e gra emen an mi e : femmes
enceintes modérément anémiées est égal à :

1
Ouédraogo S. et al. Maternal Anemia at First Antenatal Visit: Prevalence and Risk Factors in a Malaria-Endemic Area in
Benin. Am J Trop Med Hyg. 2012 Sep;87(3):418-24.

15
1.3. Taux
Soit un groupe de sujets initialement non malades (groupe ). Certains deviennent malades

au cours du temps, constituant le groupe (c e -à-dire le no ea ca ). A co r d ne

période , on in re e la i e e de ran fer d gro pe au groupe .

Dans une population de 3000 individus risquant de développer la maladie M, on a observé 45


cas de maladies en deux ans, soit un taux de :

1.4. Cote
C e le rappor en re la probabilité d'ob er er n nemen e celle d'ob er er l nemen
contraire. La cote est un ratio. Cette notion est très utilisée dans les milieux des jeux. Soit 5
000 personnes ayant parié en faveur ou en défaveur des Etalons lors du match Etalons vs
Éperviers pendant la CAN 2013: 2000 avaient parié que les Etalons perdrait et 3000 avaient
parié que les Etalons gagnerait. La cote de perdre pour les Etalons était : (2000/5000) /
(3000/5000), soit 0,7. On dira que les Etalons sont cotées à 0,7 contre 1.
1.5. Indice
To le rappor q i ne on ni ne propor ion, n a o n ra io de indice . C e le ca
par exemple du nombre de médecin par habitants, du nombre de formation sanitaire par
habitant ou encore le nombre de cardiologue par centre hospitalier régional, etc.

2. Principales mesures épidémiologiques


En pid miologie, roi pe de me re on ili . Il agi de mesures de la fréquence
d'un événement (« prévalence », « incidence », « mortalité », « létalité »), des mesures de
l'association entre une exposition à un facteur de risque et une maladie (« risque relatif ») et
des mesures de l'impact d'un facteur de risque dans une population (« mesures d'impact », «
fraction étiologique », « risque attribuable »). Toutes ces mesures font référence à trois
notions : le temps, le lieu, les personnes.

16
2.1. Mesures de fréquence
2.1.1. Mesures de prévalence
Elles prennent en compte le nombre de cas existants d ne maladie donn e ob er à un
moment donné dans une population donnée.
Prévalence absolue
Ce le nombre de cas existants à un moment donné. Par exemple, le fer est un
micronutriment précieux indispensable à la formation des globules rouges du sang. Pendant la
grossesse, les besoins en fer de la femme augmente pour répondre à la nécessité de fabriquer
beaucoup plus de sang pour la mère elle-même, pour le développement du placenta et du
f . La me re de l a de r er e en fer de l organi a ion e fai par le do age de la
ferritine dans le er m (ferri n mie riq e). On con id re q il a d fici (o manq e) en fer
lorsque la ferritinémie sérique est < 12 µg / L pendant la grossesse. Parmi les 1005 femmes
enceintes suivies au sud du Bénin, 335 présentaient un déficit en fer.
La prévalence absolue du déficit en fer est donc de 335 dans cette population en 20092.
Prévalence
La prévalence est une proportion3 et a a d . En cas de prévalence faible ou très
faible, il sera plus pratique de multiplier par 1 000, 10 000, 100 000 voire 1 000 000 pour
présenter les résultats.

Si l on reprend l e emple pr c den , la pr alence d d fici en fer a ein de la pop la ion de

femmes enceintes en 2009 au Sud du Bénin était de

2.1.2. Me e d i cide ce
Le me re d incidence prennen en comp e le nombre de nouveaux cas d ne maladie
ob er a co r d ne période donnée dans une population. Elles ne sont donc utilisables
que lorsqu'il est possible de distinguer, au cours d'une période donnée, les nouveaux cas de
ceux survenus avant le début de la période. On distingue le nombre de cas incidents,
l incidence c m l e, le a d incidence. Il fa a oir q e le d c ne q n nemen
particulier, et que les me re de mor ali con i en a i n probl me d incidence.
Nombre de cas incidents

2
Ouédraogo S et al. Maternal anemia in pregnancy: assessing the effect of routine preventive measures in a malaria-
endemic area. Am J Trop Med Hyg. 2013 Feb;88(2):292-300.

3
La prévalence n’est pas un taux, donc l’emploi de l’expression « taux de prévalence » est inapproprié.

17
Ce le nombre de nouveaux cas a co r d ne période donnée. Soit un groupe de 16
sujets, suivi pendant un an. Les résultats sont présentés dans la figure 1. La période à risque
correspond à la période de temps pendant laquelle le sujet est susceptible (« à risque ») de
d elopper l nemen di . Le nombre de cas incidents est 4 (sujets 3,4, 7 et 14).
Incidence cumulée (ou risque)
L incidence c m l e e ne proportion e n a pa d ni .

Sujet Durée de période à risque (mois)


1 12
2 PDV 8
3 M 8
4 M 4 PDV : perdu de vue
5 PDV 10 M : apparition de la maladie
6 12 DC : décès
7 M 6
8 12
9 DC 9
10 12
11 DC 2
12 PDV 6
13 12
14 M 6
15 PDV 4
16 PDV 8

0 2 4 6 8 10 12
Durée d’observation en mois
revolus
Figure 1 : S i i d n gro pe de 16 per onne

Po r l e ima ion d nombre de personnes à risque, il existe plusieurs situations :


Soit la composition des groupes étudiés est fixée au début de l'étude et n'est pas
renouvelée pendant la période d'étude : on parle de cohorte fermée ou fixe :
- le nombre d nemen , de perd de e o de d c a co r de la période
d ob er a ion e pe impor an par rappor l effec if ini ial : le nombre de
personnes à risque est alors égal à , l effec if de la pop la ion a d b de la
période d ob er a ion.
- ou bien ce nombre est important : le nombre de personnes à risque est alors égal à

18
avec : effectif de la population à la fin de la période

d ob er a ion.
Dan l e emple de la figure 1, le nombre de personnes à risque est égal à :

Comme le nombre de cas incidents est égal à 4, l incidence c m l e e gale :

Soit la composition des groupes change au cours du temps du fait d'un


renouvellement, partiel ou total, des sujets qui la composent : on parle de cohorte
dynamique :

Le nombre de per onne ri q e pe crire :

E emple : dan n camp de r f gi , la pop la ion a d b d ne ann e donn e e de 3 000


sujets et 4 500 à la fin de cette année. Au cours de cette année, 1 200 cas de choléra ont été
observés dans ce camp. Le nombre de personnes à risque est égal à:

soit une incidence cumulée de : %

Si la maladie est rare dans la cohorte, m est petit par rapport à et , et le nombre de

personnes à risque peut être estimé par :

Ta d c de ce ( de d c de ce)
Cette mesure doit être utilisée lorsque la période pendant laquelle l'incidence d'un événement
peut être étudiée (lors du suivi de la population) est variable selon les sujets. Le taux
d incidence a po r ni le personne-temps. Dans ce cas aussi, il peut être intéressant de
présenter les résultats en multipliant par un facteur 100, 1000, ...
Calcul du nombre de personne-temps à risque (dénominateur)
- Principe : chaque sujet ne compte pl po r la o ali de la p riode d ob er a ion
prévue pour la population entière, mais seulement pour la période pendant laquelle
on a pu observer ce je , a an la r en e de l nemen di . Ce e p riode
est appelée période à risque. Le nombre total de personne-temps pour une
population donnée est égal à la somme du suivi réalisé par tous les sujets de cette
population en nombre de personne-temps.
- Calcul : il peut être fait de deux manières :

19
Valeur exacte : on connaît la durée exacte de la période à risque de chacun des
sujets étudiés. Si on reprend l e emple pr c den (Figure1), le nombre de
personne-temps est égal:

Valeur estimée : on ne connaît pas la durée exacte de la période à risque de


chacun des sujets étudiés, la durée de la période à risque est alors estimée pour
le groupe dans son ensemble. Le nombre de personne-temps sera alors égal à :

Si l on reprend l e emple de la cohor e fi e, le nombre de per onne ri q e


est égal à 10,5 et , soit un nombre de personne-temps estimé à :
10,5 * 12 = 126 personne-mois. Comme le nombre de cas incidents est égal à
4, la den i d incidence est égale à 4/126 = 0,032 cas pour 1 personne-mois,
soit 3,2 pour 100 personne-mois. Si l on reprend l e emple de la cohor e
dynamique, le nombre de personnes à risque est égal à 3 150 et = 1 an, soit
un nombre de personne-temps estimé à 3150 * 1 = 3150 personne-années.
Comme le nombre de cas incidents est égal à 1 200, la densité d incidence e
égale à 1200/3150 = 0,38 cas pour 1 personne-année, soit 38 pour 100
personne-années.
Changeme d i : 600 personne-jours correspondent à 600 / 30,4375 soit 19,7
personne-mois, ou encore à 600 / 365,25 ou 19,8 / 12 soit 1,65 personne-années.
Selon l ni de emp choi ie, on pe donc ob enir de nombre r diff ren . Il
est donc très impor an d re igilan r l e pre ion de r la .
2.1.3. Mesures de mortalité
Elles prennent en compte le nombre de décès (par définition toujours des nouveaux cas)
ob er a co r d ne période donnée dans une population donnée. Il agi donc a i
d n probl me d incidence (l' nemen an le d c , on me re l'incidence de la mort). Les
mesures utilisées sont les mêmes que pour une maladie.
Mortalité brute / spécifique
On parle de mortalité brute lorsque l'on tient compte de tous les décès, quelle que soit leur
cause, et de mortalité spécifique lorsque l'on ne prend en compte que certains groupes
spécifiques (âge, sexe, etc) ou à une maladie spécifique (paludisme, cancer, etc). En 2010,

20
dans la région sanitaire du Centre-Ouest au Burkina Faso, 152 décès liés au paludisme grave
et concernant des sujets de sexe masculin de 0 à 5 ans ont été recensés parmi les 162 décès
recensés dans la population de la région. La mortalité brute du paludisme grave est de 162. La
mortalité spécifique du paludisme grave chez les sujets âgés de 0 à 5 ans et de sexe masculin
est 1524.
2.1.3.1. Part de mortalité
On appelle part de mortalité le rapport entre le nombre de décès liés à une cause donnée au
nombre o al de d c a co r d ne p riode donn e. Dan l e emple pr c den , en 2010, la
part de mortalité liée au paludisme grave chez les sujets de sexe masculin de 0 à 5 ans est :
152 / 162 = 0,938, soit 93,8%.
2.1.3.2. Létalité
Cette notion se réfère à la survenue des décès liés à une maladie donnée, chez les personnes
atteintes de cette maladie.

En 2012, dans la ville de Ouagadougou au Burkina Faso, il y a eu 1 713 je ic ime d n


accident de la voie publique grave (AVPG), dont 800 sont décédés sur le lie de l acciden .
La létalité avant hospitalisation che le je ic ime d AVPG est : 800 / 1 713 = 46,7%
(données fictives).
Relation entre les différentes mesures de fréquence
En re me re d incidence e me re de pr alence :
Si l incidence e la pr alence on con an e e q e la pr alence e faible (< 0,1) :

Une prévalence élevée peut donc correspondre à une incidence élevée ou à une durée
mo enne de la maladie long e (l ali faible). A l in er e, ne pr alence faible pe
correspondre à une incidence faible, à une durée moyenne de la maladie courte (maladie
aiguë, taux élevé de guérison), à une létalité élevée.
En re incidence c m l e e den i d incidence

2.2. Me e da ca
2.2.1. Contexte
La recherche de facteurs qui expliquent une incidence plus élevée (ou moins élevée) du
problème de santé chez les sujets exposés et chez les sujets non exposés con i e l ne de
4
Plan d’action 0 . Direction Régionale de la Santé du Centre-Ouest. Juin 2012.

21
principale q e ion q i e po en l pid miologi e. Cette recherche repose sur l'étude de
l'existence d'une association (d'un lien, d'une relation) entre l'exposition à une caractéristique
et la maladie. Cet aspect de l'épidémiologie est appelé épidémiologie analytique. Il est
toujours nécessaire de comparer au moins deux groupes. Par exemple, on sait que le taux de
mortalité par cancer broncho-pulmonaire est de 227 / 100 000 personne-années chez les
fumeurs. Cette information ne donne néanmoins aucune indication sur le lien entre tabac et
cancer du poumon. En revanche, i l on conna le taux de mortalité du cancer broncho-
pulmonaire chez les non-fumeurs e il e pl ba q e che le f me r de fa on
significative, alors on peut affirmer q il a ne a ocia ion en re le fai de f mer e la
mortalité par cancer broncho-pulmonaire.
2.2.2. Tableau de contingence
Plusieurs types d'étude sont utilisés pour la recherche d'une association. Quels qu'ils soient,
leurs résultats doivent pouvoir être présentés dans un tableau de contingence, classant les
individus selon leur statut vis-à-vis de la maladie (malade/non malade) et vis-à-vis de
l'exposition à la caractéristique étudiée (exposé/non exposé). Ceci est vrai si les variables
exposition et maladie sont catégorielles (et dans le cas présent, dichotomiques).
Tableau 1 : Répartition des sujets selon le statut
Malade Non Malade Total
Exposés A b E1
Non Exposés C d E0
Total M1 M0 M1 + M0 = E1 + E0 = T

2.2.3. Mesure d a cia i


La mesure d'association repose toujours sur la comparaison de deux groupes pour la mesure
obser e. To efoi , on pe lire le ablea elon l e po i ion (comparai on de je e po
et des sujets non exposés), ou selon la maladie (comparaison des malades et des non malades).
Soit on compare un groupe exposé à une caractéristique, et un autre non exposé à cette
caractéristique (groupe de référence). On calcule l'incidence de la maladie étudiée
dans chacun des deux groupes, soit : R1 = a / E1 dans le groupe exposé et R0 = c / E0
dans le groupe non exposé, et on écrit le risque relatif (RR) :

Th oriq emen , l end e de ale r d RR pe aller de 0 pl l infini. L in erpr a ion d


RR figure dans le tableau 2.

22
Tableau 2 : Interprétation du RR en fonction du résultat
RR* Interprétation* Synthèse*
=1 Il n a pa d a ocia ion en re l e po i ion e la maladie Pas
d a ocia ion
>1 L a ocia ion e po i i e : le risque de maladie est plus élevé chez Facteur de
les sujets exposés que chez les non exposés risque
<1 L a ociation est inverse : le risque de maladie est moins élevé chez Facteur
les sujets exposés que chez les non exposés protecteur
* L in erpr a ion doi galemen enir comp e de l in er alle de confiance de la me re
d a ocia ion o d e a i iq e correspondant.
Comment énonce-t-on ces résultats en pratique ?
RR = 1,30. Un je e po a n ri q e d re malade 1,30 foi pl le (o bien encore a
n ri q e p rie r de 30 % d re malade) q n je non e po .
RR = 2,00. Un sujet exposé a un risq e de foi pl le q n je non e po (o
supérieur de 100%).
RR = 0,65. Cela ignifie q e le ri q e d n je e po e 0,65 foi cel i d n je non
exposé ou encore un sujet exposé a un risque plus faible de 35 % (= [1 - 0,65] * 100) d re
malade q n je non e po . C e ce e derni re e pre ion ( ri q e plus faible de x % »)
q e l on ili e le pl o en .
Soit on compare un groupe de sujets malades (« cas ») et un groupe de sujets ne
pr en an pa (e n a an jamai pr en ) ce te maladie (groupe de référence : «
témoins »). Le nombre de cas et de témoins, donc de sujets présentant ou non
l'événement, est fixé dès la conception de l'étude. Il est donc impossible d'estimer une
incidence de la maladie et d ili er ne me re d'a ociation s'appuyant sur cette
incidence (RR en particulier). La mesure d'association la plus fréquemment utilisée est
alors le rapport de cotes d'exposition, RC (exposure odds ratio en anglais, OR). Pour le
calc ler, il fa d abord calc ler la co e d e position chez les cas (CEC) et chez les
témoins (CET). La cote d'exposition est le rapport entre la probabilité d'être exposé et
la probabilité de n'être pas exposé.

23
Tableau 3 : Co e d e po i ion d apr le no a ion propo e dans le tableau 1

Apr a oir calc l le co e d e po i ion, on forme le rappor de co e (RC) :

Th oriq emen , l end e de ale r d RC pe aller de 0 pl l infini. L in erpr a ion d


RC figure dans le tableau 4. En pratique, dans une population où l'événement est rare
(prévalence < 20 %), le RC est une bonne approximation du RR que l'on pourrait calculer à
par ir d' ne de perme an d e imer l incidence r la m me population. L'interprétation du
RC est alors similaire à celle du RR.
Il existe d'autres mesures d'association selon le schéma d'étude retenu. La mesure
d'association en elle-même ne suffit pas à déterminer s'il existe une association entre une
exposition et une maladie. Il faut également prendre en compte d'autres notions, telles que
l'intervalle de confiance de la mesure d'association et la valeur du test statistique, pour
déterminer si l'association observée peut être due au seul hasard, ou, au contraire, est stable,
c e -à-dire « statistiquement significative ».

Tableau 4 : Interprétation du RC en fonction du résultat


RC* Interprétation* Synthèse*
=1 Il n a pa d a ocia ion en re l e po i ion e la maladie Pas
d a ocia ion
>1 L a ocia ion e po i i e : le risque de maladie est plus élevé chez Facteur de
les sujets exposés que chez les non exposés risque
<1 L a ocia ion e in er e : le risque de maladie est moins élevé chez Facteur
les sujets exposés que chez les non exposés protecteur
* L in erpr a ion doi en fai galemen enir comp e de l in er alle de confiance de la me re
d a ocia ion o d e tatistique correspondant.

24
Il existe d'autres mesures d'association selon le schéma d'étude retenu. La mesure
d'association en elle-même ne suffit pas à déterminer s'il existe une association entre une
exposition et une maladie. Il faut également prendre en compte d'autres notions, telles que
l'intervalle de confiance de la mesure d'association et la valeur du test statistique, pour
déterminer si l'association observée peut être due au seul hasard, ou, au contraire, est stable,
c e -à-dire « statistiquement significative ».

2.3. Me e d ac
Si les mesures d'association mettent en évidence une association entre l'exposition à un
fac e r de ri q e e ne maladie, il e in re an galemen d al er la con rib ion de ce
fac e r la fr q ence d ne maladie dan ne pop la ion donn e, donc d e imer on
importance en termes de santé publique. A cette fin, on utilise des mesures d'impact,
applicable niq emen il e i e ne rela ion ca ale en re le facteur de risque et la maladie.
Si l'on compare deux groupes, l'un exposé à une caractéristique, l'autre non exposé à cette
caractéristique, on peut estimer :
quel est le risque supplémentaire lié au facteur de risque
Cette notion fait appel à celle de différence de risque, le risque chez les non exposés étant
considéré comme le risque de base (en dehors de toute exposition). Si la mesure de fréquence
est un risque, on parle de risque attribuable au facteur de risque.

Tableau 5 : Calc l d ri q e a rib able d apr le ablea 1


Chez les exposés
Dans la population avec : risque dans la population estimé par le risque
de l en emble de je i i :
DR : Différence de risque
quelle est la part du risque supplémentaire lié au facteur de risque dans le risque total
observé.
Cela représente la proportion de cas que l'on peut attribuer au facteur de risque, et donc que
l'on pourrait éviter si l'on supprimait ce facteur de risque dans ce groupe. On parle de fraction
(de risque) attribuable chez les exposés ( ) et dans la population ( ).

25
Tableau 6 : Calc l de la frac ion a rib able d apr le ablea 1

Chez les exposés

Dans la population
avec : pr alence de l e po i ion (fac e r de ri q e) dan la
population ;

combien de cas sont dus au facteur de risque dans la population et seraient donc
évités si le facteur de risque était supprimé dans cette population.
On parle de nombre de cas attribuables. Il est égal à : ; Pour une maladie donnée,
la fraction de risque attribuable à un facteur de risque dans la population dépend donc de la
force de l a ocia ion en re le facteur de risque et la maladie (RR) et de la prévalence du
facteur de risque dans la population (PE).
Une association entre un facteur de risque et une maladie peut être forte, mais si le
facteur de risque est rare, son importance en termes de santé publique sera faible.
En revanche, un facteur de risque peut être plus faiblement lié à une maladie, mais
il e fr q emmen observé dans la population générale, son impact peut être
important.
Pour une population et un facteur de risque donnés (donc PE constante), on
souhaite dier l impac de ce fac e r de ri q e r de maladie X1 et X2. Or, la
force d a ocia ion po r X1 e inf rie re la force d a ocia ion po r X2 (RR1 <
RR2), donc la fraction attribuable pour X1 est inférieure à celle pour X2. Si le
nombre de cas de X1 est plus important que le nombre de cas de X2, on pourra
observer un impact numérique plus important du facteur de risque sur X1 que sur
X2 en termes de santé publique. Par e emple, l amian e e l origine d en iron
5% des cas de cancer broncho-pulmonaire (soit 1200 décès en France en 1996),
alor q il e le principal fac e r étiologique du mésothéliome (environ 75% des
cas de mésothéliome sont liés à une e po i ion l amian e, repr en an 750 d c
en France en 1996).

26
Chapitre 3 : Intervalle de confiance
Objectifs de la leçon
calc ler n in er alle de confiance d ne mo enne ;
calculer un in er alle de confiance d ne propor ion pour les grands effectifs;
interpréter un in er alle de confiance d n e ima e r.
Plan de la leçon
Introduction ;
In er alle de confiance d ne mo enne ;
In er alle de confiance d ne propor ion ;
Interprétation d n in er alle de confiance.
1. Introduction
Le plus souvent, on dispose de données sur un échantillon et on utilise ces informations pour
décrire la population dont cet échantillon est issu. La description résumée de la distribution
d ne ariable et la comparaison de la distribution observée de cette variable dans un
échantillon par rapport à sa distribution attendue dans la population ou à sa distribution
observée dans plusieurs groupes résumés de la distribution de la variable, constitue les deux
ape de l anal e de donn e .
On souhaite utiliser les résultats obtenus dans un échantillon pour estimer la vraie valeur dans
la population. Par exemple, dans un échantillon, on trouve que la pression artérielle systolique
moyenne est 140 mmHg. Quelle information sur la vraie valeur dans la population ce résultat
apporte-t-il ?
Fai on l h po h e q e l chan illon e représentatif de la pop la ion, c e -à-dire constitué
sans biais, au mieux par tirage au sort. Si l on irai a or de chan illon cce if
par ir d ne m me pop la ion, chaq e chan illon fo rnirai ne e ima ion ponc elle d
param re d in r (par e emple, ici, la moyenne). On peut comprendre intuitivement que
cette estimation va a e d cha a e, en suivant une loi de probabilité. Cela
no aide comprendre po rq oi a ein d n chan illon repr en a if, la mo enne, m, d ne
variable, peut différer de la moyenne de la population, , uniquement du fait du hasard. Cette
fl c a ion e impor an e prendre en comp e, m me i l on a end ce q e m soit très
proche de , p i q e l chan illon e repr en a if de la pop la ion. Il e donc n cessaire
d appr cier l incertitude associée à notre estimation, grâce à un intervalle de confiance.
Dans ce chapitre, nous aborderons le cas des petits et des grands échantillons pour une
variable quantitative, et seulement le cas des grands échantillons pour les variables
catégorielles.

27
2. F c a d cha age : e e ed e e e, a ab e a a e
Une fa on de proc der e de ppo er q e l chan illon don no di po on n e en fai
q n de m l iple chan illon d ne aille donn e, n, repr en a if de la pop la ion, q il
est possible de constituer. Comment varient alors les moyennes observées dans les
échantillons, m1, m2, m3, e c. par rappor la mo enne de la pop la ion, ?
Intuitivement, on peut penser que la moyenne de chaque chan illon arie a o r de , comme
le ale r indi id elle d n chan illon arien a o r de la mo enne, elon n cer ain car ,
et selon une loi de probabilité connue. De plus, on admettra que la moyenne obtenue dans
chaque échantillon varie autour de elon le propri i an e :
1) la ariabili a o r de e moin impor an e a ec le chan illon de grande aille
q a ec ce de pe i e aille,
2) la ariabili a o r de e moin impor an e q e la ariabili de ob er a ion
individuelles dans la population,
3) la ariabili a o r de e propor ionnelle la ariabili de ob er a ion
individuelles (écart- pe, ).
Ces propriétés permettent de montrer mathématiquement (dans cet enseignement, vous
admettrez les résultats) que :
1) en moyenne, la valeur observée dans un échantillon, mi, est une bonne estimation de la
mo enne de la pop la ion, . Ce e e ima ion era d ormai notée , le chapeau
ignifian q il agi d ne e ima ion de la raie ale r.
2) la distribution des moyennes est Normale si la distribution des données individuelles
est Normale. Quelle que soit la distribution des données individuelles, la distribution
des moyennes suit une loi approximativement Normale, si les échantillons sont de
aille ffi an e, c e -à-dire 30.

3) l car -type des moyennes de plusieurs échantillons est égal à . On appelle ce

rappor l erreur-type po r le di ing er de l car -type inter-individuel (ou « écart-


type »).
4) la ariance de l chan illon no e s2 est une bonne estimation de la variance au sein de
la pop la ion ( 2) i l on ili e n-1 au dénominateur, et non n. Dans ce cas, pour
l'estimation dans la population, on utilise la notation (sigma chapeau carré) :

28

3. I e a e de c f a ce d e e e
3.1. Cas des grands échantillons
L erre r- pe e ile po r con r ire l intervalle de confiance de la moyenne. On peut
remplacer par l e ima ion de l car -type de la population, q e l on pe obtenir à partir de
l'écart-type s ob er dan l chan illon.
Si n 30, on con id rera, a ec n ri q e d erre r de 5%, q e la mo enne inconn e, , doi

être comprise entre et . C e l in er alle de confiance 95%

de la moyenne, ou encore :

Que l'on peut aussi écrire

Par exemple, dans un échantillon de 100 hommes jeunes, la moyenne de la concentration


ang ine de chole rol o al ang in e 1,84 g/l e l car -type e 0,4 g/l. L in er alle de
confiance à 95% de la moyenne est donc égal à : 1,84 1,96 * 0,04 = [1,76-1,92] g/l.

L in er alle de confiance 95% e le pl co rammen emplo , mai il arri e q e l on


con r i e n in er alle d a re ni ea de confiance. Po r calc ler n in er alle de
confiance à 99%, la seule différence sera U , qui, dans ce cas, vaut : 2,5758 (ou 2,58). Pour
l e emple, on ro e n in er alle de confiance à 99% de la moyenne égal à : 1,84 2,58 *
0,04 = [1,74-1,94] g/l. Cet intervalle est plus large que le précédent car on a moins de chance
de e romper en di an q e l in er alle con ien . En con repar ie, on a pl d incer i de
sur .
De façon g n rale, l in er alle de confiance (1- )% cri :

3.2. Cas des petits échantillons

29
La distribution théorique des moyennes est Normale à condition que la taille des échantillons
soit suffisamment grande ( 30). Pour des échantillons de plus petite taille, et à condition
que la distribution théorique de la variable soit Normale, la distribution des moyennes est un
peu différente : la forme de la courbe est plus aplatie que la loi Normale correspondante. Cette
loi, dite de Student, dépend du nombre n de sujets. La distribution t de Student a un seul
paramètre, le nombre de degrés de liberté. L en r e dan la table de Student est le nombre
de degrés de liberté.
Po r le calc l de l in er alle de confiance de la moyenne, le nombre de degrés de liberté est
égal à n-1. A condi ion de po oir faire l h po h e q e la ariable i e ne loi Normale
dan la pop la ion, on a donc po r l in er alle de confiance de la mo enne :

Sur un échantillon de 26 sujets, la moyenne de la concentration de glucose dans le sang est


5,50 mmol/l et la variance, , 1,25 (mmol/l)2. On considère que la concentration de glucose
dans le sang a une distribution Normale dans la population dont est issu cet échantillon.
Comme le nombre de je e inf rie r 30, on calc le l in er alle de confiance 95% de la
moyenne en faisant : 5,50 2,06 * 0,219 = [5,05-5,95] mmol/l, car pour et 25 degrés
de liberté, on lit dans la table de Student 2,0595, soit 2,06. On est confiant que la vraie valeur
de la moyenne de la concentration de glucose dans le sang est comprise entre 5,05 et 5,95
mmol/l.

Dan le ca de pe i chan illon , o i l on a de bonnes raisons de penser que la variable


q an i a i e ne i pa ne loi Normale, l age de la m diane e de l end e in erq ar ile
o de l end e (minim m-ma im m) e o en pr f r po r d crire la di rib ion d ne
variable quantitative plutôt que celui de la moyenne et de son intervalle de confiance.

4. Intervalle de c f a ce d e e grands échantillons


Pour une variable catégorielle dichotomique, le nombre de fois où une catégorie, par exemple
« femmes » pour la variable « sexe », apparaît dans un échantillon de taille n suit une loi
binomiale. La forme d ne elle di rib ion e a m riq e, mai de ien de pl en pl
symétrique lorsque n augmente et peut ressembler à une distribution Normale. On peut
montrer que cette appro ima ion par la loi Normale e correc e lor q e la propor ion d ne

30
des catégories dans la population, notée P, et son complémentaire, 1- P, sont tous deux plus
grands que 5/n ou encore que : (P * n) et [(1- P) * n] sont tous deux plus grands que 5.
De fa on imilaire la no a ion po r la mo enne de ariable q an i a i e , l in er alle de
confiance à ( )% de la propor ion d ne de ca gorie d ne ariable ca gorielle cri
:

Par exemple, si dans un échantillon de 100 enfants de 5 à 10 ans, représentatif de la


population des enfants du même âge, on ro e q e 20 d en re e pr en en de igne
d allergie, la propor ion de enfan a an de igne d allergie e 0,20 o 20%. L in er alle
de confiance à 95% de cette proportion vaut :

On doit vérifier a posteriori que le calcul était possible de cette façon-là, en faisant : (P * n)
et [(1- P) * n]. Comme on ne connaît pas P, on utilise son estimation à chacune des bornes de
l in er alle de confiance. Dan l e emple, on ro e re pec i emen : (0,12 * 100) et (0,88 *
100) et (0,28 * 100) et (0,72 * 100), qui sont tous supérieurs à 5. En pratique, il suffit de faire
la vérification avec la plus petite des quatre proportions (0,12 *100).
De façon similaire à la notation pour la moyenne de variables quantitatives, la précision de
l e ima ion de la fr q ence e :

5. I e a de e a e de c f a ce
Po r n in er alle de confiance 95%, il n e pa correc de dire q il a 95% de chance
que la moyenne de la pop la ion oi dan l in er alle : la mo enne de la pop la ion an ne
ale r niq e, q i ne fl c e pa , elle n e pa a ach e de probabili . 95% , c e la
probabili q e le limi e calc l e par ir d n chan illon repr en a if incl ent la vraie
valeur, . La construction de cet intervalle rend donc son interprétation délicate.

31
La figure 2 donne n e emple d calc l d in er alle de confiance par ir de 20 chan illon
tir a or d ne pop la ion de femme encein e dont on sait que le poids moyen, , est
56,8 kg cm. Le trait horizontal représente la moyenne dans la population, 172 cm. Certains
de chan illon on ne mo enne proche de ce e ale r, d a re on ne mo enne q i en e
bien plus éloignée. Pour certains, la moyenne est au-de , po r d a re , elle e a -dessous.
La moyenne de la population, 56,8 kg, est contenue dan l in er alle de confiance de 20
échantillons sur 20, soit 100% des intervalles de confiance.

64

62

60
Poids (Kg)

58

56

54

52

50
56,8 kg
48

46
E1 E2 E3 E4 E5 E6 E7 E8 E9 E10 E11 E12 E13 E14 E15 E16 E17 E18 E19 E20

Figure 2 : Intervalles de confiance à 95% calculés à partir de 20 échantillons de 50 sujets


i d ne pop la ion de femme encein e don la mo enne e 56,8 kg.

En général, au moins 95% des intervalles ainsi calculés contiennent la valeur de la moyenne
de la population. Comme nous ne pouvons pas savoir, néanmoins, quels sont les 95
chan illon r 100 q i la con iennen , on di q e l on e confian q e la mo enne e
ro e l in rie r de limi e calc l e par ir d n e l chan illon, en par ic lier.

Enfin, la partie est appelée précision de l e ima ion.

Par e emple, dan l chan illon de 100 homme je ne , la pr ci ion de l e ima ion e de
0,08 g / l po r l in er alle de confiance 95%.

32
Chapitre 4 : Différentes e d enquêtes en épidémiologie
Objectifs de la leçon
li er le diff ren e pe d enq e épidémiologiques ;
décrire la différence entre enquêtes expérimentales et non expérimentales ;
décrire les enquêtes épidémiologiques non expérimentales.
Plan de la leçon
principa pe d enquêtes épidémiologiques ;
distinction entre enquêtes expérimentales et non expérimentales ;
principales enquêtes épidémiologiques non expérimentales.
1. P c a e de e d g e
En fonction de l'objectif recherché, plusieurs types d'enquêtes sont utilisés en épidémiologie.
Il est possible de les classer selon leur schéma d'étude (« design ») (Figure 3).

Etude expérimentale
Etude longitudinale (cohorte)

descriptive
Etude transversale

E de d b e a i Etude de cohortes

analytique Etude cas-témoins

Etude transversale

Figure 3 : Principa pe d de pid miologiq e

2. Distinction entre études expérimentales et non expérimentales


Toutes les études épidémiologiques peuvent être classées selon qu'il s'agit d'une
expérimentation ou non. Cette distinction est importante car elle a des implications sur la mise
en place de l'étude elle-même, son analyse, mais aussi l'interprétation et la portée des
résultats.
On entend par études expérimentales celles dans lesquelles l'équipe réalisant la
recherche maîtrise les conditions d'exposition des sujets (qui sera exposé, à quoi,
comment, quand, où). Il agi d ne e p rimen a ion. Le gro pe e po e non
exposé à la caractéristique seront suivis puis comparés en ce qui concerne l'incidence

33
de l' nemen di . L affec a ion d' n sujet dans l'un ou l'autre des groupes
comparés peut être tirée au sort (« étude randomisée » ; essais cliniques de phase III)
ou non.
1) Inclusion : 2) Recueil des informations
attribution exposition malade/non malade ?
exposé/non exposé

Groupe
sujets

Début de l’étude

Figure 4 : Sch ma g n ral d ne de e p rimentale

Par e emple, ilFigure 2 : Sch


agi de e aimacliniq
g n ral
e dq ine
permede en
e pd'rimen
al erale.
l'efficaci o la tolérance
de traitements médicamenteux, chirurgicaux, ou autres. Il peut s'agir aussi d'études évaluant
d'autres types d'intervention : campagnes de prévention, de dépistage. Dans un essai clinique
de pha e III, il e po ible d e imer comme :
me re de fr q ence : de me re d incidence de la maladie
me re d a ocia ion : le RR.
Lorsqu'elles sont bien conduites, ces études représentent le schéma idéal pour étudier la
relation entre une exposition à une caractéristique et la survenue d'une maladie, puisque les
groupes comparés ne diffèrent que par un seul caractère : l'exposition. Néanmoins, cette
approche n'est pas toujours possible, souvent pour des raisons d'ordre éthique si l'exposition à
laquelle un des groupes de sujets devrait être soumis est potentiellement dangereuse. Par
exemple, comment proposer à des sujets de commencer à fumer pour étudier s'il existe une
association entre le tabagisme et le cancer de la vessie, en comparaison avec un groupe ne
fumant pas ? Il est alors nécessaire de recourir à des études ne reposant pas sur une
expérimentation, car, le plus souvent, il n e pa po ible de con r ler de compor emen o
bien des facteurs.

34
Dans le cas des études non expérimentales, l'équipe réalisant la recherche « observe »
la réalité, sans intervenir sur les conditions d'exposition des sujets étudiés. C'est la
raison pour laquelle ces études sont également appelées études d'observation.
3. Principales études non expérimentales
3.1. Enquête transversale
Le principe des enquêtes transversales est simple : il s'agit de mesurer chez les individus
d'une population donnée un ensemble de caractéristiques, au même moment. Ce sont des
études de courte durée, ne permettant d'estimer que des mesures de prévalence. Elles sont
utilisées généralement pour des objectifs descriptifs. Elles sont également souvent utilisées à
visée analytique, mais les résultats obtenus sont plus difficilement interprétables car
l'exposition à la caractéristique et la présence de la maladie sont mesurées au même moment.
Sélection des sujets
Et
Recueil des informations (exposé/non exposé ?malade/non malade) ?

Groupe
de
sujets

Début de l’étude

Figure 5 : Sch ma g n ral d ne de ran er ale

Dan ne de ran er ale, il e po ible d e imer comme :


mesures de fréquence : des mesures de prévalence de la maladie chez les sujets
e po e che le je non e po (o de l e po i ion che le je malade e
chez les sujets non malades)
me re d a ocia ion : le rappor de pr alence de la maladie (o de l e po i ion).
3.2. Enquête de cohortes
Ces études sont également appelées études exposés/non exposés car deux groupes de sujets
(au moins), l'un exposé, l'autre non exposé à la caractéristique, ne présentant pas
35
ini ialemen l nemen di , on suivis puis comparés pour l'incidence de cet
événement. Le principe de la comparaison est donc proche de celui des études
e p rimen ale , mai il fa e o enir d ne différence majeure : ici, l'exposition n'est pas
contrôlée par l'équipe réalisant la recherche.
Selon le moment d'inclusion des sujets dans l'étude, on distingue :
les études de cohortes prospectives : les sujets sont inclus dans l'étude avant la
survenue de l nemen p i i i de fa on pro pec i e a co r d emp ;
1) Inclusion : 2) Recueil des informations
identification au temps t malade/non malade ?
exposé/non exposé

Exposés

Non exposés

A B
Temps

Début de l’étude

Figure 6 : Sch ma g n ral d ne de de cohor e pro pec i e


les études de cohortes rétrospectives ou historiques : les sujets sont sélectionnés
après la survenue de l'événement chez certains d'entre eux.
Re ene q il fa pri il gier a an q e po ible le de de cohor e pro pec i e par
rapport aux études de cohor e hi oriq e . En effe , le rec eil de donn e r l e po i ion
avant la survenue de la maladie est plus fiable et plus précis. Dans une étude de cohortes, il
e po ible d e imer comme :
me re de fr q ence : de me re d incidence de la maladie
me re d a ocia ion : le RR.

36
1) sélection des sujets : identification au temps B
exposition exposé/non exposé au temps A
2) recueil des informations : malade/non malade ?

Exposés

Non Exposés

Temps A
B

Début de l’étude

Figure 7 : Sch ma g n ral d ne de de cohor e r ro pec i e

3.3. Enquêtes ca-témoins


Ces études reposent sur le principe inverse à celui des études de cohortes. Ici, les deux
groupes étudiés sont, d'une part, des sujets présentant l'événement (les « cas ») et, d'autre
part, des sujets ne présentant pas l'événement (les « témoins »). Ces deux groupes seront
comparés pour leur exposition antérieure à une caractéristique donnée.
Il faut à nouveau insister sur le fait que les études cas-témoins ne permettent pas de calculer
l'incidence de l'événement parmi les sujets étudiés puisque le nombre de cas et de témoins est
fixé par l'équipe réalisant la recherche.
Dans une étude cas- moin , il e po ible d e imer comme :
me re de fr q ence : de me re de pr alence de l e po i ion che le ca
e che le moin , e la co e d e po i ion dan chac n de ce de gro pe
me re d a ocia ion : le RC (d e po i ion).
3.4. Enquête écologique
Elles étudient l'association (la corrélation) entre les variations d'indicateurs collectifs
d'e po i ion e de an , lor q e l on ne pe di po er de donn e l chelon indi id el. Elle
sont donc différentes des autres types d'étude utilisés en épidémiologie analytique car elles ne
tiennent pas compte de l'exposition ou de l'état de santé de chaque individu appartenant aux
groupes comparés, mais du niveau moyen d'exposition et de l'état de santé de populations, ce
qui se traduit par l'emploi du terme « écologique ».

37
1°) sélection des sujets :
identification maladie
malade/non malade
2°) recueil des informations
exposé/non exposé ?

Malades

Non malades

D b de l de

Figure 8 : Sch ma g n ral d ne de ca -témoins

On peut étudier la même population à différentes périodes (variations temporelles) ou


plusieurs populations de différentes zones géographiques au cours de la même période
(variations géographiques). Par e emple, ce pe d enq e perme d dier la rela ion en re
de me re de poll an de l a mo ph re (CO2, o one, f m e noire , ) ob en e gr ce
des capteurs installés dans des villes et la mortalité dans les jours suivants recueillie à partir
des données hospitalières ou des certificats de décès.

38
Chapitre 5 : P c e a d d e e ee d ge
Objectifs de la leçon
d crire le ra gie po an am liorer la pr ci ion d ne me re
épidémiologique ;
décrire le 2 compo an e de la alidi d ne me re pid miologiq e ;
diff ren ier ne erre r al a oire d n biai ;
d crire le ra gie po an am liorer la alidi d ne me re pid miologiq e.
Plan de la leçon
Introduction
Pr ci ion d ne me re en pidémiologie
Validi d ne me re en pid miologie
1. Introduction
Chaque étude épidémiologique est un exercice de mesure servant à décrire ou à comparer. On
souhaite par exemple décrire la proportion de malades ou le poids moyen dans un échantillon.
Une étude cherche par exemple à comparer des femmes enceintes infectées et des femmes
enceintes non infectées par le Plasmodium falciparum (l ne de 5 e p ce pla modiale
pa hog ne po r l homme) po r la r en e d ne an mie ge a ionnelle afin d dier
l a ocia ion en re l e po i ion a P. falciparum e l an mie a co r de la gro e e. Or, le
r l a q e l on ob ien par ir d ne enq ee ne combinai on de la raie ale r (celle
q e l on ob er erai i l on po ai dier la pop la ion en i re de jets auxquels on
o hai e appliq er le r l a ) e d erre r commi e diff ren e ape de l enq e. Pour
imple r ali me, no adme on q e m me l enq e la mie planifi e ne pe prod ire n
r la d n d erre r. En re anche, pl on a ra pris de soins po r planifier l enq e, pl
le erre r eron minimi e . Le premier pe d erre r, o l a e appri , e d a
fl c a ion d chan illonnage : c e ne erreur aléatoire, due au hasard. Le deuxième type
d erre r e d la concep ion de l de, la con i ion de gro pe o a proc d re de
cla emen ili e po r carac ri er l e po i ion e la maladie : c e ne erreur
systématique, ou biais.

Ces erreurs peuvent changer les résultats attendus de la vraie valeur, soit en surestimant, soit
en sous-e iman le ale r ob en e , e pe en m me parfoi modifier la direc ion d n
effet (par exemple, un facteur de risque peut apparaître protecteur vis-à-vis de la maladie
di e). Une par ie impor an e d ra ail de l pid miologiste consiste à reconnaître, prévenir

39
e ma ri er ce erre r . A o e le ape d ne de : mi e en place, d ro lemen e
anal e, il e donc ile de r fl chir a o rce po en ielle d erre r.

To a long de ce chapi re, on parlera d effet pour r mer l a ocia ion en re ne e po i ion
et un problème de santé. Le raisonnement concerne donc en premier lieu les études
compara i e (le champ de l pid miologie di e anal iq e). N anmoin , le rai onnemen
utilisé dans le cadre des biais de sélection o de ma ai e cla ifica ion appliq e a e bien
aux études descriptives.

2. P c (ab e ce d e e a a e)
2.1. Notions générales sur la précision
L chan illon don on di po e n momen donn n e en fai q n de chan illon parmi
les multiple chan illon d ne aille donn e, n, repr en a if de la pop la ion, q il e
possible de constituer. Comme pour les moyennes ou les proportions, les valeurs des mesures
de pr alence, d incidence o d a ocia ion ob en e par ir de o le chan illons
possibles varient autour de la vraie valeur de cette mesure, selon un certain écart, et selon une
loi de probabilité connue.
D aillon pr en ce q e cela impliq e po r le RR par e emple. En l ab ence d effe , le RR
calc l par ir de l en emble de la population serait égal à 1. Dans un échantillon
repr en a if de ce e pop la ion, d e l fai de fl c a ion d chan illonnage, le RR ob en
sera le plus souvent proche de la valeur 1, mais il sera exceptionnellement exactement égal à
1. Inversemen , en pr ence d n effe , le RR calc l par ir de l en emble de la pop la ion
sera éloigné de 1 : pour un facteur de risque, il sera supérieur à 1, selon une gamme de valeurs
r end e, p i q elle pe aller j q l infini.
Par exemple, si la vraie ale r d RR e 3 dan la pop la ion, on ai q il era e cep ionnel,
d fai de fl c a ion d chan illonnage, d ob er er pr ci men ce e ale r dan n
échantillon représentatif. On sait toutefois que, grâce à un échantillon représentatif, on
observera, le plus souvent, une valeur proche de 3.
Po r chaq e chan illon, q el q e oi l e ima e r, il e donc po ible de calc ler n
in er alle de confiance de l e ima ion. Il ffi , po r cela, de a oir calc ler l car -type et de
connaître (ou de faire ne h po h e r) la loi de probabili . L e ima ion e d a an pl
pr ci e q e l car e pe i . Or, ce car d pend l i-m me de l car - pe de l e ima e r e de
la aille de l chan illon : e a e ada a c e e a variabilité de la
e e e fa b e e e a a e de cha e g a de.

40
La diffic l ien le pl o en d fai q e l on in re e de diff rence o de ra io e
pas seulement à une proportion ou une moyenne, dont on sait déjà calculer l in er alle de
confiance. Pour illustrer le problème, on abordera dans ce cours le cas de la différence entre
deux moyennes.

2.2. Illustration à partir de la différence des moyennes


On o hai e a oir i l a h ma ologiq e e diff ren che le femme enceintes infectées
par le P falciparum et chez les femmes enceintes non infectées par le P falciparum au cours
des 2 premiers trimestres de la grossesse (âge gestationnel 28 emaine d am norrh e) dan
le sud du Bénin. Une étude de 1005 sujets (152 femmes enceintes infectées et 853 non
infec e ) rappor e q e le a d h moglobine, a co r de de premier rime re de la
grossesse, était en moyenne de 97,9 g/L chez les femmes infectées et 104,1 g/L chez les
femme non infec e . L car -type était très proche dans les deux groupes : 12,0 g/L et 12,2
g/L, respectivement (on supposera que les écarts-types observés sur les échantillons sont une
bonne estimation des écarts-types des populations dont ces échantillons sont issus).
S agi an d ne ariable q an i a i e (le a d h moglobine) e de de gro pe
indépendants (« infectées » et « non infectées »), le test de comparaison des moyennes (dont
l h po h e n lle e : le a d h moglobine mo en ne diff re pa che le femme encein e
infectées et les femmes enceintes non infectées) est un test t de Student, étant donné que le
nombre d indi id dan chaq e gro pe e p rie r 30.
Le résultat est : t = 5,76 (P<0,0001). A l i e de ce e , on concl q e le a
d h moglobine mo en a co r de 2 premier rime re de la gro e e ai donc
significativement différent chez les femmes enceintes infectées et non infectées. Il était
significativement plus bas chez les femmes enceintes infectées. Remarquez que le test nous
donne une bonne idée de la stabilité de cette association (grâce au degré de signification). En
revanche, il ne nous apporte aucune information sur la différence entre groupes.

Pour être plus informatif, on peut calculer la différence : 97,9 g/L 104,1 g/L = -6,2 g/L. Le
a d h moglobine ai pl ba de 6,2 g/L, en moyenne, chez les femmes infectées par P.
falciparum par rapport à celles qui ne sont pas infectées. Po r calc ler l in er alle de
confiance d ne diff rence de mo enne , il e n ce aire de di po er de l car -type de la
diff rence de mo enne . Si le de chan illon on ind pendan , on pe mon rer q il
fa ili er l car -type commun :

41
L in er alle de confiance de la diff rence en re de mo enne cri :

L car - pe comm n d a d h moglobine au cours des 2 premiers trimestres est :

L in er alle de confiance 95 % de la diff rence femme enceintes infectées- femmes


enceintes non infectées est égal à :

En concl ion, par ir de ce chan illon, le a d h moglobine mo en a co r de 2


premiers trimestres de la grossesse était plus bas chez les femmes infectées de 6,2 g/L par
rapport aux femmes non infectées et cette différence était compatible avec des valeurs
comprises entre 4,1 g/L et 8,3 g/L.

2.3. Mesures pour améliorer la précision


La me re la pl impor an e po r am liorer la pr ci ion e limi er l erre r d e a ha ard
consiste à a g e e a a e de cha . Le plus so en , la aille de l chan illon pe
être calculée a priori en fonction de la puissance ou de la précision souhaitée. Néanmoins, le
ch ma d de e la pop la ion o rce in er iennen galemen .
Par exemple, en réalisant une enquête sur 10000 femmes pour étudier la relation entre une
caractère génétique et la survenue de la mole hydatiforme (anomalie rare de la grossesse
(2/1000), définie par la prolifération kystique des villosités choriales associée à une
dégénérescence tumorale du trophoblaste), on po rrai an iciper q e l effe era e im a ec
une très grande précision. Toutefois, si 10 femmes seulement sont exposées à la
caractéristique génétique, le risque de mole hydatiforme sera calculé chez ces 10 femmes et
chez les 9 990 autre con id r e comme non e po e . L e ima ion de l effe era, en
r ali , impr ci e comp e en d faible nombre d nemen a end che le femme
e po e q i on pe nombre e . Dan l e emple, il a rai mie al incl re n nombre
plus important de femmes exposées et un nombre moins important de femmes non exposées.
Le ch ma d de n e pa efficien , dan la me re o le co de la con i ion d n el

42
échantillon et le recueil des données est sans doute considérable, alors que la précision de
l e ima ion de l effe e en fai m diocre.
On pe mon rer par aille r q e la p i ance d ne comparai on e ma imale lor q e le
nombre de sujets (ou de personne-années de suivi) est identique dans les deux groupes
comparés, pour un nombre total constant de sujets. Ceci est à nouveau à mettre en balance
a ec le co d rec eil d informa ion po r chaq e gro pe.
Par exemple, si le nombre de cas est faible ou si le coût de la recherche de ces cas est
considérable, il sera parfois plus efficient de con id rer le recr emen d n nombre pl
faible de cas pour les comparer à un groupe de 2, 3 ou 4 témoins par cas.

3. Validité
La validité a deux composantes : la validité interne et la validité externe.
3.1. Validité interne
3.1.1. Notions générales sur la validité interne
La validité interne concerne l de elle-même : les groupes sont constitués et comparés de
elle mani re q e la diff rence d effe pe re a rib e l e po i ion q e l on die. On
peut parler de validité interne d ne me re, il n a pa de biais o d erreur
systématique r le param re q e l on me re. Par e emple, i l on o hai e dier l effe
de la mo iq aire impr gn e r la r en e de infec ion pal re de l enfan de moin de
5 ans et que le recrutement des cas de paludisme se fai niq emen par ir d n er ice d
Centre Hospitalier Universitaire Charles De Gaule, il est vraisemblable que le groupe des cas
ne con iendra q e le ca le pl gra e , non repr en a if de l en emble de ca e a i
sans doute de leur exposition a ri q e d infec ion pal re .

Le (o le ) biai en ca e cond i en donc ne di or ion de l e ima ion de l effe . Ce e


di or ion pe e rad ire par ne re ima ion de l effe , en l e ag ran . Par e emple, on
trouve un RC de 3,2 alor q en r ali , on de rai ro er 1,2. Elle pe a i e rad ire par
une sous-e ima ion de l effe , en le minimi an . Par e emple, on ro e n RC gal 1,3
alor q en r ali , on de rai ro er 4,3. Parfoi m me, le biai pe en cond ire un
changemen de direc ion de l effe . Par e emple, le RC e im par ir d ne enq ee gal
4,5, alor q en r ali , le fac e r e pro ec e r e q on de rai ro er 0,4. Ce e i a ion
extrême est sans doute assez rare, mais comme on ne connaît jamais la vraie valeur (sinon on
ne ferai pa l enq e), on ne pe pa a oir i la di or ion a re maje re o non. Or, le
concl ion q e l on propo era, e le d ci ion q i en d co leron eron diff ren e de celle

43
qui étaient attendues. Il est donc impératif de prendre toutes les précautions possibles à
chaque nouvelle enquête en sachant prévenir et reconnaître les différents biais, afin de les
ma ri er a mie e d in erpr er correc emen le r l a de de pid miologiq e .
On peut en ci er de di aine o rce de di or ion de l e ima ion de l effe elon
l e p rience d n grand nombre d de , mai le regro pemen e fai e en iellemen en
trois grandes catégories : biais de sélection, biais de confusion e biai d information. La
complexité des biais est telle que le regroupement qui est proposé (sélection, confusion,
informa ion) e parfoi ar ificiel. Il a, n anmoin , le m ri e de perme re d aborder d ne
façon aussi simple que possible ces notions, sources de discussion sans fin entre
épidémiologistes.

3.1.2. Biais de sélection


Classiquement, les biais de sélection concernent la façon dont sont constitués les groupes de
comparaison : Il agi de di or ion fai e lor de la c de cha a a .
Dans un premier emp , il o fa dra donc comprendre d o pe pro enir ce chan illon
(population cible, population source). Dans un deuxième temps, vous devrez envisager toutes
le circon ance dan le q elle ne lec ion po rrai in er enir lor q on pa e de la
pop la ion l chan illon e po rrai cond ire n biai , c e -à-dire un résultat différent chez
le je q i par icipen l de par rappor la raie ale r dan la pop la ion laq elle on
o hai e appliq er le r l a . Par e emple, i l on o hai e dier l a ocia ion en re
l infec ion pal re P. falciparum e l an mie a co r de la gro e e, on pe recr er le
cas parmi les femmes enceintes hospitalisées dans le service de gynécologie obstétricale du
Centre Hospitalier Universitaire Yalgdo Ouédraogo. Ces cas sont-ils ou non représentatifs de
l en emble de ca ? S il ne le on pa , en q oi cela pe -il biai er l e ima ion de l effe
du déficit en fer ?

Population cible, population source


La mi e en place d ne de n ce i e priori la form la ion d ne h po h e r ne
population au sein de laquelle on se demande si une association entre un facteur de risque et
une maladie existe : la population cible.
Par e emple, i l on die la rela ion en re d fici en fer e an mie au cours de la grossesse
(Tableau 7), elon l objec if re en e la fai abili de l de, la pop la ion cible pe re
la pop la ion de femme encein e d n pa (Exemples 1 et 2). Sachant que tous les cas (ou
presque) des femmes enceintes consultent dans les maternités, à un moment ou un autre de

44
l ol ion de le r gro e e (con l a ion pr na ale o acco chemen ), la pop la ion
cible de ca po rrai re galemen l en emble de femme encein e fr q en an le
services de maternité des différentes formations sanitaires de ce pays (Exemple 3). Dans
l enq e p cifiq e, on choi ira comme population source des cas c e -à-dire la
pop la ion d o eron e rai le ca l en emble de ca fr q en an 3 cen re de an de
la comm ne d Allada au sud du Bénin (Exemples 2 et 3). Néanmoins, on aurait pu aussi
choi ir de faire ne enq e m l icen riq e, o la pop la ion o rce erai l en emble de
femmes enceintes des différents services de maternité du Bénin (Exemple 1). Ces différentes
possibilités sont résumées dans le tableau 7.

Tableau 7 : Différentes possibilités pour la population cible et la population source dans une
enq e r la rela ion en re le d fici en fer e l an mie ge a ionnelle, elon l objec if retenu
et la faisabilité.
Population Exemple 1 Exemple 2 Exemple 3
Population du pays Cible Cible
Ensemble des services de maternité du Bénin Source Cible
Ser ice de ma erni de la comm ne d Allada Source Source

Le ph nom ne de lec ion de l chantillon par rapport à la population source peuvent agir
de plusieurs manières :
Dan l e emple 1, ne lec ion po rra e prod ire i cer ain er ice ne o hai en
pa par iciper l enq e o il n incl en pa ma iq emen o le r ca
pendan la p riode d incl ion.
Dan le e emple 2 e 3, la po ibili de lec ion par ir d n e l er ice era pe -
re pl facile pr enir. En re anche, l e rapola ion de r l a de la pop la ion
o rce la pop la ion cible n a ra pa la m me portée selon que la population cible
est très large par rapport à la population source, ou non.

Les définitions de la population cible et de la population source doivent donc être précisées
dès le stade de conception du protocole. Leur choix est guidé à la foi par l objec if de l de,
mai a i par la fai abili d recr emen de l chan illon. Le choi re en infl encera la
capaci d e rapola ion de r la .

45
M ca e d ac d ba
Un biais de sélection ne peut survenir que si la répartition des exposés et non exposés ou
des malades et des non malades change entre la population cible et la population source.
Reprenon no re e emple r le d fici en fer e l an mie ge a ionnelle (les chiffres sont
fictifs) pour mon rer le m cani me d ac ion po en iel d n biai de lec ion. S ppo on q e
la pop la ion cible oi l en emble de la pop la ion d ne r gion de 10 million d habi an .
Dans cette région, 50 % sont des déficientes en fer et la fréquence (f) de l an mie
gestationnelle est 0,01 % (Tableau 8). On observe 90 % de déficients en fer chez les femmes
présentant une anémie gestationnelle.

Tableau 8 : R par i ion de femme elon l e po i ion a d fici en fer e l an mie


(Population cible).
Anémiée Non Anémiée Total
Déficientes en fer 900 4 999 100 5 000 000
Non déficientes en fer 100 4 999 900 5 000 000
Total 1000 9 999 000 10 000 000
RC = 9,00 f = 0,01%

On rappelle que :

E emple o la lec ion n en ra ne pa de biai po r la me re d a ocia ion : si la


propor ion d e po e de non e po re e la m me che le ca e le moin o ,
autrement dit, si les cas restent repr en a if de l en emble de ca e le moin
repr en a if de l en emble de moin po r l e po i ion di e, le RC n a pa de
rai on d re modifi . Il n a donc pa de biai po r la me re d a ocia ion.
Reprenon l e emple pr c den . On r ali e ne enquête cas-témoins en sélectionnant
au hasard dans la population cible (Tableau 2) 50 % des malades et 1 % des non
malades. A priori, on ob er e la m me r par i ion elon l e po i ion a d fici en fer
q e dan la pop la ion cible : c e -à-dire que 90 % des cas et 50 % des témoins sont
déficientes en fer (Tableau 9).

46
Tableau 9 : R par i ion de femme elon l e po i ion a d fici en fer e l an mie dan la
population source comptant 50 % des malades et 1 % des non malades. Étude cas-témoins.
Anémiée Non Anémiée Total
Déficientes en fer 450 49 991 50 441
Non déficientes en fer 50 49 999 50 049
Total 500 99 990 100 490
RC = 9,00 f = 0,5%
La prévalence de la maladie dans cet échantillon est différente de celle de la population cible
car on a sélectionné plus de malades que de non malades), mais le RC (la mesure

l a ocia ion) n a pa chang . En effe ,

Exemple où la sélection entraîne un biais po r la me re d a ocia ion : il e i e ne


lec ion en fonc ion de l e po i ion, le RC era modifi . Par e emple, on r ali e
encore une sélection par rapport à la population cible (Tableau 8) comprenant 50 %
des cas et 1 % des sujets non-malades. Néanmoins, les sujets non malades sont des
pa ien ho pi ali por e r d a re maladie , don cer aine li e a d fici en fer. Il
y a donc de fortes chances que la proportion de sujets exposés parmi les non malades
de la population source soit beaucoup plus forte que celle des non malades de la
population cible (Tableau 10).

Tableau 10 : R par i ion de femme elon l e po i ion a d fici en fer e l an mie dan la
population source comptant 50 % des malades et 1 % des non malades avec une sélection liée
l e po i ion. de ca -témoins.
Anémiée Non Anémiée Total
Déficientes en fer 450 60 000 60 450
Non déficientes en fer 50 39 990 40 040
Total 500 99 990 100 490
RC = 6,00 f = 0,5%
Dans ce cas, le RC est sous-estimé (plus proche de 1) par rapport à la valeur attendue (celle
q i erai ob en e i l on po ai dier la pop la ion cible).
Exemples classiques de biais de sélection
To le pe d enq e on je a biai de lec ion. Lor q e l objec if principal e
d e imer le ri q e de maladie, on o hai e di po er d n chan illon repr en a if e il fa
alor di po er d ne li e e ha i e de je de la pop la ion po r irer a or n

47
échantillon représentatif. Lor q e l objec if principal e d e imer l association entre
exposition et maladie, plusieurs circonstances peuvent conduire à un biais de sélection. Tout
d abord, l chan illon de je incl pe re ne repr en a ion biai e de la pop la ion
source. Le ph nom ne de l effet du travailleur sain est un exemple classique. Par exemple,
i l on e dier la mor ali dan ne en repri e en prenan , parmi ce q i on
emba ch il a 20 an , o ce q i on encore pr en dan l en repri e, ce chan illon
aura exclu tous les travailleur q i a ron q i l en repri e po r de rai on de an e
conduira à minimiser la morbidité ou la mortalité.
Un autre exemple est celui du biais de survie sélective. C e le ca i le je e po on
soustraits de l'environnement dès l'apparition de signes faisant craindre la survenue de
l'événement ou si la létalité de la maladie est plus importante chez les sujets exposés,
conduisant à une sous-estimation de l'association. Par exemple, on constitue une cohorte de
patients infectés par le VIH pour décrire la survie de ces patients et les facteurs associés à
cette survie, en particulier une anomalie génétique associée à une progression plus rapide de
la maladie (durée de survie plus courte). Dans la cohorte, tous les patients venant consulter
dan o le er ice ho pi alier p ciali dan le rai emen de la maladie d ne r gion
sont inclus de manière consécutive. Néanmoins, parmi ces patients, ceux qui sont porteurs de
l anomalie g n iq e on pl fr q emmen d c d a an le d b de la p riode d incl ion
et ne peuvent donc être inclus. Cette cohorte sera donc constituée des patients porteurs de
l anomalie g n iq e a an , en mo enne, ne d r e de r ie pl long e. Parmi le a re
patients, la durée de survie ne sera en revanche pas affec e. L a ocia ion en re le fac e r
génétique et la survie sera ainsi sous-estimée. Par ailleurs, les groupes à comparer peuvent
d embl e ne pa re comparable . Ce ri q e de lec ion e par ic li remen impor an dan
les enquêtes cas-témoins et nous en avons montré un exemple avec le biais lié au
recrutement hospitalier des cas et des témoins.
Un autre exemple consiste à appliquer les procédures de diagnostic de façon différente selon
q e le je on o non e po , ce q e l on appelle n biai da ca de
procédures diagnostiques. Par exemple, lorsque le rôle des contraceptifs oraux a été
suspecté dans la survenue de la maladie thrombo-embolique, toutes les patientes ayant des
symptômes pouvant faire penser à une thrombose étaient investiguées de façon beaucoup plus
compl e i elle prenaien n con racep if oral q e i elle n en prenaien pa . A posteriori, en
comparant des cas de maladie thrombo-embolique à des témoins, on a trouvé une très forte
relation avec les contraceptifs oraux, en partie liée à une application des procédures
diagno iq e diff ren e en fonc ion de l e po i ion. Le ca recr n aien pa

48
repr en a if de l en emble de ca : il aien pl o en e po . Le moin recr
n aien pa repr en a if de l en emble de moin : il aien moin o en e po .
En conclusion, les biais de sélection peuvent conduire à tous les cas de figure : sur- ou sous-
e ima ion de l effe .

3.1.3. Biais de confusion


Un biai de conf ion r ien lor q n facteur externe, encore appelé tiers facteur,
en ra ne ne di or ion de l e ima ion de l effe de l e po i ion l de r la maladie. Il
e i e de fa on de rifier q n fac e r e erne jo e le r le de fac e r de conf ion. Vo
verrez successivement ces deux manières de raisonner.
Selon la 1ère définition, po r q n fac e r e erne en ra ne n biai de conf ion, il e
nécessaire que trois conditions soient réunies : 1) il doit exister une association entre
e d e e e e fac e , 2) il doit exister une association entre le tiers
facteur et la maladie étudiée, 3) le tiers facteur ne doit pas être situé sur le chemin « causal
» en re l e po i ion di e e la maladie. Ceci e ill r par la figure 9.

Exposition étudiée Maladie

Tiers facteur

Figure 9 : Condi ion po r q n ier fac e r en ra ne n biai de conf ion.


Selon la 2nde définition, la rela ion en re l e po i ion di e e la maladie diff re elon
q elle e me r e dan l en emble de l chan illon o dan le diff ren e ca gorie
d e po i ion a fac e r de conf ion.
Ces deux définitions ne sont pas strictement équivalentes, mais aboutissent le plus souvent à
la même conclusion à propos du rôle de confusion que peut jouer une caractéristique donnée.
La 1ère définition est plus utile pour choisir les caractéristiques pouvant jouer un rôle potentiel
de confusion. La 2nde d fini ion perme de bien comprendre le m cani me d ac ion d biai de
confusion engendré par la caractéristique en question.

49
Prenons pour exemple une étude de cohortes étudiant la relation entre prise de contraceptifs
oraux et accident thrombo-embolique (Tableau 11).

Tableau 11 : Association entre exposition aux contraceptifs oraux et maladie thrombo-


embolique. Étude de cohortes. Exemple fictif.

Maladie Pas de maladie Total


thromboembolique thrombo-embolique
Contraceptifs oraux 90 5 410 5 500
Pas de contraceptifs 34 6 466 6 500
oraux
Total 124 11 876 12 000
RC = 3,1 f = 1%
1ère définition : vérification des trois conditions
Selon cet e d marche, c e le résultat du test statistique qui guide la conclusion.
Vérification de la condition : « relation entre exposition et tiers facteur »
On cherche il e i e n déséquilibre dans la distribution du tiers facteur entre les
groupes comparé . Dan l e emple, l ge ( ier fac e r) e pec de jo er le r le d n
fac e r de conf ion dan la rela ion en re con racep if ora (l e po i ion di e) e
maladie thrombo-emboliq e (maladie di e). La di rib ion de l ge e -elle similaire selon
que les femmes prennent ou non des contraceptifs oraux (groupes comparés) ? Compte tenu
de connai ance r le je , l ge a ran form en ariable ca gorielle comprenan de
catégories : moins de 40 ans, plus de 40 ans (Tableau 12).

Tableau 12 : Étude de la relation entre prise de contraceptifs oraux (exposition étudiée) et âge
(tiers facteur). Étude de cohortes. Exemple fictif.

Contraceptifs oraux Pas de contraceptifs Total


oraux
Age > 40 ans 500 1 500 2 000
Age 40 ans 5 000 5 000 10 000
Total 5 500 6 500 12 000

50
Parmi les femmes prenant des contraceptifs oraux, 91 % (5 000 / 5 500) ont moins de 40 ans,
alors que parmi les femmes ne prenant pas de contraceptifs oraux, seulement 77 % (5 000/ 6
500) ont moins de 40 ans ( . On concl q il a ne rela ion en re
prise de contraceptifs oraux et âge : les femmes prenant des contraceptifs oraux sont
ignifica i emen pl je ne q e celle n en prenan pa .
N anmoin , i l ge n e pa lié au risque de maladie thrombo-embolique, ce déséquilibre
entre les groupes comparés pour le tiers facteur n a ra a c ne con q ence r la
comparai on. En re anche, i l ge e li la maladie hromboemboliq e, ce d q ilibre
pe di ordre l e ima ion de l effe de con racep if ora . C e ce q e l on rifie a ec la
2ème condition.
Vérification de la condition : « relation entre tiers facteur et maladie »
On cherche il e i e ne rela ion en re ier fac e r e maladie che le je non e po s.
Dan l e emple, ce e rela ion doi re ob er e che le femme non e po e a
contraceptifs oraux (Tableau 13), car chez celles qui sont exposées aux contraceptifs oraux,
cette relation peut être uniquement la conséquence du lien âge-contraceptifs oraux.

Tableau 13 : Association entre âge et maladie thrombo-embolique chez les femmes ne


prenant pas de contraceptifs oraux. Étude de cohortes. Exemple fictif.
Maladie Pas de maladie Total
thromboembolique thrombo-embolique
Age > 40 ans 24 1 476 1 500
Age 40 ans 10 4 990 5 000
Total 34 6 466 6 500
RR = 8,0
Che le femme ne prenan pa de con racep if ora , on concl q il e i e ne
association entre âge et maladie thrombo-embolique ( . On
remarque que les femmes de plus de 40 ans ont un risque 8 fois plus fort de maladie
thromboembolique que les femmes de moins de 40 ans.

Vérification de la condition : « un tiers facteur ne doit pas être sur le chemin causal »
Une troisième condition doit re galemen rifi e po r q n fac e r p i e en ra ner n
biai de conf ion. Si l on accole l adjec if e erne , c e q e ce fac e r de ri q e doi agir

51
elon n a re m cani me q e cel i q i e l de. A remen di , il ne doi pas être situé
sur le chemin « causal » en re l e po i ion e la maladie di e .
La vérification de la 3ème condition est souvent délicate, car elle nécessite de connaître le
modèle physio-pathologique sous-jacen q i, o en , n e pa compl emen l cid a
momen de la concep ion de l enq e. Si ce mod le e conn , le rai onnemen e
relativement simple. Par exemple, dans une étude de la relation entre tabac et risque de
maladie cardio a c laire, l l a ion de la pre ion ar rielle e -elle un facteur de confusion ?
Les deux premières conditions sont remplies : les sujets fumeurs ont une pression artérielle
pl le e q e le je non f me r d ne par , e le je a an ne l a ion de la
pression artérielle ont un risque de maladie cardio-vasculaire plus important que ceux ayant
ne pre ion ar rielle normale d a re par .
N anmoin , l l a ion de la pre ion ar rielle n e pa n fac e r e erne. Elle e l ne de
con q ence po ible de l e po i ion a abac : elle con i e en fai ne ape intermédiaire
vers la maladie cardio-vasculaire (Figure 10).

Cause Cause
Tabac Elévation de la TA Maladie cardio-vasculaire

Figure 10 : Exemple où un tiers facteur (élévation de la pression artérielle « TA ») est sur le


chemin ca al en re l e po i ion di e ( abac) e la maladie diée (maladie cardio-
vasculaire).
En revanche, on peut vérifier facilement cette 3ème condition si le facteur externe précède
l e po i ion l de e la maladie.
Dan l e emple r l a ocia ion en re con racep if ora e maladie
thromboembolique, on ne pe pa rai onnablemen pen er q e l ge e ne
con q ence de la pri e de con racep if ora . Il ne agi donc pa d n fac e r q i
e i e r le chemin ca al, mai d n ri able fac e r de conf ion. Apr a oir
vérifié les trois conditions de cette définition, on peut donc conclure que la mesure
d a ocia ion en re la pri e de con racep if ora e le ri q e de maladie hrombo-
emboliq e e le r l a de l effe mi e de con racep if ora e de l ge. Comp e
tenu des résultats de la vérifica ion de de premi re condi ion , on pe a endre
ce q e l effe de con racep if ora r la maladie hrombo-embolique soit minimisé
ca e de l ge. Or, d apr le r l a ob en j q main enan , la di or ion de
l effe de con racep if ora par l ge n appara pa clairemen . L ili a ion de la
2nde d fini ion a perme re de mie comprendre le m cani me d ac ion de ce biai .

52
2nde d fini ion : m cani me d ac ion d biai
Selon ce e d marche, c e le a de a e eda ciation qui guide la conclusion, la
me re d a ocia ion en re l e po i ion l de e la maladie an e im e dan l en emble
de l chan illon, mai galemen dan chac n de gro pe ( ra e ) d fini par le ca gorie
du tiers facteur.
Po r l e emple, i l on calc le le RR dan chac ne de ca gorie d ge (Tableau 14),
il e imilaire che le moin de 40 an d ne par e che le pl de 40 an d a re
par , mai e diff ren d RR br ob en r l en emble de l chan illon. Le RR
calculé à par ir de l en emble de l chan illon d de bi donc ne di or ion e
refl e l effe mi e de con racep if ora e de l ge. Le RR corre pondan l effe
propre des contraceptifs oraux est celui calculé dans chacune des strates où la
distribution de l ge e ffi ammen homog ne. Ce e anal e di e ra ifi e r
l ge perme de faire le diagno ic d biai de conf ion.
Tableau 14. Association entre exposition aux contraceptifs oraux et maladie thrombo-
emboliq e elon l ge e globalemen . tude de cohortes. Exemple fictif.

Tableau 14 : Association entre exposition aux contraceptifs oraux et maladie thrombo-


emboliq e elon l ge e globalemen . de de cohor e . E emple fictif.

Strate des > 40 ans S a e de 40 a Total

40 460 50 4 950 90 5 410


24 1 476 10 4 990 34 6 466
Total 64 1 936 Total 60 9 540 Total 124 11 876
RR=5,0 RR=5,0 RR= 3,1

Dans cet exemple, le facteur de confusion a conduit à une sous-e ima ion de l effe ,
q e l on po ai pec er for emen par ir de condi ion de la 1 re d fini ion.
En conclusion, les biais de confusion peuvent conduire à tous les cas de figure : sur- ou sous
e ima ion de l effet.

53
3.1.4. Biai d i f ma i
Ce biai concerne l en emble de informa ion rec eillie po r la comparai on de gro pe
l de. Il agi donc de erre r commi e en cla an le je elon le a e po /non
exposé et selon le statut malade/non malade.
On prendra l e emple le pl imple o la maladie e l e po i ion on de ariable
ca gorielle dicho omiq e . S agi an de ariable ca gorielle , on parlera d erreur de
classement ou de mauvaise classification.
Par e emple, la maladie n e pa identifiée chez un cas et ce sujet est classé à tort
parmi les témoins ou au contraire la maladie est identifiée à tort chez un sujet non
malade qui est classé parmi les malades. Dans le premier cas, les sujets concernés sont
des faux négatifs, dans le deuxième cas, des faux positifs.
Ces notions font appel aux indicateurs utilisés pour étudier la performance des tests
diagno iq e . Dan n premier emp , o erre le d fini ion a an d aborder le
m cani me d ac ion de biai d informa ion. Parmi le m cani me d ac ion de ce erre r de
classement, on distinguera les erreurs dites « différentielles » lorsque les erreurs sur
l e po i ion affec en diff remmen le malade e le non malade o lor q e le erre r r
la maladie affectent différemment le e po e le non e po . On parlera d erreurs « non
différentielles » si les erreurs affectent de la même façon les groupes comparés.

Sen ibili e p cifici d n e diagno iq e


Lor q on in re e ne maladie, le diagno ic repo e le pl o en rl ili a ion d n
e diagno iq e q i perme de me rer la pr ence o non de la maladie. S il e parfai , le
test diagnostique est positif uniquement chez les malades et négatif uniquement chez les non
malades. Autrement dit, ses performances on e cellen e : il n a a c n je malade
classé parmi les non malades et aucun sujet indemne classé parmi les malades.
En réalité, les performances de la plupart des tests utilisés pour faire le diagnostic ne sont pas
parfaites. Deux indicateurs permettent de les apprécier : la sensibilité et la spécificité. La
sensibilité est la proportion de sujets que le test diagnostique classe « malades » (test positif)
parmi l en emble de je q i on r ellemen malade . La p cifici e la propor ion de
je q e le e diagno iq e cla e non malade (e n ga if) parmi l en emble de
je q i ne on pa malade . Il agi donc re pec i emen de la propor ion de je bien
classés parmi les malades et de sujets bien classés parmi les non malades (Tableau 15).

54
Tableau 15 : R par i ion de je elon le r l a d n e diagno iq e.

Résultat du test En réalité


diagnostique Malades Non malades Total
Positif a b a+b
Négatif c d c+d
Total a+c b+d n

La sensibilité se calcule comme : et la spécificité comme :

Vo po e oir q e, d apr la d fini ion, la en ibili d pend d nombre de faux négatifs


(effectif c des sujets malades dont le test diagnostique est négatif). La proportion de faux
négatifs parmi les malades est aussi appelée le manque de sensibilité.
La spécificité dépend du nombre de faux positifs (effectif b des sujets non malades dont le test
diagnostique est positif). La proportion de faux positifs parmi les non malades est aussi
appelée le manque de spécificité.

En g n ral, ce indica e r on ili po r appr cier le performance d n e ili po r


le d pi age o le diagno ic d ne maladie. On pe galemen le ili er pour apprécier les
performance d n e ili po r cla er de je elon l e po i ion n fac e r de ri q e.
Erreurs différentielles
Dan le ca de erre r diff ren ielle , l erre r de cla emen arie elon le gro pe q e l on
compare. Dans les études de cohortes, les erreurs de classement concernent plutôt la mesure
de la maladie l de. Dan le de ca -témoins, les erreurs de classement vont plus
o en concerner la me re de l e po i ion.
Prenon l e emple d ne de r la rela ion en re con omma ion d alcool pendan la
gro e e e nai ance d n enfan pr ma r . La r par i ion de je dan la pop la ion
cible est indiquée dans le tableau 16.
A partir de cet exemple, nous allons voir deux situations extrêmes de mauvaise classification
concernant le statut exposé/non exposé.
1ère i a ion : d fa de en ibili de la me re de l e po i ion niq emen dan le
groupe des sujets atteints par le problème de santé

55
Tableau 16 : Répartition des sujets selon la con omma ion d alcool pendan la gro e e e la
prématurité. Population cible.

Consommation par la mère Enfant prématuré Enfant né à terme Total


Alcool 50 000 50 000 100 000
Pa d alcool 50 000 350 000 400 000
Total 100 000 400 000 500 000
RC = 7,0 f = 20%
Les sujets exposés sont mal classés uniquement parmi les cas.
Par exemple, dans une enquête cas- moin , la con omma ion d alcool e recherch e
l aide d n q e ionnaire a pr de femme lor de le r jo r la ma erni . Parmi le
femmes ayant donné naissance à un enfant prématuré, 30 % des femmes ayant consommé
de l alcool on en fai cla e parmi le non-con omma rice d alcool, car elle e
sentent coupables de la prématurité de leur enfant et nient (ou oublient) leur
con omma ion d alcool. En revanche, parmi les femmes ayant donné naissance à un
enfan n erme, il n a pa d erre r de cla emen . Comme il agi d n probl me de
faux négatif, on peut exprimer cette erreur en termes de sensibilité du questionnaire,
sensibilité différen e che le m re d enfan pr ma r : 70 % e che le m re
d enfan n erme : 100 % (Tableau 17).

Tableau 17 : R par i ion de je elon la con omma ion d alcool pendan la gro e e e la
prématurité. Parmi les femmes ayant donné naissance à un enfant prématuré de la population
cible, 30 % de celle e po e l alcool on cla e parmi le femme non-
con omma rice d alcool. de ca -témoins.
Consommation par la mère Enfant prématuré Enfant né à terme Total
Alcool 35 000 50 000 85 000
Pa d alcool 65 000 350 000 315 000
Total 100 000 400 000 500 000
RC = 3,8 f = 20%
On ro e RC = 3,8 alor q e la ale r a end e e RC = 7,0. L erre r commi e
conduit, dans ce cas, à sous-e imer l effe de l alcool r la prématurité.

56
2ème i a ion : d fa de en ibili de la me re de l e po i ion niq emen dan le
groupe des sujets indemnes du problème de santé
Les sujets exposés sont mal classés uniquement parmi les témoins.
Dan l e emple, on po rrai imaginer ne i a ion o l e po i ion e parfai emen
mesurée chez les femmes ayant donné naissance à un prématuré, car les enquêteurs
recherchen la con omma ion d alcool a ec ne grande in i ance alor q e che le
mères ayant donné naissance à un enfant à terme, 30 % des exposées sont classées
parmi les non exposées. Le manque de sensibilité affecte différemment les mères
d enfan pr ma r : 0 % e le m re d enfan n erme : 30 % (Tableau 18).
Tableau 18 : Répartition des suje elon la con omma ion d alcool pendan la gro e e e la
prématurité. Parmi les femmes ayant donné naissance à un enfant à terme de la population
cible, 30 % de celle e po e l alcool on cla e parmi le femme non
con omma rice d alcool. Étude cas-témoins.

Consommation par la mère Enfant prématuré Enfant né à terme Total


Alcool 50 000 35 000 85 000
Pa d alcool 50 000 365 000 415 000
Total 100 000 400 000 500 000
RC = 10,4 f = 20%
On trouve RC = 10,4 alors que la valeur attendue est RC = 7,0. L erre r commi e cond i ,
dan ce ca , re imer l effe de l alcool r la pr ma ri .
En conclusion de cette démarche, les erreurs de classement différentiel peuvent conduire à
tous les cas de figure : sur- ou sous-e ima ion de l effe .
Erreurs non différentielles
Quand la proportion de sujets mal classés ne dépend pas du statut malade/non malade ou du
statut exposé/non exposé, les erreurs commises sont dites non différentielles.
1ère situation : défaut de sensibilité de la mesure de la maladie dans une étude de
cohortes : Prenon l e emple d ne de de la rela ion en re con omma ion de
m dicamen a co r de la gro e e e r en e d ne anomalie diagno iq e che
le f l chographie d dernier rime re. La r par i ion de je s dans la
population cible est indiquée dans le tableau 19. Dans une étude de cohortes où les
femmes sont suivies depuis le début de leur grossesse et classées en « exposées/non
e po e , le diagno ic de l anomalie e fai par n e amen chographiq e. La
p cifici de l e amen e parfai e. En re anche, la en ibili e de 80% e lemen .
La répartition est illustrée par le tableau 19.

57
Tableau 19 : R par i ion de je elon l e po i ion l h pno iq e pendan la gro e e et
la d ec ion d ne anomalie l chographie. Pop la ion cible.

Consommation par la mère Anomalie Pa d anomalie Total


Hypnotique 20 480 500
Pa d h pno iq e 5 495 500
Total 25 975 1000
RC = 4,0
Tableau 20 : Répartition de je elon l e po i ion l h pno iq e pendan la gro e e e
la d ec ion che le f d ne anomalie l chographie. 20 % de je de la pop la ion
cible a an ne anomalie on cla parmi le je n a an pa d anomalie, q el q e oi le
statut vis-à- i de l e po i ion. de de cohor e .

Consommation par la mère Anomalie Pa d anomalie Total


Hypnotique 16 484 500
Pa d h pno iq e 4 496 500
Total 20 980 1000
RC = 4,0
Dan ce ca r par ic lier, le manq e de en ibili de l e amen utilisé pour le diagnostic de
la maladie dan ne de de cohor e n en ra ne pa de biai .
ème
2 i a ion : d fa de en ibili de la me re de l e po i ion dan ne de ca -
témoins Reprenon l e emple de l enq e ca -témoins étudiant la relation entre
con omma ion d alcool pendan la gro e e e nai ance d n enfan pr ma r e fai on
l h po h e q e 30 de femme e po e on cla e parmi le non e po e , a i bien
chez celles ayant donné naissance à un enfant prématuré que chez celles n a an pa
donn nai ance n enfan pr ma r . Il agi o jo r d n probl me de fa n ga if,
mai , ce e foi , le manq e de en ibili po r la me re de l e po i ion appliq e de la
même façon pour tous les individus. Cette erreur conduit à une sous-e ima ion de l effe
(Tableau 21).
3ème i a ion : d fa de p cifici de la me re de l e po i ion q el q e oi le a i -
à-vis du problème de santé : dan l e emple de l enq e ca -témoins sur consommation
d alcool pendan la gro e e e nai ance d n enfan pr ma r , on pe faire
l h po h e oppo e : 30 % de femme non e po e on cla e parmi le e po e ,
aussi bien chez celles ayant donné naissance à un enfant prématuré que chez celles
n a an pa donn nai ance n enfan prématuré

58
Tableau 21 : R par i ion de je elon l e po i ion l alcool pendan la gro e e e la
prématurité. 30 % des sujets exposés de la population cible sont classés parmi les sujets non
exposés. Étude cas-témoins.

Consommation par la mère Prématuré Pas prématuré Total


Alcool 35 000 35 000 70 000
Pa d Alcool 65 000 365 000 430 000
Total 100 000 400 000 500 000
RC = 5,6
Il agi ce e foi d n probl me de fa po i if : la p cifici de l in r men de
mesure e al r e e a 70 %. N anmoin , le manq e de p cifici appliq e de la
m me fa on o le indi id . A no ea , l erre r non diff ren ielle cond i o -
e imer l effe de l alcool r la pr ma ri (Tablea 22).

Tableau 22 : R par i ion de je elon l e po i ion l alcool pendan la gro e e e la


prématurité. 30 % des sujets non exposés de la population cible sont classés parmi les sujets
exposés. Étude cas-témoins.

Consommation par la mère Prématuré Pas prématuré Total


Alcool 65 000 155 000 220 000
Pas d alcool 35 000 245 000 280 000
Total 100 000 400 000 500 000
RC = 2,9
Ces phénomènes de sous-e a d de effe sont le résultat le plus fréquent
d ne erre r non diff ren ielle.
Synthèse des différentes situations
En ca d erre r non diff ren ielle , le al ra ion de la performance d e diagno iq e
ili po r me rer l e po i ion o la maladie cond i en ne o -estimation majeure de
l effe di . Dan le dernier e emple, le RC estimé est égal à moins de la moitié de la valeur
attendue qui est : RC = 7,0.
On pe mon rer q e l e ima ion de la me re de l effe , RR o RC, e gale 1 i le
performance de l in r men de me re de l e po i ion e r men par ne ale r moyenne
de la sensibilité et de la spécificité égale à 50 %.
Ce le ca , par e emple, lor q e la en ibili e de 60 % e la p cifici e de 40 %.
Autrement dit, dans cette situation, une association existant réellement entre un facteur de
risque et une maladie peut être complètement masquée.

59
Retenez également que si cette valeur moyenne de la sensibilité et de la spécificité est
inf rie re 50 %, l e ima ion de la me re de l effe pe aller dan la direc ion oppo e la
vraie valeur.
On peut ajo er de pr ci ion . D ne par , le RR an fonc ion de la en ibili e la
p cifici de l o il de me re, la connai ance de la en ibili e de la p cifici perme de
recalc ler le RR. D a re par , dan le ca par ic lier (mai non e cep ionnel) où la mesure de
l e po i ion e de la maladie on o e de o mi e a biai de ma ai e cla ifica ion, i
les erreurs de classification sont liées entre elles, le biais peut conduire à surestimer la relation
et non à la sous-estimer.

3.2. Validité exte e : e e a e e e de a a de a


La validité externe concerne la population dite « cible », celle à laquelle on peut extrapoler
le r l a . Par e emple, i l de a por niq emen r de femme encein e fran ai e
de grandes villes du Sud de la France, peut-on e rapoler le r la l en emble de
femmes enceintes des villes de tous les pays du monde ? Plutôt que de validité externe, on
parle a jo rd h i d extrapolation de r l a d ne de. Ce e ape d e rapola ion n e
toutefois possible que si la validité interne est elle-m me ffi an e. C e po rq oi,
logiq emen , on aborde d abord le a pec de alidi in erne, a an d aborder le a pec
d e rapola ion de r la .
En statistique, vous avez appri la no ion d chan illon repr en a if. Un pi ge erai de croire
q e le r l a d ne de pid miologiq e appliq en ric emen la pop la ion o rce
don e e rai l chan illon q i a permi d e imer le r l a . En effe , le concl ions
eraien alor rop limi e dan le emp e dan l e pace e o e le pop la ion o rce
possibles devraient être soigneusement étudiées en permanence.
En r ali , n i e o n chinoi n irai pa reme re en ca e la rela ion en re abac e
cancer d po mon a jo rd h i, o pr e e q e le de le pl proban e on
réalisées en Grande-Bre agne dan le ann e 1950. L e rapola ion de r la cien ifiq e
i e donc loigner de r l a de l ob er a ion pid miologiq e en ermes de temps, de
lieu et de personnes pour aller vers une conclusion plus universelle.
Dan l e emple pr c den : le abac e ne ca e d cancer d po mon . Or, le proce
de réflexion scientifique qui conduit à cette abstraction ne repose pas uniquement sur le
raisonnement statistique, mais surtout sur la manière dont les études sont conduites, qui
perme d ob enir de r la a e pr ci e alide po r po oir re econdairemen

60
g n rali . L id e o -jacen e e de ra embler ffi ammen d éléments pour convaincre
q e l effe mi en idence ici e main enan e i e a i aille r o dan d a re emp .
La pop la ion cible e donc ir elle o fic i e. C e l en emble de je q i l on
souhaite e rapoler le r la . Ce la raison pour laquelle on parle moins volontiers de
alidi e erne q e d extrapolation des résultats.

4. Moyens pour améliorer la validité


Cer ain de biai q i on pr en , e en iellemen le biai de lec ion e d informa ion,
ne peuvent éventuellemen re ma ri q a ade de la concep ion d pro ocole, alor q e
le biai de conf ion pe en re galemen pri en comp e a momen de l anal e,
condi ion d re iden ifi e me r .
Les moyens qui sont détaillés dans ce chapitre ne sont pas un ensemble de recettes à
appliq er, mai pl le principe d rai onnemen q i appliq en d la concep ion e la
planifica ion d ne de po r pr enir, a i q e po ible, l in rod c ion de biai . Chaq e
nouvelle question suscite une situation inédite qui doit vous inciter à puiser dans les exemples
passés les outils et les ressources pour la résoudre au mieux.

4.1. Prévenir les biais de sélection


Rappelez- o : en l ab ence de biai de lec ion, il n a pa de diff rence ma iq e
entre échan illon d de e pop la ion cible, celle laq elle on o hai e l rie remen
pouvoir extrapoler les résultats. Pour une étude de cohortes, le groupe des sujets exposés
repr en e donc l en emble de je e po e le gro pe de non e po l en emble des
non exposés. Pour une étude cas- moin , le gro pe de ca repr en e l en emble de
malade e le gro pe de moin repr en e l en emble de je non malade .
Comment faire pour être le plus proche de cette situation idéale et prévenir ce type de biais ?
La constitution des échantillons et les méthodes de recueil des données sont les deux étapes
fondamentales. Elles seront particulièrement détaillées dans les paragraphes qui suivent.
A e e e cc e ?
Le pl po ible, c e -à-dire a momen de la concep ion de l enq e, lor d
choix des groupes de comparaison. Quand les sujets sont recrutés, il est trop tard.
To a long de l de il agi d ne de de cohor e : la q ali d i i e
fondamentale pour prévenir le biais potentiel lié aux perdus de vue.
Problème des non réponses en cas de liste exhaustive de la population source
Dan le ca o l on di po e d ne liste exhaustive de tout ou partie de la population cible
(base de sondage), on peut appliquer une méthode de sondage appropriée pour constituer les

61
chan illon d de. Par e emple, n me perme d enregi rer de fa on ma iq e de
cas (laboratoire de référence sur une maladie, registre de cancers), des sujets exposés
(emplo d ne ine), o le jets adultes de la population générale qui peuvent servir de
groupe témoin (listes électorales).
Dan ce e i a ion, ne diff rence ma iq e pe , malgr o , e i er en re l chan illon
et la population source si certains sujets tirés au sort ne réponden pa l de : ce je
sont appelés les « non répondants ». Les raisons de non réponse peuvent être très variées :
ab ence de mo i a ion po r par iciper l de, d m nagemen de la r gion d de,
changement de domicile par rapport à celui enregistré dans la liste disponible, changement de
situation de santé, handicap ou maladie, entraînant une hospitalisation au moment de
l enq e. Il a n biai po en iel de lec ion i le non r pondan diff ren de r pondan
pour des caractéristiques q i on li e la maladie, l e po i ion o a de .
Par exemple, il est plus difficile de motiver les individus qui se sentent en bonne santé que
ceux qui ont des soucis de santé. Les sujets répondants ont alors, en moyenne, un état de santé
plus altéré que celui attendu dans la population cible.
La limitation de la proportion des sujets non répondants est donc très importante. La
faisabilité de l enq e, on acceptabilité, les moyens visant à faciliter les réponses et à
récupérer des non réponses doivent être envisagés. Les méthodes de recueil des données
doivent être simples et adaptées aux sujets concernés.
Par exemple, si des auto-questionnaires sont utilisés, ils ne doivent pas être trop longs ou
compliq . S il e en i ag d incl re de per onnes qui ont des difficultés de
compréhension de la langue utilisée, il faut prévoir des enquêteurs pour les aider.
Con i ion de g o e com a en l ab ence de li e e ha i e de la o la ion o ce
Lor q on ne di po e pa de li e e ha i e, la constitution des échantillons repose sur
l iden ifica ion de sources de ca e de moin o d e po e de non e po . Le choi
de olon aire en ra ne le pl o en n biai d auto-sélection, similaire à celui des
répondants/non répondants, dans on mode d ac ion.
Dans une étude cas-témoins :
le choi de ca e i an (c e -à-dire existant déjà depuis un temps variable au
momen de l enq e) cond i recr er le ca le moin gra e , car le pl gra e
on d c d a momen o l enq e d bute. Il est donc toujours préférable de
recruter des cas incidents.

62
le choix de sujets témoins hospitalisés conduit à recruter des sujets indemnes de la
maladie di e, mai n anmoin a ein d ne a re maladie e o en e po n
certain nombre de fac e r de ri q e don cel i l de.
Par e emple, ne de de l a ocia ion en re con omma ion d alcool e cirrho e d foie a
cond i recr er d ne par de ca a ein de cirrho e e d a re par de je moin dan
le service de traumatologie. Un tel recrutement des sujets témoins était justifié par le fait que
le indi id q i on admi en ra ma ologie ne on pa malade j q a jo r o il on n
accident et peuvent être considérés comme représentatifs de la population des sujets indemnes
de cirrhose. En réalité, une forte proportion des accidents entraînant des traumatismes sont
li la con omma ion d alcool e le je moin ain i recr on bea co p pl
o en e po l alcool q e la pop la ion o rce de moin d ne elle enquête.
Dans une étude de cohortes, les sujets perdus de vue peuvent entraîner une sélection au cours
d emp : il agi d ne a re forme de non r pon e, par ic li re a de e po r i an
dans le temps. Il y a un biais potentiel de sélection si les sujets perdus de vue diffèrent des
je non perd de e po r de carac ri iq e q i on li e la maladie, l e po i ion o
aux deux. Le suivi doit donc être très attentivement mené dans les études de cohortes. Pour
cela, il est fondamental d ob enir de moyens suffisants pour réaliser ce suivi.

4.2. Prévenir les biais de confusion


No a on q 'en l ab ence de biai de conf ion, la diff rence ob er e en re le gro pe
compar refl e l effe de l e po i ion l de r la maladie. Le groupes sont comparables
en tout sauf pour la maladie (étude cas- moin ) o po r l e po i ion ( de de cohor e ).
Comment faire pour être le plus proche de cette situation idéale et prévenir ce type de biais ?
Plusieurs méthodes sont disponibles et le choix doit tenir compte des circonstances
par ic li re d h me de l enq e.
A e e e cc e ? Il fa en pr occ per le pl po ible, c e -à-dire au
momen de la concep ion de l enq e. N anmoin , c e le e l biai po r leq el on peut
raimen agir a momen de l anal e galemen . On pe r ali er n aj emen par ir
d ne anal e ra ifi e. Ici, e le le me re po an re pri e lor de la concep ion de
l enq e eron d aill e .
Randomisation
La méthode la plus efficace pour prévenir un biais de confusion consiste à tirer au sort
affec a des sujets dans les groupes exposé/non exposé (étude expérimentale).
Cla iq emen , ceci e r ali dan le e ai cliniq e po r comparer l in r de

63
médicaments ou de stratégies thérapeutiques. L a an age maje r e q e le irage a or
aboutit à une répartition au hasard des sujets dans deux groupes (exposés/non exposés) et
égalise la distribution de tous les tiers facteurs, connus ou inconnus. La condition est que le
nombre de sujets soit suffisamment grand (au moins 200 à 300), car le hasard permet cette
gali a ion q and l effec if de je end er l infini.
Toutefois, le tirage au sort est rarement utilisable pour les expositions étudiées en
épidémiologie.
Par exemple, il e impo ible de irer a or l e po i ion a abac, l e po i ion n po e de
travail, ou encore à un niveau de bruit ou de pollution dans une habitation. Le plus souvent,
o ere dan ne i a ion d ob er a ion e o a re reco r d a re moyens pour
rendre les groupes comparables.
Appariement et assortiment
L assortiment permet de constituer des groupes au sein desquels les facteurs potentiels de
confusion sont répartis de manière équilibrée. Le préalable à cette méthode est donc
d iden ifier le (ou les) facteurs de confusion pour le(s)quel(s) il est important de rendre les
gro pe comparable . Le rai onnemen pe appliq er po r l a or imen de je e po
e non e po d ne de de cohor e , mai comme il agi d ne m hode rtout utilisée
dans les études cas-témoins, nous prendrons un exemple dans ce cadre.
Il existe deux possibilités :
la première consiste à recruter chaque sujet témoin en fonction du cas recruté. Si on ne
choi i q n je moin par ca , on parlera alor d appariement (ce terme est
d aille r le pl o en ili po r d crire o e le echniq e d a or imen ). Par
e emple, i l ge e n fac e r de conf ion, chaq e moin era recr dan la
ranche d ge d ca a q el il e appari .
la deuxième consiste à réaliser un assortiment de fréquence. On décrit la distribution
du facteur de confusion dans le groupe des cas, puis on choisit un groupe de sujets
moin afin q e la di rib ion de ce fac e r oi globalemen imilaire. L a an age
majeur de l a or imen e q il e a e facilemen applicable dan le de
d ob er a ion. La condi ion e en ielle e q e le fac e r de conf ion oien
iden ifi e p i en re me r . Par aille r , il perme d gali er la di rib ion
d a re ier facteurs inconnus qui sont liés au facteur de confusion sur lequel a porté
l a or imen . Il a de limi e e en ielle l ili a ion de ce e m hode. D ne
par , i n fac e r e ili comme fac e r d a or imen , on a ocia ion a ec le

64
problème de santé ne peut plus être analysée dans cette enquête puisque sa répartition
est égalisée entre les deux groupes.
D a re par , il e fondamen al de choi ir a ec pr ca ion le cri re d a or imen parmi le
facteurs de confusion les plus importants, car assortir sur un nombre important de facteurs
rendrai la comparai on impo ible (cr an ce q e l on appelle n sur-appariement) et
po rrai rendre l de pra iq emen irr ali able : cer ain ca e moin ne po rraien re
incl , le emp d incl ion serait prolongé, des coûts supplémentaires seraient générés. Enfin,
l a or imen doi re pri en comp e dan l anal e po r q e l e ima ion de la me re
d a ocia ion oi correc e. Ceci e imp ra if dan le de ca -témoins (Rothman, 1998).
Attention : les formules présentées dans ce module pour estimer les mesures
da ca e a e de de a a a e e (2 g e c a :
Indépendants). Il existe des formules spécifiques pour estimer le RR ou le RC dans le cas
d de appariées.
Restriction
La re ric ion con i e re reindre l enq e ne ra e par ic li re d fac e r de conf ion.
Par e emple, le femme o le je de moin de 40 an , i le e e o l ge, re pec i emen ,
sont des facteurs de confusion potentiel . L id e de la re ric ion e de ne pa incl re le
sujets présentant une certaine caractéristique pour que les deux groupes comparés soient aussi
homog ne q e po ible. Le de con q ence impor an e de l applica ion de la re ric ion
concernent le po en iel d e rapola ion de r la de l de e a fai abili car le
recr emen dan l de e pl len . To efoi , le r l a d n effe impor an a ein d ne
ra e r homog ne pe inci er po r i re econdairemen l de a ein de nouvelles
strates.

4.3. P e e ba d f a
Rappelez- o : en l ab ence de biai d informa ion, la me re de l e po i ion refl e
parfai emen la r ali de l e po i ion de je e la me re d n probl me de an refl e
parfaitement la réali de l a ein e de je par ce e maladie. Po r ne de de cohor e ,
tous les sujets exposés sont réellement exposés et les non exposés sont réellement non
exposés. Pour une étude cas-témoins, tous les cas sont réellement des cas et les sujets témoins
des sujets non malades. Comment être le plus proche de cette situation idéale et prévenir ce
type de biais ? Po r chaq e me re n ce aire l enq e, il e indi pen able d ili er ne
méthode de mesure adaptée, fiable, standardisée, aussi objective que possible. Cette réflexion

65
doit donc se situer dans le contexte de la question posée et du thème abordé. Par exemple, un
diagnostic de cancer doit reposer sur une preuve anatomopathologique.
A e e e cc e ? Il fa en pr occ per a moment du choix des méthodes
de me re de l e po i ion e de la maladie, c e -à-dire lor de la concep ion de l enq e. Le
biai d informa ion on le pl o en in i able . Vo a e q e, dan ce ca , on e aie
de e ramener ne i a ion d erre r non différentielle, car la distorsion liée à la mesure
entraîne une sous-e ima ion de la force de l a ocia ion e l on conna donc le en de la
distorsion a priori. Toutefois, cette recommandation peut conduire à une perte de puissance et
donc de préci ion po r la me re d a ocia ion. Il n e donc pa e lemen ile de limi er le
erreurs différentielles, il faut limiter les erreurs en général.
Le o enir r l e po i ion pe en re :
plus activement et plus précisément recherchés chez des cas motivés à comprendre
leur maladie Par e emple, lor de l de de la rela ion en re e po i ion cer ain
m dicamen pendan la gro e e e nai ance d n enfan pr ma r .
ou au contraire plus refoulés chez des cas dont le problème de santé suscite une
cer aine hon e. Par e emple, lor de l de de la rela ion en re con omma ion d alcool
et cirrhose du foie. Il est nécessaire de se mettre dans des conditions où les groupes
dans lesquels la coopération, la mémoire ou la surveillance médicale sont a priori
comparables. Cette recommandation doit être scrupuleusement appliquée dans les
études cas- moin . Dan le de de cohor e pro pec i e , la po ibili d n suivi
identique che le je e po e non e po limi e l infl ence de ce biai . Le
recueil des données doit privilégier le recueil de faits objectifs pl q e d l men
donnant lieu à interprétation. Ceci impose, dans le protocole, une définition précise
de e e d b e de a étudiés.
Par exemple, on évite la question « êtes-vous fumeur ? ». On préfère recueillir précisément la
con omma ion de abac, le pe de abac, le d b e la da e en ellemen d arr , le nombre
de cigare e f m e . La per onne q i rec eille le donn e r l e po i ion o la maladie
doit, autan q e po ible, ignorer dan q el gro pe le je e ro e (on di q elle e en insu
d a de je incl ), po r ne pa re en e de rechercher pl ac i emen l e po i ion
chez les cas que chez les sujets témoins ou de prévoir des examens supplémentaires chez les
sujets exposés par rapport aux sujets non exposés pour le diagnostic du problème de santé
(problème de détection différentielle). Ceci impose donc à nouveau un protocole de
diagnostic strictement identique chez les exposés et les non e po d ne de de

66
cohor e , e l in e iga ion d n en emble d e po i ion a re q e celle q i e d in r
principal pour une étude cas-témoins.
La andardi a ion de ce pro ocole a a ec le principe de andardi a ion de l en emble de
mesures effec e . Dan ce cadre, le recommanda ion on le i an e : ili a ion d n
questionnaire standardisé et validé, c d de e e a e pour tous les sujets,
formation des enquêteurs aux entretiens, mesures biologiques soumises à un étalonnage et
un contrôle de qualité ou centralisation des mesures dans un laboratoire de référence.

67
Références bibliographiques
Sondo B.
C d pidémiologie général, Master I : Bactériologie V g e de U e Ca h e de
Af e de O e , (UCAO).
Bobo-Dioulasso Burkina Faso, 2012.

Valleron AJ.
B eh e de d g e a a e XXe c e.
La revue de la communauté polytechnicienne, N°670, Décembre 2011

Ancelle T.
Statistique. Epidémiologie.
Paris : Maloine; 2002.
ISBN 2 224 027060

Bouyer J, Hémon D, Cordier S, Derriennic F, Stücker I, Stengel B, Clavel J.


Epidémiologie principes et méthodes quantitatives
Paris : INSERM, 2009. 498 pages
ISBN : 978-2-7430-1167-3

Czernichow P, Chaperon I, Le Coutour X.


Epidémiologie.
Paris : Masson; 2001. 456 pages (Abrégés connaissances et pratique).
ISBN 2-294-00377-2

Dabis F, Drucker J, Moren A.


Epidémiologie d'intervention.
Paris : Arnette; 1992. xxiv-589 pages.
ISBN2-7184-0563-5
Grimes DA, Schulz KF.

Bias and causal associations in observational research.


Lancet 2002;359(9302):248-252

Rothman K, Greenland S.
Modern epidemiology. 2nd edition.
Philadelphia : Lippincott Williams & Wilkins; 1998. 752 pages.
ISBN 0-316-75780-2

Sacket DL.
Bias in analytic research.
J Chronic Dis 1979;32(1-2):51-63.

68

Vous aimerez peut-être aussi