Académique Documents
Professionnel Documents
Culture Documents
iii
Plan de la leçon.................................................................................................................................. 27
1. Introduction .............................................................................................................................. 27
2. Fl c a i d écha ill age e em le d em e e a iable a i a i e................ 28
3. I e alle de c fia ce d em e e .................................................................................. 29
3.1. Cas des grands échantillons.............................................................................................. 29
3.2. Cas des petits échantillons ............................................................................................... 29
4. I e alle de c fia ce d e i le g a d écha ill ................................. 30
5. I e éai de l i e alle de c fia ce .............................................................................. 31
Chapitre 4 : Diff ren e pe d enq e en pid miologie ................................................................. 33
Objectifs de la leçon .......................................................................................................................... 33
Plan de la leçon.................................................................................................................................. 33
1. P c a e de e d g e .................................................................... 33
2. Distinction entre études expérimentales et non expérimentales .......................................... 33
3. Principales études non expérimentales .................................................................................. 35
3.1. Enquête transversale ....................................................................................................... 35
3.2. Enquête de cohortes ........................................................................................................ 35
3.3. Enquêtes ca-témoins ........................................................................................................ 37
3.4. Enquête écologique .......................................................................................................... 37
Chapitre 5 : Pr ci ion e alidi d ne me re en pid miologie ........................................................ 39
Objectifs de la leçon .......................................................................................................................... 39
Plan de la leçon.................................................................................................................................. 39
1. Introduction ............................................................................................................................. 39
2. P c (ab e ce d e e a a e) ................................................................................... 40
2.1. Notions générales sur la précision .................................................................................. 40
2.2. Illustration à partir de la différence des moyennes ...................................................... 41
2.3. Mesures pour améliorer la précision ............................................................................. 42
3. Validité ..................................................................................................................................... 43
3.1. Validité interne ................................................................................................................ 43
3.2. Va d e e e: e e a e e e de a a de a ............ 60
4. Moyens pour améliorer la validité ............................................................................................. 61
4.1. Prévenir les biais de sélection................................................................................................ 61
4.2. Prévenir les biais de confusion .............................................................................................. 63
4.3. Prévenir les biai d informa ion ............................................................................................ 65
Références bibliographiques ................................................................................................................. 68
iv
v
Chapitre 1 : I d c d ge
Objectifs de la leçon
e pliq er ce q e l pid miologie ;
comprendre l ol ion de pra iq e en pid miologie ;
ill rer par de e emple l in r de l pid miologie.
Plan de la leçon
Introduction
In r de l pid miologie
1. Introduction
1.1. Epidémiologie : e -ce ec e ?
L pid miologie e la science qui étudie les variations de fréquences des maladies dans
les groupes humains et recherche les déterminants de ces variations. Elle vise en
particulier à la recherche des causes des maladies e de l amélioration de leurs traitements
et moyens de prévention.»
1.2. Implications de la définition
De la définition ci-dessus découlent les notions de :
1.2.1. Distribution
Il agi de la aria ion de fréquence du problème, de sa variation en fonction de différents
param re el le emp , l e pace e la per onne no ammen e carac ri iq e
sociodémographiques, anthropométriques, cliniques et biologiques. L a i me de ba e de
l id mi l gie est que la maladie ne se distribue pas aléatoirement dans les populations
humaines. L l cida ion de rai on de ce e di rib ion non al a oire ren eignera r le
facteurs déterminants de la maladie et de la santé et les mécanismes biologiques qui y
conduisent.
1.2.2. Facteurs déterminants
Il agi elon le ca , de fac e r en ironnemen a (agen ph iq e : emp ra re,
radia ion , br i ; agen chimiq e : poll an de l air, de l ea ), de fac e r li a
habitudes de vie (vie professionnelle, alimentation, alcool, abac, loi ir, ), o de fac e r
génétiques, etc.
1.2.3. Etats ou évènements liés à la santé
il pe agi d a o nemen n ga if : ce on alor de probl me de an ,
exprimant soit un manque actuel ou potentiel de bien-être dans le domaine physique,
men al o ocial, oi n a non a i fai an de la an d n indi id . Les problèmes
6
de santé peuvent être aigus ou chroniques ; ils peuvent être des handicaps, des
traumatismes, des suicides, des indicateurs cliniques (tension artérielle, poids) ou
biologiques (hémoglobinurie, cholestérolémie)
Les états ou évènements liés à la santé peuvent également être positifs, exprimant le
bien-être physique, mental et social de base.
1.2.4. Population
L pid miologie occ pe pl de la pop la ion groupe humain q e de l indi id , ce q i
la distingue du reste des sciences médicales e fai d elle ne di cipline de ba e de la an
p bliq e. C e de ce poin de e, q e na le be oin de d crire la an e la maladie en
termes de fréquence et de distribution dans la population humaine. La population est définie
sur des critères géographique (lieu de résidence, de travail, de mouvement, etc.), temporel
(saison, années, etc.) ou sociodémographique (âge, sexe, profession, etc.).
1.2.5. Lutte contre les problèmes de santé
Elle con i e l en emble de in er en ion i an main enir l a de an de ba e, le
r ablir o l am liorer.
1.3. H e de d ge
1.3.1. Hippocrate : e de l id mi l gie ?
A la lumière de la définition ci-dessus, on peut invoquer Hippocrate comme le père de
l pid miologie, p i q il cherchai d j de d erminan en ironnemen a , e non pa
seulement individuels, aux maladies dans son Traité des airs, des eaux et des lieux (400 av. J.-
C.). Mai i l on adme ne parler d pid miologie en an q e cience q par ir d momen
où des schémas observationnels (enquêtes, registres, études), expérimentaux (essais
thérapeutiques comparés) et théoriques (modèles populationnels) sont employés, avec des
m hode de rec eil e d anal e de donn e adap e , ce n e q a XVIIe i cle q e l on
voit apparaître, en Angleterre, les premiers véritables travaux « épidémiologiques ».
1.3.2. Angleterre : berceau de l id mi l gie ?
Dès 1538, un document était rempli pour chaque décès et des statistiques de mortalité
hebdomadaire et annuelle étaient effectuées systématiquement en Angle erre. C e ce q on
appelait les « bills of mortality ». A partir de 1603, le processus fut amélioré par le recueil
ma iq e d informa ion r la ca e de mortalité. Toujours en Angleterre, apparurent les
premier ra a pid miologiq e , conn a jo rd h i o l appella ion de surveillance
7
épidémiologique «processus continu de recueil de données sanitaires au cours du temps
permettant de documenter des changements éventuels et de créer des alertes sanitaires. »
1.3.3. Epidémiologie : u e a e e de l a mie ?
En 1662, Graunt fournit une analyse en profondeur des bulletins de mortalité en évaluant
d ne par le o rce d erre r e de biai q i po aien rendre leur interprétation difficile, et
en me an d a re par en idence de r g lari dan le rie de d c e le pic
épidémiques, de taille variable, qui furent attribués à des épidémies récurrentes de peste. Ce
fut le tout premier travail épidémiologique au sens actuel du terme. Ensuite, dans le cadre
d ne collabora ion, Gra n abli a ec on ami Pe la premi re able de mor ali ,
l o il de ba e de d mographe .
Ce e able repr en e la probabili de r ie en fonc ion de l ge d ne cohorte de 100
nouveau-nés : au XVIIIe siècle, 36 meurent avant 6 ans et un seul survit à 76 ans. Christian
Huygens, mathématicien et astronome qui analyse avec son frère Lodewijk la table de vie de
Gra n , en d d i ne m hode de calc l de l e p rance de ie en fonc ion de l ge. Ain i, on
voit apparaître clairemen q e l pid miologie e l a ronomie appartiennent en effet à deux
di cipline q i, par ir de l ob er a ion, e aien d inf rer de loi .
1.3.4. Variolisation : ancêtre de la vaccination ?
En Asie mine re, de ob er a e r a cie a aien fai de l imm nologie an le savoir : ils
avaient compris q e l on ne prend jamai de foi la pe i e role . Pratiquée depuis 1721
en Angleterre, la variolisation consistait à défier « challenger » le système immunitaire grâce
ne carifica ion effec e par ir d n pr l emen r ne p le de malade. l poq e,
on e imai q ne grande par ie de la pop la ion anglai e a ai infec e par la ariole e
q n enfan q i en ai a ein a ai en re 20 et 30 chances sur 100 de mourir. En un temps
o la arioli a ion ai cependan for con ro er e car, Berno lli compri q il fallai me re
en a an ce q e l on appellerai a jo rd h i ne approche co -bénéfice.
Il construisit un modèle mathématique fondé sur des hypothèses simples. al an d ne par
le nombre o al de mor a rib able la ariole, e d a re par le nombre de mor q i
eraien ob er e i l on pra iq ai la arioli a ion, en ppo an q e celle-ci tue 1 inoculé
sur 200, Berno lli ro a q e l e p rance de ie progre erai de roi an (pa an de 26 29
an ), en effec an ne anal e de en ibili me an en ca e l e ima ion d ri q e de
l inoc la ion. Il concl q e, de de i a ion , la arioli a ion erai de loin la plus
in re an e par on b n fice r on ri q e p i q il fa drai q elle ca e 1 mor r 10
variolisés pour que les deux situations soient équivalentes. Trois critiques fondamentales
furent opposées à Bernouilli. La première, endossée par Laplace (1749-1827) dans son Essai
8
sur les probabilités, est que l e a ce de ie e e -être pas le bon critère de
comparaison e q e la pop la ion n e pa pr e changer n ri q e imm dia m me faible
(cel i de l inoc la ion) con re n ri q e loin ain. La seconde critique est que les risques
médicaux dépendent des opérateurs, et donc si l on arri e r d ire le ri q e imm dia de la
procédure (inoculation) à une valeur égale à celle du risque immédiat de contracter la variole
naturellement, il est éviden q e, d lor , la pop la ion choi ira d re arioli e. Il fa donc
propo er ce q on appellerai a jo rd h i de m hode da rance de la q ali . La
troisième critique est que, pour construire des modèles mathématiques sérieux, il faut des
données de qualité, q e ce oi r le ri q e o r l hi oire na relle de maladie : c e la
n ce i primordiale d n me d informa ion efficace q i e o lign e. Ce n e q en
1840 que la variolisation fut interdite en Angleterre au bénéfice de la vaccination.
1.3.5. XIXe : siècle des sciences
Le grand chapi re de l pid miologie moderne o ren a XIXe i cle avec la naissance
de l pid miologie cliniq e e de ce q on appelle a jo rd h i la m decine fond e r le
preuves » avec Pierre Louis et Claude Bernard, l pidémiologie sociale avec Villermé,
l pid miologie d in er en ion e la surveillance épidémiologique avec William Farr et la
ma i a ion de l informa ion rec eillie dan le pop la ion a ec Q e ele .
Épidémiologie clinique
Parmi les observations et expérimentations rigoureuses qui commencèrent à se mettre en
place au XVIIIe siècle, il est habituel de citer James Lind qui, en 1747, réalisa le premier essai
clinique randomisé et découvrit que le citron permettait de guérir le scorbut (maladie due à
une carence délétère en vitamine C qui se traduit, dans sa forme grave, par
un déchaussement des dents et la purulence des gencives, des hémorragies, puis la mort) des
marins sur le bateau desquels ils étaient embarqués. Pierre-Charles-Alexandre Louis (1787-
1872), m decin, e le co rage de con e er ne pra iq e m dicale dominan e de l poq e : la
saignée, souvent pratiquée grâce à des sangsues (en 1833, la France importait 42 millions de
ang e po r age m dical). L id e ai l poq e q e o e le fi re a aien la m me
origine, an la manife a ion d ne inflamma ion de organe , e q appliq er de ang e
était efficace. Pour la remettre en cause, Louis établit une observation rigoureuse sur un
groupe de malades ayant tous une forme bien caractérisée de pneumonie et conclut à une très
faible efficaci de la pra iq e. Si ce q on a appel la m hode n m riq e de Pierre Lo i
ai r ol ionnaire, parce q il cherchait à tirer des conclusions à partir de données
n m riq e rec eillie ma iq emen a li d malade, e non par ir d opinion , f -ce
celle de ma re , il l i manq ai le ppor de ce q on appelle a jo rd h i la a i iq e.
9
À cet égard, Jules Gavarret (1809- 1890) fut pionnier avec son livre Principes généraux de
statistique médicale.
S ma i a ion de l info ma ion m dicale
Dan le me d informa ion ani aire, la cla ifica ion e idemmen ne ape cl , e l
première classification internationale des maladies fut créée par Jacques Bertillon et que, ce
faisant, il était le lointain continuateur de François Boissier de Sauvages de Lacroix, fondateur
de la nosologie avec sa classification de 2400 maladies publiée post mortem en 1771. Claude
Bernard est souvent présenté comme un adversaire irréconciliable de la statistique et de
l pid miologie. Il a ain i o rn en d ri ion l id e d rine mo enne de l homme e rop en
obtenue en opérant des prélèvements dans les pissotières de la gare du Nord. En cela, il
n appr ciai g re le effor de ce q i, comme Adolphe Q e ele (1796-1874, statisticien,
in en e r de l inde de corp lence [poid / aille2] o jo r ili , ma h ma icien, a ronome
et naturaliste) avaient foi dans le rec eil ma iq e de l informa ion dan de grande
populations et en effet a ai d fend le concep d homme mo en (cel i don le
paramètres individuels seraient égaux à la moyenne des paramètres de la population). Mais
Claude Bernard a souligné tr clairemen la n ce i en cliniq e d e p rimen a ion
compara i e , no ammen dan l al a ion de rai emen . Il a cri , dan on Introduction à
la médecine expérimentale, de pa age o lignan clairemen la n ce i de ce q on
appellerait aujo rd h i de e ai h rape iq e con r l .
Épidémiologie sociale
Au début du XIXe siècle, contagionnistes et anticontagionnistes affron aien r le ca e
de maladie , andi q e pr alai o jo r la h orie hippocra iq e de mia me . D apr
cet e h orie, le di pari de an ob er e en re diff ren erri oire e pliq aien par de
fac e r opographiq e : diff rence d al i de, de den i de pop la ion, pro imi o non
d ne ri i re. Lo i -René Villermé (1782-1863), décidant de prendre les données à bras-le-
corp , o l e er l h po h e elon laq elle le in gali de an ob er e dan le do e
arrondissements de Paris dans la période 1817-1826 e pliq eraien e en iellemen par de
facteurs sociaux.
Il montra que des variables économiques (impôt moyen, prix moyen de location des
logements, etc.) étaient corrélées négativement à la mortalité, tandis que la densité de
pop la ion ne l ai pa . Villerm appor e de a re con rib ion maje re
l pid miologie ociale : la première concerne la santé des personnes emprisonnées, dont il
mon ra q elle ai corr l e a condi ion d empri onnemen e non pa la q ali morale
de pri onnier . Dan la econde, il fi ob er er q e l e p rance de ie ariai elon le
10
condition ociale de ra aille r de ind rie e ile . Se ra a f ren l origine de
premières lois limitant les conditions dans lesquelles on pouvait recourir au travail des enfants
ou louer des logements plus ou moins insalubres.
Surveillance épidémiologique
Dep i le ann e 1980, a ec la con cience de l impor ance de maladie mergen e , la
r eillance pid miologiq e e de en e n domaine impor an de l pid miologie, la foi
en termes de méthode (recherche de systèmes temps réel) et de résultats (découverte du sida,
par exemple). William Farr créa la surveillance épidémiologique moderne. La surveillance
épidémiologique avait pris son essor au XIXe siècle à Londres avec William Farr (1807-1883)
qui, lorsque le bureau des registres fut établi en Angleterre en 1838, devint rapidement
responsable du département statistique. Il mit en place une classification des causes des
maladies, travailla rigoureusement à la définition des dénominateurs permettant de calculer
le ri q e e compri q il n e pa de rec eil e d anal e de donn e an ne diff ion
appropri e (ce q il fi gr ce n grand nombre de b lle in hebdomadaire , eme riel ,
etc.). Il montra comment cette connaissance devait déboucher sur des méthodes de prévention
et fut le premier à décrire la chronologie et la taille des épidémies de grippe.
1.3.6. XXe siècle en épidémiologie
Le XXe i cle o re r le pri Nobel de Ro (1902), le mod li a e r pilo e de
l pid miologie d pal di me; dan le ann e 1930, la d marche d e d h po h se,
indispensable à la recherche des facteurs de risque est mise au point par Neyman et Pearson;
l apr - Seconde G erre mondiale erra na re e cro re l pid miologie anal iq e; le
années 1980 verront renaître la crainte des maladies infectieuses ; les années 1990 seront
celles des promesses du décryptage du génome. Surtout, depuis les années 1990, la puissance
de mo en de calc l e de rec eil de l informa ion perme de d elopper n o a re
niveau les recherches des causes génétiques et environnementales des maladies qui avaient été
initiées par les pionniers des siècles passés. Ses résultats concernant le choléra, obtenus au
milieu du XIXe siècle, mirent eux aussi en cause la théorie des miasmes, et soutinrent
l h po h e q e la ca e d chol ra ai dan l ea . C e n a re pid miologi e anglai ,
Snow, qui en apportera une démonstration définitive en géo-localisant les cas dans un quartier
de Londres et en identifiant la source de la contamination (une pompe à eau bien précise).
2. Intérêt de d ge
L pid miologie e la di cipline de ba e de la an p bliq e en ce q elle d cri la an e
les problèmes de santé dans la population plutôt que chez les individus. Plusieurs aspects
11
moignen de l in r de l pid miologie dan la pratique quotidienne des décideurs, des
gestionnaires, des praticiens et des agents de tous les niveaux du système de santé.
2.1. Décrire le spectre d e maladie
La maladie repr en e le r l a d n proce d al ra ion de me biologiq e de
l h e. Les grandes catégories descriptives cliniques ou pathologiques sont souvent
constituées de manifestations biologiques et cliniques diverses. Les variations observées dans
leur distribution statistique et dans leur évolution dans une population permettent de
di ing er le manife a ion d ne maladie de celle d ne a re.
Un en emble de igne , de mp me e de imili de de l hi oire na relle d ne maladie
est appelé syndrome. Par exemple, le syndrome méningé est un ensemble de signes, de
symptômes e de r l a de labora oire econdaire l infec ion o l irri a ion de m ninge .
La connaissance du spectre de la maladie permet aux professionnels de planifier des stratégies
d in er en ion efficace de l e comme l d ca ion, le con eil, le d pi age, les programmes
de pr en ion e de rai emen . De pe d de pid miologiq e perme en de d crire le
pec re d ne maladie : le enq e de cohor e e le de ca -témoins.
2.2. Décrire h e a e ed e maladie
L hi oire na relle de la maladie e r f re l ol ion de la maladie dan le emp che
l indi id . Elle comprend o le ph nom ne li la maladie dep i le d b de celle-ci
j q la fin de l pi ode (g ri on o d c ). Ce e de crip ion perme d l cider le
altération p cifiq e d me biologiq e de l h e e d am liorer la pr ci ion de
diagnostics. Par exemple, des études de cohor e on mon r q ne ch e d ni ea de
lymphocytes T possédant le marqueur de CD4 était a oci e l infec ion par le VIH e q ne
diminution importante des cellules CD4 était associée à un développement des symptômes de
l infec ion e d ida. Ce e ob er a ion a po le imm nologi e orien er le r recherche
sur une interaction du système immunitaire et le VIH.
L pid miologie pe galemen aider d crire l impac d rai emen r l hi oire na relle
de la maladie. Ain i de de de cohor e on d mon r l efficaci de HAART (higl ac i e
an ire ro iral herap ) a an r la r d c ion de l incidence d ida q e r la survie des
pa ien de ida. Le champ de l pid miologie cliniq e e cel i de la recherche appliq e
l hi oire na relle de la maladie dan le b d am liorer la pr ci ion de diagno ic de
praticiens.
2.3. Identifier les facteurs de risque d e maladie
Avoir certaines caractéristiques spécifiques peut augmenter la probabilité pour un individu de
d elopper la maladie. Le ri q e e la probabili d n nemen nocif o non o hai . En
12
pid miologie, le ri q e e la probabili d n indi id indemne d ne maladie con rac e
celle-ci il en re en con ac a ec de fac e r q i a gmen en le ri q e de ce e maladie. Le
facteurs associés à un risque élevé de développer la maladie sont appelés facteurs de risque.
Le facteur de risque peut être social (tabagisme, alcoolisme), génétique (trait drépanocytaire,
certains cancers), diététique (alimentation riche en graisse saturée, déficience en
micronutriments) etc. La connaissance des facteurs de risque permet aux professionnels de
planifier des programme d in er en ion efficace a an la r en e de la maladie. Par
exemple, des études descriptives, transversales, cas-témoins et de cohorte ont toutes montré
que le tabac est le plus grand facteur de risque de maladie : il est le principal facteur de risque
des maladies cardiovasculaires, respiratoires chroniques et de nombreux cancers (poumon,
na ophar n , e ie, e c.). Le abac e ain i la principale ca e d in alidi e de d c dan
o le pa . Le campagne d d ca ion ani aire e le a re ratégies de cessation ou de
réduction du tabagisme, basées sur ces études sont des activités majeures de santé publique
dans ces pays.
2.4. Prédire les tendances d e maladie
La po ibili de pr dire le f re pid mie offre l oppor ni a profe ionnel de santé
de mobiliser le plus efficacement possible les forces pour combattre la maladie. Les études
descriptives de nombreuses maladies infectieuses, comme la méningite cérébrospinale, la
grippe, la poliomyélite, etc., ont révélé une périodicité des épidémies et pandémies causées
par ce maladie . Le de de endance de l infec ion par le VIH che le per onne
adonnan de ac i i ha ri q e on permi a pid miologi e e a i icien de
développer des modèles de prédiction du nombre de cas de sida dans les 5-10 années à venir.
2.5. Expliquer les mécanismes de transmission d e maladie
Comprendre les mécanismes de transmission de la maladie peut suggérer les voies de protéger
le p blic en oppan la ran mi ion de l agen iologiq e. Le udes épidémiologiques de
certaines encéphalites par arboviroses ont incriminé certaines espèces de moustiques comme
vecteurs de la maladie et certains animaux comme réservoirs de « virus ». Les efforts des
professionnels ont alors été concentrés sur la lutte contre le vecteur et la vaccination des
anima , r er oir de ir . en o re, en d pi de la di ponibili d n accin efficace
contre la variole depuis près de deux siècles, Cours dispensé aux étudiants du Master des
études en bactériologie virologie m dicale de l Uni er i Ca holiq e de l Afriq e de
l O e (UCAO) Bobo-Dioulasso B rkina Fa o, ann e 2012 l radica ion de ce e maladie
na po ible q e dan le ann e 70, lor q e l on a compri q en rai on de la faible
contagiosité du vir de la ariole, e d emp d inc ba ion rela i emen long de la ariole,
13
seule une stratégie de surveillance des cas, de détection et de vaccination immédiates des
per onne con ac po ai cond ire ce e radica ion. L applica ion de ce e ra gie a
permi d radiq er la ariole dan n d lai de moin de 10 an .
2.6. Favoriser les pratiques médicales basées sur des preuves
L objec if premier de la an p bliq e e de pr enir la r en e de maladie par ne
in er en ion dan l hi oire na relle de la maladie. Mai l efficaci d n accin o de o
a re programme d in er en ion doi re pro e a an on emploi dan la pop la ion. Le
études épidémiologiques (essais cliniques contrôlés, double aveugle avec placebo) sont alors
une étape nécessaire dan le d eloppemen d programme q el q il oi (admini ra ion de
nouveaux vaccins, stratégie de changement de comportement ou autre).
2.7. Evaluer le g a e d e e
M me i l ili d n accin a d mon r e par de e ai randomi , do ble aveugle, ce
accin pe cho er dan a pro ec ion lor q il l n e pa accep par la majori d p blic
(vaccin antigrippal en France, vaccin contre la fièvre typhoïde dans le monde). Diverses
de pid miologiq e pe en re ili e po r l al ation continue des programmes
d in er en ion. De de ran er ale r p e pe en mon rer n changemen dan la
pr alence de la maladie o dan le indica e r d a de an a ec le emp . De de de
cohor e pe en comparer l incidence de la maladie dans des populations comparables
recevant et ne recevant pas le programme de prévention. Des études cas-témoins peuvent
d erminer il e i e ne diff rence en re le propor ion de ca e de moin q i on
b n fici d programme d in er en ion.
2.8. Identifier le be de a d ec a
Les professionnels de santé doivent connaître les problèmes majeurs de santé dans leur
comm na de er ie ain i q e le egmen ocia le pl affec .Ce ne condi ion
pour réussir un programme de promotion de la santé dans la communauté. Les études
transversales peuvent révéler la prévalence de la maladie dans la communauté aussi bien que
dans les sous-groupes de la population, tandis que les programmes de surveillance peuvent
mettre en évidence les endance de la maladie, de l infec ion e /o de l a de an dan le
emp . Par e emple, la pr alence de l infec ion par le VIH o d ida e faible dan le pa
européens, mais très forte chez les migrants.
14
Chapitre 2 : Mesures en épidémiologie
Objectifs de la leçon
décrire les différents outils de mesure utilisés en santé ;
citer les principales mesures (ou outils) épidémiologiques ;
d crire le me re d a ocia ion en épidémiologie ;
d crire le me re d impac en pid miologie.
Plan de la leçon
Rappels sur les outils de mesure
Principales mesures épidémiologiques
1. Rappels sur les principales mesures de morbidité et de mortalité
A côté des nombres absolus, la plupart des mesures utilisées en sciences de la santé sont des
parle de rapport.
1.1. Proportion
Le numérateur est compris dans le dénominateur. Elle e prime o la forme d n nombre
compris entre 0 et 1, o o la forme d n pourcentage si le résultat est multiplié par 100
(po r 1 000, po r 10 000, ).
En 2009, une enquête parmi 1005 femmes enceintes au Sud du Bénin a montré que 686
femmes étaient an mi e ( a d h moglobine < 110 g / L). Parmi le femme an mi e , 34
présentaient une anémie gra e ( a d h moglobine < 80 g / L)1. La proportion de femmes
enceintes anémiées parmi ces femmes était :
1.2. Ratio
Le numérateur e a c dans le d nomina e r. C e le rappor de fr q ence de
de cla e d ne m me ariable. Il e prime o la forme d n nombre compri en re 0 et
f . Dan l e emple pr c den , le ra io femme encein e gra emen an mi e : femmes
enceintes modérément anémiées est égal à :
1
Ouédraogo S. et al. Maternal Anemia at First Antenatal Visit: Prevalence and Risk Factors in a Malaria-Endemic Area in
Benin. Am J Trop Med Hyg. 2012 Sep;87(3):418-24.
15
1.3. Taux
Soit un groupe de sujets initialement non malades (groupe ). Certains deviennent malades
1.4. Cote
C e le rappor en re la probabilité d'ob er er n nemen e celle d'ob er er l nemen
contraire. La cote est un ratio. Cette notion est très utilisée dans les milieux des jeux. Soit 5
000 personnes ayant parié en faveur ou en défaveur des Etalons lors du match Etalons vs
Éperviers pendant la CAN 2013: 2000 avaient parié que les Etalons perdrait et 3000 avaient
parié que les Etalons gagnerait. La cote de perdre pour les Etalons était : (2000/5000) /
(3000/5000), soit 0,7. On dira que les Etalons sont cotées à 0,7 contre 1.
1.5. Indice
To le rappor q i ne on ni ne propor ion, n a o n ra io de indice . C e le ca
par exemple du nombre de médecin par habitants, du nombre de formation sanitaire par
habitant ou encore le nombre de cardiologue par centre hospitalier régional, etc.
16
2.1. Mesures de fréquence
2.1.1. Mesures de prévalence
Elles prennent en compte le nombre de cas existants d ne maladie donn e ob er à un
moment donné dans une population donnée.
Prévalence absolue
Ce le nombre de cas existants à un moment donné. Par exemple, le fer est un
micronutriment précieux indispensable à la formation des globules rouges du sang. Pendant la
grossesse, les besoins en fer de la femme augmente pour répondre à la nécessité de fabriquer
beaucoup plus de sang pour la mère elle-même, pour le développement du placenta et du
f . La me re de l a de r er e en fer de l organi a ion e fai par le do age de la
ferritine dans le er m (ferri n mie riq e). On con id re q il a d fici (o manq e) en fer
lorsque la ferritinémie sérique est < 12 µg / L pendant la grossesse. Parmi les 1005 femmes
enceintes suivies au sud du Bénin, 335 présentaient un déficit en fer.
La prévalence absolue du déficit en fer est donc de 335 dans cette population en 20092.
Prévalence
La prévalence est une proportion3 et a a d . En cas de prévalence faible ou très
faible, il sera plus pratique de multiplier par 1 000, 10 000, 100 000 voire 1 000 000 pour
présenter les résultats.
2.1.2. Me e d i cide ce
Le me re d incidence prennen en comp e le nombre de nouveaux cas d ne maladie
ob er a co r d ne période donnée dans une population. Elles ne sont donc utilisables
que lorsqu'il est possible de distinguer, au cours d'une période donnée, les nouveaux cas de
ceux survenus avant le début de la période. On distingue le nombre de cas incidents,
l incidence c m l e, le a d incidence. Il fa a oir q e le d c ne q n nemen
particulier, et que les me re de mor ali con i en a i n probl me d incidence.
Nombre de cas incidents
2
Ouédraogo S et al. Maternal anemia in pregnancy: assessing the effect of routine preventive measures in a malaria-
endemic area. Am J Trop Med Hyg. 2013 Feb;88(2):292-300.
3
La prévalence n’est pas un taux, donc l’emploi de l’expression « taux de prévalence » est inapproprié.
17
Ce le nombre de nouveaux cas a co r d ne période donnée. Soit un groupe de 16
sujets, suivi pendant un an. Les résultats sont présentés dans la figure 1. La période à risque
correspond à la période de temps pendant laquelle le sujet est susceptible (« à risque ») de
d elopper l nemen di . Le nombre de cas incidents est 4 (sujets 3,4, 7 et 14).
Incidence cumulée (ou risque)
L incidence c m l e e ne proportion e n a pa d ni .
0 2 4 6 8 10 12
Durée d’observation en mois
revolus
Figure 1 : S i i d n gro pe de 16 per onne
18
avec : effectif de la population à la fin de la période
d ob er a ion.
Dan l e emple de la figure 1, le nombre de personnes à risque est égal à :
Si la maladie est rare dans la cohorte, m est petit par rapport à et , et le nombre de
Ta d c de ce ( de d c de ce)
Cette mesure doit être utilisée lorsque la période pendant laquelle l'incidence d'un événement
peut être étudiée (lors du suivi de la population) est variable selon les sujets. Le taux
d incidence a po r ni le personne-temps. Dans ce cas aussi, il peut être intéressant de
présenter les résultats en multipliant par un facteur 100, 1000, ...
Calcul du nombre de personne-temps à risque (dénominateur)
- Principe : chaque sujet ne compte pl po r la o ali de la p riode d ob er a ion
prévue pour la population entière, mais seulement pour la période pendant laquelle
on a pu observer ce je , a an la r en e de l nemen di . Ce e p riode
est appelée période à risque. Le nombre total de personne-temps pour une
population donnée est égal à la somme du suivi réalisé par tous les sujets de cette
population en nombre de personne-temps.
- Calcul : il peut être fait de deux manières :
19
Valeur exacte : on connaît la durée exacte de la période à risque de chacun des
sujets étudiés. Si on reprend l e emple pr c den (Figure1), le nombre de
personne-temps est égal:
20
dans la région sanitaire du Centre-Ouest au Burkina Faso, 152 décès liés au paludisme grave
et concernant des sujets de sexe masculin de 0 à 5 ans ont été recensés parmi les 162 décès
recensés dans la population de la région. La mortalité brute du paludisme grave est de 162. La
mortalité spécifique du paludisme grave chez les sujets âgés de 0 à 5 ans et de sexe masculin
est 1524.
2.1.3.1. Part de mortalité
On appelle part de mortalité le rapport entre le nombre de décès liés à une cause donnée au
nombre o al de d c a co r d ne p riode donn e. Dan l e emple pr c den , en 2010, la
part de mortalité liée au paludisme grave chez les sujets de sexe masculin de 0 à 5 ans est :
152 / 162 = 0,938, soit 93,8%.
2.1.3.2. Létalité
Cette notion se réfère à la survenue des décès liés à une maladie donnée, chez les personnes
atteintes de cette maladie.
Une prévalence élevée peut donc correspondre à une incidence élevée ou à une durée
mo enne de la maladie long e (l ali faible). A l in er e, ne pr alence faible pe
correspondre à une incidence faible, à une durée moyenne de la maladie courte (maladie
aiguë, taux élevé de guérison), à une létalité élevée.
En re incidence c m l e e den i d incidence
2.2. Me e da ca
2.2.1. Contexte
La recherche de facteurs qui expliquent une incidence plus élevée (ou moins élevée) du
problème de santé chez les sujets exposés et chez les sujets non exposés con i e l ne de
4
Plan d’action 0 . Direction Régionale de la Santé du Centre-Ouest. Juin 2012.
21
principale q e ion q i e po en l pid miologi e. Cette recherche repose sur l'étude de
l'existence d'une association (d'un lien, d'une relation) entre l'exposition à une caractéristique
et la maladie. Cet aspect de l'épidémiologie est appelé épidémiologie analytique. Il est
toujours nécessaire de comparer au moins deux groupes. Par exemple, on sait que le taux de
mortalité par cancer broncho-pulmonaire est de 227 / 100 000 personne-années chez les
fumeurs. Cette information ne donne néanmoins aucune indication sur le lien entre tabac et
cancer du poumon. En revanche, i l on conna le taux de mortalité du cancer broncho-
pulmonaire chez les non-fumeurs e il e pl ba q e che le f me r de fa on
significative, alors on peut affirmer q il a ne a ocia ion en re le fai de f mer e la
mortalité par cancer broncho-pulmonaire.
2.2.2. Tableau de contingence
Plusieurs types d'étude sont utilisés pour la recherche d'une association. Quels qu'ils soient,
leurs résultats doivent pouvoir être présentés dans un tableau de contingence, classant les
individus selon leur statut vis-à-vis de la maladie (malade/non malade) et vis-à-vis de
l'exposition à la caractéristique étudiée (exposé/non exposé). Ceci est vrai si les variables
exposition et maladie sont catégorielles (et dans le cas présent, dichotomiques).
Tableau 1 : Répartition des sujets selon le statut
Malade Non Malade Total
Exposés A b E1
Non Exposés C d E0
Total M1 M0 M1 + M0 = E1 + E0 = T
22
Tableau 2 : Interprétation du RR en fonction du résultat
RR* Interprétation* Synthèse*
=1 Il n a pa d a ocia ion en re l e po i ion e la maladie Pas
d a ocia ion
>1 L a ocia ion e po i i e : le risque de maladie est plus élevé chez Facteur de
les sujets exposés que chez les non exposés risque
<1 L a ociation est inverse : le risque de maladie est moins élevé chez Facteur
les sujets exposés que chez les non exposés protecteur
* L in erpr a ion doi galemen enir comp e de l in er alle de confiance de la me re
d a ocia ion o d e a i iq e correspondant.
Comment énonce-t-on ces résultats en pratique ?
RR = 1,30. Un je e po a n ri q e d re malade 1,30 foi pl le (o bien encore a
n ri q e p rie r de 30 % d re malade) q n je non e po .
RR = 2,00. Un sujet exposé a un risq e de foi pl le q n je non e po (o
supérieur de 100%).
RR = 0,65. Cela ignifie q e le ri q e d n je e po e 0,65 foi cel i d n je non
exposé ou encore un sujet exposé a un risque plus faible de 35 % (= [1 - 0,65] * 100) d re
malade q n je non e po . C e ce e derni re e pre ion ( ri q e plus faible de x % »)
q e l on ili e le pl o en .
Soit on compare un groupe de sujets malades (« cas ») et un groupe de sujets ne
pr en an pa (e n a an jamai pr en ) ce te maladie (groupe de référence : «
témoins »). Le nombre de cas et de témoins, donc de sujets présentant ou non
l'événement, est fixé dès la conception de l'étude. Il est donc impossible d'estimer une
incidence de la maladie et d ili er ne me re d'a ociation s'appuyant sur cette
incidence (RR en particulier). La mesure d'association la plus fréquemment utilisée est
alors le rapport de cotes d'exposition, RC (exposure odds ratio en anglais, OR). Pour le
calc ler, il fa d abord calc ler la co e d e position chez les cas (CEC) et chez les
témoins (CET). La cote d'exposition est le rapport entre la probabilité d'être exposé et
la probabilité de n'être pas exposé.
23
Tableau 3 : Co e d e po i ion d apr le no a ion propo e dans le tableau 1
24
Il existe d'autres mesures d'association selon le schéma d'étude retenu. La mesure
d'association en elle-même ne suffit pas à déterminer s'il existe une association entre une
exposition et une maladie. Il faut également prendre en compte d'autres notions, telles que
l'intervalle de confiance de la mesure d'association et la valeur du test statistique, pour
déterminer si l'association observée peut être due au seul hasard, ou, au contraire, est stable,
c e -à-dire « statistiquement significative ».
2.3. Me e d ac
Si les mesures d'association mettent en évidence une association entre l'exposition à un
fac e r de ri q e e ne maladie, il e in re an galemen d al er la con rib ion de ce
fac e r la fr q ence d ne maladie dan ne pop la ion donn e, donc d e imer on
importance en termes de santé publique. A cette fin, on utilise des mesures d'impact,
applicable niq emen il e i e ne rela ion ca ale en re le facteur de risque et la maladie.
Si l'on compare deux groupes, l'un exposé à une caractéristique, l'autre non exposé à cette
caractéristique, on peut estimer :
quel est le risque supplémentaire lié au facteur de risque
Cette notion fait appel à celle de différence de risque, le risque chez les non exposés étant
considéré comme le risque de base (en dehors de toute exposition). Si la mesure de fréquence
est un risque, on parle de risque attribuable au facteur de risque.
25
Tableau 6 : Calc l de la frac ion a rib able d apr le ablea 1
Dans la population
avec : pr alence de l e po i ion (fac e r de ri q e) dan la
population ;
combien de cas sont dus au facteur de risque dans la population et seraient donc
évités si le facteur de risque était supprimé dans cette population.
On parle de nombre de cas attribuables. Il est égal à : ; Pour une maladie donnée,
la fraction de risque attribuable à un facteur de risque dans la population dépend donc de la
force de l a ocia ion en re le facteur de risque et la maladie (RR) et de la prévalence du
facteur de risque dans la population (PE).
Une association entre un facteur de risque et une maladie peut être forte, mais si le
facteur de risque est rare, son importance en termes de santé publique sera faible.
En revanche, un facteur de risque peut être plus faiblement lié à une maladie, mais
il e fr q emmen observé dans la population générale, son impact peut être
important.
Pour une population et un facteur de risque donnés (donc PE constante), on
souhaite dier l impac de ce fac e r de ri q e r de maladie X1 et X2. Or, la
force d a ocia ion po r X1 e inf rie re la force d a ocia ion po r X2 (RR1 <
RR2), donc la fraction attribuable pour X1 est inférieure à celle pour X2. Si le
nombre de cas de X1 est plus important que le nombre de cas de X2, on pourra
observer un impact numérique plus important du facteur de risque sur X1 que sur
X2 en termes de santé publique. Par e emple, l amian e e l origine d en iron
5% des cas de cancer broncho-pulmonaire (soit 1200 décès en France en 1996),
alor q il e le principal fac e r étiologique du mésothéliome (environ 75% des
cas de mésothéliome sont liés à une e po i ion l amian e, repr en an 750 d c
en France en 1996).
26
Chapitre 3 : Intervalle de confiance
Objectifs de la leçon
calc ler n in er alle de confiance d ne mo enne ;
calculer un in er alle de confiance d ne propor ion pour les grands effectifs;
interpréter un in er alle de confiance d n e ima e r.
Plan de la leçon
Introduction ;
In er alle de confiance d ne mo enne ;
In er alle de confiance d ne propor ion ;
Interprétation d n in er alle de confiance.
1. Introduction
Le plus souvent, on dispose de données sur un échantillon et on utilise ces informations pour
décrire la population dont cet échantillon est issu. La description résumée de la distribution
d ne ariable et la comparaison de la distribution observée de cette variable dans un
échantillon par rapport à sa distribution attendue dans la population ou à sa distribution
observée dans plusieurs groupes résumés de la distribution de la variable, constitue les deux
ape de l anal e de donn e .
On souhaite utiliser les résultats obtenus dans un échantillon pour estimer la vraie valeur dans
la population. Par exemple, dans un échantillon, on trouve que la pression artérielle systolique
moyenne est 140 mmHg. Quelle information sur la vraie valeur dans la population ce résultat
apporte-t-il ?
Fai on l h po h e q e l chan illon e représentatif de la pop la ion, c e -à-dire constitué
sans biais, au mieux par tirage au sort. Si l on irai a or de chan illon cce if
par ir d ne m me pop la ion, chaq e chan illon fo rnirai ne e ima ion ponc elle d
param re d in r (par e emple, ici, la moyenne). On peut comprendre intuitivement que
cette estimation va a e d cha a e, en suivant une loi de probabilité. Cela
no aide comprendre po rq oi a ein d n chan illon repr en a if, la mo enne, m, d ne
variable, peut différer de la moyenne de la population, , uniquement du fait du hasard. Cette
fl c a ion e impor an e prendre en comp e, m me i l on a end ce q e m soit très
proche de , p i q e l chan illon e repr en a if de la pop la ion. Il e donc n cessaire
d appr cier l incertitude associée à notre estimation, grâce à un intervalle de confiance.
Dans ce chapitre, nous aborderons le cas des petits et des grands échantillons pour une
variable quantitative, et seulement le cas des grands échantillons pour les variables
catégorielles.
27
2. F c a d cha age : e e ed e e e, a ab e a a e
Une fa on de proc der e de ppo er q e l chan illon don no di po on n e en fai
q n de m l iple chan illon d ne aille donn e, n, repr en a if de la pop la ion, q il
est possible de constituer. Comment varient alors les moyennes observées dans les
échantillons, m1, m2, m3, e c. par rappor la mo enne de la pop la ion, ?
Intuitivement, on peut penser que la moyenne de chaque chan illon arie a o r de , comme
le ale r indi id elle d n chan illon arien a o r de la mo enne, elon n cer ain car ,
et selon une loi de probabilité connue. De plus, on admettra que la moyenne obtenue dans
chaque échantillon varie autour de elon le propri i an e :
1) la ariabili a o r de e moin impor an e a ec le chan illon de grande aille
q a ec ce de pe i e aille,
2) la ariabili a o r de e moin impor an e q e la ariabili de ob er a ion
individuelles dans la population,
3) la ariabili a o r de e propor ionnelle la ariabili de ob er a ion
individuelles (écart- pe, ).
Ces propriétés permettent de montrer mathématiquement (dans cet enseignement, vous
admettrez les résultats) que :
1) en moyenne, la valeur observée dans un échantillon, mi, est une bonne estimation de la
mo enne de la pop la ion, . Ce e e ima ion era d ormai notée , le chapeau
ignifian q il agi d ne e ima ion de la raie ale r.
2) la distribution des moyennes est Normale si la distribution des données individuelles
est Normale. Quelle que soit la distribution des données individuelles, la distribution
des moyennes suit une loi approximativement Normale, si les échantillons sont de
aille ffi an e, c e -à-dire 30.
28
∑
∑
3. I e a e de c f a ce d e e e
3.1. Cas des grands échantillons
L erre r- pe e ile po r con r ire l intervalle de confiance de la moyenne. On peut
remplacer par l e ima ion de l car -type de la population, q e l on pe obtenir à partir de
l'écart-type s ob er dan l chan illon.
Si n 30, on con id rera, a ec n ri q e d erre r de 5%, q e la mo enne inconn e, , doi
de la moyenne, ou encore :
29
La distribution théorique des moyennes est Normale à condition que la taille des échantillons
soit suffisamment grande ( 30). Pour des échantillons de plus petite taille, et à condition
que la distribution théorique de la variable soit Normale, la distribution des moyennes est un
peu différente : la forme de la courbe est plus aplatie que la loi Normale correspondante. Cette
loi, dite de Student, dépend du nombre n de sujets. La distribution t de Student a un seul
paramètre, le nombre de degrés de liberté. L en r e dan la table de Student est le nombre
de degrés de liberté.
Po r le calc l de l in er alle de confiance de la moyenne, le nombre de degrés de liberté est
égal à n-1. A condi ion de po oir faire l h po h e q e la ariable i e ne loi Normale
dan la pop la ion, on a donc po r l in er alle de confiance de la mo enne :
30
des catégories dans la population, notée P, et son complémentaire, 1- P, sont tous deux plus
grands que 5/n ou encore que : (P * n) et [(1- P) * n] sont tous deux plus grands que 5.
De fa on imilaire la no a ion po r la mo enne de ariable q an i a i e , l in er alle de
confiance à ( )% de la propor ion d ne de ca gorie d ne ariable ca gorielle cri
:
On doit vérifier a posteriori que le calcul était possible de cette façon-là, en faisant : (P * n)
et [(1- P) * n]. Comme on ne connaît pas P, on utilise son estimation à chacune des bornes de
l in er alle de confiance. Dan l e emple, on ro e re pec i emen : (0,12 * 100) et (0,88 *
100) et (0,28 * 100) et (0,72 * 100), qui sont tous supérieurs à 5. En pratique, il suffit de faire
la vérification avec la plus petite des quatre proportions (0,12 *100).
De façon similaire à la notation pour la moyenne de variables quantitatives, la précision de
l e ima ion de la fr q ence e :
5. I e a de e a e de c f a ce
Po r n in er alle de confiance 95%, il n e pa correc de dire q il a 95% de chance
que la moyenne de la pop la ion oi dan l in er alle : la mo enne de la pop la ion an ne
ale r niq e, q i ne fl c e pa , elle n e pa a ach e de probabili . 95% , c e la
probabili q e le limi e calc l e par ir d n chan illon repr en a if incl ent la vraie
valeur, . La construction de cet intervalle rend donc son interprétation délicate.
31
La figure 2 donne n e emple d calc l d in er alle de confiance par ir de 20 chan illon
tir a or d ne pop la ion de femme encein e dont on sait que le poids moyen, , est
56,8 kg cm. Le trait horizontal représente la moyenne dans la population, 172 cm. Certains
de chan illon on ne mo enne proche de ce e ale r, d a re on ne mo enne q i en e
bien plus éloignée. Pour certains, la moyenne est au-de , po r d a re , elle e a -dessous.
La moyenne de la population, 56,8 kg, est contenue dan l in er alle de confiance de 20
échantillons sur 20, soit 100% des intervalles de confiance.
64
62
60
Poids (Kg)
58
56
54
52
50
56,8 kg
48
46
E1 E2 E3 E4 E5 E6 E7 E8 E9 E10 E11 E12 E13 E14 E15 E16 E17 E18 E19 E20
En général, au moins 95% des intervalles ainsi calculés contiennent la valeur de la moyenne
de la population. Comme nous ne pouvons pas savoir, néanmoins, quels sont les 95
chan illon r 100 q i la con iennen , on di q e l on e confian q e la mo enne e
ro e l in rie r de limi e calc l e par ir d n e l chan illon, en par ic lier.
Par e emple, dan l chan illon de 100 homme je ne , la pr ci ion de l e ima ion e de
0,08 g / l po r l in er alle de confiance 95%.
32
Chapitre 4 : Différentes e d enquêtes en épidémiologie
Objectifs de la leçon
li er le diff ren e pe d enq e épidémiologiques ;
décrire la différence entre enquêtes expérimentales et non expérimentales ;
décrire les enquêtes épidémiologiques non expérimentales.
Plan de la leçon
principa pe d enquêtes épidémiologiques ;
distinction entre enquêtes expérimentales et non expérimentales ;
principales enquêtes épidémiologiques non expérimentales.
1. P c a e de e d g e
En fonction de l'objectif recherché, plusieurs types d'enquêtes sont utilisés en épidémiologie.
Il est possible de les classer selon leur schéma d'étude (« design ») (Figure 3).
Etude expérimentale
Etude longitudinale (cohorte)
descriptive
Etude transversale
E de d b e a i Etude de cohortes
Etude transversale
33
de l' nemen di . L affec a ion d' n sujet dans l'un ou l'autre des groupes
comparés peut être tirée au sort (« étude randomisée » ; essais cliniques de phase III)
ou non.
1) Inclusion : 2) Recueil des informations
attribution exposition malade/non malade ?
exposé/non exposé
Groupe
sujets
Début de l’étude
34
Dans le cas des études non expérimentales, l'équipe réalisant la recherche « observe »
la réalité, sans intervenir sur les conditions d'exposition des sujets étudiés. C'est la
raison pour laquelle ces études sont également appelées études d'observation.
3. Principales études non expérimentales
3.1. Enquête transversale
Le principe des enquêtes transversales est simple : il s'agit de mesurer chez les individus
d'une population donnée un ensemble de caractéristiques, au même moment. Ce sont des
études de courte durée, ne permettant d'estimer que des mesures de prévalence. Elles sont
utilisées généralement pour des objectifs descriptifs. Elles sont également souvent utilisées à
visée analytique, mais les résultats obtenus sont plus difficilement interprétables car
l'exposition à la caractéristique et la présence de la maladie sont mesurées au même moment.
Sélection des sujets
Et
Recueil des informations (exposé/non exposé ?malade/non malade) ?
Groupe
de
sujets
Début de l’étude
Exposés
Non exposés
A B
Temps
Début de l’étude
36
1) sélection des sujets : identification au temps B
exposition exposé/non exposé au temps A
2) recueil des informations : malade/non malade ?
Exposés
Non Exposés
Temps A
B
Début de l’étude
37
1°) sélection des sujets :
identification maladie
malade/non malade
2°) recueil des informations
exposé/non exposé ?
Malades
Non malades
D b de l de
38
Chapitre 5 : P c e a d d e e ee d ge
Objectifs de la leçon
d crire le ra gie po an am liorer la pr ci ion d ne me re
épidémiologique ;
décrire le 2 compo an e de la alidi d ne me re pid miologiq e ;
diff ren ier ne erre r al a oire d n biai ;
d crire le ra gie po an am liorer la alidi d ne me re pid miologiq e.
Plan de la leçon
Introduction
Pr ci ion d ne me re en pidémiologie
Validi d ne me re en pid miologie
1. Introduction
Chaque étude épidémiologique est un exercice de mesure servant à décrire ou à comparer. On
souhaite par exemple décrire la proportion de malades ou le poids moyen dans un échantillon.
Une étude cherche par exemple à comparer des femmes enceintes infectées et des femmes
enceintes non infectées par le Plasmodium falciparum (l ne de 5 e p ce pla modiale
pa hog ne po r l homme) po r la r en e d ne an mie ge a ionnelle afin d dier
l a ocia ion en re l e po i ion a P. falciparum e l an mie a co r de la gro e e. Or, le
r l a q e l on ob ien par ir d ne enq ee ne combinai on de la raie ale r (celle
q e l on ob er erai i l on po ai dier la pop la ion en i re de jets auxquels on
o hai e appliq er le r l a ) e d erre r commi e diff ren e ape de l enq e. Pour
imple r ali me, no adme on q e m me l enq e la mie planifi e ne pe prod ire n
r la d n d erre r. En re anche, pl on a ra pris de soins po r planifier l enq e, pl
le erre r eron minimi e . Le premier pe d erre r, o l a e appri , e d a
fl c a ion d chan illonnage : c e ne erreur aléatoire, due au hasard. Le deuxième type
d erre r e d la concep ion de l de, la con i ion de gro pe o a proc d re de
cla emen ili e po r carac ri er l e po i ion e la maladie : c e ne erreur
systématique, ou biais.
Ces erreurs peuvent changer les résultats attendus de la vraie valeur, soit en surestimant, soit
en sous-e iman le ale r ob en e , e pe en m me parfoi modifier la direc ion d n
effet (par exemple, un facteur de risque peut apparaître protecteur vis-à-vis de la maladie
di e). Une par ie impor an e d ra ail de l pid miologiste consiste à reconnaître, prévenir
39
e ma ri er ce erre r . A o e le ape d ne de : mi e en place, d ro lemen e
anal e, il e donc ile de r fl chir a o rce po en ielle d erre r.
To a long de ce chapi re, on parlera d effet pour r mer l a ocia ion en re ne e po i ion
et un problème de santé. Le raisonnement concerne donc en premier lieu les études
compara i e (le champ de l pid miologie di e anal iq e). N anmoin , le rai onnemen
utilisé dans le cadre des biais de sélection o de ma ai e cla ifica ion appliq e a e bien
aux études descriptives.
2. P c (ab e ce d e e a a e)
2.1. Notions générales sur la précision
L chan illon don on di po e n momen donn n e en fai q n de chan illon parmi
les multiple chan illon d ne aille donn e, n, repr en a if de la pop la ion, q il e
possible de constituer. Comme pour les moyennes ou les proportions, les valeurs des mesures
de pr alence, d incidence o d a ocia ion ob en e par ir de o le chan illons
possibles varient autour de la vraie valeur de cette mesure, selon un certain écart, et selon une
loi de probabilité connue.
D aillon pr en ce q e cela impliq e po r le RR par e emple. En l ab ence d effe , le RR
calc l par ir de l en emble de la population serait égal à 1. Dans un échantillon
repr en a if de ce e pop la ion, d e l fai de fl c a ion d chan illonnage, le RR ob en
sera le plus souvent proche de la valeur 1, mais il sera exceptionnellement exactement égal à
1. Inversemen , en pr ence d n effe , le RR calc l par ir de l en emble de la pop la ion
sera éloigné de 1 : pour un facteur de risque, il sera supérieur à 1, selon une gamme de valeurs
r end e, p i q elle pe aller j q l infini.
Par exemple, si la vraie ale r d RR e 3 dan la pop la ion, on ai q il era e cep ionnel,
d fai de fl c a ion d chan illonnage, d ob er er pr ci men ce e ale r dan n
échantillon représentatif. On sait toutefois que, grâce à un échantillon représentatif, on
observera, le plus souvent, une valeur proche de 3.
Po r chaq e chan illon, q el q e oi l e ima e r, il e donc po ible de calc ler n
in er alle de confiance de l e ima ion. Il ffi , po r cela, de a oir calc ler l car -type et de
connaître (ou de faire ne h po h e r) la loi de probabili . L e ima ion e d a an pl
pr ci e q e l car e pe i . Or, ce car d pend l i-m me de l car - pe de l e ima e r e de
la aille de l chan illon : e a e ada a c e e a variabilité de la
e e e fa b e e e a a e de cha e g a de.
40
La diffic l ien le pl o en d fai q e l on in re e de diff rence o de ra io e
pas seulement à une proportion ou une moyenne, dont on sait déjà calculer l in er alle de
confiance. Pour illustrer le problème, on abordera dans ce cours le cas de la différence entre
deux moyennes.
Pour être plus informatif, on peut calculer la différence : 97,9 g/L 104,1 g/L = -6,2 g/L. Le
a d h moglobine ai pl ba de 6,2 g/L, en moyenne, chez les femmes infectées par P.
falciparum par rapport à celles qui ne sont pas infectées. Po r calc ler l in er alle de
confiance d ne diff rence de mo enne , il e n ce aire de di po er de l car -type de la
diff rence de mo enne . Si le de chan illon on ind pendan , on pe mon rer q il
fa ili er l car -type commun :
41
L in er alle de confiance de la diff rence en re de mo enne cri :
42
échantillon et le recueil des données est sans doute considérable, alors que la précision de
l e ima ion de l effe e en fai m diocre.
On pe mon rer par aille r q e la p i ance d ne comparai on e ma imale lor q e le
nombre de sujets (ou de personne-années de suivi) est identique dans les deux groupes
comparés, pour un nombre total constant de sujets. Ceci est à nouveau à mettre en balance
a ec le co d rec eil d informa ion po r chaq e gro pe.
Par exemple, si le nombre de cas est faible ou si le coût de la recherche de ces cas est
considérable, il sera parfois plus efficient de con id rer le recr emen d n nombre pl
faible de cas pour les comparer à un groupe de 2, 3 ou 4 témoins par cas.
3. Validité
La validité a deux composantes : la validité interne et la validité externe.
3.1. Validité interne
3.1.1. Notions générales sur la validité interne
La validité interne concerne l de elle-même : les groupes sont constitués et comparés de
elle mani re q e la diff rence d effe pe re a rib e l e po i ion q e l on die. On
peut parler de validité interne d ne me re, il n a pa de biais o d erreur
systématique r le param re q e l on me re. Par e emple, i l on o hai e dier l effe
de la mo iq aire impr gn e r la r en e de infec ion pal re de l enfan de moin de
5 ans et que le recrutement des cas de paludisme se fai niq emen par ir d n er ice d
Centre Hospitalier Universitaire Charles De Gaule, il est vraisemblable que le groupe des cas
ne con iendra q e le ca le pl gra e , non repr en a if de l en emble de ca e a i
sans doute de leur exposition a ri q e d infec ion pal re .
43
qui étaient attendues. Il est donc impératif de prendre toutes les précautions possibles à
chaque nouvelle enquête en sachant prévenir et reconnaître les différents biais, afin de les
ma ri er a mie e d in erpr er correc emen le r l a de de pid miologiq e .
On peut en ci er de di aine o rce de di or ion de l e ima ion de l effe elon
l e p rience d n grand nombre d de , mai le regro pemen e fai e en iellemen en
trois grandes catégories : biais de sélection, biais de confusion e biai d information. La
complexité des biais est telle que le regroupement qui est proposé (sélection, confusion,
informa ion) e parfoi ar ificiel. Il a, n anmoin , le m ri e de perme re d aborder d ne
façon aussi simple que possible ces notions, sources de discussion sans fin entre
épidémiologistes.
44
l ol ion de le r gro e e (con l a ion pr na ale o acco chemen ), la pop la ion
cible de ca po rrai re galemen l en emble de femme encein e fr q en an le
services de maternité des différentes formations sanitaires de ce pays (Exemple 3). Dans
l enq e p cifiq e, on choi ira comme population source des cas c e -à-dire la
pop la ion d o eron e rai le ca l en emble de ca fr q en an 3 cen re de an de
la comm ne d Allada au sud du Bénin (Exemples 2 et 3). Néanmoins, on aurait pu aussi
choi ir de faire ne enq e m l icen riq e, o la pop la ion o rce erai l en emble de
femmes enceintes des différents services de maternité du Bénin (Exemple 1). Ces différentes
possibilités sont résumées dans le tableau 7.
Tableau 7 : Différentes possibilités pour la population cible et la population source dans une
enq e r la rela ion en re le d fici en fer e l an mie ge a ionnelle, elon l objec if retenu
et la faisabilité.
Population Exemple 1 Exemple 2 Exemple 3
Population du pays Cible Cible
Ensemble des services de maternité du Bénin Source Cible
Ser ice de ma erni de la comm ne d Allada Source Source
Le ph nom ne de lec ion de l chantillon par rapport à la population source peuvent agir
de plusieurs manières :
Dan l e emple 1, ne lec ion po rra e prod ire i cer ain er ice ne o hai en
pa par iciper l enq e o il n incl en pa ma iq emen o le r ca
pendan la p riode d incl ion.
Dan le e emple 2 e 3, la po ibili de lec ion par ir d n e l er ice era pe -
re pl facile pr enir. En re anche, l e rapola ion de r l a de la pop la ion
o rce la pop la ion cible n a ra pa la m me portée selon que la population cible
est très large par rapport à la population source, ou non.
Les définitions de la population cible et de la population source doivent donc être précisées
dès le stade de conception du protocole. Leur choix est guidé à la foi par l objec if de l de,
mai a i par la fai abili d recr emen de l chan illon. Le choi re en infl encera la
capaci d e rapola ion de r la .
45
M ca e d ac d ba
Un biais de sélection ne peut survenir que si la répartition des exposés et non exposés ou
des malades et des non malades change entre la population cible et la population source.
Reprenon no re e emple r le d fici en fer e l an mie ge a ionnelle (les chiffres sont
fictifs) pour mon rer le m cani me d ac ion po en iel d n biai de lec ion. S ppo on q e
la pop la ion cible oi l en emble de la pop la ion d ne r gion de 10 million d habi an .
Dans cette région, 50 % sont des déficientes en fer et la fréquence (f) de l an mie
gestationnelle est 0,01 % (Tableau 8). On observe 90 % de déficients en fer chez les femmes
présentant une anémie gestationnelle.
On rappelle que :
46
Tableau 9 : R par i ion de femme elon l e po i ion a d fici en fer e l an mie dan la
population source comptant 50 % des malades et 1 % des non malades. Étude cas-témoins.
Anémiée Non Anémiée Total
Déficientes en fer 450 49 991 50 441
Non déficientes en fer 50 49 999 50 049
Total 500 99 990 100 490
RC = 9,00 f = 0,5%
La prévalence de la maladie dans cet échantillon est différente de celle de la population cible
car on a sélectionné plus de malades que de non malades), mais le RC (la mesure
Tableau 10 : R par i ion de femme elon l e po i ion a d fici en fer e l an mie dan la
population source comptant 50 % des malades et 1 % des non malades avec une sélection liée
l e po i ion. de ca -témoins.
Anémiée Non Anémiée Total
Déficientes en fer 450 60 000 60 450
Non déficientes en fer 50 39 990 40 040
Total 500 99 990 100 490
RC = 6,00 f = 0,5%
Dans ce cas, le RC est sous-estimé (plus proche de 1) par rapport à la valeur attendue (celle
q i erai ob en e i l on po ai dier la pop la ion cible).
Exemples classiques de biais de sélection
To le pe d enq e on je a biai de lec ion. Lor q e l objec if principal e
d e imer le ri q e de maladie, on o hai e di po er d n chan illon repr en a if e il fa
alor di po er d ne li e e ha i e de je de la pop la ion po r irer a or n
47
échantillon représentatif. Lor q e l objec if principal e d e imer l association entre
exposition et maladie, plusieurs circonstances peuvent conduire à un biais de sélection. Tout
d abord, l chan illon de je incl pe re ne repr en a ion biai e de la pop la ion
source. Le ph nom ne de l effet du travailleur sain est un exemple classique. Par exemple,
i l on e dier la mor ali dan ne en repri e en prenan , parmi ce q i on
emba ch il a 20 an , o ce q i on encore pr en dan l en repri e, ce chan illon
aura exclu tous les travailleur q i a ron q i l en repri e po r de rai on de an e
conduira à minimiser la morbidité ou la mortalité.
Un autre exemple est celui du biais de survie sélective. C e le ca i le je e po on
soustraits de l'environnement dès l'apparition de signes faisant craindre la survenue de
l'événement ou si la létalité de la maladie est plus importante chez les sujets exposés,
conduisant à une sous-estimation de l'association. Par exemple, on constitue une cohorte de
patients infectés par le VIH pour décrire la survie de ces patients et les facteurs associés à
cette survie, en particulier une anomalie génétique associée à une progression plus rapide de
la maladie (durée de survie plus courte). Dans la cohorte, tous les patients venant consulter
dan o le er ice ho pi alier p ciali dan le rai emen de la maladie d ne r gion
sont inclus de manière consécutive. Néanmoins, parmi ces patients, ceux qui sont porteurs de
l anomalie g n iq e on pl fr q emmen d c d a an le d b de la p riode d incl ion
et ne peuvent donc être inclus. Cette cohorte sera donc constituée des patients porteurs de
l anomalie g n iq e a an , en mo enne, ne d r e de r ie pl long e. Parmi le a re
patients, la durée de survie ne sera en revanche pas affec e. L a ocia ion en re le fac e r
génétique et la survie sera ainsi sous-estimée. Par ailleurs, les groupes à comparer peuvent
d embl e ne pa re comparable . Ce ri q e de lec ion e par ic li remen impor an dan
les enquêtes cas-témoins et nous en avons montré un exemple avec le biais lié au
recrutement hospitalier des cas et des témoins.
Un autre exemple consiste à appliquer les procédures de diagnostic de façon différente selon
q e le je on o non e po , ce q e l on appelle n biai da ca de
procédures diagnostiques. Par exemple, lorsque le rôle des contraceptifs oraux a été
suspecté dans la survenue de la maladie thrombo-embolique, toutes les patientes ayant des
symptômes pouvant faire penser à une thrombose étaient investiguées de façon beaucoup plus
compl e i elle prenaien n con racep if oral q e i elle n en prenaien pa . A posteriori, en
comparant des cas de maladie thrombo-embolique à des témoins, on a trouvé une très forte
relation avec les contraceptifs oraux, en partie liée à une application des procédures
diagno iq e diff ren e en fonc ion de l e po i ion. Le ca recr n aien pa
48
repr en a if de l en emble de ca : il aien pl o en e po . Le moin recr
n aien pa repr en a if de l en emble de moin : il aien moin o en e po .
En conclusion, les biais de sélection peuvent conduire à tous les cas de figure : sur- ou sous-
e ima ion de l effe .
Tiers facteur
49
Prenons pour exemple une étude de cohortes étudiant la relation entre prise de contraceptifs
oraux et accident thrombo-embolique (Tableau 11).
Tableau 12 : Étude de la relation entre prise de contraceptifs oraux (exposition étudiée) et âge
(tiers facteur). Étude de cohortes. Exemple fictif.
50
Parmi les femmes prenant des contraceptifs oraux, 91 % (5 000 / 5 500) ont moins de 40 ans,
alors que parmi les femmes ne prenant pas de contraceptifs oraux, seulement 77 % (5 000/ 6
500) ont moins de 40 ans ( . On concl q il a ne rela ion en re
prise de contraceptifs oraux et âge : les femmes prenant des contraceptifs oraux sont
ignifica i emen pl je ne q e celle n en prenan pa .
N anmoin , i l ge n e pa lié au risque de maladie thrombo-embolique, ce déséquilibre
entre les groupes comparés pour le tiers facteur n a ra a c ne con q ence r la
comparai on. En re anche, i l ge e li la maladie hromboemboliq e, ce d q ilibre
pe di ordre l e ima ion de l effe de con racep if ora . C e ce q e l on rifie a ec la
2ème condition.
Vérification de la condition : « relation entre tiers facteur et maladie »
On cherche il e i e ne rela ion en re ier fac e r e maladie che le je non e po s.
Dan l e emple, ce e rela ion doi re ob er e che le femme non e po e a
contraceptifs oraux (Tableau 13), car chez celles qui sont exposées aux contraceptifs oraux,
cette relation peut être uniquement la conséquence du lien âge-contraceptifs oraux.
Vérification de la condition : « un tiers facteur ne doit pas être sur le chemin causal »
Une troisième condition doit re galemen rifi e po r q n fac e r p i e en ra ner n
biai de conf ion. Si l on accole l adjec if e erne , c e q e ce fac e r de ri q e doi agir
51
elon n a re m cani me q e cel i q i e l de. A remen di , il ne doi pas être situé
sur le chemin « causal » en re l e po i ion e la maladie di e .
La vérification de la 3ème condition est souvent délicate, car elle nécessite de connaître le
modèle physio-pathologique sous-jacen q i, o en , n e pa compl emen l cid a
momen de la concep ion de l enq e. Si ce mod le e conn , le rai onnemen e
relativement simple. Par exemple, dans une étude de la relation entre tabac et risque de
maladie cardio a c laire, l l a ion de la pre ion ar rielle e -elle un facteur de confusion ?
Les deux premières conditions sont remplies : les sujets fumeurs ont une pression artérielle
pl le e q e le je non f me r d ne par , e le je a an ne l a ion de la
pression artérielle ont un risque de maladie cardio-vasculaire plus important que ceux ayant
ne pre ion ar rielle normale d a re par .
N anmoin , l l a ion de la pre ion ar rielle n e pa n fac e r e erne. Elle e l ne de
con q ence po ible de l e po i ion a abac : elle con i e en fai ne ape intermédiaire
vers la maladie cardio-vasculaire (Figure 10).
Cause Cause
Tabac Elévation de la TA Maladie cardio-vasculaire
52
2nde d fini ion : m cani me d ac ion d biai
Selon ce e d marche, c e le a de a e eda ciation qui guide la conclusion, la
me re d a ocia ion en re l e po i ion l de e la maladie an e im e dan l en emble
de l chan illon, mai galemen dan chac n de gro pe ( ra e ) d fini par le ca gorie
du tiers facteur.
Po r l e emple, i l on calc le le RR dan chac ne de ca gorie d ge (Tableau 14),
il e imilaire che le moin de 40 an d ne par e che le pl de 40 an d a re
par , mai e diff ren d RR br ob en r l en emble de l chan illon. Le RR
calculé à par ir de l en emble de l chan illon d de bi donc ne di or ion e
refl e l effe mi e de con racep if ora e de l ge. Le RR corre pondan l effe
propre des contraceptifs oraux est celui calculé dans chacune des strates où la
distribution de l ge e ffi ammen homog ne. Ce e anal e di e ra ifi e r
l ge perme de faire le diagno ic d biai de conf ion.
Tableau 14. Association entre exposition aux contraceptifs oraux et maladie thrombo-
emboliq e elon l ge e globalemen . tude de cohortes. Exemple fictif.
Dans cet exemple, le facteur de confusion a conduit à une sous-e ima ion de l effe ,
q e l on po ai pec er for emen par ir de condi ion de la 1 re d fini ion.
En conclusion, les biais de confusion peuvent conduire à tous les cas de figure : sur- ou sous
e ima ion de l effet.
53
3.1.4. Biai d i f ma i
Ce biai concerne l en emble de informa ion rec eillie po r la comparai on de gro pe
l de. Il agi donc de erre r commi e en cla an le je elon le a e po /non
exposé et selon le statut malade/non malade.
On prendra l e emple le pl imple o la maladie e l e po i ion on de ariable
ca gorielle dicho omiq e . S agi an de ariable ca gorielle , on parlera d erreur de
classement ou de mauvaise classification.
Par e emple, la maladie n e pa identifiée chez un cas et ce sujet est classé à tort
parmi les témoins ou au contraire la maladie est identifiée à tort chez un sujet non
malade qui est classé parmi les malades. Dans le premier cas, les sujets concernés sont
des faux négatifs, dans le deuxième cas, des faux positifs.
Ces notions font appel aux indicateurs utilisés pour étudier la performance des tests
diagno iq e . Dan n premier emp , o erre le d fini ion a an d aborder le
m cani me d ac ion de biai d informa ion. Parmi le m cani me d ac ion de ce erre r de
classement, on distinguera les erreurs dites « différentielles » lorsque les erreurs sur
l e po i ion affec en diff remmen le malade e le non malade o lor q e le erre r r
la maladie affectent différemment le e po e le non e po . On parlera d erreurs « non
différentielles » si les erreurs affectent de la même façon les groupes comparés.
54
Tableau 15 : R par i ion de je elon le r l a d n e diagno iq e.
55
Tableau 16 : Répartition des sujets selon la con omma ion d alcool pendan la gro e e e la
prématurité. Population cible.
Tableau 17 : R par i ion de je elon la con omma ion d alcool pendan la gro e e e la
prématurité. Parmi les femmes ayant donné naissance à un enfant prématuré de la population
cible, 30 % de celle e po e l alcool on cla e parmi le femme non-
con omma rice d alcool. de ca -témoins.
Consommation par la mère Enfant prématuré Enfant né à terme Total
Alcool 35 000 50 000 85 000
Pa d alcool 65 000 350 000 315 000
Total 100 000 400 000 500 000
RC = 3,8 f = 20%
On ro e RC = 3,8 alor q e la ale r a end e e RC = 7,0. L erre r commi e
conduit, dans ce cas, à sous-e imer l effe de l alcool r la prématurité.
56
2ème i a ion : d fa de en ibili de la me re de l e po i ion niq emen dan le
groupe des sujets indemnes du problème de santé
Les sujets exposés sont mal classés uniquement parmi les témoins.
Dan l e emple, on po rrai imaginer ne i a ion o l e po i ion e parfai emen
mesurée chez les femmes ayant donné naissance à un prématuré, car les enquêteurs
recherchen la con omma ion d alcool a ec ne grande in i ance alor q e che le
mères ayant donné naissance à un enfant à terme, 30 % des exposées sont classées
parmi les non exposées. Le manque de sensibilité affecte différemment les mères
d enfan pr ma r : 0 % e le m re d enfan n erme : 30 % (Tableau 18).
Tableau 18 : Répartition des suje elon la con omma ion d alcool pendan la gro e e e la
prématurité. Parmi les femmes ayant donné naissance à un enfant à terme de la population
cible, 30 % de celle e po e l alcool on cla e parmi le femme non
con omma rice d alcool. Étude cas-témoins.
57
Tableau 19 : R par i ion de je elon l e po i ion l h pno iq e pendan la gro e e et
la d ec ion d ne anomalie l chographie. Pop la ion cible.
58
Tableau 21 : R par i ion de je elon l e po i ion l alcool pendan la gro e e e la
prématurité. 30 % des sujets exposés de la population cible sont classés parmi les sujets non
exposés. Étude cas-témoins.
59
Retenez également que si cette valeur moyenne de la sensibilité et de la spécificité est
inf rie re 50 %, l e ima ion de la me re de l effe pe aller dan la direc ion oppo e la
vraie valeur.
On peut ajo er de pr ci ion . D ne par , le RR an fonc ion de la en ibili e la
p cifici de l o il de me re, la connai ance de la en ibili e de la p cifici perme de
recalc ler le RR. D a re par , dan le ca par ic lier (mai non e cep ionnel) où la mesure de
l e po i ion e de la maladie on o e de o mi e a biai de ma ai e cla ifica ion, i
les erreurs de classification sont liées entre elles, le biais peut conduire à surestimer la relation
et non à la sous-estimer.
60
g n rali . L id e o -jacen e e de ra embler ffi ammen d éléments pour convaincre
q e l effe mi en idence ici e main enan e i e a i aille r o dan d a re emp .
La pop la ion cible e donc ir elle o fic i e. C e l en emble de je q i l on
souhaite e rapoler le r la . Ce la raison pour laquelle on parle moins volontiers de
alidi e erne q e d extrapolation des résultats.
61
chan illon d de. Par e emple, n me perme d enregi rer de fa on ma iq e de
cas (laboratoire de référence sur une maladie, registre de cancers), des sujets exposés
(emplo d ne ine), o le jets adultes de la population générale qui peuvent servir de
groupe témoin (listes électorales).
Dan ce e i a ion, ne diff rence ma iq e pe , malgr o , e i er en re l chan illon
et la population source si certains sujets tirés au sort ne réponden pa l de : ce je
sont appelés les « non répondants ». Les raisons de non réponse peuvent être très variées :
ab ence de mo i a ion po r par iciper l de, d m nagemen de la r gion d de,
changement de domicile par rapport à celui enregistré dans la liste disponible, changement de
situation de santé, handicap ou maladie, entraînant une hospitalisation au moment de
l enq e. Il a n biai po en iel de lec ion i le non r pondan diff ren de r pondan
pour des caractéristiques q i on li e la maladie, l e po i ion o a de .
Par exemple, il est plus difficile de motiver les individus qui se sentent en bonne santé que
ceux qui ont des soucis de santé. Les sujets répondants ont alors, en moyenne, un état de santé
plus altéré que celui attendu dans la population cible.
La limitation de la proportion des sujets non répondants est donc très importante. La
faisabilité de l enq e, on acceptabilité, les moyens visant à faciliter les réponses et à
récupérer des non réponses doivent être envisagés. Les méthodes de recueil des données
doivent être simples et adaptées aux sujets concernés.
Par exemple, si des auto-questionnaires sont utilisés, ils ne doivent pas être trop longs ou
compliq . S il e en i ag d incl re de per onnes qui ont des difficultés de
compréhension de la langue utilisée, il faut prévoir des enquêteurs pour les aider.
Con i ion de g o e com a en l ab ence de li e e ha i e de la o la ion o ce
Lor q on ne di po e pa de li e e ha i e, la constitution des échantillons repose sur
l iden ifica ion de sources de ca e de moin o d e po e de non e po . Le choi
de olon aire en ra ne le pl o en n biai d auto-sélection, similaire à celui des
répondants/non répondants, dans on mode d ac ion.
Dans une étude cas-témoins :
le choi de ca e i an (c e -à-dire existant déjà depuis un temps variable au
momen de l enq e) cond i recr er le ca le moin gra e , car le pl gra e
on d c d a momen o l enq e d bute. Il est donc toujours préférable de
recruter des cas incidents.
62
le choix de sujets témoins hospitalisés conduit à recruter des sujets indemnes de la
maladie di e, mai n anmoin a ein d ne a re maladie e o en e po n
certain nombre de fac e r de ri q e don cel i l de.
Par e emple, ne de de l a ocia ion en re con omma ion d alcool e cirrho e d foie a
cond i recr er d ne par de ca a ein de cirrho e e d a re par de je moin dan
le service de traumatologie. Un tel recrutement des sujets témoins était justifié par le fait que
le indi id q i on admi en ra ma ologie ne on pa malade j q a jo r o il on n
accident et peuvent être considérés comme représentatifs de la population des sujets indemnes
de cirrhose. En réalité, une forte proportion des accidents entraînant des traumatismes sont
li la con omma ion d alcool e le je moin ain i recr on bea co p pl
o en e po l alcool q e la pop la ion o rce de moin d ne elle enquête.
Dans une étude de cohortes, les sujets perdus de vue peuvent entraîner une sélection au cours
d emp : il agi d ne a re forme de non r pon e, par ic li re a de e po r i an
dans le temps. Il y a un biais potentiel de sélection si les sujets perdus de vue diffèrent des
je non perd de e po r de carac ri iq e q i on li e la maladie, l e po i ion o
aux deux. Le suivi doit donc être très attentivement mené dans les études de cohortes. Pour
cela, il est fondamental d ob enir de moyens suffisants pour réaliser ce suivi.
63
médicaments ou de stratégies thérapeutiques. L a an age maje r e q e le irage a or
aboutit à une répartition au hasard des sujets dans deux groupes (exposés/non exposés) et
égalise la distribution de tous les tiers facteurs, connus ou inconnus. La condition est que le
nombre de sujets soit suffisamment grand (au moins 200 à 300), car le hasard permet cette
gali a ion q and l effec if de je end er l infini.
Toutefois, le tirage au sort est rarement utilisable pour les expositions étudiées en
épidémiologie.
Par exemple, il e impo ible de irer a or l e po i ion a abac, l e po i ion n po e de
travail, ou encore à un niveau de bruit ou de pollution dans une habitation. Le plus souvent,
o ere dan ne i a ion d ob er a ion e o a re reco r d a re moyens pour
rendre les groupes comparables.
Appariement et assortiment
L assortiment permet de constituer des groupes au sein desquels les facteurs potentiels de
confusion sont répartis de manière équilibrée. Le préalable à cette méthode est donc
d iden ifier le (ou les) facteurs de confusion pour le(s)quel(s) il est important de rendre les
gro pe comparable . Le rai onnemen pe appliq er po r l a or imen de je e po
e non e po d ne de de cohor e , mai comme il agi d ne m hode rtout utilisée
dans les études cas-témoins, nous prendrons un exemple dans ce cadre.
Il existe deux possibilités :
la première consiste à recruter chaque sujet témoin en fonction du cas recruté. Si on ne
choi i q n je moin par ca , on parlera alor d appariement (ce terme est
d aille r le pl o en ili po r d crire o e le echniq e d a or imen ). Par
e emple, i l ge e n fac e r de conf ion, chaq e moin era recr dan la
ranche d ge d ca a q el il e appari .
la deuxième consiste à réaliser un assortiment de fréquence. On décrit la distribution
du facteur de confusion dans le groupe des cas, puis on choisit un groupe de sujets
moin afin q e la di rib ion de ce fac e r oi globalemen imilaire. L a an age
majeur de l a or imen e q il e a e facilemen applicable dan le de
d ob er a ion. La condi ion e en ielle e q e le fac e r de conf ion oien
iden ifi e p i en re me r . Par aille r , il perme d gali er la di rib ion
d a re ier facteurs inconnus qui sont liés au facteur de confusion sur lequel a porté
l a or imen . Il a de limi e e en ielle l ili a ion de ce e m hode. D ne
par , i n fac e r e ili comme fac e r d a or imen , on a ocia ion a ec le
64
problème de santé ne peut plus être analysée dans cette enquête puisque sa répartition
est égalisée entre les deux groupes.
D a re par , il e fondamen al de choi ir a ec pr ca ion le cri re d a or imen parmi le
facteurs de confusion les plus importants, car assortir sur un nombre important de facteurs
rendrai la comparai on impo ible (cr an ce q e l on appelle n sur-appariement) et
po rrai rendre l de pra iq emen irr ali able : cer ain ca e moin ne po rraien re
incl , le emp d incl ion serait prolongé, des coûts supplémentaires seraient générés. Enfin,
l a or imen doi re pri en comp e dan l anal e po r q e l e ima ion de la me re
d a ocia ion oi correc e. Ceci e imp ra if dan le de ca -témoins (Rothman, 1998).
Attention : les formules présentées dans ce module pour estimer les mesures
da ca e a e de de a a a e e (2 g e c a :
Indépendants). Il existe des formules spécifiques pour estimer le RR ou le RC dans le cas
d de appariées.
Restriction
La re ric ion con i e re reindre l enq e ne ra e par ic li re d fac e r de conf ion.
Par e emple, le femme o le je de moin de 40 an , i le e e o l ge, re pec i emen ,
sont des facteurs de confusion potentiel . L id e de la re ric ion e de ne pa incl re le
sujets présentant une certaine caractéristique pour que les deux groupes comparés soient aussi
homog ne q e po ible. Le de con q ence impor an e de l applica ion de la re ric ion
concernent le po en iel d e rapola ion de r la de l de e a fai abili car le
recr emen dan l de e pl len . To efoi , le r l a d n effe impor an a ein d ne
ra e r homog ne pe inci er po r i re econdairemen l de a ein de nouvelles
strates.
4.3. P e e ba d f a
Rappelez- o : en l ab ence de biai d informa ion, la me re de l e po i ion refl e
parfai emen la r ali de l e po i ion de je e la me re d n probl me de an refl e
parfaitement la réali de l a ein e de je par ce e maladie. Po r ne de de cohor e ,
tous les sujets exposés sont réellement exposés et les non exposés sont réellement non
exposés. Pour une étude cas-témoins, tous les cas sont réellement des cas et les sujets témoins
des sujets non malades. Comment être le plus proche de cette situation idéale et prévenir ce
type de biais ? Po r chaq e me re n ce aire l enq e, il e indi pen able d ili er ne
méthode de mesure adaptée, fiable, standardisée, aussi objective que possible. Cette réflexion
65
doit donc se situer dans le contexte de la question posée et du thème abordé. Par exemple, un
diagnostic de cancer doit reposer sur une preuve anatomopathologique.
A e e e cc e ? Il fa en pr occ per a moment du choix des méthodes
de me re de l e po i ion e de la maladie, c e -à-dire lor de la concep ion de l enq e. Le
biai d informa ion on le pl o en in i able . Vo a e q e, dan ce ca , on e aie
de e ramener ne i a ion d erre r non différentielle, car la distorsion liée à la mesure
entraîne une sous-e ima ion de la force de l a ocia ion e l on conna donc le en de la
distorsion a priori. Toutefois, cette recommandation peut conduire à une perte de puissance et
donc de préci ion po r la me re d a ocia ion. Il n e donc pa e lemen ile de limi er le
erreurs différentielles, il faut limiter les erreurs en général.
Le o enir r l e po i ion pe en re :
plus activement et plus précisément recherchés chez des cas motivés à comprendre
leur maladie Par e emple, lor de l de de la rela ion en re e po i ion cer ain
m dicamen pendan la gro e e e nai ance d n enfan pr ma r .
ou au contraire plus refoulés chez des cas dont le problème de santé suscite une
cer aine hon e. Par e emple, lor de l de de la rela ion en re con omma ion d alcool
et cirrhose du foie. Il est nécessaire de se mettre dans des conditions où les groupes
dans lesquels la coopération, la mémoire ou la surveillance médicale sont a priori
comparables. Cette recommandation doit être scrupuleusement appliquée dans les
études cas- moin . Dan le de de cohor e pro pec i e , la po ibili d n suivi
identique che le je e po e non e po limi e l infl ence de ce biai . Le
recueil des données doit privilégier le recueil de faits objectifs pl q e d l men
donnant lieu à interprétation. Ceci impose, dans le protocole, une définition précise
de e e d b e de a étudiés.
Par exemple, on évite la question « êtes-vous fumeur ? ». On préfère recueillir précisément la
con omma ion de abac, le pe de abac, le d b e la da e en ellemen d arr , le nombre
de cigare e f m e . La per onne q i rec eille le donn e r l e po i ion o la maladie
doit, autan q e po ible, ignorer dan q el gro pe le je e ro e (on di q elle e en insu
d a de je incl ), po r ne pa re en e de rechercher pl ac i emen l e po i ion
chez les cas que chez les sujets témoins ou de prévoir des examens supplémentaires chez les
sujets exposés par rapport aux sujets non exposés pour le diagnostic du problème de santé
(problème de détection différentielle). Ceci impose donc à nouveau un protocole de
diagnostic strictement identique chez les exposés et les non e po d ne de de
66
cohor e , e l in e iga ion d n en emble d e po i ion a re q e celle q i e d in r
principal pour une étude cas-témoins.
La andardi a ion de ce pro ocole a a ec le principe de andardi a ion de l en emble de
mesures effec e . Dan ce cadre, le recommanda ion on le i an e : ili a ion d n
questionnaire standardisé et validé, c d de e e a e pour tous les sujets,
formation des enquêteurs aux entretiens, mesures biologiques soumises à un étalonnage et
un contrôle de qualité ou centralisation des mesures dans un laboratoire de référence.
67
Références bibliographiques
Sondo B.
C d pidémiologie général, Master I : Bactériologie V g e de U e Ca h e de
Af e de O e , (UCAO).
Bobo-Dioulasso Burkina Faso, 2012.
Valleron AJ.
B eh e de d g e a a e XXe c e.
La revue de la communauté polytechnicienne, N°670, Décembre 2011
Ancelle T.
Statistique. Epidémiologie.
Paris : Maloine; 2002.
ISBN 2 224 027060
Rothman K, Greenland S.
Modern epidemiology. 2nd edition.
Philadelphia : Lippincott Williams & Wilkins; 1998. 752 pages.
ISBN 0-316-75780-2
Sacket DL.
Bias in analytic research.
J Chronic Dis 1979;32(1-2):51-63.
68