Académique Documents
Professionnel Documents
Culture Documents
L2 ENATSE
ANNEE ACADEMIQUE 2021-2022
Dr HOUEHANOU CORINE
PARTIE I
SOMMAIRE
Introduction ....................................................................................................................................... 3
1. Généralités ................................................................................................................................. 4
1.1. Définitions de concepts .................................................................................................... 4
1.2. Objectif analytique ........................................................................................................... 5
1.3. Mesure de l’évènement et de l’exposition ........................................................................ 5
1.4. Distinction entre études expérimentales et non expérimentales ....................................... 6
1.5. Principales études d’observation en épidémiologie analytique ........................................ 7
1.6. Principes de l’analyse brute et de l’analyse stratifiée ....................................................... 7
1.7. Précision ........................................................................................................................... 7
2. Etudes de cohortes ..................................................................................................................... 8
2.1. Principe ............................................................................................................................ 8
2.2. Schémas d’étude ............................................................................................................... 8
2.3. Sélection des groupes comparés ......................................................................................10
2.4. Calcul du nombre de sujets nécessaire ............................................................................10
2.5. Mesure de l’évènement dans les groupes exposé/non exposé .........................................11
2.6. Analyse des données .......................................................................................................11
2.6.1. Analyse brute ..............................................................................................................11
2.6.1.1. Tableau de contingence ..........................................................................................11
2.6.1.2. Estimation des mesures de fréquence de l’événement dans chaque groupe ...........12
2.6.1.3. Estimation de la mesure d’association ....................................................................13
2.6.1.4. Précision de la mesure d’association ......................................................................14
2.6.1.5. Stabilité de l'association .........................................................................................15
2.6.1.6. Présentation des résultats ........................................................................................15
2.6.2. Analyse stratifiée ........................................................................................................16
2.6.2.1. Recherche de la modification d’effet ou interaction ...............................................17
2.6.2.2. Recherche de la confusion ......................................................................................18
2.6.3. Mesures d’impact ........................................................................................................18
2.6.3.1. Différence de risque (DR) ou risque attribuable .....................................................19
2.6.3.2. Fraction (de risque) attribuable et fraction étiologique...........................................19
2.6.3.3. Nombre de cas attribuable ......................................................................................20
2.6.3.4. Synthèse .................................................................................................................20
2
Objectifs pédagogiques de l’UE
Ce cours est destiné aux étudiants de la deuxième année de licence en santé publique
à l’ENATSE ayant comme prérequis :
Notions de base en bio-statistique
Notions en épidémiologie descriptive
Notions d’exposition et d’évènement
L’objectif général est : utiliser les principes d’épidémiologie pour identifier les
facteurs de risque (versus facteurs protecteurs) de problèmes de santé d’une
communauté.
A la fin du cours, l’étudiant doit être capable de :
- Reconnaitre un objectif d’étude épidémiologique analytique
- Distinguer les schémas des études d’observation analytique
- Reconnaître les mesures d’association appropriées aux études d’observation
analytiques
- Calculer les mesure(s) d’association appropriée(s) aux études d’observation
analytiques et les interpréter
- Comprendre les notions de validité interne, validité externe et biais lors d’une
étude d’observation analytique
- Etablir la relation de cause à effet en épidémiologie analytique
3
Introduction
1. Généralités
Evènement : c’est le phénomène étudié lors d’une étude épidémiologique ; il peut s’agir de la
maladie, du décès, d’un problème de santé, d’un comportement en rapport avec la santé.
4
Exposition : c’est un facteur ou une caractéristique qui influence la survenue d’un évènement.
Il peut s’agir d’agent infectieux, de facteur environnemental, de comportement…etc.
Facteur de risque : c’est un facteur qui augmente le risque de survenue d’une maladie ou de
façon plus générale d’un problème de santé
Facteur protecteur : c’est un facteur qui diminue le risque de survenue d’une maladie c’est un
facteur qui augmente le risque de survenue d’une maladie ou de façon plus générale d’un
problème de santé
Lorsque nous recherchons les causes d’un problème de santé, le lien entre une exposition et un
évènement, les facteurs qui influencent la survie ou la mortalité nous visons des objectifs
analytiques ou étiologiques.
Voici quelques exemples d’objectifs analytiques :
- Identifier les facteurs de risque de pré-éclampsie chez les gestantes de l’hôpital X au
Bénin
- Etudier la relation entre l’utilisation de produits cosmétiques à base de corticoïdes et le
cancer de la peau.
- Etudier le lien entre la consommation de tisanes et l’insuffisance rénale chronique
L’évènement, l’exposition ou les expositions doivent être clairement définis. Les moyens de
mesure (questionnaires, mesures physiques, prélèvements…) doivent être présentés.
Le choix de l’exposition ou des expositions doit être objectif, basé sur les mécanismes
physiopathologiques ou de données d’études antérieures.
En fonction de l'événement étudié, sa mesure (ou méthode diagnostique) fera appel à des
entretiens, des données cliniques, biologiques, d'imagerie, des résultats d'autopsie…etc
Le choix de l'événement mesuré est guidé par la question posée, mais la manière de le mesurer
doit tenir compte d'autres paramètres. Il faut que cette mesure soit reproductible, sensible et
spécifique.
La définition et les moyens de mesure concernant l'exposition et l'événement doivent être
identiques pour tous les sujets d'une étude donnée. On parle de définition et de mesures
standardisées.
5
Les moyens mis en œuvre pour mesurer l'exposition et l'événement doivent être acceptables par
les sujets participant à l’étude, et éthiquement recevables pour la communauté. Par ailleurs, il
faut également tenir compte des contraintes pratiques et financières dans le choix de l’exposition
et de l’évènement.
Toutes les études épidémiologiques peuvent être classées selon qu'il s'agit d'une expérimentation
ou non.
- Etudes expérimentales : il s’agit des études dans lesquelles l'équipe réalisant la
recherche maîtrise les conditions d'exposition des sujets (qui sera exposé, à quoi,
comment, quand, où). On parle aussi d’essai clinique. L’affectation d'un sujet dans l'un
ou l'autre des groupes comparés est tirée au sort (« étude randomisée »).
Lorsqu'elles sont bien conduites, ces études représentent le schéma idéal pour étudier la
relation entre une exposition à une caractéristique et la survenue d'un événement, puisque
les groupes comparés ne diffèrent que par un seul caractère : l'exposition. Néanmoins,
cette approche n'est pas toujours possible, souvent pour des raisons d'ordre éthique si
l'exposition à laquelle un des groupes de sujets devrait être soumis est potentiellement
dangereuse.
Par exemple, comment proposer à des sujets de commencer à fumer pour étudier s'il
existe une association entre le tabagisme et le cancer broncho-pulmonaire, en
comparaison avec un groupe ne fumant pas ?
- Etudes non expérimentales : l'équipe réalisant la recherche « observe » sans intervenir
sur les conditions d'exposition des sujets étudiés. Ces études sont aussi appelées études
d'observation.
- Etudes quasi expérimentales : l'équipe réalisant la recherche ne maitrise pas
entièrement les conditions d'exposition des sujets étudiés. La randomisation n’est pas
possible. Exemple : évaluation de l’effet d’une campagne de sensibilisation contre la
COVID-19 menée sur une radio locale dans une communauté.
6
1.5. Principales études d’observation en épidémiologie analytique
Dans le cadre de l'épidémiologie analytique, les études de cohorte et les études cas-témoins sont
les deux schémas classiquement utilisés, mais on recourt souvent également aux études
transversales.
La recherche des facteurs de risque/facteurs protecteurs des événements repose sur l'étude de
l'existence d'une association entre l'exposition et l’événement.
La première étape consiste à estimer des mesures de fréquence. Elles concernent soit
l’exposition, soit l’événement selon le schéma d’étude.
Puis, l’analyse se poursuit par l’estimation de mesures d’association, entre la/les expositions et
le/les événements, les associations étant étudiées pour chaque couple {exposition, événement}
s’il en existe plusieurs. On parle d’analyse brute.
Pour mener à bien cette analyse, il est nécessaire de construire un tableau de contingence,
correspondant à la répartition croisée des variables exposition et événement si celles-ci sont
catégorielles.
L’analyse stratifiée consiste à créer des strates à partir des catégories (classes) d’un facteur
externe (tiers facteur) à la relation exposition évènement. Pour chacune de ces strates, il est
nécessaire de construire un tableau de contingence et d’estimer la mesure d’association entre
l’exposition et l’événement.
1.7. Précision
Comme pour les moyennes, les proportions, ou encore les mesures de fréquence, les valeurs des
mesures d’association obtenues à partir de tous les échantillons varient autour de la vraie valeur
de cette mesure, selon un certain écart et une loi de probabilité connue.
Détaillons à présent ce que cela implique pour une mesure d’association par exemple :
La mesure d’association dans un échantillon représentatif de cette population, du seul fait des
fluctuations d’échantillonnage, sera le plus souvent proche de la vraie valeur de l’ensemble de
la population, mais il sera exceptionnellement exactement égal à cette valeur. Pour chaque
échantillon, quelle que soit la mesure d’association, il est donc possible de calculer un intervalle
de confiance de l’estimation. On sait que, plus l’intervalle de confiance est large, moins il est
précis, et que la précision augmente quand la taille de l’échantillon augmente.
7
L’association sera considérée comme statistiquement significative si l’intervalle de confiance ne
contient pas la valeur 1 et sera d’autant plus significative qu’il est éloigné de 1.
2. Etudes de cohortes
2.1. Principe
Il s'agit de comparer deux groupes (au moins), identifiés à partir de leur statut exposé/non exposé
à un événement et d'étudier dans chacun des groupes l'incidence de l’événement d’intérêt. Une
incidence de l’événement plus (ou moins) importante chez les sujets exposés est en faveur d’une
association entre l’exposition et l’événement.
8
Figure 2 : Etude de cohorte Figure 3 : Etude de cohortes
9
2.3. Sélection des groupes comparés
Idéalement, dans une étude de cohorte de type exposé/non exposé s’intéressant à une seule
caractéristique d’exposition, le principe de la sélection de ces sujets est, qu’en dehors de
l’exposition à la caractéristique étudiée, ils doivent être en tous points comparables aux sujets
du groupe exposé. Le groupe de référence a donc les caractéristiques suivantes :
- ils doivent avoir les mêmes caractéristiques sociodémographiques, professionnelles et
vis-à-vis d’autres expositions, que les sujets exposés ;
- ils doivent pouvoir être suivis de la même manière que les sujets exposés.
Le groupe de référence peut être un échantillon issu de la population générale, un groupe
appartenant à un univers défini.
Dans le cadre d’une étude de cohorte (permettant l’estimation d’une incidence cumulée), le
nombre de sujets, n, à inclure dans chacun des deux groupes, exposés et non exposés, dépend :
1. de l’incidence de l’événement d’intérêt chez les sujets non exposés : R0 (cette hypothèse
peut provenir d’une étude antérieure),
2. du risque relatif attendu (cette hypothèse peut provenir d’une étude antérieure) ; la taille
de l’échantillon est d’autant plus importante que l’association recherchée est faible
(risque relatif attendu proche de 1),
3. du risque α : classiquement, il est choisi égal à 5 %,
10
les non exposées est de 1 % et que le RR attendu est d’au moins 3, pour α = 5 % et β = 20 %, il
faut inclure 865 femmes dans chaque groupe.
Dans les études de cohorte, on mesure l'incidence de l'événement. Il faut donc définir
précisément l’évènement : par exemple ce que l'on entend par date de survenue de l'événement
(date des premiers symptômes ? date de l'examen confirmant le diagnostic ?... )
Rappelons que les formules présentées ici pour estimer les mesures d’association ne s’appliquent
qu’à des études comparant des groupes indépendants.
Il existe des formules spécifiques pour estimer le RR dans le cas d’études appariées qui ne sont
pas abordées dans cette UE.
Les résultats résumés dans un tableau de contingence (tableau 2*2) sont présentés différemment
selon que l’on dispose d’effectifs en personnes ou en personne-temps. Nous présentons le tableau
de contingence pour la situation où il existe deux groupes : exposé / non exposé.
- Effectifs en personnes
Tableau 1 : Tableau de contingence dans une étude de cohorte en cas d’exposition à deux
catégories. Effectifs en personnes.
Malades Non malades Total
Exposés a b E1
Non exposés c d E0
Total M1 M0 T
11
Tableau 2 : Relation entre maladie thromboembolique (MTE) et contraceptifs oraux (CO),
étude de cohorte fictive
MTE Pas de MTE Total
CO 60 440 500
Pas de CO 25 475 500
Total 85 915 1000
- Effectifs en personne-temps
Lorsque l’on souhaite estimer des densités d’incidence, on présente pour chacun des groupes
étudiés, groupe exposé et groupe non exposé, le nombre de sujets ayant présenté l’événement
ainsi que le nombre de personne-temps (Tableau 3).
Tableau 3. Tableau de contingence dans une étude de cohorte en cas d’exposition à deux
catégories. Effectifs en personne-temps.
Malades Total (personne-temps)
Exposés a E1
Non exposés c E0
Total M1 T
L'incidence, incidence cumulée ou densité d'incidence, est calculée dans chacun des groupes
étudiés, ainsi que son intervalle de confiance (Tableau 4).
12
Tableau 4 : Estimation de l’incidence dans une étude de cohorte.
Forme générale
R 1 = a / E1 R0 = c / E0
Calcul dénominateur
Incidence cumulée E1=nombre exposés E0=nombre non exposés
Dans l’exemple de la maladie thromboembolique (Tableau 2), voici le détail des calculs :
- L’incidence chez les exposés est : R1 = 60/500= 0,12, soit 12% et son intervalle de
0,12(1−0,12)
confiance à 95 % (IC 95 %) : 0,12 ± 1,96 √ 500 soit 0,09-0,15
- La mesure d'association utilisée dans les études de cohorte est le risque relatif (RR).
Le RR est égal à : RR = R1 / R0
- On peut apprécier la force de l’association, en estimer sa précision et sa stabilité. La
force de l’association entre l’exposition et l’événement s’apprécie à partir de la valeur
13
du RR : plus le RR est éloigné de 1 (vers l’infini pour un RR > 1, ou vers zéro pour un
RR < 1), plus la force d’association est importante.
Dans l’exemple de la maladie thromboembolique (Tableau 2), voici le détail des calculs :
RR = R1/R0 = 0,12/0,05 = 2,4
Elle s’apprécie à partir de son intervalle de confiance. Différentes méthodes peuvent être
utilisées pour le calcul de l’intervalle de confiance du RR comme la méthode semi-exacte et la
méthode de Miettinen, utilisables en dehors d'un logiciel statistique. Si vous faites les calculs à
la main, autant que possible, il est recommandé de choisir la méthode semi-exacte.
Dans l’exemple de la maladie thromboembolique (Tableau 2), voici le détail des calculs :
Intervalle de confiance à 95% de RR = 2,4 selon la méthode semi-exacte :
440 475
2,4*exp ( ± 1,96 √(60∗500) + (25∗500) ) : 1,5-3,8
On conclut que les femmes ayant reçu des contraceptifs oraux ont un risque deux fois supérieur
aux autres d’avoir une maladie thromboembolique. L’exposition aux contraceptifs oraux est un
facteur de risque de la maladie thromboembolique.
14
2.6.1.5. Stabilité de l'association
Elle repose sur le test de l'hypothèse nulle, H0, qu’il n'existe pas d'association entre l'exposition
et l'événement, c’est-à-dire que le risque de maladie n’est pas différent selon le groupe
d’exposition, soit RR = 1.
- Pour les effectifs en personnes : Les tests utilisés sont les tests statistiques classiques de
comparaisons de proportions sur séries indépendantes (test du Chi-2 de Pearson ou test
exact de Fisher selon les conditions d'application). Deux autres formules peuvent être
signalées, utilisables si les conditions d’application du test du Chi-2 de Pearson sont
vérifiées :
- Dans l’exemple de la maladie thromboembolique (Tableau 2), voici le détail des calculs
les effectifs en personne : Chi²P = ((60*475) - (25*440))²*1000 / 85*915*500*500 =
17,5
Si on souhaite présenter les résultats de la mesure d’association dans un tableau, on peut opter
par exemple pour la présentation proposée dans le Tableau 5.
15
Tableau 5. Association entre maladie thromboembolique et contraceptifs oraux. Etude de
cohortes.
Total Maladie RR (IC 95 %)
thromboembolique
Prenons l’exemple de l’étude du lien entre le rang de naissance et le risque de trisomie 21. Les
résultats d’une étude de cohorte réalisée dans une population présentant un risque
particulièrement élevé de trisomie 21, pour répondre à cet objectif, sont présentés dans le
Tableau 6.
16
- Rang = 1, le risque de trisomie 21 est R2 = 100 / 800 = 12,5 %.
- RR (Rang > 1 / Rang = 1) = 2,0 et IC 95% = [1,6 ; 2,5]. Le test du Chi-2 de Pearson
vaut : 41,03 (p < 10-3).
- Ces résultats bruts permettent de conclure à une association significative entre le rang
de naissance et la survenue d’une trisomie 21 (p < 10-3).
Or, l’âge de la mère est un facteur de risque important pour la survenue de trisomie 21 (les
mères âgées ont un risque plus élevé de donner naissance à un enfant porteur d’une trisomie 21
que les mères moins âgées), et il est également associé au rang de naissance (les enfants nés en
premier sont issus de mères plus jeunes en moyenne que les autres). On souhaite donc prendre
en compte également ce facteur dans l’analyse.
17
- le RR brut est différent des RR chez les enfants nés de mères de 35 ans et plus et
chez ceux nés de mères de moins de 35 ans,
- le RR chez les enfants nés de mères de 35 ans et plus est le même que celui chez
les enfants nés de mères de moins de 35 ans.
La mesure d’association étant la même dans les deux strates d’âge de la mère (formellement, il
faudrait réaliser un test de Woolf cf. annexe 1, mais le chevauchement des intervalles de
confiance à 95 % des RR de chacune des deux strates permettent d’arriver à cette conclusion),
il n’y a donc pas de modification par l’âge de la mère de l’effet du rang de naissance sur la
survenue d’une trisomie 21.
On va donc rechercher si l’âge de la mère est un facteur de confusion.
Pour cela, on calcule le RR ajusté. Il est égal à 1,02 (cf. annexe 2). La différence avec la mesure
d’association brute correspond à :
Dans une étude de cohorte, dans le cas d’une relation causale entre l’exposition et l’événement,
on peut estimer :
- quel est le risque supplémentaire lié au facteur de risque : il s'agit de la différence de
risque ou risque attribuable
18
- quelle est la part du risque supplémentaire que l'on peut attribuer au facteur de risque dans
le risque total observé : il s'agit de la fraction de risque attribuable et de la fraction
étiologique
- combien de cas sont dus au facteur de risque dans la population et seraient donc évités si
le facteur de risque était supprimé dans cette population : on parle du nombre de cas
attribuable.
Il s'agit du risque supplémentaire lié au facteur de risque ou encore de l'excès de risque. Cette
notion fait appel à celle de différence de risque, le risque chez les non exposés étant considéré
comme le risque de base (en dehors de toute exposition à la caractéristique étudiée). Si la mesure
de fréquence est un risque (ou incidence), comme ici dans le cas d’une étude de cohorte, on parle
de risque attribuable au facteur de risque.
- Dans la population totale : DRP = RP-R0, avec RP : risque dans la population, celui-ci
étant estimé par le risque de l’ensemble des sujets suivis : RP=M1/T.
Si l'on veut tenir compte de la prévalence de l'exposition dans la population, PE, on obtient : Rp=
PE x R1 + (1-PE) x R0 = PE x (R1-R0) + R0 DRP= RP-R0 = PE x (R1-R0).
Cela représente la proportion de cas que l'on peut attribuer au facteur de risque, et donc que l'on
pourrait éviter si l'on supprimait ce facteur de risque dans ce groupe. On parle de fraction (de
risque) attribuable (FRA) et de fraction étiologique (FE).
19
Les termes fraction attribuable et fraction étiologique sont fréquemment employés
pour désigner la même chose. On emploie en général le terme de :
- fraction attribuable pour la population ;
- fraction étiologique chez les exposés.
2.6.3.4. Synthèse
Dans le cas d’un facteur de risque (RR > 1), les mesures d’impact évaluent la contribution de
la caractéristique d’exposition à la fréquence d’une maladie dans une population donnée, en cas
de relation causale possible entre cette caractéristique et la maladie. Dans le cas d’un facteur
protecteur (RR < 1), les mesures d’impact sont nommées autrement : fraction préventive,
nombre de cas prévenus.
Dans l’exemple de la relation entre exposition aux contraceptifs oraux et maladie
thromboembolique (Tableau 2), si la relation est causale et que la fréquence de l’exposition est
représentative, la fraction de risque attribuable dans la population est : FRAP = 0,085 –
0,05/0,085 = 0,4117.
Cela signifie que 41,2% (soit près d’un cas sur deux) de maladie thromboembolique dans la
population féminine sont attribuables à l’exposition aux contraceptifs oraux.
20
ANNEXE 1
21
22