EPI ANAL21 - L2 - Cours - I

COURS EPIDEMIOLOGIE ANALYTIQUE
L2 ENATSE
ANNEE ACADEMIQUE 2021-2022
Dr HOUEHANOU CORINE
PARTIE I
SOMMAIRE
Introduction ....................................................................................................................................... 3
1. Généralités ................................................................................................................................. 4
1.1. Définitions de concepts .................................................................................................... 4
1.2. Objectif analytique ........................................................................................................... 5
1.3. Mesure de l’évènement et de l’exposition ........................................................................ 5
1.4. Distinction entre études expérimentales et non expérimentales ....................................... 6
1.5. Principales études d’observation en épidémiologie analytique ........................................ 7
1.6. Principes de l’analyse brute et de l’analyse stratifiée ....................................................... 7
1.7. Précision ........................................................................................................................... 7
2. Etudes de cohortes ..................................................................................................................... 8
2.1. Principe ............................................................................................................................ 8
2.2. Schémas d’étude ............................................................................................................... 8
2.3. Sélection des groupes comparés ......................................................................................10
2.4. Calcul du nombre de sujets nécessaire ............................................................................10
2.5. Mesure de l’évènement dans les groupes exposé/non exposé .........................................11
2.6. Analyse des données .......................................................................................................11
2.6.1. Analyse brute ..............................................................................................................11
2.6.1.1. Tableau de contingence ..........................................................................................11
2.6.1.2. Estimation des mesures de fréquence de l’événement dans chaque groupe ...........12
2.6.1.3. Estimation de la mesure d’association ....................................................................13
2.6.1.4. Précision de la mesure d’association ......................................................................14
2.6.1.5. Stabilité de l'association .........................................................................................15
2.6.1.6. Présentation des résultats ........................................................................................15
2.6.2. Analyse stratifiée ........................................................................................................16
2.6.2.1. Recherche de la modification d’effet ou interaction ...............................................17
2.6.2.2. Recherche de la confusion ......................................................................................18
2.6.3. Mesures d’impact ........................................................................................................18
2.6.3.1. Différence de risque (DR) ou risque attribuable .....................................................19
2.6.3.2. Fraction (de risque) attribuable et fraction étiologique...........................................19
2.6.3.3. Nombre de cas attribuable ......................................................................................20
2.6.3.4. Synthèse .................................................................................................................20
2
Objectifs pédagogiques de l’UE
Ce cours est destiné aux étudiants de la deuxième année de licence en santé publique
à l’ENATSE ayant comme prérequis :
Notions de base en bio-statistique
Notions en épidémiologie descriptive
Notions d’exposition et d’évènement
L’objectif général est : utiliser les principes d’épidémiologie pour identifier les
facteurs de risque (versus facteurs protecteurs) de problèmes de santé d’une
communauté.
A la fin du cours, l’étudiant doit être capable de :
- Reconnaitre un objectif d’étude épidémiologique analytique
- Distinguer les schémas des études d’observation analytique
- Reconnaître les mesures d’association appropriées aux études d’observation
analytiques
- Calculer les mesure(s) d’association appropriée(s) aux études d’observation
analytiques et les interpréter
- Comprendre les notions de validité interne, validité externe et biais lors d’une
étude d’observation analytique
- Etablir la relation de cause à effet en épidémiologie analytique
3
Introduction
L’épidémiologie analytique (encore appelée épidémiologie étiologique) permet d’identifier les

facteurs qui influencent la survenue des problèmes de santé d’une communauté.
- Voici quelques exemples de questions dans le champ de l’épidémiologie analytique :
L’utilisation de pesticides est-elle liée à la survenue de la maladie de diabète chez les
agriculteurs de coton dans la commune de Banikoara au Bénin ?
- La survenue d’accident vasculaire cérébral est-elle favorisée par la consommation de
tabac, en tenant compte des autres facteurs de risque connus tels que l’hypertension
artérielle, le diabète sucré et l’âge ?
- L’utilisation de contraceptifs oraux augmente-t-elle le risque de thrombose veineuse des
membres inférieurs ?
Pour y répondre, plusieurs schémas d'étude peuvent être proposés. Chaque schéma d'étude
présente des avantages et des inconvénients. Chacun expose éventuellement à des biais différents
(ou erreurs différentes). Enfin, l'analyse des données est différente selon le schéma d'étude.
Néanmoins, quelques principes s’appliquent quel que soit le type d’étude.
Dans ce cours, nous aborderons des notions générales à l’épidémiologie analytique puis
approfondirons les principaux schémas d’étude d’observation en épidémiologie analytique.
Tous les schémas d’étude utilisés en épidémiologie analytique reposent sur la comparaison de
deux groupes (au moins).
Par exemple, si on recherche le lien entre le tabagisme et le cancer broncho-pulmonaire, il est
nécessaire de comparer l’incidence du cancer broncho-pulmonaire entre les fumeurs et les non-
fumeurs. S’il est plus bas que chez les fumeurs de façon significative, alors on peut affirmer
qu’il y a une association statistique entre le tabagisme et la survenue du cancer du poumon.
1. Généralités
1.1. Définitions de concepts
Evènement : c’est le phénomène étudié lors d’une étude épidémiologique ; il peut s’agir de la
maladie, du décès, d’un problème de santé, d’un comportement en rapport avec la santé.
4
Exposition : c’est un facteur ou une caractéristique qui influence la survenue d’un évènement.
Il peut s’agir d’agent infectieux, de facteur environnemental, de comportement…etc.
Facteur de risque : c’est un facteur qui augmente le risque de survenue d’une maladie ou de
façon plus générale d’un problème de santé
Facteur protecteur : c’est un facteur qui diminue le risque de survenue d’une maladie c’est un
facteur qui augmente le risque de survenue d’une maladie ou de façon plus générale d’un
problème de santé
1.2. Objectif analytique
Lorsque nous recherchons les causes d’un problème de santé, le lien entre une exposition et un
évènement, les facteurs qui influencent la survie ou la mortalité nous visons des objectifs
analytiques ou étiologiques.
Voici quelques exemples d’objectifs analytiques :
- Identifier les facteurs de risque de pré-éclampsie chez les gestantes de l’hôpital X au
Bénin
- Etudier la relation entre l’utilisation de produits cosmétiques à base de corticoïdes et le
cancer de la peau.
- Etudier le lien entre la consommation de tisanes et l’insuffisance rénale chronique
1.3. Mesure de l’évènement et de l’exposition
L’évènement, l’exposition ou les expositions doivent être clairement définis. Les moyens de
mesure (questionnaires, mesures physiques, prélèvements…) doivent être présentés.
Le choix de l’exposition ou des expositions doit être objectif, basé sur les mécanismes
physiopathologiques ou de données d’études antérieures.
En fonction de l'événement étudié, sa mesure (ou méthode diagnostique) fera appel à des
entretiens, des données cliniques, biologiques, d'imagerie, des résultats d'autopsie…etc
Le choix de l'événement mesuré est guidé par la question posée, mais la manière de le mesurer
doit tenir compte d'autres paramètres. Il faut que cette mesure soit reproductible, sensible et
spécifique.
La définition et les moyens de mesure concernant l'exposition et l'événement doivent être
identiques pour tous les sujets d'une étude donnée. On parle de définition et de mesures
standardisées.
5
Les moyens mis en œuvre pour mesurer l'exposition et l'événement doivent être acceptables par
les sujets participant à l’étude, et éthiquement recevables pour la communauté. Par ailleurs, il
faut également tenir compte des contraintes pratiques et financières dans le choix de l’exposition
et de l’évènement.
1.4. Distinction entre études expérimentales et non expérimentales
Toutes les études épidémiologiques peuvent être classées selon qu'il s'agit d'une expérimentation
ou non.
- Etudes expérimentales : il s’agit des études dans lesquelles l'équipe réalisant la
recherche maîtrise les conditions d'exposition des sujets (qui sera exposé, à quoi,
comment, quand, où). On parle aussi d’essai clinique. L’affectation d'un sujet dans l'un
ou l'autre des groupes comparés est tirée au sort (« étude randomisée »).
Lorsqu'elles sont bien conduites, ces études représentent le schéma idéal pour étudier la
relation entre une exposition à une caractéristique et la survenue d'un événement, puisque
les groupes comparés ne diffèrent que par un seul caractère : l'exposition. Néanmoins,
cette approche n'est pas toujours possible, souvent pour des raisons d'ordre éthique si
l'exposition à laquelle un des groupes de sujets devrait être soumis est potentiellement
dangereuse.
Par exemple, comment proposer à des sujets de commencer à fumer pour étudier s'il
existe une association entre le tabagisme et le cancer broncho-pulmonaire, en
comparaison avec un groupe ne fumant pas ?
- Etudes non expérimentales : l'équipe réalisant la recherche « observe » sans intervenir
sur les conditions d'exposition des sujets étudiés. Ces études sont aussi appelées études
d'observation.
- Etudes quasi expérimentales : l'équipe réalisant la recherche ne maitrise pas
entièrement les conditions d'exposition des sujets étudiés. La randomisation n’est pas
possible. Exemple : évaluation de l’effet d’une campagne de sensibilisation contre la
COVID-19 menée sur une radio locale dans une communauté.
6
1.5. Principales études d’observation en épidémiologie analytique
Dans le cadre de l'épidémiologie analytique, les études de cohorte et les études cas-témoins sont
les deux schémas classiquement utilisés, mais on recourt souvent également aux études
transversales.
1.6. Principes de l’analyse brute et de l’analyse stratifiée
La recherche des facteurs de risque/facteurs protecteurs des événements repose sur l'étude de
l'existence d'une association entre l'exposition et l’événement.
La première étape consiste à estimer des mesures de fréquence. Elles concernent soit
l’exposition, soit l’événement selon le schéma d’étude.
Puis, l’analyse se poursuit par l’estimation de mesures d’association, entre la/les expositions et
le/les événements, les associations étant étudiées pour chaque couple {exposition, événement}
s’il en existe plusieurs. On parle d’analyse brute.
Pour mener à bien cette analyse, il est nécessaire de construire un tableau de contingence,
correspondant à la répartition croisée des variables exposition et événement si celles-ci sont
catégorielles.
L’analyse stratifiée consiste à créer des strates à partir des catégories (classes) d’un facteur
externe (tiers facteur) à la relation exposition évènement. Pour chacune de ces strates, il est
nécessaire de construire un tableau de contingence et d’estimer la mesure d’association entre
l’exposition et l’événement.
1.7. Précision
Comme pour les moyennes, les proportions, ou encore les mesures de fréquence, les valeurs des
mesures d’association obtenues à partir de tous les échantillons varient autour de la vraie valeur
de cette mesure, selon un certain écart et une loi de probabilité connue.
Détaillons à présent ce que cela implique pour une mesure d’association par exemple :
La mesure d’association dans un échantillon représentatif de cette population, du seul fait des
fluctuations d’échantillonnage, sera le plus souvent proche de la vraie valeur de l’ensemble de
la population, mais il sera exceptionnellement exactement égal à cette valeur. Pour chaque
échantillon, quelle que soit la mesure d’association, il est donc possible de calculer un intervalle
de confiance de l’estimation. On sait que, plus l’intervalle de confiance est large, moins il est
précis, et que la précision augmente quand la taille de l’échantillon augmente.
7
L’association sera considérée comme statistiquement significative si l’intervalle de confiance ne
contient pas la valeur 1 et sera d’autant plus significative qu’il est éloigné de 1.
2. Etudes de cohortes
2.1. Principe
Il s'agit de comparer deux groupes (au moins), identifiés à partir de leur statut exposé/non exposé
à un événement et d'étudier dans chacun des groupes l'incidence de l’événement d’intérêt. Une
incidence de l’événement plus (ou moins) importante chez les sujets exposés est en faveur d’une
association entre l’exposition et l’événement.
Figure 1. Schéma d’une étude de cohortes

Exemple : on souhaite savoir si le travail de nuit est un facteur de risque de survenue du de
l’hypertension artérielle. Pour cela, on suit durant une période définie, deux groupes d’agents de
santé, l’un travaillant de jour, et l’autre travaillant de nuit, indemnes initialement d’hypertension
artérielle. On recherche pour l’ensemble de ces agents, la survenue au cours du temps d’une
hypertension artérielle.
2.2. Schémas d’étude
Ces études peuvent être classées en plusieurs types.

- Selon le caractère unique ou multiple des cohortes initialement constituées :
 soit il s’agit d’une cohorte unique constituée initialement, au sein de laquelle on va
identifier deux groupes (ou plus) que l’on comparera en fin de suivi ;
 soit il s’agit de deux cohortes distinctes dès l’inclusion exposé/non exposé.
8
Figure 2 : Etude de cohorte Figure 3 : Etude de cohortes
- Selon la chronologie du recueil des données :

 les études de cohorte prospectives : les sujets sont sélectionnés et leur statut exposé/non
exposé identifié au début de l’enquête, puis l’événement est recueilli au cours du suivi
de façon prospective (dans le futur) (Figure 4). Aucun sujet ne présente l’événement au
début de l’enquête ;
 les études de cohorte rétrospectives ou historiques : la cohorte est reconstituée à partir
des archives, puis l’exposition et l’évènement sont recueillis de façon rétrospective (dans
le passé) (Figure 5).
Figure 4. Cohorte prospective Figure 5. Cohorte rétrospective ou historique
 les études mixtes rétro-prospectives ou historico-prospectives : elles correspondent à

des études de cohorte historiques dont on prolonge le recueil des événements de façon
prospective.
- Selon que la composition des groupes est fixée ou change au cours du temps :
 les cohortes fermées ou fixes quand la composition des groupes étudiés est fixée au début
de l'étude et n'est pas renouvelée pendant la période d'étude ;
 les cohortes dynamiques quand la composition des groupes change au cours du temps.
9
2.3. Sélection des groupes comparés
Idéalement, dans une étude de cohorte de type exposé/non exposé s’intéressant à une seule
caractéristique d’exposition, le principe de la sélection de ces sujets est, qu’en dehors de
l’exposition à la caractéristique étudiée, ils doivent être en tous points comparables aux sujets
du groupe exposé. Le groupe de référence a donc les caractéristiques suivantes :
- ils doivent avoir les mêmes caractéristiques sociodémographiques, professionnelles et
vis-à-vis d’autres expositions, que les sujets exposés ;
- ils doivent pouvoir être suivis de la même manière que les sujets exposés.
Le groupe de référence peut être un échantillon issu de la population générale, un groupe
appartenant à un univers défini.
2.4. Calcul du nombre de sujets nécessaire
Dans le cadre d’une étude de cohorte (permettant l’estimation d’une incidence cumulée), le
nombre de sujets, n, à inclure dans chacun des deux groupes, exposés et non exposés, dépend :
1. de l’incidence de l’événement d’intérêt chez les sujets non exposés : R0 (cette hypothèse
peut provenir d’une étude antérieure),
2. du risque relatif attendu (cette hypothèse peut provenir d’une étude antérieure) ; la taille
de l’échantillon est d’autant plus importante que l’association recherchée est faible
(risque relatif attendu proche de 1),
3. du risque α : classiquement, il est choisi égal à 5 %,
4. du risque β : le plus souvent, on choisira β = 20 %, soit une puissance (1 - β) de 80 %,

5. du rapport entre le nombre de sujets exposés et le nombre de sujets non exposés : s’il est
égal à 1 (effectif du groupe exposé = effectif du groupe non exposé), le nombre total de sujets
(effectif du groupe exposé + effectif du groupe non exposé) est le plus faible.
Le résultat de ce calcul est donné directement dans de nombreux logiciels. Citons par exempke
Epi Info, développé par les CDC et l’OMS.
Exemple : on souhaite comparer l’incidence cumulée à 5 ans de la maladie thrombo-embolique

chez des femmes prenant des contraceptifs oraux (« exposées ») et des femmes ne prenant pas
de contraceptifs oraux (« non exposées »). Si on fait l’hypothèse que l’incidence attendue chez
10
les non exposées est de 1 % et que le RR attendu est d’au moins 3, pour α = 5 % et β = 20 %, il
faut inclure 865 femmes dans chaque groupe.
2.5. Mesure de l’évènement dans les groupes exposé/non exposé
Dans les études de cohorte, on mesure l'incidence de l'événement. Il faut donc définir
précisément l’évènement : par exemple ce que l'on entend par date de survenue de l'événement
(date des premiers symptômes ? date de l'examen confirmant le diagnostic ?... )
2.6. Analyse des données
Rappelons que les formules présentées ici pour estimer les mesures d’association ne s’appliquent
qu’à des études comparant des groupes indépendants.
Il existe des formules spécifiques pour estimer le RR dans le cas d’études appariées qui ne sont
pas abordées dans cette UE.
2.6.1. Analyse brute
2.6.1.1. Tableau de contingence
Les résultats résumés dans un tableau de contingence (tableau 2*2) sont présentés différemment
selon que l’on dispose d’effectifs en personnes ou en personne-temps. Nous présentons le tableau
de contingence pour la situation où il existe deux groupes : exposé / non exposé.
- Effectifs en personnes
Tableau 1 : Tableau de contingence dans une étude de cohorte en cas d’exposition à deux
catégories. Effectifs en personnes.
Malades Non malades Total
Exposés a b E1
Non exposés c d E0
Total M1 M0 T
Exemple : résultats d’une étude de cohorte comparant le risque de maladie thromboembolique

chez des femmes prenant ou non des contraceptifs oraux (Tableau 2).
11
Tableau 2 : Relation entre maladie thromboembolique (MTE) et contraceptifs oraux (CO),
étude de cohorte fictive
MTE Pas de MTE Total
CO 60 440 500
Pas de CO 25 475 500
Total 85 915 1000
- Effectifs en personne-temps
Lorsque l’on souhaite estimer des densités d’incidence, on présente pour chacun des groupes
étudiés, groupe exposé et groupe non exposé, le nombre de sujets ayant présenté l’événement
ainsi que le nombre de personne-temps (Tableau 3).
Tableau 3. Tableau de contingence dans une étude de cohorte en cas d’exposition à deux
catégories. Effectifs en personne-temps.
Malades Total (personne-temps)
Exposés a E1
Non exposés c E0
Total M1 T
2.6.1.2. Estimation des mesures de fréquence de l’événement dans chaque groupe
L'incidence, incidence cumulée ou densité d'incidence, est calculée dans chacun des groupes
étudiés, ainsi que son intervalle de confiance (Tableau 4).
12
Tableau 4 : Estimation de l’incidence dans une étude de cohorte.
Forme générale
R 1 = a / E1 R0 = c / E0
Calcul dénominateur
Incidence cumulée E1=nombre exposés E0=nombre non exposés
Densité d'incidence E1=nombre de personnetemps E0=nombre de personnetemps

d’observation chez exposés d’observation chez les non
exposés
Intervalle de confiance Exposés Non exposés
(à 1-α) %
Incidence cumulée R (1 − R ) R (1 − R )
R ±U 1 1 R ±U 0 0
1 α E 0 α E
1 0
Densité R R
R ±U 1 R ±U 0
d'incidence 1 α E 0 α E
1 0
Dans l’exemple de la maladie thromboembolique (Tableau 2), voici le détail des calculs :
- L’incidence chez les exposés est : R1 = 60/500= 0,12, soit 12% et son intervalle de
0,12(1−0,12)
confiance à 95 % (IC 95 %) : 0,12 ± 1,96 √ 500 soit 0,09-0,15
(Formule applicable car : 0,09 × 500 = 45 > 5)

- L’incidence chez les non exposés est : R0 = 25/500= 0,05, soit 5% et son intervalle de
0,05(1−0,05)
confiance à 95 % (IC 95 %) : 0,05 ± 1,96 √ 500 soit 0,03-0,07
(Formule applicable car : 0,03 × 500 = 15 > 5)
2.6.1.3. Estimation de la mesure d’association
- La mesure d'association utilisée dans les études de cohorte est le risque relatif (RR).
Le RR est égal à : RR = R1 / R0
- On peut apprécier la force de l’association, en estimer sa précision et sa stabilité. La
force de l’association entre l’exposition et l’événement s’apprécie à partir de la valeur
13
du RR : plus le RR est éloigné de 1 (vers l’infini pour un RR > 1, ou vers zéro pour un
RR < 1), plus la force d’association est importante.
RR = R1/R0 = 0,12/0,05 = 2,4
2.6.1.4. Précision de la mesure d’association
Elle s’apprécie à partir de son intervalle de confiance. Différentes méthodes peuvent être
utilisées pour le calcul de l’intervalle de confiance du RR comme la méthode semi-exacte et la
méthode de Miettinen, utilisables en dehors d'un logiciel statistique. Si vous faites les calculs à
la main, autant que possible, il est recommandé de choisir la méthode semi-exacte.
Selon la méthode semi-exacte,
Selon la méthode de Miettinen,
l’intervalle de confiance à (1 - α) % du RR s’écrit :

Cette méthode est utilisable uniquement si les conditions d'application du test du Chi-2 sont
vérifiées, et de moins en moins exacte au fur et à mesure que le RR s’éloigne de 1.
Intervalle de confiance à 95% de RR = 2,4 selon la méthode semi-exacte :
440 475
2,4*exp ( ± 1,96 √(60∗500) + (25∗500) ) : 1,5-3,8
On conclut que les femmes ayant reçu des contraceptifs oraux ont un risque deux fois supérieur
aux autres d’avoir une maladie thromboembolique. L’exposition aux contraceptifs oraux est un
facteur de risque de la maladie thromboembolique.
14
2.6.1.5. Stabilité de l'association
Elle repose sur le test de l'hypothèse nulle, H0, qu’il n'existe pas d'association entre l'exposition
et l'événement, c’est-à-dire que le risque de maladie n’est pas différent selon le groupe
d’exposition, soit RR = 1.
- Pour les effectifs en personnes : Les tests utilisés sont les tests statistiques classiques de
comparaisons de proportions sur séries indépendantes (test du Chi-2 de Pearson ou test
exact de Fisher selon les conditions d'application). Deux autres formules peuvent être
signalées, utilisables si les conditions d’application du test du Chi-2 de Pearson sont
vérifiées :
- Pour les effectifs en personne-temps :
- Dans l’exemple de la maladie thromboembolique (Tableau 2), voici le détail des calculs
les effectifs en personne : Chi²P = ((60*475) - (25*440))²*1000 / 85*915*500*500 =
17,5
- Les résultats de l’intervalle de confiance du RR et le test statistique sont concordants :

il y a une association entre la prise ce contraceptifs oraux et la maladie
thromboembolique, avec un risque alpha de première espèce.
2.6.1.6. Présentation des résultats
Si on souhaite présenter les résultats de la mesure d’association dans un tableau, on peut opter
par exemple pour la présentation proposée dans le Tableau 5.
15
Tableau 5. Association entre maladie thromboembolique et contraceptifs oraux. Etude de
cohortes.
Total Maladie RR (IC 95 %)
thromboembolique
Contraceptifs oraux 500 60 2,4 (1,5; 3,8)

Pas de contraceptifs oraux 500 25 1
Total 12000 124
RR :
risque relatif ; IC 95 % : intervalle de confiance à 95 % du RR.
2.6.2. Analyse stratifiée
Nous présentons ici la démarche de l’analyse de l’association entre une exposition et un

événement, stratifiée sur un tiers facteur, appliquée à un exemple d’étude de cohorte.
Les formules mathématiques spécifiques aux études de cohorte sont présentées en annexe 2.
Seul le principe de l’analyse stratifiée est à retenir, pas les formules mathématiques.
Prenons l’exemple de l’étude du lien entre le rang de naissance et le risque de trisomie 21. Les
résultats d’une étude de cohorte réalisée dans une population présentant un risque
particulièrement élevé de trisomie 21, pour répondre à cet objectif, sont présentés dans le
Tableau 6.
Tableau 6 : Analyse brute de l’association entre le rang de naissance de l’enfant et le risque de

trisomie 21. Étude de cohortes.
Trisomie 21 Pas de trisomie 21 Total
Rang de naissance > 1 200 600 800

Rang de naissance = 1 100 700 800
Total 300 1300 1600
Parmi les enfants :

- Rang > 1, le risque de trisomie 21 est R1 = 200 / 800 = 25,0 % ;
16
- Rang = 1, le risque de trisomie 21 est R2 = 100 / 800 = 12,5 %.
- RR (Rang > 1 / Rang = 1) = 2,0 et IC 95% = [1,6 ; 2,5]. Le test du Chi-2 de Pearson
vaut : 41,03 (p < 10-3).
- Ces résultats bruts permettent de conclure à une association significative entre le rang
de naissance et la survenue d’une trisomie 21 (p < 10-3).
Or, l’âge de la mère est un facteur de risque important pour la survenue de trisomie 21 (les
mères âgées ont un risque plus élevé de donner naissance à un enfant porteur d’une trisomie 21
que les mères moins âgées), et il est également associé au rang de naissance (les enfants nés en
premier sont issus de mères plus jeunes en moyenne que les autres). On souhaite donc prendre
en compte également ce facteur dans l’analyse.
2.6.2.1. Recherche de la modification d’effet ou interaction
Les tableaux 7 et 8 présentent les résultats de l’analyse de l’association entre le rang de

naissance et le risque de trisomie 21 selon l’âge de la mère.
Tableau 7 : Analyse de l’association entre le rang de naissance de l’enfant et le risque de

trisomie 21, parmi les enfants nés de mères de 35 ans et plus. Étude de cohortes.

Total 220 300 520
Risque relatif (RR) = 1,0 ; IC à 95 % = [0,8 ; 1,3] ; Chi-2 de Pearson = 0,03 (p > 0,50)
Tableau 8. Analyse de l’association entre le rang de naissance de l’enfant et le risque de trisomie

21, parmi les enfants nés de mères de moins de 35 ans. Étude de cohortes.

Total 80 1000 1080
Risque relatif (RR) = 1,0 ; IC à 95 % = [0,7 ; 1,6] ; Chi-2 de Pearson = 0,01 (p > 0,90)
L’observation des différents RR montre que :
17
- le RR brut est différent des RR chez les enfants nés de mères de 35 ans et plus et
chez ceux nés de mères de moins de 35 ans,
- le RR chez les enfants nés de mères de 35 ans et plus est le même que celui chez
les enfants nés de mères de moins de 35 ans.
La mesure d’association étant la même dans les deux strates d’âge de la mère (formellement, il
faudrait réaliser un test de Woolf cf. annexe 1, mais le chevauchement des intervalles de
confiance à 95 % des RR de chacune des deux strates permettent d’arriver à cette conclusion),
il n’y a donc pas de modification par l’âge de la mère de l’effet du rang de naissance sur la
survenue d’une trisomie 21.
On va donc rechercher si l’âge de la mère est un facteur de confusion.
2.6.2.2. Recherche de la confusion
Pour cela, on calcule le RR ajusté. Il est égal à 1,02 (cf. annexe 2). La différence avec la mesure
d’association brute correspond à :
L’âge de la mère est donc un facteur de confusion, et on présentera le RR ajusté, 1,02.

Le résultat du test statistique est : 0,0033n soit p comprise entre 0,50 et 0,90.
L’intervalle de confiance à 95 % du RR ajusté est : [0,82 - 1,26].

On peut donc conclure (à partir du résultat du test ou de l’intervalle de confiance à 95 % du RR
ajusté) que, après prise en compte de l’âge de la mère, il n’y a pas d’association significative
entre le rang de naissance et le risque de survenue d’une trisomie 21.
Après vérification, il existe bien une association significative entre, d’une part, l’âge de la mère
et, d’autre part, la survenue d’une trisomie 21 ou le rang de naissance, et l’âge maternel n’est pas
situé sur le chemin causal entre rang de naissance et trisomie 21.
2.6.3. Mesures d’impact
Dans une étude de cohorte, dans le cas d’une relation causale entre l’exposition et l’événement,
on peut estimer :
- quel est le risque supplémentaire lié au facteur de risque : il s'agit de la différence de
risque ou risque attribuable
18
- quelle est la part du risque supplémentaire que l'on peut attribuer au facteur de risque dans
le risque total observé : il s'agit de la fraction de risque attribuable et de la fraction
étiologique
- combien de cas sont dus au facteur de risque dans la population et seraient donc évités si
le facteur de risque était supprimé dans cette population : on parle du nombre de cas
attribuable.
2.6.3.1. Différence de risque (DR) ou risque attribuable
Il s'agit du risque supplémentaire lié au facteur de risque ou encore de l'excès de risque. Cette
notion fait appel à celle de différence de risque, le risque chez les non exposés étant considéré
comme le risque de base (en dehors de toute exposition à la caractéristique étudiée). Si la mesure
de fréquence est un risque (ou incidence), comme ici dans le cas d’une étude de cohorte, on parle
de risque attribuable au facteur de risque.
- Dans la population totale : DRP = RP-R0, avec RP : risque dans la population, celui-ci
étant estimé par le risque de l’ensemble des sujets suivis : RP=M1/T.
Si l'on veut tenir compte de la prévalence de l'exposition dans la population, PE, on obtient : Rp=
PE x R1 + (1-PE) x R0 = PE x (R1-R0) + R0 DRP= RP-R0 = PE x (R1-R0).
- Dans la population exposée : DRE = R1-R0.
2.6.3.2. Fraction (de risque) attribuable et fraction étiologique
Cela représente la proportion de cas que l'on peut attribuer au facteur de risque, et donc que l'on
pourrait éviter si l'on supprimait ce facteur de risque dans ce groupe. On parle de fraction (de
risque) attribuable (FRA) et de fraction étiologique (FE).
19
Les termes fraction attribuable et fraction étiologique sont fréquemment employés
pour désigner la même chose. On emploie en général le terme de :
- fraction attribuable pour la population ;
- fraction étiologique chez les exposés.
2.6.3.3. Nombre de cas attribuable
Il est égal à : FRAP X effectif de malades dans la population.
2.6.3.4. Synthèse
Dans le cas d’un facteur de risque (RR > 1), les mesures d’impact évaluent la contribution de
la caractéristique d’exposition à la fréquence d’une maladie dans une population donnée, en cas
de relation causale possible entre cette caractéristique et la maladie. Dans le cas d’un facteur
protecteur (RR < 1), les mesures d’impact sont nommées autrement : fraction préventive,
nombre de cas prévenus.
Dans l’exemple de la relation entre exposition aux contraceptifs oraux et maladie
thromboembolique (Tableau 2), si la relation est causale et que la fréquence de l’exposition est
représentative, la fraction de risque attribuable dans la population est : FRAP = 0,085 –
0,05/0,085 = 0,4117.
Cela signifie que 41,2% (soit près d’un cas sur deux) de maladie thromboembolique dans la
population féminine sont attribuables à l’exposition aux contraceptifs oraux.
20
ANNEXE 1
21
22

EPI ANAL21 - L2 - Cours - I

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

EPI ANAL21 - L2 - Cours - I

Transféré par

Droits d'auteur :

Formats disponibles

COURS EPIDEMIOLOGIE ANALYTIQUE

L’épidémiologie analytique (encore appelée épidémiologie étiologique) permet d’identifier les

1.1. Définitions de concepts

1.2. Objectif analytique

1.3. Mesure de l’évènement et de l’exposition

1.4. Distinction entre études expérimentales et non expérimentales

1.6. Principes de l’analyse brute et de l’analyse stratifiée

Figure 1. Schéma d’une étude de cohortes

2.2. Schémas d’étude

Ces études peuvent être classées en plusieurs types.

- Selon la chronologie du recueil des données :

Figure 4. Cohorte prospective Figure 5. Cohorte rétrospective ou historique

 les études mixtes rétro-prospectives ou historico-prospectives : elles correspondent à

2.4. Calcul du nombre de sujets nécessaire

4. du risque β : le plus souvent, on choisira β = 20 %, soit une puissance (1 - β) de 80 %,

Exemple : on souhaite comparer l’incidence cumulée à 5 ans de la maladie thrombo-embolique

2.5. Mesure de l’évènement dans les groupes exposé/non exposé

2.6. Analyse des données

2.6.1. Analyse brute

2.6.1.1. Tableau de contingence

Exemple : résultats d’une étude de cohorte comparant le risque de maladie thromboembolique

2.6.1.2. Estimation des mesures de fréquence de l’événement dans chaque groupe

Densité d'incidence E1=nombre de personnetemps E0=nombre de personnetemps

(Formule applicable car : 0,09 × 500 = 45 > 5)

(Formule applicable car : 0,03 × 500 = 15 > 5)

2.6.1.3. Estimation de la mesure d’association

2.6.1.4. Précision de la mesure d’association

Selon la méthode semi-exacte,

Selon la méthode de Miettinen,

l’intervalle de confiance à (1 - α) % du RR s’écrit :

- Pour les effectifs en personne-temps :

- Les résultats de l’intervalle de confiance du RR et le test statistique sont concordants :

2.6.1.6. Présentation des résultats

Contraceptifs oraux 500 60 2,4 (1,5; 3,8)

2.6.2. Analyse stratifiée

Nous présentons ici la démarche de l’analyse de l’association entre une exposition et un

Tableau 6 : Analyse brute de l’association entre le rang de naissance de l’enfant et le risque de

Rang de naissance > 1 200 600 800

Parmi les enfants :

2.6.2.1. Recherche de la modification d’effet ou interaction

Les tableaux 7 et 8 présentent les résultats de l’analyse de l’association entre le rang de

Tableau 7 : Analyse de l’association entre le rang de naissance de l’enfant et le risque de

Rang de naissance > 1 170 230 400

Tableau 8. Analyse de l’association entre le rang de naissance de l’enfant et le risque de trisomie

Rang de naissance > 1 30 370 400

L’observation des différents RR montre que :

2.6.2.2. Recherche de la confusion

L’âge de la mère est donc un facteur de confusion, et on présentera le RR ajusté, 1,02.

L’intervalle de confiance à 95 % du RR ajusté est : [0,82 - 1,26].

2.6.3. Mesures d’impact

2.6.3.1. Différence de risque (DR) ou risque attribuable

- Dans la population exposée : DRE = R1-R0.

2.6.3.2. Fraction (de risque) attribuable et fraction étiologique

2.6.3.3. Nombre de cas attribuable

Il est égal à : FRAP X effectif de malades dans la population.

Vous aimerez peut-être aussi