Vous êtes sur la page 1sur 49

METHODOLOGIE

EPIDEMIOLOGIE

Dr Jacqueline DUFFOUR
I/EPIDEMIOLOGIE: Généralités
 I-1  L’Epidémiologie

 Définition: distribution temporelle et spatiale des états de santé des


populations

 Historique:
 Mesure  de  l’importance  des  épidémies  (maladies  infectieuses)  XIX  et  début  
XXème siècle
 Elargissement du champ de compétences à partir des années 50 avec
apparition des maladies de civilisation (cancers, maladies C°V) 1ère étude
Doll et Hill: tabac et cancer

 Classification
 Selon la procédure: observationnelle ou expérimentale
 Selon la finalité: descriptive, étiologique, évaluative
 Selon la chronologie:
 Transversale ou longitudinale
 Rétrospective ou prospective
 Selon la méthodologie
 Cas/témoins, Cohortes exposés/non exposés
 Essais thérapeutiques, randomisés ou non
 A  quoi  sert  l’épidémiologie  ?

 Analyse des besoins de santé de la population


Outil  de  diagnostic  et  d’évaluation  en  santé  publique

 Surveillance de la population. Veille & alerte sanitaire

 Histoire naturelle de la maladie. Facteurs pronostiques

 Recherche des causes des affections. Observation «


organisée »

 Évaluation des interventions


I- 2 La DEMARCHE EPIDEMIOLOGIQUE

 1-Enquête descriptive
 Observation  d’un  phénomène
 2 indicateurs: fréquence et mortalité
 et  d’un  phénomène  concomitant  (étude  écologique)

 Formulation  d’une  hypothèse

 2-Enquêtes étiologiques:
 On  cherche  à  vérifier  l’hypothèse
 2 étapes:
 1- Cas/témoins
 2- Exposés/non exposés
 mise en évidence des facteurs de risque

 3- Essais interventionnels:
 Evaluation des mesures de prévention par le facteur
de risque (si celui-ci est protecteur)
1/Enquêtes Descriptives
 Objectif principal: distribution des variables

 Objectifs annexes:
 populations ou sous groupes atteints
 répartition dans le temps et espace des atteintes ...

 Observation  d’un  phénomène


 2 indicateurs: fréquence et mortalité

 et  d’un  phénomène  concomitant  (étude  


écologique)

 Formulation  d’une  hypothèse

 EXEMPLE:  Importance  du  cancer  de  l’œsophage  dans  


une  région,  région  où  la  consommation  d’alcool  est  
forte
2/Enquêtes Analytiques ou étiologiques

Objectif principal:
 Recherche de  causes  ou  d’expositions à un facteur de risque par
comparaison de 2 groupes

 II/ Groupe de malades/groupe de non malades = Cas/Témoins


 Ex:  des  malades  atteints  de  cancers  de  l’œsophage  comparés  à  des  
gens  bien  portants  (concernant  l’exposition  à  l’alcool)

 Si cette étude montre une différence entre les cas et les témoins
concernant le risque: on poursuit la recherche

 III/Groupe de personnes exposées au facteur de risque


supposé/ groupe de personnes non exposées
 Ex: des personnes présentant un alcoolisme +++(exposés) comparés
à un groupe non exposé (concernant le nombre de cancers de
l’oesophage)

 Objectifs annexes:
 vérification des hypothèses des études descriptives

 études des liens de causalité


3/ Essais interventionnels
 Objectif principal:
 Recherche et vérification par comparaison de 2
groupes de  l’efficacité  d’un  facteur  de  protection

 Deux groupes:
 1 groupe exposé au facteur de protection
 1 autre non

 Ne  peut  être  mise  en  œuvre  que  pour  les  


facteurs supposés protecteurs

 Même principe pour les essais cliniques


I-3 La part des biostatistiques

I-3-1Notion  d’échantillonnage

Les enquêtes épidémiologiques sont le plus souvent réalisées


sur un échantillon de la population cible

 La représentativité de  l’échantillon/population
cible+++
 Échantillonnage par tirage au sort: la meilleure
 A  partir  d’une  liste  exhaustive  de  la  population  cible  
 Problème:  comme  aucune  liste  n’est  complète  (PDV)  risque  
de biais de sélection

 Les indicateurs (incidence, prévalence, Risque relatifs)


calculés sur ces échantillons sont des estimations
 Toujours représentés avec leur intervalle de confiance à 95%
[IC-95%]
 Ex:  prévalence  de  l’insuffisance  rénale  chronique  aux  USA:
 13.1% [IC 95%: 12.0%-14.1%]
La part des biostatistiques
I-3-2  L’usage  des  biostatistiques garantit la
rigueur méthodologique de ces études
 Avant  l’étude: protocole indispensable= véritable cahier
des  charges  des  divers  éléments  de  l’étude:  matériel et
méthodes
 nombre de sujets nécessaires, les fondements et modalités de
l’étude  (mise  en  place,  suivi,  analyse)
 les  aspects  temporels  de  l’étude
 les documents de recueil des données
 Techniques statistiques permettant de réduire la variabilité des
2 groupes à comparer
 Appariements
 Stratification…

 Après  l’étude: tests spécifiques permettant de conclure


(avec  un  certain  degré  d’erreur  consenti)  que  les  2  groupes  
diffèrent ou non significativement
II/ Les outils épidémiologiques

 II-1/MESURE des INDICATEURS de SANTE


 Mortalité
 Morbidité (FREQUENCE d'une ATTEINTE)
 dans  le  cadre  de  tous  les  types  d’enquêtes

 II-2 La Standardisation

 II-3/Mesure  de  l’ASSOCIATION  Atteinte /


Exposition = mesure du RISQUE
II-1 INDICATEURS de SANTE
(Pour  tous  les  types  d’étude)
 II-1-1/ Indicateurs de mortalité

 Taux brut de mortalité:


=  Nombre  de  décès  au  cours  de  l’année  dans  une  
population/population moyenne de cette année x 1000
= 9 pour 1000 environ
Ne  tient  pas  compte  de  l’âge
 Taux spécifiques de mortalité
 Par âge
= Nombre  de  décès  dans  une  tranche  d’âge  pdt  1  an/population  
moyenne  de  tranche  d’âge  cette  année  là  x  1000
 Par sexe
 Par cause
= Nombre de décès due à une cause pendant 1 an/population
moyenne cette année là x 1000
 Taux de létalité par cause
= Nombre de décès due à une cause/nombre de patients atteints
de cette cause x 1000
II-1-2/ Indicateurs de morbidité

= Fréquence d'une Atteinte


 information essentielle
 va de pair avec:
 la taille de la population ou de l'échantillon
 la durée du temps du recueil

 deux grandes catégories de fréquence

 Incidence

 Prévalence
 1/ Prévalence

Nombre de cas de malades pendant une période


donnée

Le taux de prévalence = nombre de cas de malades


/population moyenne pendant cette période

Intérêt: permet d'estimer le risque (probabilité)


d'un individu d'être porteur de l'atteinte à un
moment donné
 2/Incidence
Nombre de nouveaux cas de malades pendant une
période donnée

S’exprime  par  le  nombre  de  nouveaux  cas  de  malades  


/population moyenne pendant cette période

3/Rapport entre les deux


P (prévalence) = I (incidence) x D (durée)
 si l'incidence d'une maladie de longue durée est faible, la
prévalence pourra être forte mais ce ne sera pas péjoratif
( possibilités thérapeutiques)
 si l'incidence d'une maladie de courte durée est forte,
c’est  un  élément  péjoratif  (progression  de  la  maladie)

 Ces 2 indicateurs sont complémentaires


Fréquence d'une Atteinte
Fréquence d'une Atteinte
 INCIDENCE

2 notions:

 Incidence Cumulative (IC): proportion


d'individus atteints en une période donnée
(définition précédente)

 Taux d'Incidence (TI): nombre de


nouveaux cas atteints au cours d'une
période donnée divisé par la durée totale
d'observation individus-temps
 INCIDENCE

 Formule de l'Incidence Cumulée

nbre de nouveaux cas atteints


IC = pdt une période donnée
population totale

 Formule du Taux d'Incidence


nbre de nouveaux cas atteints pendant une période donnée
TI = somme durées d'observation des individus avant atteinte
 INCIDENCE
 intérêt Taux d'Incidence
 mesure à un instant donné la vitesse
d'apparition de l'atteinte
 exemple: 5 individus
 A suivi 1 an pas atteint, perdu de vue
au bout de 1 an
 B suivi 3 ans atteint au bout des 3 ans
 C suivi 5 ans pas atteint
 D suivi 4 ans pas atteint
 E suivi 2,5 ans atteint au bout des 2,5 ans

TI = 2 cas/15,5 individus-année = 12,9/100


individus-année
II-2 STANDARDISATION

 Les indicateurs de mortalité ou


morbidité  s’expriment  par  taux

 La comparaison de ces taux bruts peut


conduire  à  des  erreurs  d’interprétation

  Nécessité de standardiser ces taux


par âge, sexe, catégorie socio-
professionnelle…/  à  une  population  
type
STANDARDISATION

Groupes Px Tx P’x T’x


d’âge répartition population Taux de Mortalité Répartition population Taux de Mortalité
Limousin (%) Limousin (0/00) France(%) France(0/00)

0-24 ans 31,5 1,2 36,4 1,15

25-54 ans 38,5 2,5 40,6 2,6

>55ans 30 34,5 23 34

Taux Brut de la Mortalité dans le Limousin:


T= Px X Tx = (31,5X1,2)+(38,5X2,5)+(30X34,5) = 11,54‰
100
Taux Brut de Mortalité en France:
T’=    P’x  X  T’x  =  (36,4X1,15)+(40,6X2,6)+(23X34) = 9,29‰
100
Conclusion apparente: la mortalité est plus importante dans le Limousin
Utilisons la  structure  d’âge  de  la  France et appliquons-la au Limousin:
T’’=    P’xXTx  =  (36,4X1,2)+(40,6X2,5)+(23X34,5) = 9,27‰
100
II-3/ ASSOCIATION ATTEINTE/EXPOSTION
Mesure du risque (seulement dans les études
étiologiques)

 II-3-1/Notion de risque et facteur de risque

 II-3-2/les indicateurs de risque: RR et OR

 II-3-3/ les facteurs de confusion

 II-3-4/Recherche de la causalité
II-3-1 Notion de RISQUE et Facteur de
Risque
 Le risque est  la  probabilité  de  survenue  d’un  
évènement  (décès,  maladie…)

 Cette probabilité n’est  pas  la  même  pour  tous  les  


individus  d’une  population

 Elle  varie  en  fonction  d’un  certain  nombre  de  facteurs  


(endogènes,  environnementaux,  comportementaux…)

 Ces facteurs sont appelés: facteurs de risque


 Un facteur F est un facteur de risque pour une
maladie  M  si  l’exposition  au  facteur  F  modifie  la  
probabilité  d’apparition  (l’incidence)  de  la  maladie  M
II-3-2 Les Indicateurs de Risque
Pour  vérifier  l’hypothèse  d’une  relation  
entre  l’exposition  à  un  facteur  de  
risque et la survenue de la maladie

 II-3-2-1 -Le Risque Relatif

 II-3-2-2-l’ODDS  RATIO

 II-3-2-3-L’excès  de  Risque

 II-3-2-4-La fraction de Risque


attribuable
II-3-2-1-Le risque relatif

 C’est  le  rapport  des  incidences


de la
maladie chez les exposés/ non exposés
 IE / InE

 Le risque = 1  le facteur est sans


influence
 Le risque est >1  le facteur  l’incidence  
de la maladie
 Le risque est <1  le facteur  l’incidence  
de la maladie
atteinte
oui non

oui a b a+b = nb exposés


exposition

non c d c+d = nb non exposés

a+c b+d a+b+c+d


= = =
nb atteints nb non atteints nb total individus
I exposés
RR =
I non exposés

IC exposés a / (a + b)
RR = =
IC non exposés c / (c + d)

RR  ne  s’utilise  que  dans  les  études  de  


cohorte exposées/ non exposées
EXEMPLE
 Etude d’une  cohorte  de  travailleurs  exposés  à  un  
contaminant / une population non exposée

lymphomes
oui non

60 1940 2000= nb exposés


oui

Exposition
à un contaminant
20 1980
non 2000= nb non exposés

80 3920
4000
= =
=
nb atteints nb non atteints
nb total individus
EXEMPLE
 Etude d’une  cohorte  de  travailleurs  exposés  à  un  
contaminant / une population non exposée

lymphomes
oui non

60 1940 2000= nb exposés


oui

Exposition
à un contaminant
20 1980
non 2000= nb non exposés

80 3920
4000
= =
=
nb atteints nb non atteints
nb total individus
IC exposés a / (a + b)
RR = =
IC non exposés c / (c + d)

I exposés: 60/2000 = 3/100

I non exposés: 20 / 2000 = 1/100

RR = 3/100: 1/100 = 3

 Le RR doit être présenté avec un intervalle de confiance (IC) à


95%
 Si  l’IC95%  ne  contient  pas  le  1,  l’association  facteur  –maladie est
significative
 Si  l’IC95%  contient  le  1,  l’association  facteur  –maladie  n’est  pas  
significative
Enquêtes de cohorte exposés / non exposés

Atteinte?
oui non

oui a b a+b = nb exposés


exposition

non c d c+d = nb non exposés

a+c b+d a+b+c+d


= = =
nb atteints nb non atteints nb total individus
Enquêtes Cas / Témoins

atteinte
oui non

oui a b a+b = nb exposés


Exposition?

non c d c+d = nb non exposés

a+c b+d a+b+c+d


= = =
nb atteints nb non atteints nb total individus
II-3-2-2-l’ODDS  RATIO  (OR)
 OR = Odds de la maladie chez les exposés/odds
de la maladie chez les non exposés

 L’odds  de  la  maladie  chez  les  exposés=    


est  la  probabilité  d’être  malade/probabilité  de  ne  
pas être malade chez les exposés

 = a/a+b/b/a+b

 L’odds  chez  les  non  exposés

 = c/c+d/d/c+d

 On démontre que:
 OR = a/c/b/d = ad/bc
 Quand la maladie est rare RR = OR
 Interprétation  de  l’OR
 OR = 1  le facteur est sans influence

 OR >1  le facteur  l’incidence  de  la  


maladie

 OR <1  le facteur  l’incidence  de  la  


maladie

 L’OR  doit  être  présenté  avec  un  intervalle  de  confiance  


(IC) à 95%
 Si  l’IC95%  ne  contient  pas  le  1,  l’association  facteur  –
maladie est significative
 Si  l’IC95%  contient  le  1,  l’association  facteur  –maladie  n’est  
pas significative
 OR  ne  s’utilise  que  dans  les  études  Cas/Témoins
 Intervalle de confiance
II-3-2-2-3- L’excès  de  risque

Excès de risque ou R Attribuable = IE – InE


 Exprime  l’augmentation  de  l’incidence  de  la  maladie  attribuable  à  la  
présence  du  facteur  d’exposition

 Fournit une estimation du nombre de cas qui pourraient être évités


si  l’exposition  était  supprimée  chez  les  exposés
II-3-2-2-4- Fraction de risque attribuable
 FRA= PF (RR-1)/PFRR + (1- PF)

où PF est  la  fréquence  d’exposition  au  facteur  de  risque  dans  


la population

 Exemple
 RR du tabac pour cancer du poumon: 14
 Fréquence du tabagisme dans la population: 0.30

 FRA= 0.30 x (14-1)/0.30 x 14 + (1-0.30) = 80%


 CCl: la proportion de risque de décès par cancer du poumon
attribuable au tabac est de 80%

 Si la fréquence du tabagisme avait été de 10%


 FRA= 0.10 x (14-1)/0.10 x 14 + (1-0.10) = 56.5%
II-3-3/ les facteurs de confusion

liaison causale ?
Exposition Atteinte

Facteur
de
Confusion
Facteurs de Confusion
 DEFINITION
 confusion:
 Si  E  est  un  facteur  d’exposition  
potentiel à une maladie M, un tiers
facteur est un facteur de confusion si

 Il explique totalement ou partiellement


un effet apparent de E sur M

 Il masque totalement ou partiellement


une association réelle entre E et M
Facteurs de Confusion
 Exemple
 évaluation des édulcorants (E) sur le cancer de
la vessie (CV)
 E Augmentation CV

 CV plus fréquent chez les fumeurs que chez les


non fumeurs
 Les édulcorants sont-ils responsables à eux
seuls du CV?

 Ou  bien  l’augmentation  des  CV  constatée  chez  


les  consommateurs  d’édulcorants  se  fait-elle
par  l’intermédiaire  du  tabac?  
 (les buveurs de thé et café fument)
 MORTALITE  par  cancer  de  la  vessie  (‰  par  an)

Consommation Consommation de tabac ( paquets/j)


d’édulcorants/j       0 1à2 >2 ensemble

 0 4 9 15 6
 1 à 10 6 10 13 8
 > 10 5 9 16 12

 ensemble 4 10 15
 MORTALITE  par  cancer  de  la  vessie  (‰  par  an)

Consommation Consommation de tabac ( paquets/j)


d’édulcorants/j       0 1à2 >2 ensemble

 0 4 9 15 6
 1 à 10 6 10 13 8
 > 10 5 9 16 12

 ensemble 4 10 15
Facteurs de Confusion

 Conséquences
 utiliser des méthodes pour limiter la
confusion
 lors de la phase préparatoire
 Randomisation  (dans  les  essais  d’intervention  ou  
thérapeutiques uniquement)
 Restriction de la population à certaines
catégories
 Appariement sur les facteurs de confusion déjà
connus (âge exemple:

 Exemple: Étude édulcorants – cancer de la


vessie
 facteurs de confusion: âge, sexe, tabagisme
 une femme de 65 ans, grosse fumeuse atteinte
sera appariée à une femme de même âge et
habitudes non atteinte
Facteurs de Confusion
 Analyse stratifiée
 type : méthode de contrôle de la confusion lors de
la phase d'analyse

 = évaluation de l'association dans les catégories


ou classes où la variable de confusion est répartie
de manière homogène

 la valeur globale de l'association peut être calculée


par "moyenne pondérée" des associations
partielles (méthodes de Mantel-Haenszel)

 exemple: si le sexe est un éventuel facteur de


confusion, l'association sera calculée séparément
pour les hommes et les femmes
Facteurs de Confusion
 Analyse multivariée

 1-Estréalisée après l’analyse  univariée de


l’association  Facteurs  ou  variable-Maladie
(chaque variable étant prise individuellement)

 2-Sicette analyse met en évidence des


variables  ou  le risque significativement

 3-on entre ces variables dans « le modèle de


Cox » (analyse des variables simultanément)
qui permet de confirmer la significativité (et
donc la mise en cause) des facteurs apparus
lors de la 1ère analyse
Facteurs de Confusion

 Analyse univariée
Facteurs de Confusion

 Analyse multivariée
II-3-4/Recherche de la causalité
 Nécessité de certaines conditions
 Existence  d’un  lien  statistique  entre  le  facteur  et  la  
maladie

 Cohérence chronologique

 Constance  et  reproductibilité  de  l’association  dans  


d’autres  études  et  populations  

 Force  de  l’association  statistique  (RR  élevé)

 Relation dose-effet

 Une intervention visant à supprimer le facteur de risque


doit faire  l’incidence  de  la  maladie

 Cohérence avec les connaissances expérimentales