Vous êtes sur la page 1sur 158
EPIDEMIOLOGIE ET STATISTIQUE DE BASE (EPISTAT 1) Département d’Epidémiologie et de Contrôle des maladies

EPIDEMIOLOGIE ET STATISTIQUE DE BASE (EPISTAT 1)

Département d’Epidémiologie et de Contrôle des maladies

Ce syllabus a été développé par l’unité d’épidémiologie et de contrôle des maladies à l’IMT : Marleen Boelaert, Greet

Dieltiens, Marie-Laurence Lambert, Francine Matthys, Bart Ostyn, Jo Robays, Patrick Van der Stuyft and Veerle Vanlerberghe.

Toute remarque peut être envoyée à Nadine Nuyts, nnuyts@itg.be

Dernière mise à jour : août 2009

Epistat 1 – Table de matières

CHAPITRE 1: INTRODUCTION À L’ÉPIDÉMIOLOGIE - MESURE DE LA FRÉQUENCE DE LA

MALADIE----------------------------------------------------------------------------------------------------------------------------7

I. Introduction ----------------------------------------------------------------------------------------------------------------8

II. Mesures de la fréquence de la maladie---------------------------------------------------------------------------9

A. Concepts de base: ratio, proportion, taux -----------------------------------------------------------------------9

B. Prévalence et incidence-------------------------------------------------------------------------------------------- 11

C. Éléments à prendre en compte dans le calcul de la mesure de l’incidence-------------------------- 14

D. Cas particulier de mesures d’incidence et de prévalence------------------------------------------------- 14

E. Relation entre l’incidence et la prévalence-------------------------------------------------------------------- 15

F. Usage des mesures d’incidence et de prévalence---------------------------------------------------------- 15

G. Indicateurs de base et utilisation de l’information disponible--------------------------------------------- 16

1. Mortalité --------------------------------------------------------------------------------------------------------------------16

2. L’espérance de vie ------------------------------------------------------------------------------------------------------17

3. Morbidité -------------------------------------------------------------------------------------------------------------------17

III. Description de la distribution de la maladie ------------------------------------------------------------------ 18

A. Caractéristiques de la personne --------------------------------------------------------------------------------- 18

B. Caractéristiques de lieu -------------------------------------------------------------------------------------------- 18

C. Caractéristiques de temps----------------------------------------------------------------------------------------- 18

CHAPITRE 1BIS: STANDARDISATION----------------------------------------------------------------------------------- 19

I. Problématique ---------------------------------------------------------------------------------------------------------- 20

II. Standardisation directe -------------------------------------------------------------------------------------------- 22

III. Standardisation indirecte ----------------------------------------------------------------------------------------- 25

IV. Standardisation directe ou indirecte ? ---------------------------------------------------------------------- 27

V. Contre-indications---------------------------------------------------------------------------------------------------- 28 Résumé--------------------------------------------------------------------------------------------------------------------- 30 Annexe---------------------------------------------------------------------------------------------------------------------- 31

CHAPITRE 2: VALIDITÉ ET REPRODUCTIBILITÉ D’UN TEST --------------------------------------------------- 33

I. Introduction : validité et reproductibilité----------------------------------------------------------------------- 34

II. Validité d'une mesure------------------------------------------------------------------------------------------------- 35

A. Concepts de base et définitions---------------------------------------------------------------------------------- 35

1. Sensibilité et spécificité ------------------------------------------------------------------------------------------------35

2. Valeur prédictive ---------------------------------------------------------------------------------------------------------38

3. Résumé---------------------------------------------------------------------------------------------------------------------38

4. Valeur prédictive et prévalence--------------------------------------------------------------------------------------39

5. Stabilité de la sensibilité et de la spécificité----------------------------------------------------------------------40

6. NB: Définition de cas clinique----------------------------------------------------------------------------------------41

7. Annexe: rapport de vraisemblance (RV)--------------------------------------------------------------------------42

B. Utiliser l’information pour la prise de décision.--------------------------------------------------------------- 43

1. Tests : diagnostic vs dépistage--------------------------------------------------------------------------------------43

2. Conséquences : faux positifs et faux négatifs-------------------------------------------------------------------44

III. Reproductibilité --------------------------------------------------------------------------------------------------------- 47

A. Définition --------------------------------------------------------------------------------------------------------------- 47

B. Mesurer la reproductibilité ----------------------------------------------------------------------------------------- 47

1. Méthodes inadéquates-------------------------------------------------------------------------------------------------47

2. Le coefficient de Kappa------------------------------------------------------------------------------------------------48

3. Kappa : points de discussion-----------------------------------------------------------------------------------------49

CHAPITRE 3 : TYPES D'ÉTUDES ÉPIDÉMIOLOGIQUES ---------------------------------------------------------- 51

I. Introduction -------------------------------------------------------------------------------------------------------------- 52

II. Etudes expérimentales ----------------------------------------------------------------------------------------------- 53

A. Définition --------------------------------------------------------------------------------------------------------------- 53

B. Principes --------------------------------------------------------------------------------------------------------------- 53

C. Avantages et inconvénients--------------------------------------------------------------------------------------- 54

Avantages---------------------------------------------------------------------------------------------------------------------54

Inconvénients ----------------------------------------------------------------------------------------------------------------55

III. Etudes d'Observation (non expérimentales)------------------------------------------------------------------ 56

A. Définition --------------------------------------------------------------------------------------------------------------- 56

B. Objectif------------------------------------------------------------------------------------------------------------------ 56

1. Étude épidémiologique descriptive---------------------------------------------------------------------------------56

2. Études épidémiologiques analytiques-----------------------------------------------------------------------------57

C. Les plans d'étude ---------------------------------------------------------------------------------------------------- 57

1. Études transversales (En Anglais : Cross-sectional study) -------------------------------------------------57

2. Études longitudinales (ou de suivi) (En Anglais : Longitudinal ou Follow-up Study)-----------------58

3. Études de cas témoins (En Anglais : Case-Control Study) -------------------------------------------------61

4. Études écologiques -----------------------------------------------------------------------------------------------------64

5. Vue d'ensemble des différences entre les études longitudinales, et cas témoins--------------------65

IV. Conclusion---------------------------------------------------------------------------------------------------------------- 65

CHAPITRE 4: STATISTIQUE DESCRIPTIVE---------------------------------------------------------------------------- 67

I. Introduction :------------------------------------------------------------------------------------------------------------- 68

II. Variables et echelles de mesure ---------------------------------------------------------------------------------- 69

A. Echelles nominales (ou catégorielles, ou qualitatives)----------------------------------------------------- 69

B. Echelles ordinales (qualitatives) --------------------------------------------------------------------------------- 69

C. Echelles numériques (quantitatives)---------------------------------------------------------------------------- 70

D. Quelques remarques sur les échelles de mesure----------------------------------------------------------- 70

III. Organiser et présenter des données univariées ------------------------------------------------------------ 71

A. Tableaux et distributions de fréquences ----------------------------------------------------------------------- 71

B. Suggestions pour la construction de tableaux pour des rapports--------------------------------------- 74

C. Graphiques ------------------------------------------------------------------------------------------------------------ 74

1. Diagramme en bâtons--------------------------------------------------------------------------------------------------74

2. Diagrammes en cercle (‘’Camembert’’) ---------------------------------------------------------------------------74

3. Histogrammes ------------------------------------------------------------------------------------------------------------75

4. Polygone -------------------------------------------------------------------------------------------------------------------76

D. Que chercher dans un histogramme ou un polygone ? --------------------------------------------------- 76

E. Conseils pratiques pour construire un graphique ----------------------------------------------------------- 77

IV. Résumer des données univariées -------------------------------------------------------------------------------- 78

A. Introduction ------------------------------------------------------------------------------------------------------------ 78

B. Mesure de tendance centrale------------------------------------------------------------------------------------- 78

1. La moyenne ---------------------------------------------------------------------------------------------------------------78

2. La médiane----------------------------------------------------------------------------------------------------------------79

3. Le mode --------------------------------------------------------------------------------------------------------------------79

4. Comparaison entre les mesures de tendance centrale ------------------------------------------------------80

C. Mesures de dispersion --------------------------------------------------------------------------------------------- 81

1. L'écart type ----------------------------------------------------------------------------------------------------------------82

2. Coefficient de variation-------------------------------------------------------------------------------------------------83

3. L'intervalle interquartile (IIQ)-----------------------------------------------------------------------------------------83

4. L'amplitude (ou étendue)----------------------------------------------------------------------------------------------84

5. Comparaison des mesures de dispersion------------------------------------------------------------------------84

6. Les valeurs extrêmes (‘outliers’)-------------------------------------------------------------------------------------85

7. Annexe: résultat d'un traitement informatique (EpiInfo) décrivant une distribution-------------------85

D. Représentation graphique des statistiques descriptives--------------------------------------------------- 86

1. Graphique branche et feuilles----------------------------------------------------------------------------------------86

2.

Histogramme (polygone de fréquence) ---------------------------------------------------------------------------87

3. Diagramme en boîte (diagramme en moustaches, « box plot » ou « box and whisker plot ») ---87

V. Réduction des données ---------------------------------------------------------------------------------------------- 89

VI. Visualiser et résumer des données bivariées ---------------------------------------------------------------- 90

A. Association entre 2 variables quantitatives ------------------------------------------------------------------- 91

B. Association entre une variable qualitative et une variable quantitative.------------------------------- 92

C. Association entre 2 variables qualitatives --------------------------------------------------------------------- 95

CHAPITRE 5 : INFÉRENCE--------------------------------------------------------------------------------------------------- 97

I. Introduction: le concept d'inférence----------------------------------------------------------------------------- 98

II. La distribution normale ---------------------------------------------------------------------------------------------- 99 A. Une courbe très utile en biologie : la distribution normale ------------------------------------------------ 99

B. La distribution normale standardisée ------------------------------------------------------------------------- 100

C. Une courbe très utile en statistique --------------------------------------------------------------------------- 102

1. La distribution d’échantillonnage---------------------------------------------------------------------------------102

2. Transformation des résultats d'échantillons en écart réduit----------------------------------------------103

3. Probabilité et écart réduit-------------------------------------------------------------------------------------------105

III. La logique des tests d'inférence -------------------------------------------------------------------------------- 106

A. Comment formuler une hypothèse? ----------------------------------------------------------------------------106

B. Comment déterminer le seuil de décision? -------------------------------------------------------------------108

C. Comment choisir le test approprié?-----------------------------------------------------------------------------109

D. Comment calculer la valeur d'un test? -------------------------------------------------------------------------109

E. A propos des probabilités liées aux valeurs du test --------------------------------------------------------110

F. Comment interpréter le test?--------------------------------------------------------------------------------------110

IV. La logique des intervalles de confiance---------------------------------------------------------------------- 112

V. Les outils ---------------------------------------------------------------------------------------------------------------- 113

A. Inférence pour un simple échantillon ------------------------------------------------------------------------- 113

1. Une moyenne-----------------------------------------------------------------------------------------------------------113

2. Une médiane------------------------------------------------------------------------------------------------------------114

3. Une proportion----------------------------------------------------------------------------------------------------------115

4. Un taux -------------------------------------------------------------------------------------------------------------------115

B. Inférence lorsqu'on compare deux échantillons ----------------------------------------------------------- 116

1. Comparaison de deux moyennes --------------------------------------------------------------------------------116

2. Comparaison de deux médianes ---------------------------------------------------------------------------------116

3. Comparaison de deux proportions -------------------------------------------------------------------------------117

4. Comparaison de deux taux -----------------------------------------------------------------------------------------119

5. I.C. autour d'une différence de risque ---------------------------------------------------------------------------120

6. I.C. autour d'une différence de taux------------------------------------------------------------------------------120

7. I.C. autour d'un rapport de risques ou d'un rapport des taux (RR)--------------------------------------121

CHAPITRE 6: VALIDITÉ D'UNE ÉTUDE ÉPIDÉMIOLOGIQUE -------------------------------------------------- 127

I. Concepts ---------------------------------------------------------------------------------------------------------------- 128

A. Principes de l'inférence------------------------------------------------------------------------------------------- 128

B. Erreur aléatoire ----------------------------------------------------------------------------------------------------- 129

C. Validité interne------------------------------------------------------------------------------------------------------ 130

D. Validité externe ----------------------------------------------------------------------------------------------------- 130

II. Biais de sélection----------------------------------------------------------------------------------------------------- 131

III. Biais d'information (ou d'observation)------------------------------------------------------------------------ 133

IV. La confusion ----------------------------------------------------------------------------------------------------------- 135

A. Conditions pour la confusion------------------------------------------------------------------------------------ 136

B. Méthodes pour contrôler la confusion dans le plan d'étude -------------------------------------------- 138

C. Méthodes pour contrôler la confusion pendant l'analyse------------------------------------------------ 138

CHAPITRE 6BIS : ANALYSE STRATIFIÉ : UNE TECHNIQUE POUR CONTRÔLER LES BIAIS DE CONFUSION--------------------------------------------------------------------------------------------------------------------- 139

I. Définition ---------------------------------------------------------------------------------------------------------------- 139

II. Que faire en cas de suspicion de confusion ? ------------------------------------------------------------- 140

III. La modification de l'effet------------------------------------------------------------------------------------------- 141

IV. Procédure de l’analyse stratifiée-------------------------------------------------------------------------------- 142

V. Calcul de la mesure pondérée de l'association entre facteur de risque et maladie selon la méthode de Mantel-Haenszel------------------------------------------------------------------------------------------ 143

VI. Résumé ------------------------------------------------------------------------------------------------------------------- 144

CHAPITRE 7 : LE CONCEPT DE RISQUE ----------------------------------------------------------------------------- 145

Introduction------------------------------------------------------------------------------------------------------------------ 146

I. Le risque absolu ------------------------------------------------------------------------------------------------------ 148

II. Les mesures d’association --------------------------------------------------------------------------------------- 149

A. Mesures de rapport ------------------------------------------------------------------------------------------------ 149

1. Rapport de risque------------------------------------------------------------------------------------------------------149

2. Le rapport des taux ---------------------------------------------------------------------------------------------------150

3. Le rapport des cotes (Odds ratio)---------------------------------------------------------------------------------151

B. Mesures de différence -------------------------------------------------------------------------------------------- 152

1) a) La différence de risque ou le risque attribuable-----------------------------------------------------------152 1) b) Le pourcentage de risque attribuable dans les personnes exposées------------------------- 153 2) a) Risque attribuable dans la population (RAP) -------------------------------------------------------- 153 2) b) La Fraction de risque Attribuable dans la Population (FAP)------------------------------------- 155

Chapitre 1: Introduction à l’épidémiologie Mesure de la fréquence de la maladie

Ce chapitre est adapté de:

C.H.Hennekens and J.E.Buring. Epidemiology in Medicine. Little Brown and Company. Boston.1987. Chapter I.4.

OBJECTIFS DU CHAPITRE 1

Après avoir lu ce chapitre, vous devriez être capables de:

1. Utiliser de façon appropriée les concepts de prévalence et d'incidence, ainsi que diverses mesures assimilées (taux d'attaque, taux de morbidité)

2. Expliquer la relation entre incidence et prévalence

3. Évaluer d'un œil critique la collecte systématique de données

I.

INTRODUCTION

L'épidémiologie est "l'étude de la distribution et des déterminants de la fréquence de la maladie dans les populations humaines", dans le but d'améliorer l'état de santé de cette population. Ces trois concepts interdépendants – distribution, déterminants et fréquence – recouvrent l’ensemble des principes et méthodes épidémiologiques.

La mesure de la fréquence de la maladie concerne la quantification de la présence ou de la survenue de la maladie. La disponibilité de telles données est une condition préalable à toute recherche visant à étudier les modalités d'apparition de la maladie dans des populations humaines.

La distribution de la maladie considère des questions telles que : qui est malade dans la population, où et quand la maladie est-elle apparue (TLP: Temps, Lieu, Personnes). La connaissance d'une telle distribution est essentielle pour décrire la maladie ainsi que pour formuler des hypothèses concernant de possibles facteurs causaux et / ou de prévention.

Les déterminants de la maladie découlent des deux premiers puisque la connaissance de la fréquence et de la distribution de la maladie sont nécessaires pour tester une hypothèse épidémiologique.

Il est tout d'abord nécessaire de mesurer la fréquence d’une maladie (ou d'autres variables d’intérêt). De telles mesures sont les outils de base pour formuler et tester des hypothèses. Elles permettent la comparaison de la fréquence d’une maladie dans différentes populations, ou chez différents individus présentant une caractéristique particulière au sein de la population. Les diverses informations produites auront des usages multiples. Certaines pourront servir à des gestionnaires de santé, d'autres à la recherche en épidémiologie.

II.

MESURES DE LA FREQUENCE DE LA MALADIE

La plus simple des mesures de fréquence de la maladie est le comptage des individus atteints. Une telle information est essentielle pour les planificateurs de santé et les gestionnaires qui souhaitent déterminer l'allocation des ressources sanitaires dans une communauté particulière.

Le tableau ci-dessous présente le nombre de cas d'hépatites C diagnostiquées dans deux villes. Dans la ville A, 58 nouveaux cas ont été rapportés durant l'année 1995. Dans la ville B, il y eut 35 cas pendant les années 1994 et 1995. Cette information pourrait être suffisante aux gestionnaires de santé des deux cités pour planifier le personnel et les services nécessaires au traitement des individus malades.

Données hypothétiques sur la fréquence de l'hépatite C dans les deux villes

 

Nouveaux cas

Période

Population

d'hépatite

Ville A

58

1995

25.000

Ville B

35

1994-1995

7.000

Taux annuel d'apparition de l'hépatite:

Ville A:

58/25.000/1an =

232/100.000/an

Ville B:

35/7.000/2ans =

250/100.000/an (17.5/7.000/1an)

Au vu du simple nombre des cas, on pourrait penser à tort que l'hépatite est plus fréquente dans la ville A que dans la B. Afin de comparer la fréquence dans les deux villes, il faut tenir compte de la taille de leurs populations respectives et de la durée de chaque période d'enregistrement. Dans cet exemple, le taux annuel d'apparition de l'hépatite est de 58 pour 25.000 dans la ville A et de 17,5 pour 7.000 dans la ville B (35 pour 7.000 en deux ans). En général, on utilise la même unité de population au dénominateur pour faciliter la comparaison directe des taux. On l'exprime d'habitude sous la forme d'un multiple de 10 (100, 1000, 10.000, 100.000, ou 1 million).

Il apparaît donc ainsi clairement que la fréquence d'apparition de l'hépatite C est légèrement plus élevée dans la ville B. L'utilisation d’'unités semblables (population, temps) facilite les comparaisons directes des fréquences de maladies entre des populations différentes.

A. Concepts de base: ratio, proportion, taux

En épidémiologie, on utilise trois classes principales de paramètres mathématiques: le ratio, la proportion et le taux.

Le ratio est obtenu par la simple division d'une quantité par une autre sans qu'il y ait de relation particulière entre le numérateur et le dénominateur. Il n'est pas nécessaire que le numérateur soit inclue dans le dénominateur. Ils peuvent tous les deux avoir des unités différentes.

ratio =

x

y

Exemples de ratios

- Nombre d'hommes / nombre de femmes (sex ratio)

- Les cas observés / les cas attendus

- Le nombre d'habitants / centre de santé

- Nombre de morts maternels/cent mille naissances vivantes

- Nombre de mort-nés / mille naissances vivantes

La proportion est un type particulier de ratio où le numérateur fait partie du dénominateur. Les deux doivent évidemment avoir les mêmes unités. Ce ratio considéré comme une partie du total est souvent exprimé sous la forme de pourcentage.

proportion

=

a

a

+

b

Exemples de proportions

- Nombre de femmes de plus de 50 ans qui ont subi une hystérectomie / toutes les femmes de plus de 50 ans

- Les enfants de 12 à 23 mois immunisés contre la polio / l'ensemble des enfants de 12 à 23 mois

- Nombre de femmes enceintes séropositives venues en consultation prénatale / toutes les femmes enceintes suivies en CPN

Un taux au sens strict est un paramètre pour lequel existe une relation entre le numérateur et le dénominateur (événement / unités à risque pour cet événement). Plus spécialement le dénominateur comprend une notion de temps.

Exemples de taux

- Les cas de tuberculose diagnostiqués par 100.000 habitants pendant un an

- Le nombre de nouveaux cas de choléra par 1000 réfugiés pendant une semaine

Malheureusement, le terme "taux" est souvent utilisé pour désigner bon nombre de mesures démographiques et épidémiologiques qui peuvent être tout aussi bien des vrais taux que des ratios ou des proportions. Considérons par exemple le cas du taux de mortalité infantile.

nombre de décès apparus en une année chez les enfants de moins d'un an

nombre de naissances vivantes pendant cette même année

Ceci n'est, strictement parlant, pas un taux mais un ratio. Puisque ces termes sont souvent utilisés l'un pour l'autre, il est important d'être bien conscient de la façon dont chaque mesure est en fait définie et calculée.

Lorsque l'on établit des mesures de fréquences de maladie, il faut être très précis dans la définition du numérateur et du dénominateur. On doit, par exemple, clairement spécifier si l'on parle d'un nombre d'événements ou d'individus.

Exemples

Dans une étude sur l'utilisation de services de santé privés, l'unité analysée peut être:

- le patient visitant une structure de santé

- les visites à une structure de santé (le même patient peut y consulter plusieurs fois!)

Lors du calcul de la fréquence des effets secondaires d'un médicament, on peut choisir comme dénominateur:

- le nombre total des traitements

- ou le nombre total des individus recevant le traitement.

Dans une étude sur le trachome, l'unité d'analyse pourrait aussi bien être l'œil que le patient.

B. Prévalence et incidence

Les mesures de fréquence de la maladie les plus utilisées en épidémiologie peuvent être classées en deux grandes catégories: la prévalence et l'incidence. La prévalence mesure la proportion des individus d'une population, qui ont la maladie à un instant précis.

P =

Exemples

Le nombre de cas d'une maladie à un instant donné

total de la population à ce moment précis

En 1994, tous les 434 habitants de Fasila Bime (Soudan), furent l'objet d'un dépistage de la maladie du sommeil. On détecta 27 cas positifs. La prévalence de la maladie du sommeil était donc de 27/434 = 6,2%.

Le 31 décembre 1992, il y avait 145 patients enregistrés, traités pour tuberculose au centre de santé d'Agdao, aux Philippines. La population couverte par ce centre était de 45.000 personnes. La prévalence des tuberculoses (traitées) était donc de

145/45.000=322/100.000.

Les termes "taux de prévalence" et "prévalence" sont souvent utilisés l'un pour l'autre quoique ce dernier soit, strictement parlant, une proportion et non un taux. La prévalence peut être considérée comme l'état de la maladie dans une population à un moment donné. Celui-ci fait référence soit à un moment précis du calendrier, soit à un point précis dans le cours des évènements, qui peut varier d'une personne à l'autre. On peut prendre par exemple la survenue de la ménopause ou de la puberté ou encore la prévalence d'une infection de la plaie opératoire trois jours après l'intervention.

L’incidence est définie par le nombre de nouveaux événements ou cas de maladie qui se développent dans une population d’individus à risque pendant un intervalle de temps déterminé. La prévalence mesure un état tandis que l’incidence mesure le changement d'un état (en bonne santé) vers un autre état (malade). Il existe deux sortes de mesures d’incidence : l’incidence cumulative et le taux d’incidence ou densité.

L’incidence cumulative (IC) est la proportion de gens qui tombent malades pendant une période de temps définie.

IC =

Nombre de nouveaux cas de maladies pendant une période de temps

Total de la population à risque au début de cette période de temps

L’incidence cumulative donne une estimation de la probabilité, ou risque qu’un individu développe une maladie pendant une période de temps déterminée. C’est une proportion mais elle est parfois appelée "taux d’incidence cumulative".

Exemples

Dans une étude associant contraception orale et bactériurie, 482 utilisatrices âgées de 16 à 49 ans sans bactériurie furent identifiées. Pendant les trois années suivantes, 27 d’entre elles développèrent une bactériurie. L’incidence cumulative de la bactériurie parmi les utilisatrices de contraception orale fut donc de 27 sur 482, soit 5,6 % pendant cette période de trois ans.

La période de temps considérée doit être clairement précisée lors du calcul de l’IC. Une incidence cumulative de bactériurie de 5,7% est différente si elle concerne une période de 6 mois ou une période de dix ans.

Déterminer une incidence cumulative suppose que toute la population à risque au début de l’étude a été suivie pendant toute la durée de l'étude. Fréquemment cependant, la durée du suivi n'est pas uniforme pour tous, certains sujets peuvent être perdus dans le décours de l'étude.

Le taux d’incidence (TI), (appelé aussi densité d'incidence), est une estimation plus précise de l'occurrence de maladie dans la population.

TI =

nombre de nouveaux cas d’une maladie pendant une période de temps donnée

Total des personnes à risque observées x temps d’observation

Ici aussi, comme dans toutes les mesures d’incidence, le numérateur est le nombre de nouveaux cas (ou événements) dans la population durant une période donnée. Le dénominateur, cependant, devient la somme des temps d'observation pour chaque individu à risque ou encore la somme du temps que chaque personne demeure sous observation et libre de la maladie considérée. Il est essentiel de préciser l’unité de temps la plus pertinente. Le dénominateur pourra par exemple avoir un format de personnes-jours, personnes-mois, personnes-années, etc.

Exemple: Cinq enfants sont suivis pendant 5 ans après la naissance pour déterminer le taux
Exemple:
Cinq enfants sont suivis pendant 5 ans après la naissance pour déterminer le taux
d’incidence de la rougeole.
Enfant
Contribution au numérateur
(0= pas de rougeole,
1= rougeole)
Contribution au dénominateur
(années d’observation)
A
0
5
B
0
1
(mort d’un accident de circulation après 1 an)
C
1
3
(rougeole à 3 ans)
D
1
2
(mort de la rougeole à l’âge de 2 ans)
E
0
4
(mort de diarrhée à l’âge de 4 ans)
Total
2
15
Le taux d’incidence = 2/15 personnes-années ou 0,13/personnes-années ou 13/100
personnes-années.
Child history
A
5
B
1
C
3 -> MEASLES
D
2-> MEASLES
E
4
0123456
Years
L’hypothèse sous-jacente est que l’observation de 16 personnes pendant un an est
équivalente à l’observation de 8 personnes pendant 2 ans ou de 32 personnes pendant 6
mois, soit : 16 personnes-années d’observation.
Exemple
Child

Dans une étude de cohorte étudiant l'association entre l’utilisation d’hormones de substitution après la ménopause et le risque de maladie coronarienne, 90 cas furent diagnostiqués parmi 32.317 femmes ménopausées lors d’un suivi de 105.786 personnes- années. Le taux d’incidence de la maladie coronarienne parmi les participantes à cette étude est de 90/105.786,2 soit: 85/100.000 personnes-années.

Il existe une association mathématique entre le taux d’incidence et l’incidence cumulative (le risque individuel de développer la maladie pendant une certaine période de temps).

IC = 1 – e -TIxΔt

Cette formule suppose que le taux d’incidence est stable pendant tout le temps de l’étude. Si l’IC de la maladie est bas (inférieure à 0,1), ou que le temps d’observation est court, la formule peut être simplifiée par l’approximation suivante :

IC = TI x Δt

L’incidence cumulative est approximativement le produit du taux d’incidence par la période de temps considérée.

C. Éléments à prendre en compte dans le calcul de la mesure de l’incidence

La définition précise du dénominateur est essentielle tant pour l'exactitude que la clarté. Le dénominateur d’une mesure d’incidence doit, en théorie, contenir seulement ceux qui sont considérés "à risque" de développer la maladie étudiée. En conséquence, ceux qui font la maladie en étude ou l'ont déjà faite auparavant devraient en principe être exclus du dénominateur. Il en est de même des personnes qui ne peuvent développer la maladie pour des raisons telles que l’âge, le sexe, une immunisation, etc. La population à risque du cancer du col ne comprend évidemment pas les hommes. La rougeole ou la perte des deux jambes ne peut arriver qu’une seule fois !

D. Cas particulier de mesures d’incidence et de prévalence

On peut considérer que toutes les mesures épidémiologiques sont des types particuliers d’incidence ou de prévalence.

Nom

Type

Numérateur

Dénominateur

Taux de morbidité

Incidence

Nouveaux cas de maladie

Total des personnes- années observées dans la population à risque

Taux de mortalité

Incidence

Nombres de décès toutes causes confondues

Taux de mortalité spécifique

Incidence

Nombre de décès liés à une cause spécifique

Taux de létalité

Incidence

Nombre de décès liés à une maladie

Nombre de cas de cette maladie

(cumulative)

Taux d’attaque

Incidence

Nombre de cas d’une maladie

Total de la population à risque observée pendant une période limitée de temps (par exemple une épidémie)

(cumulative)

Taux de malformations congénitales

Prévalence

Nombre de bébés nés avec une malformation

Nombre de naissances vivantes

Exemple

Aux États-Unis, en 1982, il y eut un total de 1.973.000 décès parmi une population de 231.534.000 individus. Cela correspond à un « taux » général de mortalité (incidence cumulative) de 852 par 100.000 habitants et par an. Il y eut 1807 décès attribués à la tuberculose ce qui donne un « taux » (incidence cumulative) de mortalité spécifique de 7,8 par million et par an.

E. Relation entre l’incidence et la prévalence

La prévalence et l’incidence sont liées étroitement. La prévalence dépend à la fois du taux d’incidence et de la durée de la maladie. Si, mais ceux qui en sont affectés le sont pendant une longue période, la proportion de la population qui présente la maladie à un moment donné peut être élevée par rapport à l’incidence. Réciproquement, même si l’incidence est élevée, mais que la durée est courte (par guérison ou décès), la prévalence sera basse comparée à l’incidence.

Exemples

Le taux d’incidence du diabète de l’adulte est bas dans les pays occidentaux, mais la prévalence est proportionnellement élevée parce que le diabète n’est ni curable ni très mortel.

Pour la fièvre hémorragique d’Ebola, la mortalité varie entre 50 et 90% et la durée entre le début des symptômes et le décès est d’habitude entre 7 et 14 jours. Dans ce cas, la prévalence sera basse par rapport à l’incidence.

Donc, si l'on constate une variation de la prévalence dans le temps, cela peut être dû à une variation de l’incidence ou un changement dans la durée de la maladie, ou les deux. L’introduction d’une nouvelle thérapeutique qui prévient la mort, mais ne guérit pas, aura pour effet d’augmenter la prévalence de la maladie. De même, une diminution de la prévalence peut résulter d’une diminution de la durée de la maladie grâce à une guérison plus rapide.

Dans une situation stable où le taux d’incidence (TI), et la durée moyenne de la maladie (D) sont constants dans le temps; et pour autant que la prévalence (P) de la maladie dans la population soit basse (moins de 10%), alors incidence et prévalence sont liés comme suit:

P = TI x D

F. Usage des mesures d’incidence et de prévalence

Comme la prévalence représente les cas existants à un moment donné et l’incidence mesure la vitesse avec laquelle des nouveaux cas apparaissent, chaque mesure peut être utilisée pour des différents objectifs. La mesure de la prévalence est surtout utile aux gestionnaires de soins de santé pour évaluer l’impact d’une maladie chronique dans une communauté et pour planifier les soins médicaux nécessaires aux individus touchés (personnel, nombre de lits d’hôpital, …).

Le taux d’incidence peut être utilisé pour évaluer l’impact, en termes de santé publique, des maladies aiguës ainsi que pour le suivi d'une intervention. Est-ce que le programme de vaccination a réduit efficacement l’incidence de la rougeole ? Est-ce que le programme de contrôle du vecteur a réussi à réduire l’incidence de la maladie du sommeil ?

Les études concernant les déterminants de la maladie peuvent rarement se baser sur des données de prévalence. Par exemple lorsqu’une association est trouvée entre une maladie et un facteur de risque supposé, il est impossible de savoir lequel vient en premier et la direction de la causalité. Une étude de prévalence a montré que des patients souffrant de maladie coronarienne pratiquaient moins d'exercice physique régulier que ceux sans cette affection. Peut-on conclure que l'exercice protège contre la maladie coronarienne ? Ou bien encore que les gens qui en sont atteints simplement ne se sentent pas capables de tels exercices ?

G. Indicateurs de base et utilisation de l’information disponible

L'étude de la santé d’une population commence en général par les informations disponibles en routine.

1. Mortalité

Dans beaucoup de pays l’enregistrement des décès et de leurs causes se fait sur un certificat de décès qui contient aussi des informations sur l’âge, le sexe, la date de naissance et le domicile. Avec ces données, on peut déjà calculer des taux de mortalité bruts et ajustés.

L’utilité des données dépend de beaucoup de facteurs dont l'exhaustivité des enregistrements et l'exactitude avec laquelle les causes de la mort sont attribuées. Malheureusement, dans de nombreux pays, les statistiques de base de la mortalité ne sont pas encore disponibles, en général parce que les moyens ne permettent pas l’enregistrement systématique des décès. Disposer de données précises sur les décès est une priorité pour les épidémiologistes. Une procédure de classification internationalement acceptée se retrouve dans « La classification internationale des maladies (OMS, 1992) » qui est mise à jour périodiquement.

Le taux de mortalité infantile est couramment utilisé comme indicateur du niveau de santé des populations. On se base sur la l’hypothèse qu’il est particulièrement sensible aux changements socio-économiques et aux actions sanitaires. Ce taux varie énormément. En 1985, il était de 7,8/1000 naissances vivantes en France mais de 152/1000 naissances vivantes en Éthiopie (OMS, 1990). Les taux élevés doivent alerter les professionnels de la santé sur la nécessité de mesures à grande échelle.

Taux de mortalité infantile =

Le nombre de morts dans l’année d’enfants de < 1 an

x 1000

Nombre de naissances vivantes dans la même année

Le taux de mortalité maternelle (ce n’est pas vraiment un taux mais plutôt un ratio), est un important indicateur souvent négligé jusqu’il y a peu parce qu’il est difficile à calculer précisément. Il varie considérablement d’une valeur d’environ 10 pour 100.000 naissances vivantes en Europe à plus de 1000 pour 100,000 naissances vivantes en Afrique.

Taux de mortalité maternelle =

Le nombre de décès maternels en un an

Total des naissances la même année

(x 10 5 )

Selon l’OMS : « le décès d'une femme survenu au cours de la grossesse ou dans un délai de 42 jours après sa terminaison, quelle qu'en soit la durée ou la localisation, pour une cause quelconque déterminée ou aggravée par la grossesse ou les soins qu'elle a motivé, mais ni accidentelle ni fortuite. »

2. L’espérance de vie

L’espérance de vie est une autre mesure globale de l’état de santé de la population fréquemment utilisée. Elle est définie comme le nombre moyen d’années qu’un individu d’un certain âge peut espérer vivre en considérant que les taux de mortalité actuels restent constants. Il n’est pas toujours facile d’interpréter les raisons des différences d'espérance de vie d'un pays à un autre, car cela dépend de la mesure. En tant que mesure globale de l’état de santé d'une population, attache une plus grande importance aux décès survenus dans l’enfance, qu’à ceux chez les personnes plus âgées (donc difficile de comparer l’espérance de vie à la naissance, et l’espérance de vie à 20 ans).

3. Morbidité

Dans beaucoup de pays, certaines données de morbidité sont collectées pour satisfaire des exigences légales, par exemple les maladies à déclaration obligatoire. Cette déclaration dépend du fait que les malades consultent effectivement pour leur problème, de la qualité des diagnostics, et de la transmission effective de l'information aux autorités de santé publique. Bien souvent de nombreux cas ne sont jamais enregistrés.

D’autres sources d’information sur la morbidité sont les données d'admissions et de sorties hospitalières, de consultations de 1 er, de 2 nd niveaux, de services spécialisés (les traitements d’accidents par exemple) ainsi que les registres des maladies spécifiques telles que les cancers ou les malformations congénitales. Les taux d’admission à l’hôpital sont influencés par d'autres facteurs que la morbidité de la population (comme la disponibilité des lits, les politiques d’admission, les facteurs sociaux, etc.). Dans certains cas, Il n'est pas possible de séparer les admissions des réadmissions ni de déterminer la population couverte par un hôpital (le dénominateur).

Comme l’enregistrement en routine des données sur la morbidité présente de nombreuses limites, beaucoup d'études de morbidité se basent sur la récolte de nouvelles données. Il s'agira de les collecter en se servant de questionnaires adaptés et de méthodes de dépistage spécifiques.

III.

DESCRIPTION DE LA DISTRIBUTION DE LA MALADIE

La distribution de la maladie est étudiée selon des caractéristiques de temps, de lieu et de personne (TPP). La connaissance d’une telle distribution est essentielle pour décrire la maladie ainsi que pour formuler des hypothèses concernant d'éventuels facteurs causaux ou protecteurs.

A. Caractéristiques de la personne

La survenue des maladies et des décès est fortement associée à l’âge et dans beaucoup de cas au sexe. Toute description élémentaire de la maladie doit au minimum inclure une répartition par âge et par sexe. Il existe un ensemble d’autres caractéristiques utiles à étudier tels que les facteurs sociodémographiques comme les groupes ethniques, religieux, socio- économiques (revenus, éducation, profession, …), le statut familial, etc.

B. Caractéristiques de lieu

Quand on parle de lieu, on sous-entend une notion géographique mais il peut aussi être défini par les conditions environnementales et ses habitants. Les caractéristiques du lieu peuvent inclure des facteurs climatiques (saisons sèches ou pluvieuses), l’urbanisation, la densité de population, l’organisation du secteur de la santé, les richesses, etc. La notion de lieu est particulièrement importante en surveillance épidémiologique. Le relevé cartographique peut être une technique très utile pour étudier les liens entre une maladie et sa répartition géographique.

C. Caractéristiques de temps

Périodicité :

Il faut toujours chercher une possible périodicité des phénomènes morbides : variations saisonnières de la malaria, les cycles d’apparition de la méningite, etc. Ces variations périodiques peuvent prendre des mois, un an ou même plusieurs années. La période d’observation doit dépasser le temps d’un cycle avant de pouvoir tirer des conclusions sur un éventuel changement du modèle épidémiologie d’une maladie (par exemple les variations épidémiques de la rougeole endémique).

Variabilité :

Les termes endémique et épidémique font référence à la variabilité de la fréquence d’un phénomène de santé dans le temps (surtout utilisé pour les maladies infectieuses). En situations endémiques, l’incidence demeure plus ou moins stable dans le temps et dans des limites connues. Une épidémie est définie comme une augmentation significative par rapport au niveau endémique considéré comme le niveau "normal" de l'incidence dans la population (augmentation des cas attendus, étant données les variations saisonnières ou autres considérées comme "normales").

Les changements séculaires (tendances):

Cette notion concerne l'évolution d'un phénomène sur une très longue période de temps (décade, génération, siècle, etc.). On peut donner comme exemple la mortalité infantile en Europe ou la disparition de la lèpre en Norvège. Les causes des changements séculaires sont souvent nombreuses et interdépendantes comme par exemple les changements des conditions économiques, de vie et sanitaires, nutritionnelles, etc. La connaissance des tendances est importante lorsque l'on doit évaluer l'impact des programmes de santé.

Chapitre 1bis: Standardisation

OBJECTIFS POUR LE CHAPITRE 1bis :

Après avoir lu ce chapitre, vous devriez être capables de:

1. Reconnaître la relevance de standardisation

2. Utiliser les deux techniques de standardisation

3. Expliquer les avantages et les limitations des deux techniques

4. Connaître les contre-indications de standardisation

I.

PROBLEMATIQUE

En 1962, le taux brut de mortalité en Suède était plus élevé qu’au Panama (9,8 versus 7,7 par 1000 personnes-années, Tableau 1), malgré le fait que le niveau de vie en Suède est considéré plus élevé qu’au Panama. Pourtant, les taux de mortalité par âge étaient plus hauts au Panama qu’en Suède dans toutes les strates d’âge (Tableau 1). Comment expliquer ces ‘contradictions’ ?

 

1962

 

Suède

 

Panama

 

Population

Décès

Taux de

Population

Décès

Taux de

 

mortalité

 

mortalité

0

– 29 ans

3.145.000

3.523

1,1

741.000

3.904

5,3

30

– 59 ans

3.057.000

10.928

3,6

275.000

1.421

5,2

>

59 ans

1.297.000

59.104

45,6

59.000

2.956

50,1

 

TOTAL

7.499.000

73.555

9,8

1.075.000

8.281

7,7

Taux de mortalités : par 1000 personnes-années (pa)

Tableau 1 : Taux de mortalité en Suède et au Panama, 1962

Cette ‘contradiction’ est due aux faits que, primo, les taux de mortalité augmentent avec l’âge (Tableau 1), et que, secundo, la structure d’âge n’est pas la même dans les deux populations : la population de Panama est plus jeune que celle de la Suède (tableau 2). Ainsi, en calculant les taux bruts de mortalité, la strate jeune de la population avec son taux de mortalité relativement bas a une influence plus grande au Panama qu’en Suède.

 

1962

 

Suède

Panama

 

Population

% de la population totale

Population

% de la population totale

0

– 29 ans

3.145.000

42%

741.000

69%

30

– 59 ans

3.057.000

41%

275.000

26%

>

59 ans

1.297.000

17%

59.000

5%

 

TOTAL

7.499.000

100%

1.075.000

100%

Tableau 2 : Structure d’âge en Suède et au Panama, 1962

Le taux brut de mortalité est réel et reflète la mortalité dans une population spécifique. Cependant, pour la comparaison de la mortalité de plusieurs populations, les taux bruts ne peuvent pas être utilisés, si ces populations diffèrent quant à l’âge, et si les taux spécifiques par âge varient avec l’âge. Dans ce contexte on dit que l'âge est un ‘facteur de confusion’.

Les taux spécifiques par âge (en anglais : Age Specific Mortality Rate ou ASMR) ne sont pas confus par l’âge, mais il est lourd et peu pratique de baser la comparaison de plusieurs populations sur toute une gamme des taux spécifiques.

Ce qu’on cherche c’est une mesure sommaire de mortalité qui prend en compte les différences dans la structure d’âge. Ceci peut se faire par standardisation. La standardisation est une réponse à la question : comment la mortalité serait-elle si la population de l’étude avait la même structure d’âge comme la population-type ?

La standardisation existe en deux variations : la standardisation directe et indirecte. La différence principale entre les deux techniques est que dans la standardisation directe, la structure d’âge de la population-type est utilisée (« importée » et appliquée aux taux spécifiques par âge) tandis que dans la standardisation indirecte, les taux spécifiques par âge de la population standard sont utilisés (« importés » et appliqués à la structure d’âge de la population d’étude)

à la structure d’âge de la population d’étude) NB : 1. Il n’importe pas si les

NB :

1. Il n’importe pas si les populations à comparer diffèrent en ce qui concerne la place (Suède. /. Panama) et/ou le temps (1990. /. 2000) et/ou l’exposition à un facteur de risque (fumeurs ./. non-fumeurs).

2. Il n’importe pas si le caractéristique à comparer c’est la mortalité ou un autre caractéristique de la population.

3. Il n’importe pas si c’est l’âge ou une autre variable qui joue le rôle d’un facteur de confusion.

II. STANDARDISATION DIRECTE

Principe et calcul

On choisit une population-type. On multiplie les taux spécifiques par âge de la population d’étude (t xi ) avec les effectifs des groupes d’âge de la population-type (n ti ) et obtient ainsi les nombres de cas attendus dans la population d’étude si la structure d’âge de la population étudiée était comme dans la population-type. La somme de cas attendus divisée par le nombre total de la population-type (N t ) donne le taux standardisé de mortalité (T SD ). Si on applique cette méthode à deux populations d’étude, un rapport des taux standardisés de mortalité peut être calculé, aussi appelé ‘rapport comparatif de mortalité’ (RCM) ou ‘indice comparatif de mortalité’ (ICM). Le terme ‘comparatif’ indique que le paramètre a été calculé par standardisation directe.

T

SD

=

g

i = 1

t

xi

×

n

ti

N

t

Exemple

avec g = nombre de groupes d’âge

Ici, la population-type est une population fictive. Le résultat de cette standardisation : Au Panama, le taux de mortalité standardisé est 50% plus élevé qu’en Suède.

 

Population

 

Population

 

type

 

Suède

type

 

Panama

Population

Taux de

Décès

Population

Taux de

Décès

mortalité

attendus

mortalité

attendus

0 – 29 ans

56.000

x

1,1

=

63

56.000

x

5,3

=

295

30 – 59 ans

33.000

x

3,6

=

118

33.000

x

5,2

=

171

> 59 ans

11.000

x

45,6

=

501

11.000

x

50,1

=

551

TOTAL

100.000

 

682

100.000

 

1.017

Taux standardisé

 

682 / 100.000 =

 

1.017 / 100.000 =

de mortalité

6,8 par 1.000 pa

10,2 par 1.000 pa

 

10,2 / 6,8 =

 

Rapport des taux standardisés de mortalité

 

1,5

Tableau 3 : Standardisation directe avec population-type fictive

Les taux standardisés ne sont pas de taux réels, mais fictifs qu’on ne calcule qu’avec un seul objectif : la comparaison d’une population avec une autre population.

Donc, dans la standardisation directe, les taux de mortalité par âge proviennent de la population d’étude, et sont ensuite appliqués à la structure d’âge de la population standard.

Population X Population Y Taux de mortalité par âge Taux de mortalité par âge Structure
Population X
Population Y
Taux de mortalité
par âge
Taux de mortalité
par âge
Structure d’âge
Population-type
Décès attendus
Décès attendus
Taux standardisé de mort.
Taux standardisé de mort.
Rapport des taux standardisés de mortalité =
‘Rapport comparatif de mortalité’

Graphique 1 : Le principe de la standardisation directe

Choix de la population-type

N’importe quelle population peut servir comme population-type :

1. Une des populations d’étude à comparer (p.e. la population de Suède).

2. La somme des populations à comparer (p.e. la population de Suède + la population de Panama).

3. Une autre population réelle, p.ex. la population mondiale

4. Une population fictive

Comme les taux standardisés sont des taux pondérés, avec les poids dérivés de la population-type, chaque population-type produira des taux standardisés différents, et souvent un rapport des taux standardisés différent. La différence entre les résultats des différents standards est particulièrement prononcée si la distribution d’âge des deux populations d’étude se croise.

Par exemple, si on standardise la mortalité en Suède et au Panama en utilisant la somme des deux populations comme population-type, les taux standardisés ainsi que le rapport des taux standardisés sont différents de ce qu’on avait calculé avant (tableau 4) : dans ce cas, le rapport des taux de mortalité standardisés s’élève à 1.4 en comparant Panama avec Suède ; on pourrait dire aussi : le taux de mortalité standardisé est 40% plus élevé au Panama qu’en Suède.

 

Population

 

Population

 

type

 

Suède

type

 

Panama

Population

Taux de

Décès

Population

Taux de

Décès

mortalité

attendus

mortalité

attendus

0 – 29 ans

3.886.000

x

1,1

=

4.353

3.886.000

x

5,3

=

20.474

30 – 59 ans

3.332.000

x

3,6

=

11.911

3.332.000

x

5,2

=

17.217

> 59 ans

1.356.000

x

45,6

=

61.793

1.356.000

x

50,1

=

67.938

TOTAL

8.574.000

 

78.057

8.574.000

 

105.629

Taux standardisé

 

78.057 / 8.574.000 =

 

105.629 / 8.574.000 =

de mortalité

9,1 par 1.000 pa

12,3 par 1.000 pa

   

12,3 / 9,1 =

Rapport des taux standardisés de mortalité

1,4

Tableau 4 : Standardisation directe, population-type : la somme de Suède et Panama

L’utilisation d’une population standard ‘idéale’, mise en disposition par l’OMS etc., est recommandée pour rendre les comparaisons comparables. Il y a plusieurs standards idéals, p.e. la population standard européenne, la population standard mondiale etc.

III. STANDARDISATION INDIRECTE

Principe et calcul

On choisit une population-type. On multiplie les taux spécifiques par âge de la population- type (t si ) avec les effectifs des groupes d’âge de la population d’étude (n xi ) et obtient ainsi les nombres de cas attendus dans la population d’étude si les taux spécifiques par âge dans la population d’étude étaient comme dans la population-type. La somme des cas observés dans la population d’étude C x divisée par la somme des cas attendus dans la population d’étude donne le rapport standardisé des mortalités (RSM).

RSM

C

x

= g

i = 1

t

si

× n

xi

, avec g = nombre de groupes d’âge

Donc, dans la standardisation indirecte, la structure d’âge provient de la population d’étude, qui est alors appliquée aux taux de mortalité par âge de la population-type.

Population A Population B Structure d’âge Structure d’âge Taux par âge Population-type Décès attendus
Population A
Population B
Structure d’âge
Structure d’âge
Taux par âge
Population-type
Décès attendus
Décès attendus
Rapport standardisé
de mortalité
Rapport standardisé
de mortalité

Exemple graphique 2 : Le principe de la standardisation indirecte

Exemple

Ici, la Suède sert comme population-type. Le résultat de cette standardisation indirecte : Au Panama, le rapport standardisé de mortalité s’élève à 1.84 par rapport à la Suède (tableau

5).

   

VOIRE TABLE 1

 

Panama :

   

Panama :

   

structure d’âge de la population

 

Population

type =

 

structure d’âge de la population

 

Panama

Suede

 
   

Décès

 

Taux de

Déces

Population

Taux de

mortalité

(par 1000 pa)

attendus

Population

mortalité

(par 1000

pa)

attendus

0 – 29 ans

741000

x

1,1

=

830

741000

x

5,3

= 3904

30 – 59ans

275000

x

3,6

=

983

275000

x

5,2

= 1421

> 59 ans

59000

x

45,6

=

2689

59000

x

50,1

= 2956

TOTAL

1075000

   

4502

1075000

 

8281

 

Pas de taux de mortalité standardisé disponible !!

 
 

Décès attendus: 4502

Décès observés: 8281

 

Rapport standardise de mortalité (RSM)

 

8281 / 4502 = 1,84 ou 184%

Tableau 5 : Standardisation indirecte avec la Suède comme population-type

Choix de la population-type

Les rapports standardisés de mortalité (RSM) sont surtout utilisés pour la comparaison d’une population d’étude avec une population-type. Comme pour la standardisation directe, en principe n’importe quelle population peut servir comme population-type, mais chaque population-type résultera dans un autre RSM. Pour de raisons subtiles, il est déconseillé de comparer les RSM l’un avec l’autre 1 . Pour qu’on puisse quand même comparer deux populations d’étude, on choisit souvent l’une parmi elles comme population-type (p.e. la population des non exposés).

On doit admettre qu’en pratique les RSM sont souvent comparés entre eux sans qu’une inconsistance majeure soit introduite par cette pratique. On devrait s’attendre à une inconsistance majeure surtout si les taux spécifiques (p.e. par âge) ou les effectifs par strate sont très différents d’une population à l’autre (voir annexe).

1 Les RSM ne devraient pas à être comparés l’un avec l’autre pour la raison suivante : même s’ils sont basés sur les taux de la même population-type, le nombre de décès attendus dans une certaine population dépend de la structure d’âge de cette population d’étude. Ainsi, chaque RSM est standardisé à une population spécifique avec une distribution d’âge spécifique ; ils ne sont pas standardisés dans un sens universel. L’avantage de la méthode directe est son résultat universel. Ceci sera illustré par un exemple : Si population A montre un rapport comparatif de mortalité (RCM) de 3 comparé avec la population-type T, et le RCM de la population B s’élève à 2 comparé avec la population T, le RCM de la population A comparée avec la population B sera 3/2 = 1,5. Cette consistance peut manquer aux RSM de la méthode indirecte. Dans l’annexe, il y a un exemple pour cette problématique.

IV. STANDARDISATION DIRECTE OU INDIRECTE ?

Les différences principales entre les deux types de standardisation concernent l’origine des paramètres qui entrent dans les calculs - les taux spécifiques et la taille des strates -, et la validité des comparaisons entre différentes populations d’étude (tableau 6).

 

Standardisation directe

Standardisation indirecte

Origine des paramètres

   

Taille de la population par âge

population-type

population d’étude

Taux de mortalité par âge

population d’étude

population-type

Comparaisons valides

populations d’étude entre elles à l’aide d’une population-type

population d’étude avec une population-type

Produits

taux de mortalité standardisé (TSM)

rapport standardisé de mortalité (RSM)

 

rapport de taux de mortalité standardisés = rapport comparatif de mortalité (RCM)

 

Tableau 6 : Différences entres les deux techniques de standardisation

Comme règle générale, la standardisation directe est à préférer s’il est possible de l’utiliser, vu ses avantages en ce qui concerne la consistance de ses résultats (voir note en bas de la page précédente).

Cependant il est évident que dans l’absence des taux de mortalité par strate dans une population d’étude - ce qui est souvent le cas -, la standardisation indirecte est la seule méthode disponible.

Si les strates d’âge dans une population d’étude sont petites (disons, moins de 30 observations per strate), il est préférable d’utiliser la standardisation indirecte, car les taux de mortalités par âge de la population d’étude sont instables et ont donc un grand potentiel de fausser les résultats de la standardisation. Cela sera illustré par l’exemple suivant : manquer un décès réduit le taux de mortalité de 60% à 40% dans une petite strate avec 5 observations, mais de 60% à 58% seulement dans la strate avec 50 observations (tableau

7).

   

évaluation complète

évaluation incomplète

population

# décès

taux de mortalité

# décès

taux de mortalité

petite strate

5

3

60%

3 – 1 = 2

40%

grande strate

50

30

60%

30 – 1 = 29

58%

Tableau 7 : Effet d’une évaluation incomplète dans une petite strate vs une grande strate

V. CONTRE-INDICATIONS

Comme beaucoup de méthodes en épidémiologie et statistique, la validité de la standardisation dépend de certaines conditions. Pour la standardisation il est conseillé de vérifier d’abord les taux spécifiques qui doivent être homogènes, c’est à dire qu’ils suivent la même tendance assez claire dans les populations d’étude à comparer – ce qui est le cas dans l’exemple ‘Suède vs. Panama’ du syllabus, et ‘Population générale vs. classe sociale I’ de l’exercice (graphique 3). Dans une telle situation, la standardisation est possible.

Suède / Panama

60 50 40 30 20 10 0 0 - 29 30 - 59 > 59
60
50
40
30
20
10
0
0 - 29
30 - 59
> 59
Taux

Groupe d'âge

Population générale/ Classe sociale I

30 25 20 15 10 5 0 15 – 19 20 – 24 25 –
30
25
20
15
10
5
0
15 – 19
20 – 24
25 – 34
35 – 44
45 – 54
55 – 64
Taux

Groupe d'âge

Graphique 3 : Taux spécifiques homogènes

Des taux et rapports standardisés sont des mesures sommaires, qui sont par définition moins détaillées que les mesures spécifiques par strate. Cela est un désavantage s’il y a un détail qui devrait plutôt être rapporté que d’être aplani. Dans le graphique 4, on remarque une hétérogénéité : chez une des populations, il y a une augmentation extraordinaire de la mortalité dans la catégorie d'âge 25-34. La standardisation ferait disparaître cette information essentielle, elle est donc déconseillée.

Phénomène extraordinaire

30 25 20 15 10 5 0 15 – 19 20 – 24 25 –
30
25
20
15
10
5
0
15 – 19
20 – 24
25 – 34
35 – 44
45 – 54
55 – 64
Taux

Groupe d'âge

Graphique 4 : Taux hétérogènes, avec un taux extraordinaire dans un groupe d’âge

Une autre forme d’hétérogénéité existe si le facteur de confusion (dans cet exemple : l’âge) a une influence opposée sur la variable de résultat (ici : la mortalité) dans les populations d'étude (le pays ou la classe sociale étant les variables d’exposition dans nos exemples) : les taux de mortalité par âge se croisent (graphique 5). Comme avant, cette information devrait plutôt être rapportée que d’être fait disparaître. En plus il y a ici un problème méthodologique, car les taux et les rapports standardisés dépendraient énormément de la population-type choisie.

Croisement

20 15 10 5 0 15 – 19 20 – 24 25 – 34 35
20
15
10
5
0
15 – 19
20 – 24
25 – 34
35 – 44
45 – 54
55 – 64
Taux

Groupe d'âge

Graphique 5 : Hétérogénéité des taux, avec croisement des taux spécifiques

Conclusion :

La standardisation est contre-indiquée si les taux spécifiques sont hétérogènes.

RESUME

1. Taux cru : Taux réel et sommaire, mais souvent non appropriée pour comparer plusieurs populations du à l’effet de confusion

2. Taux spécifiques par strate : Taux réels et détaillés, en principes appropriés pour la comparaison, mais difficiles à rapporter

3. Taux standardisé (méthode directe) : Taux fictif et sommaire, ajusté pour le facteur de confusion et approprié pour comparaisons entre plusieurs populations d’études

4. Rapport standardisé (méthode indirecte) : Mesure sommaire, ajustée pour le facteur de confusion et appropriée pour comparaisons entre la population d’étude et la population- type

5. En général, la méthode directe est à préférer si elle est faisable (exception : petites strates)

6. Eviter la comparaison de rapports standardisés (méthode indirecte)

7. Avant de standardiser, vérifier d’abord les taux spécifiques ; en cas d’hétérogénéité :

considérer de rapporter les taux spécifiques au lieu de faire disparaître l’hétérogénéité par une mesure sommaire

8. En principe, la standardisation peut être utilisée pour d’autres facteurs de confusion que l’âge

ANNEXE

Cet exemple illustre la problématique de comparer des RSM (standardisation indirecte) si les structures d’âges sont très différentes dans les populations d’étude.

Dans le tableau 8, la mortalité de deux populations exposées, A et B, est comparée avec celle de la population générale. On remarque que les taux spécifiques sont identiques dans les deux populations exposés. On s’attendrait donc que les rapports standardisés de mortalité de ces deux populations soient identiques, si la population générale sert comme population-type pour les deux populations exposées.

 

Population générale

 

Exposition A

 

Exposition B

 

Pop.

Décès

Taux

Pop.

Décès

Taux

Pop.

Décès

Taux

20-39

100.000

50

0,5 ‰

10.000

50

5 ‰

1.000

5

5 ‰

40-59

200.000

400

2 ‰

1.000

4

4 ‰

10.000

40

4 ‰

Total

300.000

450

1,5 ‰

11.000

54

4,9 ‰

11.000

45

4,1 ‰

Tableau 8 : Problématique de la comparaison des RSM

Or, si on applique la standardisation indirecte on obtient :

Pour l’exposition A :

RSM

A

=

10.000

×

0,5 /1000

+

1.000

×

2 /1000

54

=

Pour l’exposition B :

RSM

B

=

1.000

×

0,5 /1000

+

10.000

×

2 /1000 =

45

7,7

2,2

Ces rapport standardisés de mortalité permettent la conclusion que la mortalité ajustée est plus élevée dans les deux populations exposées que dans la population générale, mais ils ne permettent pas la conclusion que la mortalité ajustée est plus élevée dans la population A que dans la population B (elle est identique) : il n’est pas valable de comparer des rapports standardisés!

La standardisation directe ne produit pas cette inconsistance. En prenant la population générale comme population-type, les taux standardisés et les rapports comparatifs pour les populations A et B sont identiques :

TSM

A

RCM

A

100.000

×

5 /1000

+

200.000

×

4 /1000

 

300.000

 

RCM

B

=

4,3/1000

1,5/1000

=

2,9

=

=

=

4,3 /1000

=

TSM

B

=

100.000

×

5 /1000

+

200.000

×

4 /1000

300.000

Chapitre 2: Validité et Reproductibilité d’un test

OBJECTIFS POUR LE CHAPITRE 2

Après avoir lu ce chapitre, vous devriez être capables de:

1. Interpréter l'information fournie par les tests en termes de probabilité

2. Evaluer les conséquences de résultats faux positifs, et faux négatifs, et utiliser cette information pour la prise de décision clinique et en santé publique.

3. Discriminer entre les méthodes adéquates, et inadéquates, pour évaluer la reproductibilité.

I.

INTRODUCTION : VALIDITE ET REPRODUCTIBILITE

Dans quelle mesure le résultat d’un examen, ou d’un test, reflète-t-il la réalité ?

Exemple:

Un médecin soupçonne une tuberculose pulmonaire chez un patient. Il demande une recherche de bacilles alcoolo-acido résistants (BAAR) dans les crachats de son patient.

- La recherche de BAAR dans les crachats est-elle un bon moyen de mesurer la présence ou l'absence de la maladie 'tuberculose pulmonaire'? Quelle est la validité de la méthode de mesure? (La validité d'une mesure exprime la distance entre ce que l'on veut mesurer, et ce que l'on mesure en réalité).

- Si le test est répété, donnera-t-il les mêmes résultats? Quelle est la reproductibilité de la méthode?

La valeur diagnostique d'une méthode de mesure est toujours relative à une méthode de référence à laquelle les autres méthodes sont comparées. Ce test, le 'standard d'or' (gold standard) fourni l'information diagnostique la plus proche de la réalité, dans l'état actuel des connaissances scientifiques.

Validité

Elevée

Elevée

Réproductibilité

Faible

Valeurs mesurées

Elevée Elevée Réproductibilité Faible Valeurs mesurées |--------------------------------------| Valeur réelle

|--------------------------------------|

Valeur réelle

Valeurs mesurées

|--------------------------------------|

Valeur réelle

Faible

Valeurs mesurées

Valeur réelle Faible Valeurs mesurées |--------------------------------------| Valeur réelle

|--------------------------------------|

Valeurs mesurées |--------------------------------------| Valeur réelle Valeurs mesurées

Valeur réelle

Valeurs mesurées

|--------------------------------------|

Valeur réelle

II.

VALIDITE D'UNE MESURE

A. Concepts de base et définitions

1. Sensibilité et spécificité

Les critères suivants sont utilisés pour décrire les caractéristiques d'un test:

La sensibilité d'un test décrit sa capacité à identifier correctement les personnes malades.

La spécificité d'un test décrit sa capacité à identifier correctement les personnes NON malades.

En comparant les résultats d’un test avec l’état réel, ou avec un test de référence, les possibilités suivantes peuvent se présenter:

- Une personne malade peut avoir un résultat positif (« vrai positif »)

- Une personne malade peut avoir un résultat négatif (« faux négatif »)

- Une personne non-malade peut avoir un résultat négatif (« vrai négatif »)

- Une personne non-malade peut avoir un résultat positif (« faux positif »)

Nouveau

test

sous

étude

STATUT REEL

(ou test de référence)

 

+

-

Total

 

Vrais

Faux

 

+

positifs

positifs

 

Faux

Vrais

 

_

négatifs

négatifs

Total

     

Supposons que nous connaissions, grâce à un test parfait (lequel n'existe pas pour la tuberculose) que 100 personnes souffrent de tuberculose pulmonaire (TBP). Ces 100 patients subissent une radiographie de poumons.

Le radiologiste n'est pas au courant du diagnostic. Il pose un diagnostic de PTB pour 90 de ces patients, mais pour 10 patients il se trompe: il n'a pas identifié les lésions radiologiques comme étant dues à la tuberculose, ou peut-être que r certains patients ne présentaient pas de lésions identifiables à la radiographie. La sensibilité de la radiographie (en comparaison avec le test 'parfait') est la suivante:

No. de malades de TBP correctement diagnostiqués No. de malades de TBP

=

90

100

Supposons que nous avons exclu avec une certitude absolue, la tuberculose pulmonaire chez 100 patients. Ces 100 personnes subissent une radiographie de poumons.

A la lecture de la radiographie, le radiologiste, (qui ne sait pas que le diagnostic de TBP a été exclu), confondant peut-être des lésions cancéreuses, ou dues à d'autres maladies pulmonaires, diagnostique une TBP pour 20 de ces patients. La spécificité de la radiographie (en comparaison avec le test 'parfait') est la suivante :

No. de personnes non malades de TBP correctement identifiées comme telles No. de personnes non malades de TBP

=

80

100

Sensibilité :

Nombre de personnes malades avec un test positif Nombre de personnes malades

Spécificité :

Nombre de personnes non malades avec un test négatif Nombre de personnes non-malades

La sensibilité et la spécificité d'un test sont exprimées par un pourcentage et représentent des probabilités.

La sensibilité d'un test est la probabilité qu'une personne malade soit correctement reconnue comme telle par ce test.

La

spécificité

d'un

test

est

la

probabilité

qu'une

personne

NON

malade

correctement reconnue comme telle par ce test.

soit

Pour les tests qui donnent un résultat sur une échelle numérique -ou ordinale (taux d'hémoglobine, de cholestérol…), la différence entre un test positif et un test négatif est définie par un seuil:

Exemple

Le test tuberculinique (TT) mesure la réponse immunitaire stimulée par le contact préalable avec le bacille de Koch (BK). Cette réaction est mesurée par le diamètre de l'induration cutanée causée par l'injection intradermique d'un antigène mycobactérien.

Chez les personnes infectées par le BK, la taille de l'induration peut varier fortement d'un individu à l'autre. D'autre part, une réaction peu importante au TT peut exister également chez les personnes non-infectées par le BK, par exemple en cas de contact préalable avec une mycobactérie atypique. Il est donc nécessaire de choisir un seuil de positivité.

Seuil

Induration >= 10 mm

Induration >= 5 mm

Combien de personnes infectées par le BK testeront positives?

Sensitivité (Personnes BK-infectées, TT positives / total des personnes BK-infectées)

Quelques personnes infectées auront une réaction TT au dessous de ce seuil (une certaine proportion de faux négatifs)

Plus basse

Moins de personnes infectées auront une réaction TT au dessous de ce seuil (moins de faux négatifs)

Plus haute

Combien de personnes non-infectées testeront positives??

Spécificité:

(Personnes non- infectées, TT négatives / total des personnes non- infectées)

Très peu de réactions TT, suite à des mycobactéries atypiques ou à un BCG administré à l’enfance dépasseront ce seuil (très peu de faux positifs)

Plus haute

Plus de réactions TT, liées aux mycobactéries atypiques ou à un BCG dépasseront ce seuil (plus de faux positifs)

Plus basse

Le choix du seuil détermine la sensibilité et la spécificité du test. Si on augmente la sensibilité, la spécificité diminue - et vice-versa.

2.

Valeur prédictive

Dans les exemples précédents, le vrai diagnostic était connu à l'avance, et les performances du test (radiographie de poumon), étaient évaluées en relation avec ce diagnostic.

En pratique, on ne connaît pas à l'avance le vrai diagnostic (sinon on n'aurait pas besoin de faire ce test). Quand on est confronté au résultat d'un test, ce que l'on souhaite savoir, c'est:

Si le test est positif, quelles sont les chances que le patient soit malade?

Si le test est négatif, quelles sont les chances que le patient ne soit pas malade?

La valeur prédictive positive d'un test (VPP) est la probabilité qu'une personne avec un test positif, soit réellement malade.

La valeur prédictive négative d'un test (VPN) est la probabilité qu'une personne avec un test négatif, soit réellement non- malade.

No. de personnes malades avec un test positif No. de personnes avec un test positif

No. de personnes non-malades avec un test négatif No. de personnes avec un test négatif

Chaque paramètre est exprimé comme un pourcentage, et représente une probabilité.

3. Résumé

   

Malade

 

Test

Oui

Non

Total

Positif

a

b

a+b (Total tests positifs)

(VP = vrais positifs)

(FP = faux positifs)

Négatif

c

d

c+d (Total tests négatifs)

(FN = faux négatifs)

(VN =Vrais négatifs)

Total

a+c

b+d

a+b+c+d

(Total malades)

(Total non)

(Total testés)

Sensibilité:

test + parmi les malades

a/a+c

Spécificité:

test - parmi les non-malades

d/b+d

Valeur prédictive positive:

malades parmi les tests +

a/a+b

Valeur prédictive négative:

non-malades parmi les tests -

d/c+d

4. Valeur prédictive et prévalence

La valeur prédictive d’un test dépend de sa sensibilité, et de sa spécificité, mais également de la prévalence de la maladie dans la population testée.

Exemple : dépistage de l’infection VIH.

On suppose une sensibilité de 99%, et une spécificité de 98% pour le test de dépistage ELISA. On teste 2 populations différentes : 100.000 donneurs de sang, parmi lesquels la prévalence de VIH est de 0,1%, et 100.000 prostituées, parmi lesquelles la prévalence de VIH est de 20%.

 

100,000 donneurs de sang

100,000 prostituées

 

VIH+

VIH--

Total

VIH +

VIH -

Total

Elisa +

99 (VP)

1.998 (FP)

2.097

19.800 (VP)

1.600 (FP)

21.400

Elisa -

1 (FN)

97.902 (VN)

97.903

200 (FN)

78.400 (VN)

78.600

Total

100

99.900

100.000

20.000

80.000

100.000

Valeur prédictive positive (VPP): Vrais positifs / Total Elisa +

Donneurs de sang : 99 / 2.097 = 5 %

Prostituées: 19.800 / 21.400 = 93%

Un résultat positif chez un donneur de sang a une probabilité de 5% d'être un vrai positif et donc une probabilité de 95% d'être un faux positif. Par contre la probabilité d'un résultat positif d'être un vrai positif, est de 93% parmi les prostituées.

Valeur prédictive négative (VPN): Vrais négatifs / Total Elisa -

Donneurs de sang : 97.902 / 97.903 = 100 %

Prostituées: 78.400 / 78.600 = 99,7%

Dans ce cas un test négatif est beaucoup plus fiable dans les 2 groupes: leur valeur prédictive est presque de 100%.

Pour une sensibilité et une spécificité donnée, la VPP dépend de la prévalence dans la population testée. Un test positif chez une prostituée (personne à haut risque d'infection par le VIH) - a une probabilité beaucoup plus élevée d'être un vrai positif, qu'un résultat positif chez une personne à faible risque (donneur de sang).

Le théorème de Bayes donne la formule permettant de calculer la VPP, et la VPN, connaissant la sensibilité (Se) et la spécificité (Sp) du test, et la prévalence de la maladie dans la population testée (P) en remplaçant simplement le contenu des cases dans le tableau ci-dessus dans les formules VPP = a / (a+b) & VPN = d / (c+d), dans lesquels N peut être enlevé du numérateur et du dénominateur).

VPP =

Se x P

VPN =

Sp x (1-P)

Se x P + (1-Sp) x (1-P)

Sp x (1-P) + (1-Se) x P

NB: tester une population versus tester une personne

L'exemple précédent impliquait de tester une population. La valeur prédictive du test était reliée à la prévalence de l'infection HIV dans cette population.

Au niveau individuel, le concept de prévalence dans la population testée est la probabilité pré- test: avant le test, quelle est la probabilité de cette personne, de souffrir de la maladie en question?

Exemples:

- Un commerçant d’Anvers se sentant fatigué, consulte un spécialiste en médecine interne. Il tousse depuis quelques jours. Un check-up général inclut une radiographie de thorax, car ce commerçant est un gros fumeur. Sur base de lésions atypiques, le radiologiste émet une suspicion de tuberculose. Ce commerçant, a, en l’absence de facteurs de risques connus pour la TB, une probabilité pré-test de tuberculose équivalente à la prévalence de la tuberculose pulmonaire en Belgique (à peu près 20/100.000): une probabilité très faible, mais non nulle. La valeur prédictive positive de ce diagnostic radiologique sera extrêmement faible.

- A l’inverse, dans un pays d’Afrique sub-saharienne, un patient se plaint de tousser depuis plus de 3 semaines. On sait par expérience que la proportion de tuberculose pulmonaire parmi les personnes présentant ce symptôme dans un pays à haute prévalence de TB, peut atteindre jusqu'à 20%, ou même plus. Ceci est la probabilité pré-test de tuberculose. La valeur prédictive positive d’un diagnostic radiologique sera nettement plus élevée que dans l’exemple précédent.

Pouvez-vous calculer les valeurs prédictives positives de la radiographie dans ces 2 exemples (estimation des performances de la radiographie: sensibilité : 95%, spécificité :

85%).

5. Stabilité de la sensibilité et de la spécificité

La sensibilité et la spécificité sont souvent présentées comme des caractéristiques stables, données, qui résument les performances d'un test, alors que la valeur prédictive dépend de la population, ou de la personne testée. Cependant, la performance du test est liée à un tableau clinique particulier. La recherche de BAAR par examen direct de crachat est un examen performant chez les malades qui excrètent une grande quantité de BK dans les crachats, mais l'est nettement moins chez les patients qui excrètent peu de BK. La présentation clinique peut dépendre de l'âge, du sexe, de l'intensité de l'infection, du stade de la maladie, ou de facteurs individuels…Le tableau radiologique de la tuberculose pulmonaire est différent chez les malades du SIDA. La sensibilité et la spécificité d'un test peuvent varier selon les sous-groupes de patients souffrant d'une même maladie.

6. NB: Définition de cas clinique

Une définition de cas clinique peut être considérée comme un test diagnostique.

Exemple: définition de cas clinique de la fièvre Dengue.

Une épidémie de Dengue est survenue dans la ville de Santa Cruz, en Bolivie, en Février 1997. Lors d'une enquête aléatoire dans la population, on a interrogé les participants à l'enquête quant à la survenue d'épisodes de maladie dans les 2 derniers mois, et en cas de réponse positive, on a posé des questions sur les signes et symptômes de ces épisodes. Des échantillons de sang ont également été prélevés pour sérologie.

Des 433 personnes inclues dans l'enquête, 5.9 % possédaient des anticorps IgM spécifiques de la dengue. En utilisant les résultats de la sérologie comme ‘gold standard’, il a été possible d'évaluer la sensibilité et la spécificité des différents signes et symptômes, ainsi que la sensibilité, spécificité, et valeur prédictive de la définition de cas utilisée.

1)

Sensibilité (%) et spécificité (%) des signes et symptômes inclus dans la définition classique de la dengue:

 

Sensibilité (%)

Spécificité (%)

 

Fièvre Céphalée Douleur rétro-orbitaire Myalgies Arthralgies Eruption Manifestations hémorragiques

77

64

69

64

50

75

62

75

58

80

31

92

31

92

2)

Sensibilité (%) et spécificité (%) et valeur prédictive positive de la définition de cas clinique : 'Maladie fébrile aiguë, avec n, ou plus symptômes de la liste ci-dessus’

n

Sensibilité (%)

Spécificité (%)

Valeur Prédictive Positive (%)

0

77

64

12

1

73

68

12

2

65

74

13

3

62

80

16

4

46

84

15

La conclusion fut que la définition de cas existante, n'était pas adéquate pour le diagnostic de l’infection ‘dengue’.

7. Annexe: rapport de vraisemblance (RV)

Le calcul des VPP et VPN à partir de la sensibilité, de la spécificité, et de la prévalence, est fastidieux. Une approche alternative est le calcul du rapport de vraisemblance, (likelihood ratio), ou RV, lequel est le rapport de 2 probabilités: probabilité d’un résultat donné chez les malades/ probabilité de ce résultat chez les non-malades.

RV +

Prob. Test (+) chez un malade Prob. Test (+) chez un non malade

= Se/(1-Sp)

RV -

Prob. Test (-) chez un malade Prob. Test (-) chez un non malade

= (1-Se)/Sp

Le rapport de vraisemblance exprime les cotes (odds) qu’un certain résultat soit attendu chez un malade, par opposition au même résultat chez une personne non malade.

Propriétés :

(1) RV ne dépend pas de la prévalence (ou de la probabilité pré-test)

(2) Pour les tests qui donnent des résultats sur une échelle numérique, les RV peuvent être calculés pour différentes valeurs du seuil

(3) Les cotes pré-test x RV (+) = les cotes post-test

Exemple : test VIH

Supposons que le test Elisa soit 99% sensible, et 98% spécifique.

RV+ = 0.99/(1-0.98)= 49.5.

Si le test est +, l'infection VIH chez la personne testée est 49.5 fois plus probable que si le test est négatif.

RV- = 1-0.99/0.98=0.01

Un test - est 1/100 moins probable chez une personne VIH -, par rapport à une personne VIH+ (100 fois plus probable chez une personne VIH-).

Une prostituée de Nairobi se présente à la consultation externe avec des signes cliniques suggérant la tuberculose. Sachant que (1) la prévalence du VIH est élevée chez les prostituées, et (2) la tuberculose est fréquente chez les personnes VIH+, le médecin estime la probabilité pré-test de l'infection VIH, à 60%. Les cotes sont donc de 6 : 4 (60% vs 40%), ou 1,5 : 1, pour l'infection VIH.

Le test Elisa est positif pour le VIH.

Cotes pré-test (HIV+) x

RV (+)

= Cotes post-test (VIH+)

1,5:1

x

49,5

= 74,25:1

Après le test, la présence de l’infection VIH est 74 fois plus probable que l’absence d’infection.

Les cotes post-test peuvent être transformées en probabilités :

Probabilité post-test =

cotes post-test VIH (+)

cotes post-test VIH (+) + 1

= (74,25/74,25 + 1)

= 74.25 / ,75.25 = 99%.

Un important désavantage des RV est cette nécessité de passer des cotes aux probabilités, et vice-versa.

B. Utiliser l’information pour la prise de décision.

Quelles vont être les conséquences du résultat du test?

NB:

Si le résultat du test ne change pas la prise de décision, alors il n’est pas justifié de faire le test.

Exemples

- Diagnostic: le test tuberculinique est souvent utilisé pour identifier les personnes susceptibles de bénéficier de chimio prophylaxie tuberculeuse. Dans beaucoup de pays cependant, la chimio prophylaxie n’est recommandée que pour certains groupes à risque. Si la personne n’appartient pas à ces groupes à risque, il n’est pas justifié de faire le test: même si le test est positif, la chimio prophylaxie ne sera pas offerte.

- Dépistage: un frottis de Papanicolaou positif demande une confirmation. Dans beaucoup de PVD, la confirmation n’est pas disponible. Dans ces conditions, il n’est pas justifié de faire le test.

1. Tests : diagnostic vs dépistage

Dans un exemple précédant, la valeur prédictive positive d’un test VIH était d’à peine 5 %. On ne peut bien entendu pas baser un diagnostic sur une telle probabilité. Par contre, un test positif rend possible d'identifier des personnes suspectes, candidates à un test de confirmation.

A test de diagnostic positif conduit à prescrire un traitement. A test de dépistage conduit à demander un test de confirmation.

- Caractéristiques souhaitables d'un test de dépistage : facile à utiliser, bon marché (car il sera utilise sur un grand nombre de personnes), sensibilité élevée. Exemple : CATT test pour la maladie du sommeil.

- Caractéristiques souhaitables d'un test diagnostic : spécificité et sensibilité élevée. Cependant cela veut souvent dire que ces tests sont plus invasifs, et/ou plus chers. Exemple : ponction lombaire pour le diagnostic de la maladie du sommeil, stade 2.

Un test de dépistage permet une présélection des suspects. Cela augmente la valeur prédictive positive des tests diagnostiques qui suivent (puisque la probabilité pré-test de maladie est plus élevée chez les suspects), mais aussi cela permet un usage plus rationnel de tests plus chers, plus invasifs, ou plus définitifs (par exemple, le Western Blot pour le VIH).

Parfois, le même test peut servir pour le dépistage, ou pour le diagnostic, selon la situation. Par exemple, la radiographie de thorax peut être utilisée pour le diagnostic ou pour le dépistage de la tuberculose pulmonaire :

- Dans un pays à haute prévalence de TBC, une personne se présente avec une toux chronique, ce qui correspond avec la définition de cas de « tuberculose suspectée » :

la probabilité pré-test de TBC est élevée, de ce fait, la VPP d’une radiographie « compatible avec la TBC » est élevée. Toute personne présentant des lésions suggérant la présence de TBC commencera donc un traitement antituberculeux. (NB : Comme il est moins cher et plus spécifique, l’examen de crachat devrait toujours être utilisé comme premier test – et la radiographie seulement pour des cas crachat-négatifs).

- Dans d’autres pays, tout le personnel soignant est dépisté pour TBC chaque année à travers une radiographie du thorax. La probabilité pré-test est basse, de ce fait la valeur prodictive positive d’une radiographie « compatible avec une tuberculose pulmonaire » est basse. Toute personne présentant des lésions suggestives devront passer des tests supplémentaires.

2. Conséquences : faux positifs et faux négatifs

Il n’y a virtuellement pas de test qui soit 100% sensible, et 100% spécifique. Certains résultats seront donc des faux positifs, d’autres des faux négatifs. La magnitude, et les conséquences de ces erreurs, doivent être évalues.

a) La magnitude des erreurs de classification.

Cela dépend de la sensibilité, de la spécificité, et de la prévalence dans la population testée.

Il y a beaucoup de faux positifs quand la Valeur Prédictive Positive du test est faible. La VPP est faible quand la spécificité du test, et/ou la prévalence de ce qu’on teste (ou la probabilité pré-test), sont faibles.

Il y a beaucoup de faux négatifs quand la Valeur Prédictive Négative du test est faible. La VPN est faible quand la sensibilité du test est faible, et/ou la prévalence de ce qu’on teste (ou la probabilité pré-test), est élevée.

b) Conséquences des erreurs de classification

Pour l’individu

Pour la communauté/ les services de santé

Faux-positifs

Anxiété, stigma social Risques lies à d’autres tests, Risques lies au traitement (effets secondaires) Coût

Charge pour les services Gaspillage de ressources (problème d’autant plus grave qu’un grand nombre de faux positifs met en cause la qualité du traitement donne aux vrais positifs)

Faux-négatifs

Diagnostic correct retardé, souffrance, morts

Transmission (maladies infectieuses) Diagnostic tardif peut augmenter le coût de la prise en charge.

Les conséquences des erreurs de classification varient selon la maladie testée – et l’objectif du test (clinique? surveillance?). Un résultat VIH+ erroné a des conséquences dramatiques pour le patient : seuls des résultats confirmés devraient lui être communiqués. D’un autre coté une banque de sang ne peut pas se permettre de résultat VIH faux négatif. La maladie du sommeil est toujours mortelle, (conséquences graves pour les faux -négatifs), d'un autre côté le traitement présente un risque élevé de mortalité iatrogène élevée (conséquences graves pour les faux-positifs).

Souvent on insiste sur le fait qu’il est particulièrement important pour un test de dépistage d'être sensible, et pour un test diagnostic d'être spécifique (tout en restant sensible). Cependant les conséquences des résultats faux positifs et faux négatifs devraient toujours être évaluées.

Exemple : comparaison entre deux définitions de cas cliniques pour l’identification des sujets suspects de TBP (test de dépistage)

L’objectif d’un programme de contrôle de la TB est d’identifier au plus tôt et de traiter les cas les plus contagieux, ç.à.d. les patients TBP ayant assez de BK dans leur crachat pour être visible dans un examen de frottis direct (Smear+ PTB). Le but est de faire un dépistage dans une population avec une définition de cas clinique. Les personnes qui correspondent à cette définition (sujets suspects de TB) subiront ultérieurement 3 examens de crachat. Deux définitions de cas cliniques sont comparées aux résultats des examens de frottis directs.

Définition de cas

Toux depuis deux semaines ou plus

Toux depuis trois semaines ou plus

Sensitivité de la définition

Plus élevée

Plus basse

Spécificité de la définition

Plus basse

Plus élevée

Personnes qui correspondent à la définition de cas

1500*

1000*

Frottis+ % parmi les suspects (valeur

8%*

10%*

prédictive positive) Nombre de cas détectés (Frottis + TB) Nombre de tests de crachat Nombre de faux positifs (correspondent à

8% x 1500=120 1500 x 3 = 4500 1500 - 120 = 1380

10% x 1000=100 1000 x 3 = 3000 1000-100 = 900

la définition de cas des sujets suspects, mais ne sont pas des cas Frottis+ TB). Nombre de faux négatifs (ne correspondent pas à la définition de cas des sujets suspects, mais sont des cas Frottis(+) TB *Chiffres hypothétiques

Plus basse

Plus élevée

Conséquences des faux positifs

Conséquences des faux négatifs

Individu : mineures (faire test de crachat) Services de santé: surcharge de travail pour le laboratoire Individu : diagnostic retardé (mineur dans ce cas) Communauté : ces patients sont contagieux

Il y a plus de patients avec un frottis+ qui ne correspondent pas à la définition de cas de ‘3 semaines’ (plus de faux négatifs). Mais les conséquences sont mineures pour l’individu : les TBP qui n’avaient pas de toux pendant les 3 dernières semaines, atteindront ce stade plus tard et seront dépistés (espérons !) à ce moment là - TBP n’est pratiquement jamais urgente, et un délai d’une ou deux semaines dans le diagnostic ne ferra pas beaucoup de différence pour le patient.

Les conséquences des faux négatifs sont potentiellement plus graves pour la communauté, parce que ces patients peuvent transmettre la maladie. Il y a moins de faux négatifs avec la définition de cas de ‘2 semaines’, mais la différence entre les 2 définitions signifie que quelques patients seront contagieux pendant une semaine additionnelle seulement. Selon les normes TB, ceci est négligeable.

Une définition de cas plus sensitive permet de détecter plus de cas – au coût de travail additionnel pour le laboratoire. (Dans cet exemple 1500 tests étaient nécessaires pour détecter 20 cas supplémentaires). Le choix de la meilleure définition dépendra donc de la charge de travail que le laboratoire est capable de gérer.

III.

REPRODUCTIBILITE

A. Définition

La reproductibilité est la capacité d'un test à donner le même résultat (qu'il soit correct, ou incorrect), lors d'applications répétées pour un même état de la maladie (Rothmann).

On rencontre 3 types de variation des mesures prises:

Le phénomène observé (par ex., les fluctuations de pression artérielle), la manifestation sur laquelle le test est basé (la quantité de BK dans les expectorations varie entre les échantillons)

L'instrument de mesure: un microscope monoculaire, et un microscope binoculaire, ont des performances différentes

La variabilité due à l'observateur: variabilité inter observateurs, ou intra-observateurs

NB: En anglais on distingue la 'répétabilité' (repeatability) - ou capacité à reproduire le même résultat en conditions théoriques, idéales (même laboratoire, même technicien, même échantillon) et la reproductibilité ('reproducibility')- capacité à reproduire le même résultat en conditions de terrain.

Exemple

Il n'existe pas de tableau radiologique absolument 'typique' de la tuberculose pulmonaire. Dans une étude, la même radiographie a été lue par les mêmes radiologues à quelque mois d'intervalle. Dans 19% à 24% des cas, le radiologiste a contredit le résultat de sa lecture précédente.

B. Mesurer la reproductibilité

On peut comparer les résultats obtenus de manière indépendante par différents observateurs (ou obtenus par le même observateur, à des moments différents)

1. Méthodes inadéquates

Une simple comparaison des totaux, ou proportions, peut induire en erreur, car même si les totaux sont égaux, ils ne se réfèrent pas nécessairement aux mêmes observations.

La corrélation (par exemple, le coefficient de corrélation) entre différents résultats (par 2 méthodes, 2 observateurs) est également une méthode incorrecte (bien que fréquemment utilisée). La corrélation est différente de l'accord: Si 2 observateurs sont systématiquement en désaccord, il existe une corrélation élevée entre les 2, puisque qu'un résultat permet automatiquement de prédire l'autre!

Pour la même raison, un test Chi2 est inadéquat (il teste l'association, pas l'agrément!)

L’approche appropriée est de comparer le résultat des différentes observations pour chaque unité (ou chaque individu) testée et de les classifier pour quantifier l’accord.

2. Le coefficient de Kappa

Exemple. Lecture de 85 mammographies par 2 radiologistes

Lecteur B

 

Normal

Tumeur

Suspicion

Cancer

Total

Lecteur A

bénigne

de cancer

Normal

21