Académique Documents
Professionnel Documents
Culture Documents
Dr REZOUG/ MCA
Pr MEHENNI/ MCA
Pr BENZAROUR/Professeur
0
OBJECTIFS DU COURS
PLAN DU COURS
I. Introduction-définition
VI. Conclusion :
VII. Références
1
I. INTRODUCTION
Toute prescription d’examen complémentaire a un coût ; ce coût peut comprendre le coût
financier, le coût lié au désagrément ou au risque qu’entraînel’examen et le coût du préjudice
subi par le malade lorsque le résultat de l’investigation conduit à des décisions inadéquates.
Imposer au malade de supporter ce coût doit se justifier par l’espérance d’un bénéfice. Ce
bénéfice peut résulter d’une appréciation plus exacte du diagnostic ou du pronostic pour un
choix plus pertinent des investigations ultérieures et une meilleure décision thérapeutique. Le
choix de retenir ou non un examen dans l’aide au diagnostic ne peut donc se faire qu’après
une évaluation rigoureuse de ses avantages et de ses inconvénients par rapport à ceux des
examens qui existaient jusque là.
Avant d’évaluer l’intérêt d’une méthode à des fins diagnostiques, il faut avoir vérifié qu’elle
fournit une information valide. La méthode doit avoir fait la preuve notamment de :
- sa qualité technique. Par exemple, un électrocardiogramme ne pourra pas être interprété
si les contractions des muscles de la paroi thoracique apparaissent sur le tracé.
- sa spécificité. Par exemple, si l’on veut doser la glycémie, la méthode permet-elle de
mesurer spécifiquement le glucose ou dose-t-elle l’ensemble des sucres sanguins ?
- sa fiabilité. Y a-t-il une erreur systématique de la mesure ? la précision de celle-ci est-elle
satisfaisante (variance faible) ?
Il faut en outre s’assurer que la variabilité de l’interprétation des résultats de l’examen,
inter intra-observateur, est acceptable.
Définition du test :
Le test est toute information dont le résultat peut être utilisé dans une démarche décisionnelle
le plus souvent dans un but diagnostique. Il serait soit :
- la recherche d’un signe clinique ;
- une technique para-clinique (examen biologique, cliché d’imagerie,examen physiologique
etc.) ;
- une combinaison de plusieurs signes cliniques ou para-cliniques ;
- une procédure ou une stratégie (combinaisons de plusieurs tests) ;
- une évaluation d’une performance.
La décision des résultats d’un test dépend du seuil de la probabilité de la maladie au dessus
duquel on décide d’intervenir « seuil de traitement » et,du bénéfice global de l’intervention
(amélioration potentielle de l’état de santé /Effets secondaires possibles).
La distinction entre le test diagnostique et le test de dépistage se résume dans le tableau ci-
après :
2
a. Test diagnostique b. Test de dépistage
- Efficacité prouvée (parfois moins d’efficacité que - Identifier présomptivement les sujets
les tests de référence). atteints d’une maladie.
- Qualité n’est pas toujours fixe : composition de - Faire un partage entre les sujets
la méthode qui est basée sur plusieurs tests. apparemment sains et les autres
- Peu de méthodes diagnostiques ont été validées
- Appliqué aux personnes montrant des troubles - Appliqué aux personnes apparemment en
définis. bonne santé.
- Pratiqué essentiellement sur l’individu - Pratiqué sur les groupes de population.
- Plus précis. - Moins précis.
- Plus coûteux. - Peu coûteux.
- Constitue une base du traitement. - Ne constitue pas une base de traitement
Considérons la population à laquelle sera appliqué l’examen diagnostique s’il fait la preuve de
son intérêt.Dans cette population figurent des malades M+ (sujets atteints de la maladie que
doit permettre diagnostiquer l’examen) et des sujets non malades M-. La prévalence « p » de
la maladie est égale à la probabilité pour qu’un sujet pris au hasard soit réellement atteint de la
maladie.
Les résultats de l’examen diagnostique étudié sont résumés par une variable à deux classes :
des sujets ayant donné une réponse positive à l’examen « qu’il a le signe » S+, et au contraire
« qu’il ne l’a pas » si sa réponse est négative S-. Cela ne pose pas de problème si ce résultat
est qualitatif (présence ou non d’une lésion ulcéreuse à l’endoscopie) ; par contre, s’il est
quantitatif (dosage des phosphatases alcalines) il faut définir le seuil à partir duquel le
résultat sera déclaré positif.
Le schéma ci-dessous résume la structure d’une étude diagnostique :
Examen diagnostique
de référence Groupe de sujets
Gold stantard
Sujets Sujets
Non malades malades
Nouvel examen
diagnostique Test Test
Test Test
positif négatif positif négatif
FP VN VP FN
3
L’ensemble de la population se répartit comme suit vis-à-vis de la maladie et du résultat de
l’examen :
Maladie MALADIE
Signe M+ M-
S+ P1 P2
SIGNE
S- P3 P4
P(M+) P(M-)
Maladie Non
Malades Total
Test malades
Faux
Vrais positifs VP+FP
Test positif positifs
VP (a) (a+b)
FP (b)
Vrais FN+VN
Faux négatifs
Test négatif négatifs (c+d)
FN (c)
VN (d)
VP+FN FP+VN VP+FP+FN+VN
Total (a+c) (b+d) (a+b+c+d)
m1 m0 N
4
III.1- VALIDITE INTRINSEQUE
III.1.1-SENSIBILITE « Se » :
La sensibilité d’un test est la capacité d’un test à donner un résultat positif quand la maladie
est présente. Elle est estimée par la proportion de vrais positifs chez les malades.
III.1.2-SPECIFICITE « Sp » :
La spécificité d’un test est la capacité d’un test à donner un résultat négatif quand la maladie
est absente. Elle est estimée par la proportion de vrais négatifs chez les non malades.
5
III.2.2-VALEUR PREDICTIVE NEGATIVE « VPN » :
La valeur prédictive négative est estimée par la proportion de tests négatifs (VN)
correspondant à des sujets indemnes de la maladie (sujets n’ayant pas le signe).
é
é é
NB :On doit choisir un test ayant une VPP élevée quand le traitement d'un sujet faussement
positif peut avoir des conséquences graves (ex : ablation d'un organe en chirurgie).Un test
ayant une valeur prédictive négative élevée doit être retenu quand l'absence de traitement
entraîne des conséquences graves chez un patient au test faussement négatif (ex : taux de
lymphocytes CD4 dans l’infection à VIH).
Ce rapport signifie donc qu’un sujet a k fois plus de chances d’être atteint de la maladie si
l’examen est positif que s’il est négatif. Il est similaire au risque relatif défini en
épidémiologie.
Exemples numériques :
Exemple A ExempleB
Sujets Sujets Sujets Sujets
anémiques sains anémiques sains
Test : + 19 10 29 Test : + 15 5 20
HB≤12g/100 - 1 70 71 HB≤10g/100 - 2 78 80
Total 20 80 100 Total 17 83 100
6
IV. RELATION ENTRE LES INDICES
*Théorème de Bayes :
Tab1 :
7
Tab 2 :
Le rapport de vraisemblance positif se définit par le rapport des probabilités d'avoir un nouvel
examen positif chez les malades et chez les non malades :
Si RVP = 4 : le test est 4 fois plus souvent positif chez les malades que chez les sains.
Le rapport de vraisemblance négatif se définit par le rapport des probabilités d'avoir un nouvel
examen négatif chez les malades et chez les non malades :
Si RVN = - 0,5 ou - ½ : l’absence de signe est 2 fois moins souvent observée chez les malades
que chez les sujets sains.
Autres indices:
8
IV.3-COURBE ROC (CAS DE REPONSE QUANTITATIVE) :
Pour une réponse quantitative, il faut choisir un seuil « S » permettant de séparer les résultats
positifs et négatifs. Une approche graphique permet de résumer les propriétés d'un nouvel
examen diagnostique quand le résultat de l'examen est quantitatif. Elle consiste à tracer la
courbe représentant la sensibilité obtenue pour différentes valeurs seuils du résultat en
fonction de la spécificité correspondante. Cette courbe s'appelle courbe ROC «Receiver
Operating Characteristic», terminologie provenant de l’étude des caractéristiques
d’appareils de réception de signaux radio. Elle part du point (0,0) et va jusqu’au point (1,1).
1°) Si le test est discriminant (distribution est unimodale): les valeurs des sains sont bien
séparées des valeurs des malades : rechercher un seuil pour sensibilité et spécificité à 100%.
Cette situation rare est illustrée sur la figure suivante :
2°) Si le test n’est pas discriminant (distribution bimodale) : Il y a chevauchement des deux
distributions, le groupe des « cas limites » comprend à la fois les sujets malades et les sujets
sains rassemblés dans le même intervalle. Tel qu'illustré sur la figure suivante :
9
Exemple: troubles héréditaires comme la phénylcétonurie
Tab 3 :
10
V. VALIDITE EXTERNE D’UN TEST
« REPRODUCTIBILITE, CONCORDANCE »
Reproductibilité :
Un test ne doit pas seulement posséder une bonne validité interne. Il doit être reproductible et
cette reproductibilité (d’une personne à l’autre, d’une circonstance à l’autre chez les mêmes
sujets etc.) doit être connue au départ.
La reproductibilité d’une mesure s’évalue en étudiant la concordance entre des mesures
répétées. On peut évaluer la concordance entre deux appareils différents, entre deux
opérateurs différents utilisant le même appareil, ou entre deux lectures du même examen par
le même opérateur. Les méthodes statistiques utilisées dans ces différentes situations sont les
mêmes et ne dépendent que de la nature du résultat, binaire ou continu.
Pour étudier la concordance sur un tableau 2x2, on teste l'hypothèse nulle d'indépendance
entre les 2 facteurs ligne et colonne contre une alternative de liaison particulière, qui est ici
une liaison positive. Le test du Chi2 habituel ne répond pas au problème précis de la
concordance. En effet, un Chi2 significatif indique l'existence d'une liaison qu'elle soit
positive ou négative. Les résultats observés et attendus se résument de la façon suivante :
OBS 1 Observateur 1
Total
OBS2 Anormal Normal
O1 O2
Anormal
E1 E2
Observateur2
O3 O4
Normal
E3 E4
Total N
Pour comparer ces deux pourcentages on utilise, par exemple, le coefficient de concordance
Kappa (ⱪ).
11
Le coefficient de concordance Kappa (ⱪ) est défini comme le rapport entre le gain observé et
le gain maximum « ⱪ = Gain observé /Gain maximum ». . Il vaut ici :
Le coefficient kappa peut varie de -1,0 (désaccord absolu) an passant par 0,0 (accord dû au
hasard) à 1,0 (accord absolu entre les diagnostics, tests, ou personnes). L’estimation du degré
de concordance est la suivante :
12
Tab.6 : classement attendu sous l’hypothèse d’indépendance des deux lecteurs
OL OL Total
RG IRM+ IRM-
RG IRM+ 73,3 24,7 98
IRM- 33,7 11,3 45
total 107 36 143
nc=(98x107)/143+(45x36)/143=73,3+11,3=84,6
La proportion d'accords attendus pc est donc de 84,6/143=59,2%
Si les observateurs étaient parfaitement d’accord (100% d’accords), on aurait 100%- 59.2% =
40.8% d’accords en plus. Ceci représente le gain maximum par rapport à l'indépendance.
On a observé 93.7% d’accords, c’est à dire 93.7%- 59.2%= 34.5% de plus que ce que l’on
attend sous l’hypothèse d’indépendance.
V. CONCLUSION
Chaque méthode possède une validité interne et externe qui lui est propre pour le jugement
de la valeur d’un outil de diagnostic.
Pour évaluer un nouvel examen diagnostique, il faut comparer les résultats qu’il fournit avec
ceux d'un examen de référence. L'examen de référence retenu n’est pas toujours une référence
incontestable, comme peuvent l'être un examen histologique ou une autopsie. Le diagnostic de
référence peut notamment être obtenu à posteriori par les données de la surveillance des
sujets. On peut aussi utiliser un examen de référence complété par les résultats de la
surveillance, quand pour des raisons éthiques, il n'est pas possible de pratiquer l'examen de
référence chez tous les sujets. Par exemple, quand on s'intéresse à la nature bénigne ou
maligne d'une lésion osseuse, la certitude diagnostique ne peut être obtenue qu'à partir d'une
biopsie, cet examen ne sera pratiqué que chez les sujets pour lesquels il y a une forte
suspicion de malignité, pour les autres le diagnostic sera considéré comme établi par les
données du suivi à un an.
13
VII. REFERENCES
VIII. ANNEXES
14
ANNEXE 1: DEFINITION DE CERTAINS TERMES /
« Evaluation global d’un test diagnostique »
15