Cours Validité Dun Test Diagnostique - A6 - EU - IX 2 2

REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE
MINISTRE DE L’ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE

UNIVERSITE D’ALGER / FACULTE DE MEDECINE
ENSEIGNEMENT DE LA SIXIEME ANNEE DE GRADUATION EN MEDECINE
UE-IX.UNITE D’ENSEIGNEMENT EPIDEMIOLOGIE-METHODOLOGIE DE

RECHERCHE-LECTURE CRITIQUE D’ARTICLE- SANTE PUBLIQUE ET
ECONOMIE DE LA SANTE
VALIDITE D’UN TEST DIAGNOSTIQUE

ANNEE UNIVERSITAIRE: 2O23-2024
Cours rédigé par Dr.BENELEFKIR.H/ MAT
Dr REZOUG/ MCA
Pr MEHENNI/ MCA
Pr BENZAROUR/Professeur
0
OBJECTIFS DU COURS
1. Connaitre la définition d’un test diagnostique.

2. Décrire la structure d’une étude diagnostique.
3. Définir, calculer et interpréter les indices de validité interne et externe.
PLAN DU COURS
I. Introduction-définition
II. Structure d’une étude diagnostique
III. Validité interne d’un test
III.1. Validité intrinsèque

III.1.1. sensibilité
III.1.2. spécificité
III.2. Validité prédictive

II.2.1. Valeur prédictive positive (VPP)
II.2.2. Valeur prédictive négative (VPN)
II.2.3. Valeur prédictive globale (VPG)
IV. Relation entre les différents indices
IV.1. Prévalence de la maladie « théorème de Bayes »

IV.2. Rapport de vraisemblance « LikelihoodRatio ou lR » :cas de réponse
qualitative
IV.3. Courbe ROC : cas de réponse quantitative
V. Validité externe d’un test : reproductibilité, concordance
V.1.Concordance entre réponses binaires : coefficient kappa
VI. Conclusion :
VII. Références
VIII. Annexes : évaluation globale d’un test
1
I. INTRODUCTION
Toute prescription d’examen complémentaire a un coût ; ce coût peut comprendre le coût
financier, le coût lié au désagrément ou au risque qu’entraînel’examen et le coût du préjudice
subi par le malade lorsque le résultat de l’investigation conduit à des décisions inadéquates.
Imposer au malade de supporter ce coût doit se justifier par l’espérance d’un bénéfice. Ce
bénéfice peut résulter d’une appréciation plus exacte du diagnostic ou du pronostic pour un
choix plus pertinent des investigations ultérieures et une meilleure décision thérapeutique. Le
choix de retenir ou non un examen dans l’aide au diagnostic ne peut donc se faire qu’après
une évaluation rigoureuse de ses avantages et de ses inconvénients par rapport à ceux des
examens qui existaient jusque là.
Avant d’évaluer l’intérêt d’une méthode à des fins diagnostiques, il faut avoir vérifié qu’elle
fournit une information valide. La méthode doit avoir fait la preuve notamment de :
- sa qualité technique. Par exemple, un électrocardiogramme ne pourra pas être interprété
si les contractions des muscles de la paroi thoracique apparaissent sur le tracé.
- sa spécificité. Par exemple, si l’on veut doser la glycémie, la méthode permet-elle de
mesurer spécifiquement le glucose ou dose-t-elle l’ensemble des sucres sanguins ?
- sa fiabilité. Y a-t-il une erreur systématique de la mesure ? la précision de celle-ci est-elle
satisfaisante (variance faible) ?
Il faut en outre s’assurer que la variabilité de l’interprétation des résultats de l’examen,
inter intra-observateur, est acceptable.
Définition du test :
Le test est toute information dont le résultat peut être utilisé dans une démarche décisionnelle
le plus souvent dans un but diagnostique. Il serait soit :
- la recherche d’un signe clinique ;
- une technique para-clinique (examen biologique, cliché d’imagerie,examen physiologique
etc.) ;
- une combinaison de plusieurs signes cliniques ou para-cliniques ;
- une procédure ou une stratégie (combinaisons de plusieurs tests) ;
- une évaluation d’une performance.
Le résultat d’un test s’exprime, schématiquement,soit en une variable qualitative

binaire(test positif ou test négatif), soit en une variable quantitative (valeur d’une mesure
biologique, note, indice, score etc.)
Le choix du test est fonction de la qualité de l’examen, la prévalence de la maladieet les

utilités du test (coûts, risques iatrogènes etvécu psychologique).
La décision des résultats d’un test dépend du seuil de la probabilité de la maladie au dessus
duquel on décide d’intervenir « seuil de traitement » et,du bénéfice global de l’intervention
(amélioration potentielle de l’état de santé /Effets secondaires possibles).
La distinction entre le test diagnostique et le test de dépistage se résume dans le tableau ci-
après :
2
a. Test diagnostique b. Test de dépistage
- Efficacité prouvée (parfois moins d’efficacité que - Identifier présomptivement les sujets
les tests de référence). atteints d’une maladie.
- Qualité n’est pas toujours fixe : composition de - Faire un partage entre les sujets
la méthode qui est basée sur plusieurs tests. apparemment sains et les autres
- Peu de méthodes diagnostiques ont été validées
- Appliqué aux personnes montrant des troubles - Appliqué aux personnes apparemment en
définis. bonne santé.
- Pratiqué essentiellement sur l’individu - Pratiqué sur les groupes de population.
- Plus précis. - Moins précis.
- Plus coûteux. - Peu coûteux.
- Constitue une base du traitement. - Ne constitue pas une base de traitement
II. STRUCTURE D’UNE ETUDE DIAGNOSTIQUE
Considérons la population à laquelle sera appliqué l’examen diagnostique s’il fait la preuve de
son intérêt.Dans cette population figurent des malades M+ (sujets atteints de la maladie que
doit permettre diagnostiquer l’examen) et des sujets non malades M-. La prévalence « p » de
la maladie est égale à la probabilité pour qu’un sujet pris au hasard soit réellement atteint de la
maladie.
Les résultats de l’examen diagnostique étudié sont résumés par une variable à deux classes :
des sujets ayant donné une réponse positive à l’examen « qu’il a le signe » S+, et au contraire
« qu’il ne l’a pas » si sa réponse est négative S-. Cela ne pose pas de problème si ce résultat
est qualitatif (présence ou non d’une lésion ulcéreuse à l’endoscopie) ; par contre, s’il est
quantitatif (dosage des phosphatases alcalines) il faut définir le seuil à partir duquel le
résultat sera déclaré positif.
Le schéma ci-dessous résume la structure d’une étude diagnostique :
Examen diagnostique
de référence Groupe de sujets
Gold stantard
Sujets Sujets
Non malades malades
Nouvel examen
diagnostique Test Test
Test Test
positif négatif positif négatif
FP VN VP FN
Structure d’une étude diagnostique
3
L’ensemble de la population se répartit comme suit vis-à-vis de la maladie et du résultat de
l’examen :
Maladie MALADIE
Signe M+ M-
S+ P1 P2
SIGNE
S- P3 P4
P(M+) P(M-)
P (M+)= p1+p3=p et (M-)= p2+p4

Les quatre indices suivants vont servir à décrire la valeur diagnostique d’un examen.
a. La sensibilité d’un examen : est égale à la probabilité, pour un sujet malade, de présenter
un résultat positif à l’examen : P (S+/M+).
b. La spécificité d’un examen : est égale à la probabilité, pour un sujet non malade, de
présenter un résultat négatif à l’examen : P (S-/M-).
c. La valeur prédictive positive d’un examen : est égale à la probabilité d’être malade
chez les sujets dont le résultat de l’examen est positif : P (M+/S+).
d. La valeur prédictive négative d’un examen : est égale à la probabilité d’être non malade
chez les sujets dont le résultat de l’examen est négatif : P (M-/S-).
La valeur diagnostique d’un examen est d’autant meilleure qu’il est à la fois sensible et
spécifique; il est d’autant plus intéressant que ses valeurs prédictives positive et négative sont
élevées.
III. VALIDITE INTERNE D’UN TEST

La valeur d’une méthode de diagnostic est toujours relative à une méthode de référence
(diagnostic vrai, constat définitif et irréfutable, meilleur test disponible). Sa qualité n’est pas
fixe ; elle varie en fonction de la prévalence de la maladie dans la population et de la
composition de la méthode de diagnostic basée sur plusieurs tests.
Chez les sujets sains, comme chez les malades, une méthode peut fournir des résultats vrais
/ou faux qui seront vérifiés à l’aide d’un test de référence.
La méthode idéale devrait avoir une sensibilité, une spécificité et des valeurs prédictives aussi
près de 100%. Ceci constitue plutôt l’exception que la règle.
Le plan d’évaluation de base d’un test est le suivant :
Maladie Non
Malades Total
Test malades
Faux
Vrais positifs VP+FP
Test positif positifs
VP (a) (a+b)
FP (b)
Vrais FN+VN
Faux négatifs
Test négatif négatifs (c+d)
FN (c)
VN (d)
VP+FN FP+VN VP+FP+FN+VN
Total (a+c) (b+d) (a+b+c+d)
m1 m0 N
4
III.1- VALIDITE INTRINSEQUE
III.1.1-SENSIBILITE « Se » :
La sensibilité d’un test est la capacité d’un test à donner un résultat positif quand la maladie
est présente. Elle est estimée par la proportion de vrais positifs chez les malades.
Les caractéristiques de la sensibilité d’un test sont les suivantes :

- proportion du total des malades reconnus comme tels ;
- probabilité d’être diagnostiqué comme malade quand on a la maladie ;
- probabilité de dépister des faux négatifs ;
- elle est déterminée à partir d’un échantillon de malades.
La performance d'un test se jugera en effet essentiellement sur sa capacité à identifier

les patients pour lesquels la présence de la maladie n'est pas évidente.
III.1.2-SPECIFICITE « Sp » :
La spécificité d’un test est la capacité d’un test à donner un résultat négatif quand la maladie
est absente. Elle est estimée par la proportion de vrais négatifs chez les non malades.
Les caractéristiques de la spécificité d’un test sont les suivantes :

- proportion des sujets sains confirmés comme tels par le résultat négatif du test ;
- probabilité d’être diagnostiqué comme sain quand on n’a pas la maladie ;
- probabilité de dépister des faux positifs ;
- elle est déterminée à partir d’un échantillon de non malades.
La performance d'un test se jugera en effet essentiellement sur sa capacité à identifier

les patients pour lesquels l'absence de la maladie n'est pas évidente.
III.2- VALIDITE PREDICTIVE :

La valeur prédictive du test est la capacité de prévoir, à partir des résultats du test, la présence
ou l’absence de la maladie. Il s’agit de la performance d’une stratégie diagnostique
III.2.1-VALEUR PREDICTIVE POSITIVE « VPP » :

La valeur prédictive positive est estimée par la proportion de tests positifs (VP) correspondant
à de vrais malades (sujets ayant le signe).
5
III.2.2-VALEUR PREDICTIVE NEGATIVE « VPN » :
La valeur prédictive négative est estimée par la proportion de tests négatifs (VN)
correspondant à des sujets indemnes de la maladie (sujets n’ayant pas le signe).
é
é é
NB :On doit choisir un test ayant une VPP élevée quand le traitement d'un sujet faussement
positif peut avoir des conséquences graves (ex : ablation d'un organe en chirurgie).Un test
ayant une valeur prédictive négative élevée doit être retenu quand l'absence de traitement
entraîne des conséquences graves chez un patient au test faussement négatif (ex : taux de
lymphocytes CD4 dans l’infection à VIH).
On peut calculer le rapport :
Ce rapport signifie donc qu’un sujet a k fois plus de chances d’être atteint de la maladie si
l’examen est positif que s’il est négatif. Il est similaire au risque relatif défini en
épidémiologie.
III.2.3-VALEUR PREDICTIVE GLOBALE « VPG » :
Exemples numériques :
Exemple A ExempleB
Sujets Sujets Sujets Sujets
anémiques sains anémiques sains
Test : + 19 10 29 Test : + 15 5 20
HB≤12g/100 - 1 70 71 HB≤10g/100 - 2 78 80
Total 20 80 100 Total 17 83 100
K=0,66 / 1- 0,99 = 66 K= 0,75 / 1- 0 ,98= 37,5
6
IV. RELATION ENTRE LES INDICES
IV.1- PREVALENCE DE LA MALADIE :

La relation entre la sensibilité « Se », laspécificité « Sp » et les valeurs prédictives « VPP/
VPN » fait intervenir la prévalence « p » de la pathologie étudiée dans la population.
*Théorème de Bayes :
Tab1 :
Fig1 : Variation des valeurs VPP et VPN en fonction de la prévalence de la maladie
7
Tab 2 :
IV.2- RAPPORT DE VRAISEMBLANCE « Likelihood ratio ou LR »:
Ce rapport permet de combiner la sensibilité et la spécificité :
IV.2.1-RAPPORT DE VRAISEMBLANCE POSITIF (RVP) :
Le rapport de vraisemblance positif se définit par le rapport des probabilités d'avoir un nouvel
examen positif chez les malades et chez les non malades :
Si RVP = 4 : le test est 4 fois plus souvent positif chez les malades que chez les sains.
IV.2.2-RAPPORT DE VRAISEMBLANCE NEGATIF (RVN) :
Le rapport de vraisemblance négatif se définit par le rapport des probabilités d'avoir un nouvel
examen négatif chez les malades et chez les non malades :
Si RVN = - 0,5 ou - ½ : l’absence de signe est 2 fois moins souvent observée chez les malades
que chez les sujets sains.
Autres indices:
1. Rapport de vraisemblance à partir d’un résultat négatif: 1-Se / Sp

2. Indice de Youden : Se + Sp – 1 (cet indice varie entre -1 et 1, il vaut -1 si la sensibilité et
la spécificité sont nulles et +1 si la sensibilité et la spécialité valent 1.
Le rapport de vraisemblance est à privilégier, en particulier parce qu’il a une interprétation
simple.
8
IV.3-COURBE ROC (CAS DE REPONSE QUANTITATIVE) :
Pour une réponse quantitative, il faut choisir un seuil « S » permettant de séparer les résultats
positifs et négatifs. Une approche graphique permet de résumer les propriétés d'un nouvel
examen diagnostique quand le résultat de l'examen est quantitatif. Elle consiste à tracer la
courbe représentant la sensibilité obtenue pour différentes valeurs seuils du résultat en
fonction de la spécificité correspondante. Cette courbe s'appelle courbe ROC «Receiver
Operating Characteristic», terminologie provenant de l’étude des caractéristiques
d’appareils de réception de signaux radio. Elle part du point (0,0) et va jusqu’au point (1,1).
1°) Si le test est discriminant (distribution est unimodale): les valeurs des sains sont bien
séparées des valeurs des malades : rechercher un seuil pour sensibilité et spécificité à 100%.
Cette situation rare est illustrée sur la figure suivante :
Fig2 : Distribution des valeurs observées
Exemples: tension artérielle, taux de cholestérol sanguin, glycémie, tension intra-oculaire,

taux sanguin d’hémoglobine etc.
2°) Si le test n’est pas discriminant (distribution bimodale) : Il y a chevauchement des deux
distributions, le groupe des « cas limites » comprend à la fois les sujets malades et les sujets
sains rassemblés dans le même intervalle. Tel qu'illustré sur la figure suivante :
Fig3: Distribution des valeurs observées
9
Exemple: troubles héréditaires comme la phénylcétonurie
Pour former le diagramme ROC, on met l’antispécificité « 1-Sp » en abscisse et la sensibilité

« Se » en ordonnée.
Intérêt de la courbe ROC :

Elle permet la détermination et la comparaison des performances diagnostiques de plusieurs
tests à l’aide de l’évaluation des aires sous la courbe. Elle est aussi utilisée pour estimer la
valeur seuil optimale d’un test en tenant compte des données épidémiologiques et médico-
économiques de la maladie.
Exemple numérique : dépistage des sujets atteints de diabète type II « DNID », à l’aide
d’un dosage de la glycémie postprandiale (t+2h). Ci-dessous figure la distribution de la
glycémie chez les malades et chez les non malades.
Tab 3 :
Fig4 : Courbe caractéristique de la performance d’un test diagnostique du diabète

« courbe de ROC » :
10
V. VALIDITE EXTERNE D’UN TEST
« REPRODUCTIBILITE, CONCORDANCE »
Reproductibilité :
Un test ne doit pas seulement posséder une bonne validité interne. Il doit être reproductible et
cette reproductibilité (d’une personne à l’autre, d’une circonstance à l’autre chez les mêmes
sujets etc.) doit être connue au départ.
La reproductibilité d’une mesure s’évalue en étudiant la concordance entre des mesures
répétées. On peut évaluer la concordance entre deux appareils différents, entre deux
opérateurs différents utilisant le même appareil, ou entre deux lectures du même examen par
le même opérateur. Les méthodes statistiques utilisées dans ces différentes situations sont les
mêmes et ne dépendent que de la nature du résultat, binaire ou continu.
V.1-CONCORDANCE ENTRE REPONSES BINAIRES

« COEFFICIENT KAPPA »
Pour étudier la concordance sur un tableau 2x2, on teste l'hypothèse nulle d'indépendance
entre les 2 facteurs ligne et colonne contre une alternative de liaison particulière, qui est ici
une liaison positive. Le test du Chi2 habituel ne répond pas au problème précis de la
concordance. En effet, un Chi2 significatif indique l'existence d'une liaison qu'elle soit
positive ou négative. Les résultats observés et attendus se résument de la façon suivante :
Tab4: nombres observés (Oi) et attendus (Ei) sous l’hypothèse d’indépendance
OBS 1 Observateur 1
Total
OBS2 Anormal Normal
O1 O2
Anormal
E1 E2
Observateur2
O3 O4
Normal
E3 E4
Total N
Pour évaluer le degré de concordance, il faut:
1) estimer la proportion d’accords pc si les réponses des 2 observateurs étaient complètement

indépendantes
2) voir si la proportion d’accords po observés leur est nettement supérieure

 Le pourcentage d'accords observé est : p0=( O1+O4)/N
 Le pourcentage d'accords attendu est : pc= ( E1+E4)/N
Pour comparer ces deux pourcentages on utilise, par exemple, le coefficient de concordance
Kappa (ⱪ).
11
Le coefficient de concordance Kappa (ⱪ) est défini comme le rapport entre le gain observé et
le gain maximum « ⱪ = Gain observé /Gain maximum ». . Il vaut ici :
Le coefficient kappa peut varie de -1,0 (désaccord absolu) an passant par 0,0 (accord dû au
hasard) à 1,0 (accord absolu entre les diagnostics, tests, ou personnes). L’estimation du degré
de concordance est la suivante :
Coefficient kappa Estimation du degré

de concordance
0,8 à 1 Excellent
0,6 à 0,8 Bon
0,4 à 0,6 Moyen
000,2 à 0,4 Faible
0 à 0,2 Négligeable
<0 Mauvais
NB :En général, on accompagne le calcul du coefficient ⱪ de son degré de signification. Ceci
n'a pas beaucoup d'intérêt au sens où l’on devait a priori s’attendre à une concordance
significative. En effet, c’est un pré requis minimum que d’avoir des résultats plus concordants
que l'effet du hasard, dans une étude diagnostique.
Exemple numérique : lecture de l’IRM par deux opérateurs
Pour étudier la reproductibilité de la lecture de l’IRM dans l’exemple (nature de la tumeur

dans le cancer du sein), chaque résultat d’examen a été relu par deux opérateurs RG et OL.
Les résultats sont reportés dans le tableau ci-contre.
Tab.5: classement des IRM par les deux lecteurs

OL OL Total
RG IRM+ IRM-
RG IRM+ 98 0 98
IRM- 9 36 45
Total 107 36 143
 Le nombre total d’accords est égal à 98+36, soit 134.

 La proportion observée d'accords est égale à p0 =134/ 143 = 93,7%.Dans 93,7% des cas,
les opérateurs sont d’accord.
 Les 9 désaccords correspondent tous à des tumeurs considérées comme malignes par OL
et bénignes par RG.
 Pour évaluer le degré de concordance des réponses de ces deux observateurs, il faut
estimer la proportion d’accords que l’on observerait si les réponses des deux observateurs
étaient complètement indépendantes et voir ensuite si la proportion d'accords observés lui
est nettement supérieure. Le nombre d'accords attendus est calculé à partir des effectifs
attendus dans un tableau 2x2, il est noté nc.
12
Tab.6 : classement attendu sous l’hypothèse d’indépendance des deux lecteurs
OL OL Total
RG IRM+ IRM-
RG IRM+ 73,3 24,7 98
IRM- 33,7 11,3 45
total 107 36 143
nc=(98x107)/143+(45x36)/143=73,3+11,3=84,6
La proportion d'accords attendus pc est donc de 84,6/143=59,2%
Si les observateurs étaient parfaitement d’accord (100% d’accords), on aurait 100%- 59.2% =
40.8% d’accords en plus. Ceci représente le gain maximum par rapport à l'indépendance.
On a observé 93.7% d’accords, c’est à dire 93.7%- 59.2%= 34.5% de plus que ce que l’on
attend sous l’hypothèse d’indépendance.
Le degré de concordance est, comme attendu, très significativement différent de zéro

(p<10-3).
V. CONCLUSION
En épidémiologie, une variable physiologique ne varie pas exclusivement en fonction de

l’action d’un facteur ou d’un complexe de facteurs autres raisons, en particulier les
fluctuations périodique des fonctions, les variations non périodiques, la qualité et la précision
du matériel de mesure et le travail de l’observateur. Malgré cette situation complexe il faut
toujours définir, dans le cadre des observations de santé, le seuil d’une valeur qui sépare les
individus anormaux des individus normaux et qui devrait être, en principe, indépendant de
toutes les raisons mentionnées ci-dessus.
Chaque méthode possède une validité interne et externe qui lui est propre pour le jugement
de la valeur d’un outil de diagnostic.
Pour évaluer un nouvel examen diagnostique, il faut comparer les résultats qu’il fournit avec
ceux d'un examen de référence. L'examen de référence retenu n’est pas toujours une référence
incontestable, comme peuvent l'être un examen histologique ou une autopsie. Le diagnostic de
référence peut notamment être obtenu à posteriori par les données de la surveillance des
sujets. On peut aussi utiliser un examen de référence complété par les résultats de la
surveillance, quand pour des raisons éthiques, il n'est pas possible de pratiquer l'examen de
référence chez tous les sujets. Par exemple, quand on s'intéresse à la nature bénigne ou
maligne d'une lésion osseuse, la certitude diagnostique ne peut être obtenue qu'à partir d'une
biopsie, cet examen ne sera pratiqué que chez les sujets pour lesquels il y a une forte
suspicion de malignité, pour les autres le diagnostic sera considéré comme établi par les
données du suivi à un an.
13
VII. REFERENCES
1. Paul-Marie Bernard,Claude Lapointe-Mesures Statistiques en Épidémiologie

2. C.Rumeau-Rouquette, G.Breat, R.Padieu- Méthodes en épidémiologie-Flammarion
,janvier 1991
3. Alain- Jacques Vlleron- Masson -Introduction à la biostatistique-1996/1997
4. Jean Bouyer- Méthodes statistiques-Médecine-Biologie- Editions INSERM 1996
5. M.Jenicek, R.Cléroux- Epidémiologie « Principes, techniques, applications »-Edisem
Inc,1982
6. A. Laplanche, C. Com-Noigué, R.Flamant- Méthodes statistiques appliquées à la
recherche clinique-juin2004
7. Bernard Grenier, Masson, Evaluation de la décision médicale-Introduction à l'analyse
médico-économique. .
8. J.A. Ingelfinger, F. Mosteller, L.A. Thibodeau, J.H. Ware, Masson- Biostatistique en
médecine clinique, G. Landrivan, F. Delahaye, avec Le Recit, Masson. La recherche
clinique, de l'idée à la publication.
9. R. Salmi et N. Burkin(CDC), Cours IDEA 1987- Institut pour le développement de
l'épidémiologie appliquée. Diagnostic et dépistage. Introduction aux notions de sensibilité,
spécificité et valeurs prédictives.
VIII. ANNEXES
14
ANNEXE 1: DEFINITION DE CERTAINS TERMES /
« Evaluation global d’un test diagnostique »
VARIABILITE DES OBSERVATIONS

a. Les fluctuations périodiques des rythmes biologiques, circadiens et autres
fonctions
b. Les variations non périodiques réactions et adaptations aux diffères facteurs
autres que ceux qui constituent le sujet de l’étude
c. La qualité et la précision du matériel Ex. appareils et réactifs
de mesure
d. le travail de l’observateur
JUGEMENT DE LA VALEUR D’UN OUTIL DE DIAGNOSTIC
I.VALIDITE INTERNE :
la répartition des sujets dans les groupes étudiés,
A. Qualité de la sélection selon la nature même du problème (exposition,
pathologies étudiées, état des sujets)
B. Qualité de l’observation :
- La validité « proprement dite » - la performance du test par rapport à une
méthode de référence (sensibilité, spécificité,
valeur prédictive).
- L’efficience (valeur globale) - la proportion d’observations correctes dans
l’ensemble de toutes les observations.
- le choix du groupe de référence (témoins). En
C. Qualité de la comparaison l’absence de facteurs de distorsion, les sujets
témoins sont les témoins vrais
- l’aptitude du test à distinguer deux valeurs
D. Qualité de la discrimination avoisinant le seuil de normalité (dernier sujet
(finesse) sain et premier sujet malade).
II.VALIDITE EXTERNE
- l’aptitude à donner des résultats uniformes
A. La reproductibilité ou fiabilité malgré la variabilité de la méthode même, du
travail des observateurs et du phénomène
mesuré.
- l’aptitude à détecter les cas méconnus
B. Le rendement (iceberg) et l’ampleur réelle du problème
(sensibilité)
C. L’exactitude l’aptitude à cerner la réalité de façon non
biaisée, précise et juste.
- L’estimation sans biais - la faculté d’arriver à une valeur réelle sans

facteur correcteur.
- La précision - représente l’étendue des observations autour
de la valeur estimée.
- La justesse - une combinaison des deux qualités
précédentes offrant quatre possibilités :⃰
D. La représentativité - Indique la possibilité d’appliquer des résultats
à la population-cible désirée.
⃰-bonne estimation et bonne précision, - mauvaise estimation et bonne précision,
-bonne estimation et mauvaise précision, - mauvais estimation et mauvaise précision.
15

Cours Validité Dun Test Diagnostique - A6 - EU - IX 2 2

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Cours Validité Dun Test Diagnostique - A6 - EU - IX 2 2

Transféré par

Droits d'auteur :

Formats disponibles

REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE

MINISTRE DE L’ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE

ENSEIGNEMENT DE LA SIXIEME ANNEE DE GRADUATION EN MEDECINE

UE-IX.UNITE D’ENSEIGNEMENT EPIDEMIOLOGIE-METHODOLOGIE DE

VALIDITE D’UN TEST DIAGNOSTIQUE

Cours rédigé par Dr.BENELEFKIR.H/ MAT

1. Connaitre la définition d’un test diagnostique.

II. Structure d’une étude diagnostique

III. Validité interne d’un test

III.1. Validité intrinsèque

III.2. Validité prédictive

IV. Relation entre les différents indices

IV.1. Prévalence de la maladie « théorème de Bayes »

V. Validité externe d’un test : reproductibilité, concordance

V.1.Concordance entre réponses binaires : coefficient kappa

VIII. Annexes : évaluation globale d’un test

Le résultat d’un test s’exprime, schématiquement,soit en une variable qualitative

Le choix du test est fonction de la qualité de l’examen, la prévalence de la maladieet les

II. STRUCTURE D’UNE ETUDE DIAGNOSTIQUE

Structure d’une étude diagnostique

P (M+)= p1+p3=p et (M-)= p2+p4

III. VALIDITE INTERNE D’UN TEST

Le plan d’évaluation de base d’un test est le suivant :

Les caractéristiques de la sensibilité d’un test sont les suivantes :

La performance d'un test se jugera en effet essentiellement sur sa capacité à identifier

Les caractéristiques de la spécificité d’un test sont les suivantes :

La performance d'un test se jugera en effet essentiellement sur sa capacité à identifier

III.2- VALIDITE PREDICTIVE :

III.2.1-VALEUR PREDICTIVE POSITIVE « VPP » :

On peut calculer le rapport :

III.2.3-VALEUR PREDICTIVE GLOBALE « VPG » :

K=0,66 / 1- 0,99 = 66 K= 0,75 / 1- 0 ,98= 37,5

IV.1- PREVALENCE DE LA MALADIE :

Fig1 : Variation des valeurs VPP et VPN en fonction de la prévalence de la maladie

IV.2- RAPPORT DE VRAISEMBLANCE « Likelihood ratio ou LR »:

Ce rapport permet de combiner la sensibilité et la spécificité :

IV.2.1-RAPPORT DE VRAISEMBLANCE POSITIF (RVP) :

IV.2.2-RAPPORT DE VRAISEMBLANCE NEGATIF (RVN) :

1. Rapport de vraisemblance à partir d’un résultat négatif: 1-Se / Sp

Fig2 : Distribution des valeurs observées

Exemples: tension artérielle, taux de cholestérol sanguin, glycémie, tension intra-oculaire,

Fig3: Distribution des valeurs observées

Pour former le diagramme ROC, on met l’antispécificité « 1-Sp » en abscisse et la sensibilité

Intérêt de la courbe ROC :

Fig4 : Courbe caractéristique de la performance d’un test diagnostique du diabète

V.1-CONCORDANCE ENTRE REPONSES BINAIRES

Tab4: nombres observés (Oi) et attendus (Ei) sous l’hypothèse d’indépendance

Pour évaluer le degré de concordance, il faut:

1) estimer la proportion d’accords pc si les réponses des 2 observateurs étaient complètement

2) voir si la proportion d’accords po observés leur est nettement supérieure

Coefficient kappa Estimation du degré

Exemple numérique : lecture de l’IRM par deux opérateurs

Pour étudier la reproductibilité de la lecture de l’IRM dans l’exemple (nature de la tumeur

Tab.5: classement des IRM par les deux lecteurs

 Le nombre total d’accords est égal à 98+36, soit 134.

Le degré de concordance est, comme attendu, très significativement différent de zéro

En épidémiologie, une variable physiologique ne varie pas exclusivement en fonction de

1. Paul-Marie Bernard,Claude Lapointe-Mesures Statistiques en Épidémiologie

VARIABILITE DES OBSERVATIONS

- L’estimation sans biais - la faculté d’arriver à une valeur réelle sans

Vous aimerez peut-être aussi