Vous êtes sur la page 1sur 18

LCA

Lecture critique d’article

Page Lu Nombre de tour


Introduction 3
Essai clinique 7
Cohorte étiologique 10
Cohorte pronostique 12
Etude cas-témoin 14
Tests diagnostiques 16

1
2
LCA - INTRODUCTION
- Eléments à prendre en compte : validité interne (biais), externe (reproductibilité, et inférence statistique :
extrapolation à la pop), pertinence pour la pratique et cohérence avec les autres données de la littérature

Structure d’un article


- Titre : doit être concis et clair ; Introduction : replace l’étude dans son contexte : ce qu’on sait déjà, le problème
et les questions que ça pose, et la question de recherche à la fin (la plus précise possible)
Matériel et méthode
- Précise la population étudiée (avec méthode de sélection, critères et période d’inclusion…), le type d’essai, le
plan d’étude, les éléments pour limiter les biais et l’élément étudié :
o Si c’est un FdR (étude étiologique : TA, glc…) : décrire les procédures de recueil (quand, où, comment…)
o Si c’est une intervention (étude interventionnelle) : décrire la posologie, voie d’admin, méthode chir…
- Critère de jugement principal : évent étudié pour évaluer le FdR/intervention (AVC…), avec définition, recueil…
- Eléments statistiques : calcul du nombre de sujet, tests statistiques avec seuils retenus, estimations…
Résultats
-
- Ne doit pas interpréter. Décrit la population recrutée et celle effectivement recrutée (flow chart), avec ses
caractéristiques initiales
Objectifs Ce qu’on doit trouver
- Objectif principal : répond à la question posée, - Critère de jugement binaire (ex : AVC ou pas AVC) :
présentés en tableaux, description… le nombre d’évent dans chaque groupe avec leur
- Secondaire : présentés ensuite fréquence et les indices d’efficacité si intervention
- Les résultats rapportés dans le tableau ne sont pas (RR, OR), ou mesure d’asso si FdR
forcément dans le texte, et inversement - Variable continue (TA, taille) : moyenne + écart type
ou médiane + étendue (ou quartiles)
Discussion
- Synthétise les résultats (ce qui est intéressant), répond à la question posée, pose les limites de l’étude (biais, ce
à quoi ça ne répond pas), compare à la littérature, formule de nouvelles hypothèses,…
- Ne doit pas discuter de résultats non présentés dans la section différente. Au max 50% de l’article
- Bibliographie
- Ne doit citer que ce qu’il y a de marqué dans le texte. Doit être à jour avec des références récentes
- Système séquentiel de Vancouver : 1er auteur (nom entier + 1ère lettre du prénom) + autres (si > 6 : « et al »)
/!\ : la check list suivante est valable pour les études de
Question de recherche cohortes et randomisées ; un peu différente pour les cas
témoins et études diagnostiques
- A la fin de l’introduction : répond au PECO
- Population étudiée ; élément évalué (intervention ou FdR) ; comparaison (groupe de rèf) ; outcome (critère de
jugement principal) : tous les critères de jugement (principal ou secondaire) sont des objectifs
- Question répondue
Efficacité d’une intervention Etiologie
- Pour un TTT : efficacité sur la prévention d’un évent - Etudie un lien statistiquement significatif entre un
ou sur l’évolution d’un état de santé/symptôme dans FdR et un évent, mais ne conclut pas sur une causalité
une pop définie car pas de maîtrise du facteur étudié (on va pas faire
- Peut comprendre les dépistages (plus complexe : fumer des gens pour un kc du poumon)
comprend la détection et les TTT utilisés en aval), - Facteur pronostic : demande quasi tjrs une cohorte
télémédecine… Test diagnostique
- Incidence/prévalence - Vise à classer des malades et non malades ; différent
- Incidence : nécessite une étude de cohorte avec de l’étude de l’efficacité d’un test diag qui sera une
suivi longitudinal. Pas de comparaison de 2 groupes intervention
- Prévalence : étude transversale - Défini par Se, Sp, VP par rapport à un Gold standard

3
Descriptive Types d’étude épidémiologique
Analytique - Descriptive (non explicative) : transversale (prévalence), cohorte (incidence)
Selon
Diagnostique - Etudes comparatives (analytiques) : cas témoin ou cohorte d’exposé/non-exposé
l’objectif
D’efficacité (étiologique) ou cohorte de malade (pronostique) ; facteur non maitrisé
Pronostique - Etude observationnelle randomisée = essai clinique (maîtrise du facteur)
Grade A (niveau 1) Grade B (niveau 2) Grade C
Transversale
Essai randomisé Essai randomisé (faible Niveau 3 : cas-témoin
Selon le Longitudinale
(forte puissance), puissance), étude non Niveau 4 : rétrospective, série
schéma Cas-témoin -méta-analyse ; randomisée bien menée, de cas, étude descriptive,
Randomisé
analyse de décision cohorte étude comparative biaisée

Matériel et méthodes Fluctuations d’échantillonnage


- Variations de paramètres stat d’un échantillon
Population étudiée à un autre simplement dues au hasard
- Différence entre la population cible (conceptuelle), la pop - Diminue avec la taille de l’échantillon, mais
source, définie par des critères d’inclusion/non-inclusion pas par la randomisation. L’IC à 95% sert à
(vise à réduire les « bruits de fond »), et la pop effectivement prendre en compte la fluctuation
étudiée après screening
- La pop étudiée peut varier du fait du contexte de recrutement (lieu sélectif, période…)
- Si le groupe est très sélectionné, améliore la validité interne et on met plus facilement en évidence une
différence si elle existe, mais diminue l’extrapolation à la population cible (validité externe)
- Critères de jugement
- Ce qui doit être influencé (ou pas) par le FdR ou l’intervention. Peuvent être durs (mesurables sans biais : décès)
ou subjectifs (handicap, QdV… dis mous) ; entre les deux, les critères demandant un jugement clinique, bio (AVC)
- Instrument de mesure : caractérisé par sa validité (mesure ce qu’il doit mesurer) et sa reproductibilité
- Doit être le plus précis possible : pour une asso fracture/ostéoporose, quelles fractures ? Quel contexte ?
- Limitation du biais de mesure : doit être en aveugle du FdR/intervention étudiée, et avoir des outils validés
o Permet de limiter les biais différentiels (qui n’irait pas dans le même sens dans un groupe et un autre)
- Critère de qualité : critère simple meilleur que composite. Meilleur si validé, objectif, consensuel et pertinent
cliniquement parlant (les critères intermédiaires le sont rarement, sauf si validés dans l’event étudié)
Analyse statistique
Taille de l’échantillon Essai randomisé
- Doit être suffisant pour pouvoir montrer entre les - La comparaison entre les groupes traduit l’efficacité
grpes une différence si elle existe : plus cet effet est du TTT, indiquée par une mesure d’association
rare, plus l’échantillon doit être grand - Différence absolue : soustraction du % d’un groupe
- Dépend du risque α (erreur type I : risque consenti de avec celui de l’autre (plus proche de la « pop G »)
conclure à tort à une association, par défaut à 5%) et o Ex : dans un groupe XP, on a 3% de # et 1% dans
du risque β (type II : risque de ne pas conclure à tort le placebo : diff absolue de 2%
à une asso : 1-puissance ; doit être à 20% max) - Différence relative : rapport entre les deux diffs
o En cas de TTT à lourd impact (chimio), on peut (risque « de base » - risque « expérimental »/risque
réduire α à 1% (évite ++ d’en donner à tort) « de base » : ici, on a une baisse de 66% du risque)
- Doit être fait à priori à partir d’une hypothèse - Rapport de risque : Rexpérimental/Rplacebo, soit 1%/3% =
clairement exprimée : absence de l’étude = grave. 0,33 (réduit le risque de 67%). Plus il s’approche de 1,
Etude étiologique moins l’effet du TTT est important
- Nombre de sujets à traiter pour éviter un évent : se
- Cohorte : comparaison d’un groupe exposé et d’un
non exposé : effet du FdR mesuré par le risque relatif base sur la différence absolue ; soit 2%, donc besoin
o Eventexposé/Eventnon-exposé : 9 évents chez les de traiter 100 patients pour éviter 2 fractures sup ;
exposés et 3 chez les non-expo = RR x3 donc 50 patients pour un évent
o Si < 1 : facteur protecteur - En cas de variable linéaire (TA), sera exprimé par une
- Cas-témoin : RR impossible (vu qu’on sélectionne les différence de moyenne
malades), sera approché par l’Odd-ratio
-
4
Résultats et conclusion
- Vérifier que les résultats sont statistiquement significatifs : estimé par le p-value, dont la valeur indique les
chances que ce résultat soit dû au hasard (en général, significatif si < 0,01)
o L’IC 95% fonctionne idem : si on répète l’étude, le RR sera compris dans l’intervalle dans 95% des cas
- Importance de l’effet du TTT/force de l’association FdR-maladie : basé sur la pertinence clinique ; le number
to treat est un très bon indicateur (reste subjectif) ; ne pas confondre l’effet (objectif) et le bénéfice (pertinence)
Facteurs de confusion
- Peut induire une erreur sur la mesure du critère de jugement : par ex, si on étudie le lien OH/kc du poumon
sans prendre en compte le tabac, on va conclure que l’OH est associé au kc du poumon (alors qu’il est surtout
associé à la conso de tabac)
- Ces facteurs sont à prendre en compte avant l’étude (stratification) ou après (analyse multivariée)
o En analyse multivariée, la prise en compte du facteur de confusion donnera un rapport de risque plus
proche de 1 que si on ne le prend pas en compte.
o A l’inverse, un facteur d’interaction amplifierait l’effet observé (ex du tabac qui potentialise l’OH dans les
kc des VADS). A l’inverse, peut réduire l’effet : effet antagoniste
- Biais
- Erreurs allant systématiquement dans le même sens (différent de l’erreur aléatoire)
- Biais de mesure (classement) : biais de la mesure du FdR ou du critère de jugement principal
o Comprend les biais de confusion : non prise en compte d’un F. de confusion, qui change le classement
- Biais de sélection : non comparabilité des groupes, défaut de représentativité (plutôt en lien avec la validité
externe), exclusion de certains patients selon différents critères entre deux groupes…
Auteurs
- 1er auteur : en général celui qui a dirigé et rédigé l’essentiel de l’article. Le dernier auteur est souvent le
directeur de l’équipe (qui a proposé/guidé le projet). Les autres auteurs ont participé au travail ou la rédac

Notions de statistique supplémentaires


- L’analyse uni/bivariée (en fait les deux c pareil mdrrrrr) sert surtout à chercher quelles variables ont une
influence sur le CDJ, pour pouvoir les intégrer à l’analyse multivariée.
Notion de variable
- Variable quantitative : mesure une quantité, peut être discrète (valeur finie) ou continue
- Variable qualitative/catégorielle : mesure un état (oui/non, homme/femme…), binaire si prend 2 valeurs
- Variable censurée : délai avant la survenue d’un évent (censurée car pour certains patients, on aura juste un
temps jusqu’à la fin du suivi et non jusqu’à l’event)
Analyse descriptive
- Quantitative : comprend la prévalence (influencée par la durée de la maladie et l’incidence) et l’incidence
- Qualitative : paramètres de position : moyenne, médiane (moins sensible aux valeurs extrêmes que la
moyenne) ; et de dispersion : variance et écart-type (plus ils sont étroits, plus les valeurs sont proches de la
moyenne), intervalle interquartile (liés à la médiane)
- Censurée : représentées par la courbe de survie de Kaplan-Meier (peut déterminer la médiane)
Analyse univariée
- Association entre 2 variables. Besoin de faire des hypothèses (H0 : nulle, càd absence de différence – peut
parfois être un seuil sous lequel on considère le résultat non pertinent ; ou H1), permettant de définir les risques
α et β. Inflation du risque α limité par la méthode de Bonferroni (répartit le risque sur les différents tests)
- /!\ : un test bilatéral permet de conclure que A > B ou que A < B, tandis qu’un test unilat ne peut conclure qu’à
l’un des deux (mais avec un risque α moindre)
- Association entre une variable quantitative et qualitative donnée par un OR/RR. L’asso entre 2 quantitatives
est donnée par un coefficient de corrélation (-1 : corrélation évoluant en sens inverse ; 0 = absence d’asso (mais
pas forcément indépendance) ; 1 = corrélation dans le même sens)

5
Analyse multivariée
- Facteur intermédiaire : causé par l’exposition et causant le CDJ (ex : TTT anxiolytique augmentant le risque de
chute, et chute causant des fractures : chute = intermédiaire)
- Facteur de confusion : associé à l’exposition et au CDJ sans être intermédiaire (« véritable cause » d’une
association entre l’expo et le CDJ, car également associé à l’exposition)
o Pour un unique facteur de confusion, on peut utiliser l’ajustement de Manterl-Haenszel : estime un
OR/HR ajusté sur le FdC, en faisant une moyenne de l’OR/HR de chaque strate, et en la comparant à
l’OR/HR brut. S’ils sont proches, ce facteur n’est pas un FdC (de moins en moins utilisé : on préfère les
modèles de régression multivariés)
- Facteur d’interaction : modifie l’association entre l’expo ou le CDJ. Dans une analyse stratifiée, l’association
sera différente selon la strate (tandis que pour un FdC, les strates font disparaître l’association)

Méta-analyses
- La validité interne se juge sur celle des essais qu’elle inclut. Etablir en amont la procédure de sélection des
essais, en s’assurant notamment de rassembler tous les sujets d’intérêt portant sur l’étude
- Biais de publication : les études concluantes ont tendance à être plus souvent publiées que les non concluantes.
Besoin de rechercher ce biais
- Se fait via la base de données Cochrane. Peut inclure des études non encore sorties

Placebo et nocebo
- Placebo : l’effet dépend de la caractéristique qu’il mime, du moins initialement. Des placebos de paliers 1 ont
été ressentis comme moins efficaces que des placebos de paliers 2 (mais non maintenu à long terme)
o L’effet placebo est populationnel tandis que la réponse placebo est évaluée au niveau individuel
o Purs si aucun effet pharmaco ; impurs si présence d’un effet, mais pas dans l’indication utilisée
- Nocebo : composante négative, le plus souvent somnolence, céphalées et troubles digestifs. Cas de syndromes
de sevrage décrits
-

6
LCA – ESSAIS CLINIQUES
- Dans la majorité des cas : essai de supériorité (parfois de non-infériorité). Parfois juste descriptif (phase I)

Type d’étude
- Essai contrôlé randomisé = seul adapté (souvent dans le cadre d’une phase 3), avec un groupe intervention et
un groupe contrôle (recevant soit un placebo, soit le TTT de référence)
Rôle du groupe contrôle
- Permet de s’assurer que le résultat observé n’est pas dû à l’évolution naturelle de la maladie, à l’effet placebo
(importance de l’aveugle pour éviter le biais différentiel), ou à l’effet de TTT concomitants (recueillir)
- Régression à la moyenne : phénomène lié aux critères d’inclusions utilisant un seuil. Par ex, si on inclut sur la
TA, on peut inclure des patients ayant une TA normale mais qui, au moment de l’inclusion, vont avoir une mesure
artéfactuelle avec une HTA les faisant intégrer l’étude. Lors de l’essai, ils diminueront la TA moyenne
o Si c’est une erreur aléatoire et pas d’inclusion, la TA finale sera sous-estimée idem dans les deux groupes
Randomisation
- L’allocation des patients dans chaque groupe est entièrement faite par hasard : les 2 groupes doivent être
comparables ; par table de nombre au hasard, séquence informatique…
- L’allocution dans les groupes est le plus souvent en 1 :1 (clause d’ambivalence). Parfois, le ratio est 2 :1 pour
augmenter le nombre de patient traités pour avoir plus d’info sur la tolérance (et améliore le recrutement…)
Assignation secrète Comparabilité initiale
- Correspond à la clause d’ignorance : celui qui inclut - Les caractéristiques des patients sont dans le 1er
le patient ne peut pas savoir dans quel groupe il sera tableau de l’article, avec toutes les infos importantes
intégré (évite qu’il puisse « choisir » les groupes) (/!\ aux caractéristiques non renseignées)
- Meilleure méthode : randomisation centralisée par - La comparaison se fait à l’œil : pas de test stat, sauf
un centre tiers attribuant les patients si petit effectif (test possible pour s’assurer de
- Toute méthode où celui qui inclut peut savoir dans l’absence de différence significative)
quel groupe sera le patient n’est pas bonne - Des fluctuations sont possibles pour des groupes de
faible effectif : vérifier qu’elles vont dans le même
sens pour les deux groupes
Double insu
- Permet d’éviter la modification du comportement du patient Types de randomisation
et du médecin (ou en tous cas, de façon non différentielle) : - Simple : séquences de nombre, risque de
maintien la comparabilité pendant le suivi déséquilibre si faible effectif
o Simple insu : seul le patient est en aveugle (/!\ : doit être - Par blocs : permet de s’assurer que le même
levé si EI grave) nbre de patient est attribué dans chaque grpe
o Triple insu : le statisticien effectuant les analyses est (par ex, si blocs de 4 : 2 dans chaque grpe)
aussi en aveugle (de préférence, toujours vérifier qui est - Stratifiée : utilisée pour s’assurer que des
précisé en aveugle) facteurs prono importants sont bien répartis
- Besoin que le placebo et le TTT testé soient identiques (si dans chaque grpe (une strate = une liste de
impossible, par ex avec un injectable et un PO : utiliser deux randomisation). Permet l’analyse sous-grpe
placebos). Parfois impossible (comparaison de TTT hospit vs - Par minimisation : algorithme limitant les
ambulatoire, chirurgie, kiné, EI visibles ++ d’un TTT) déséquilibres sur les facteurs importants,
o Dans ce cas, s’assurer que le médecin en charge de la utiles en petits groupes (onco ++)
mesure du critère de jugement soit en aveugle.
Schéma d’essai randomisé
- En parallèle : chaque groupe reçoit soit le TTT, soit le placebo, et on analyse
- En cross-over : idem, mais en échange les groupes dans la 2e partie d’étude ; la randomisation porte sur l’ordre
dans lequel on reçoit le TTT. Besoin d’un wash-out (temps sans TTT) pour éliminer l’effet du 1er
o La 1ère analyse permet de comparer les 2 TTT, la 2e de comparer la séquence de TTT
o Augmente la puissance de l’étude ; mais le CDJ doit pouvoir être mesuré plusieurs fois de façon
indépendante, l’effet du TTT doit être réversible, la maladie ne doit pas évoluer pendant le wash-out,
les perdus de vus ne peuvent être comptés, et il ne doit pas y avoir d’effet d’apprentissage
-
7
Matériel et méthodes
Population étudiée
- Validité externe : les critères d’inclusion/non inclusion sont pertinents si la pop recrutée correspond à celle q
ciblée en dehors de l’essai. Estimable sur le flow chart : si bcp de patients screenés mais non inclus, sursélection
- Les grpes doivent rester comparables jusqu’à la fin; principale risque = attrition (avec CDJ non mesurable) ;
chercher s’il y a une attrition différentielle entre les 2 grpes (nbre, carac …) : biais de sélection, ↘ puissance
o /!\ : si différence dès l’inclusion, devra être prise en compte dans une analyse multivariée.
Analyse en intention de traiter Analyse per protocole
- Analyse tous les patients randomisés, qu’ils aient - On n’analyse que les patients suivant le protocole
reçu ou non le TTT, suivi ou non le protocole… - A tendance à surestimer l’efficacité du TTT
- Aura tendance à diminuer la diff entre les groupes o Exclut les patients ayant arrêté pour EI, parce
(plus proche de la vraie vie) que leur TTT ne leur semblait pas efficace…
- /!\ : possible que si on a le CDJ pour tous les patients o /!\ : vérifier la flow chart (absence d’exclusion)
- Pour les vrais perdus de vue : gestion de données
manquantes nécessaire (reste un biais d’attrition) Maintien de la comparabilité = ITT
Critère de jugement
Critères de jugement composites
- Pertinence : /!\ critères intermédiaires (de substitution - Constitués de plusieurs évent (type AVC + IDM +
ou surrogate). Permettent une durée d’étude plus courte décès) : le patient a présenté le CDJ s’il a eu au
avec un recrutement moindre, mais ne traduisent pas tjrs moins un de ces évènements
l’effet clinique associé (voire parfois l’inverse) - Permettent un gain de puissance pour un même
- Si plusieurs CDJ, préciser le principal (éviter d’en avoir effectif, et peuvent être pertinents dans certaines
plusieurs : augmente α) situations (prévention des FdR CV par ex)
- Pour les critères mous ou demandant un jugement - Par contre, ne permet pas de conclure sur un des
clinique, on peut utiliser un comité d’adjudication éléments du critère séparément (un peu comme
indépendant, ou à défaut faire une évaluation en double/ on ne peut pas conclure sur un sous-groupe)
triplet pour s’assurer de la reproductibilité des critères
o /!\ : plus le critère est compliqué à valider (nbx examens…), plus le risque de perdus de vue est fort
- Biais de classement : limité par le double-insu ; mais s’assurer les modalités de suivi des 2 groupes soit identique
Analyse statistique
- Portent en premier sur le CDJ principal. Passent en général par une analyse descriptive, puis une analyse uni ou
bivariée, puis multivariée pour les facteurs de confusion potentiels (pas besoin si bonne randomisation)
ITT – Gestion des données manquantes Analyse en sous-groupe
- Problème posé quand le CDJ ne peut être mesuré - Analyse du CDJ selon l’âge, le sexe, les ATCD…
- Imputation multiple : on attribue le CDJ selon les - Doivent être prédéfinies, et peuvent permettre
caractéristiques du perdu de vue d’émettre des hypothèses à explorer par d’autres
- Worse case scenario : considère les données du bras études, mais jamais ne permet de conclure
expérimental comme des échecs, et celles du bras - Lié une inflation du risque α (plus de chances que le
placebo comme des succès résultat significatif d’un sous-groupe soit due au
o Diminue ++ la différence entre les bras, hasard car on fait plus de test statistique)
restrictive, donc peu utilisée - Souvent présenté sous forme de forest plot
- Last observation carried forward : on prend la Nombre de sujets nécessaires
dernière valeur dispo pour le patient (ex : si suivi à
- Fait à priori, basé sur une hypothèse détaillée. Si
M6 et M12 et qu’on a que M6, on reprendra la valeur
impossible en amont, doit être vérifié à posteriori
de M6). Fréquente, mais non recommandée
- Comprend dans son calcul la puissance attendue, et
Résultats de tolérance la durée de suivi de TTT si critère non censurée (si
- Souvent mal rapportée dans les essais : mais l’étude dure plus longtemps, on aura un nombre
manquent svt de puissance car les EI sont plus rares d’évent plus important)
- L’absence de diff stat significative ne permet pas de - Pour une étude de non infériorité, prendra aussi en
conclure à une bonne tolérance du TTT compte la marge de non infériorité

8
Critère binaire Critère continu Critère censuré
Analyse Moyenne + écarts type ou Courbe Kaplan-Meier
Fréquence, %
descriptive Médiane + quartiles ( (médiane de survie)
Chi2 (paramétrique) Student (para)
Test du log rank
Analyse uni Fisher (non para) Wilcoxon ou Mann Whitney
Modèle de Cox univarié
ou bivariée RR brut ou régression (non paramétrique)
(HR brut)
logistique univariée (OR brut) ANOVA ou ANCOVA
RR ajusté
Analyse Comparaison des survies
Régression logistique Régression linéaire
multivariée Modèle de Cox (HR ajusté)
multivariée (OR ajusté)
- Critère binaire : CDJ à J30 (mort/pas mort) ; Critère continu : Dlr, TA, QdV… ; Critère censuré : temps nécessaire
pour avoir un critère binaire (jours avant AVC, décès… modélisé par une courbe de survie)

Résultats et conclusion
- Les tests statistiques permettent d’obtenir le petit p ou l’IC95. Si la différence observée n’est pas significative
statistiquement, on ne peut pas conclure qu’il n’existe pas de différence (peut être dû à un manque de puissance
par ex, même si peu probable si effectif > NSN, gde étude…)
Biais
- Sélection différentielle : survient sur un défaut de randomisation ou sur une attrition (à tjrs rechercher)
- Biais de mesure : mesure du CDJ différente dans les deux groupes, à risque ++ si critère mou en ouvert
- Biais de suivi : suivi différent entre les 2 groupes, à risque si essai en ouvert (double insu ++)
- Biais de confusion : maîtrisé par le groupe contrôle et pris en compte dans les analyses multivariées
Conclusion
- Discute de la validité interne et de la significativité des résultats : répondent-ils à la problématique ?

Formes particulières
Essai de non-infériorité
- Proposé pour des médicaments pas plus efficace, mais avec moins d’EI, moins chers, plus pratiques…
- Dans un essai de supériorité, l’absence de différence entre les traitements ne permet pas de conclure à leur
équivalence (puisqu’il peut aussi être moins bien).
- Impossible de montrer une stricte équivalence : on montre alors qu’ils ne sont pas trop différents
o On définit une borne de non-infériorité (marge « tolérée » où le médicament peut être moins efficace).
o L’IC95 devrait se trouver dans cette marge. Possible essai d’équivalence où on définit borne inf et sup
Transformation en supériorité Conduite de l’étude
- Ne pose pas de problème si une analyse en ITT a été - Besoin de faire une analyse en ITT et per protocole,
faite en plus du per protocole puisque là l’ITT aura tendance à réduire la différence
- L’inverse est plus compliqué : il faut qu’une borne de entre les TTT, et donc à favoriser la non-infériorité
non infériorité soit définie avant le début de l’essai, o S’assurer que les deux concordent, même si le
que le design soit approprié, que l’essai soit assez per protocole est plus pertinent
sensible, et que les auteurs montrent que le TTT de Choix de la borne
rèf a montré son efficacité habituelle
- Plus elle est petite, plus le nombre de patient
o Plus simple de concevoir d’emblée une non
nécessaire sera élevé. A l’inverse, plus elle est large,
infériorité
moins il sera pertinent de parler de non infériorité
Etudes quasi-expérimentales
- Utilisées pour les programmes de santé publique (dépistage) ou quand une randomisation n’est pas possible
- Comparaison de la fréquence d’un évènement dans un seul groupe, soit avant/après (possible avec groupe
témoin), soit à un autre groupe d’un autre centre (ici/ailleurs)
- Cas du dépistage : permet une avance au diagnostic menant à une guérison : s’exprime en gain de survie pour
le dépistage vs l’absence de dépistage. Essai contrôlé randomisé = rèf, mais difficile à mettre en place car effet
plus dilué (besoin de gros effectifs, avec long suivi…). L’analyse se fait en intention de dépister (= ITT)

9
LCA – COHORTE ETIOLOGIQUE
- Ensemble de personnes suivies pour lequel le recueil du facteur de risque est fait avant la survenue du CDJ
- Une cohorte peut être descriptive (incidence d’un évent, prévalence, pronostic… sans recherche d’asso à un
autre facteur), étiologique (FdR d’un évent) ou pronostique (taille d’une tumeur influence la survie ?)

Type d’étude et population étudiée


- Au recrutement dans l’étude, les patients sont indemnes de la maladie (CDJ), classés en exposés/non exposés,
et suivis dans le temps (au moins deux temps : un initial pour FdR, et un final pour mesure du CDJ)
o 1ère chose à vérifier : comment les auteurs se sont assurés que le patient était indemne ?
o Souvent par questionnaire car les cohortes peuvent regrouper de nombreux patients (parfois > 100k…
impossible de tous leur faire une radio par ex)
- La cohorte peut être classique (suivi prospectif), historique (même design basé sur un recueil dans les dossiers)
ou une cohorte prospective où le recrutement est fait du fait de la présence du FdR
o Dans une cohorte classique, le FdR est confirmé après inclusion
Cohorte classique
Patients inclus selon le FdR
- Cohortes souvent peu représentatives car tout le monde n’accepte
- Utilisées dans le cas où le FdR est
pas de participer à une étude (biais de sélection : les plus éduqués
rare (peu de patient exposé en pop G)
participent plus). Peu de risque sur la validité interne
- Plus grand risque de biais de
o Le biais de sélection entre les exposés/non exposés est très
sélection différentiel, notamment
improbable du fait du recrutement à priori
car les exposés ont peut-être d’autres
o Il sera surtout dû aux perdus de vue : attention au suivi +++ (si
caractéristiques particulières
perdu de vue, chercher pourquoi)
Cohorte historique
- Proposée pour les maladies rares avec besoin d’un effectif important, pour les cas où le temps entre l’exposition
et la maladie sont longs (et à fortiori, quand on a besoin d’une réponse rapide)
- Peu de biais de sélection : on inclut dans l’étude indépendamment de l’expo au FdR ou de la survenue de la
maladie (on prend une « pile de dossiers médicaux » qui fait la cohorte, et on analyse tout dedans)
o Les données seront par contre de moins bonne qualité : données manquantes, imprécisions…
- /!\ : tous les individus doivent être suivis sur la même durée. Si perdu de vue, chercher si c’est lié au CDJ
- Ambiguïté sur le terme rétrospectif : techniquement, le recueil des données est prospectif et a déjà été fait, c’est
la question de recherche qui est rétrospective. On peut parler d’étude rétro-prospective

Matériel et méthodes
Critères de jugement
- Mêmes exigences que pour une étude clinique. Il doit être mesuré en aveugle de l’expo au FdR (sauf si critère
dur, type décès). Sinon : risque de biais de mesure (si on sait qu’un patient est exposé, on peut avoir tendance à
le suivre plus souvent). Le suivi doit être suffisamment long (sa durée fait partie du CDJ)
Cohorte prospective Cohorte exposés/non exposés
- CDJ précisé avant le début de l’étude : méthode de - Surveiller le biais de suivi car le fait d’être exposé le
recueil parfaitement adaptée (précisé dans l’étude), modifie souvent (meilleur suivi par le MT, la
permet de limiter le biais de mesure médecine du travail…) : biais de recueil/suivi +++
Cohorte historique
Facteur de risque
- Peu de risque de biais de mesure différentiel, mais
- Pas de différence pour les cohortes prospectives ou
possible biais de suivi à cause du FdR
exposés/non exposés (peu de biais possible)
o L’examinateur peut être influencé en sachant
- Historique : biais possible si l’investigateur sait qui a
qui a le FdR
développé la maladie
- Le recueil du CDJ peut être prospectif
-

10
Biais
- La moins biaisée des études non interventionnelles (dans l’ordre : cohorte prospective > historique > exposés/
non exposés > cas témoin niché dans une cohorte > cas témoin incident > cas témoin prévalent)
De sélection De mesure
- A l’inclusion : biais différentiel possible pour les - Recueil déclaratif : les patients peuvent mentir et
expo/non exposés (définir les critères d’inclusion ++) sous-estimer le FdR (sujet tabou) ou sur-estimer (si
- Pendant le suivi : perdus de vue ++, surtout si à cause indemnisé). Corrigé par un recueil fiable, standardisé
de la maladie (demande un suivi rigoureux) - Recueil de la maladie différents entre les 2 groupes
De confusion (suivi différent : tous les cas chez les exposés vs que les
- Idem que pour une étude clinique symptos chez les non exposés par ex)

Analyses statistiques
- Le calcul du nombre de sujets nécessaires se base aussi sur la puissance (qui est toujours au moins > 80%), et
sur la valeur du risque relatif attendu en hypothèse par rapport à l’incidence connue de population générale
Mesure d’association Modèle de régression
-
- Estimée par un RR avec IC95%, comparant le % de - Permet d’estimer le risque relatif, le plus souvent par
maladie chez les exposés et les non exposés régression logistique (la variable à expliquer Y
o /!\ : ne pas prendre la valeur absolue du nombre représente un event à 2 réponses : oui/non)
de malades : les grpes n’ont pas la même taille ! o Donnera un Odd ratio et pas un RR
- On peut faire selon plusieurs niveaux d’exposition : - La régression logistique mesure l’association entre
la catégorie de référence (RR = 1) sera la moins expo l’event et le FdR en prenant en compte les F. de confu
o Par ex : RR d’ADK pulm selon la quantité de cig/j o Les FdC sont considérés comme d’autres
o Permet de déduire un effet dose (RR croissant variables explicatives (XFDR ; Xâge ; Xsexe…)
avec l’exposition) si les IC ne se chevauchent pas o Si on a qu’une seule variable explicative, c’est
o Si les IC se chevauchent : besoin d’un test stat une régression univariée avec RR brut (crude)
pour voir si la tendance est significative, fait par o Si plusieurs variables : régression multivariée,
un Chi2 donnant le p tendance le RR est ajusté en enlevant l’influence des FdC
- Si on fait des analyses de survie (temps avant
l’event), l’analyse se fait sur des personnes-
années/mois via un modèle de Cox, qui donne un HR

Résultats et conclusion
- La conclusion doit porter sur le résultat le moins biaisé, issu de l’analyse multivariée (même si peut être remis
en cause par la non prise en compte de FdC majeurs).
- Une fois qu’on est sûr du résultat et de sa pertinence, il faut chercher un lien de causalité (s’il existe, la
suppression du FdR peut faire espérer la réduction de la maladie).
Critères de Hill
- Permettent de renforcer la présomption de causalité (puisque faire un essai clinique randomisé pour ça est pas
très très éthique askip)
Critères internes Critères externes
-
- Forte intensité de l’association : RR/OR/HR élevé - Concordance avec de précédentes études
- Existence d’une relation dose-effet significative - Plausibilité biologique : connaissance physiopath
- Spécificité de la relation entre l’exposition et la pouvant étayer la conclusion
maladie (pas d’autre FdR imputés) - Concordance avec des études in vitro/vivo
- Chronologie : FdR survient avant la maladie - Diminution de l’incidence de la maladie quand
suppression de l’exposition au FdR

11
LCA – COHORTE PRONOSTIQUE
- Etudie l’association entre un facteur et l’évolution de la maladie : facteur pronostique

Type d’étude, population étudiée


- Peut parfois être fait à posteriori sur une étude descriptive de survie (histoire naturelle de la maladie)
- Fait sur des études de cohorte : mêmes avantages et limites qu’une cohorte étiologique, mais ici on aura
seulement des sujets malades à l’inclusion (obj = adaptation TTT). Parfois fait sur cas-témoin (non approprié)
Population étudiée
- Préférer des patients au même stade de la maladie, à l’évolution la plus précoce possible (doit être décrit ++,
avec la durée d’évolution à l’inclusion des patients)
- Risque de surreprésentation de bon mojo si on inclut des cancers à 3 ans d’évolution (ceux de mauvais mojo
sont déjà morts, donc non inclus…) ; ou de mauvais mojo si inclusion de DT chroniques multicompliqués
Critères à priori Critères à posteriori
- Doivent être aussi représentatifs que possible de la - Le suivi doit être idem pour tous les patients
population G (le pronostic sera svt moins bon en CHU, - Dans l’idéal, il faut connaître l’état de santé de tous
différent si suivi par Med G ou spécialiste…) les patients à la fin de l’étude
- Les critères de non inclusion sont plus exigeants - /!\ perdus de vue : tjrs chercher pourquoi, car peut
- Dans l’idéal : essayer de recruter les cas incidents être lié à la maladie (guérison et arrêt suivi, ou DC)
dans toutes les filières de suivi o Importance selon la fréquence de l’évent :
o A minima : inclure tous les patients consécutifs remet en cause la validité interne si 5% de
perdus de vue et outcome à 10% de
prévalence, mais ballec si égal à 60%

Matériel et méthodes
Critère de jugement
- Si le CDJ est mou/soumis à un jugement clinique : l’aveugle de l’évaluateur est toujours nécessaire quant à
l’exposition ou non au facteur pronostique. Le suivi doit être long, jusqu’à survenue attendue de l’event
- Le suivi peut être plus rapproché si un médecin sait qu’un patient a un facteur de mauvais mojo
Facteur pronostique
- Variés : démographiques (âge, sexe…), liés à la maladie (stade TNM, marqueur infla…), une patho associée…
- Peuvent prédire un event positif (survie, guérison…) ou négatif (décès tout cause ou spécifique, complication…)
- Causalité non nécessaire ; il suffit juste d’avoir une corrélation assez forte

Analyses statistiques Dates


- D’origine : date d’inclusion à partir de
- Nbre de patients nécessaires : idem qu’ailleurs, mais on parlera laquelle le suivi du patient commence
souvent en patient-année pour prendre en compte la différence de o Virtuellement identique pour tous
suivi entre les patients - De point : date d’arrêt du suivi (idem
o Dans une étude randomisée, les patients ont normalement le pour tous : toute donnée après cette
même temps de suivi, d’où le fait que l’expression en patient- date, y compris décès… ne sera pas prise
année ne soit pas utile en compte)
- Une cohorte pronostique est basée sur une analyse de survie. Si on - De dernières nouvelles : dernière date
utilise en outcome les décès spécifiques, les décès d’autres causes de recueil d’info pour le patient
seront considérées comme des censures.
o Données censurées : patient perdus de vue et ceux vivants à la fin de la période de suivi
- Fonction de survie : probabilité que l’event ne survienne pas avant une date t (si décès : % de survie jusqu’à
date t)
- On peut résumer l’analyse soit par un taux de survie à un certain temps, soit en exprimant le délai nécessaire
pour atteindre un certain taux de survie (ex : médiane = temps pour atteindre 50% de survie)
o La médiane exacte est souvent difficile à avoir : définie par la durée la plus courte avant 50%

12
Méthodes d’analyse de survie
- Deux méthodes non-paramétrique : l’analyse actuarielle (presque plus utilisée) et la méthode de Kaplan-Meier
- Toujours indiquer à intervalle régulier le nombre de patients encore suivis dans l’étude
Analyse actuarielle Méthode de Kaplan-Meier
- Life-table estimate : données représentées par - Product-limit estimate : intervalles non définis à
intervalle de temps (par ex, tous les 10 J) priori, mais par les instants où on observe l’évent
- Donne une courbe avec le nbre de patients vivants (donc inégaux)
tous les 10 J : ainsi, un patient décédé à J1 et J9 seront o Proba de survie égale entre chaque palier
sur le même point de la courbe ; et pas de diff entre - Donne un aspect en marche d’escalier de la courbe
un sujet suivi 21 et 29 jours - En cas de donnée censuré : ajout d’un petit trait sur
- Réservée à de grands échantillons la courbe (pas une marche d’escalier)
Comparaison entre plusieurs groupes
- Méthodes permettant de comparer la survie de plusieurs groupes indépendants
- Test du log rank : estime le nombre d’évent attendu sur la période étudiée, puis le compare pour chaque
intervalle de temps dans chaque groupe. Test le plus souvent utilisé
- Test de Wilcoxon : idem que le log rank, mais pondère en fonction du nombre attendu et observé d’évent
- Les taux observés sont estimés par un IC 95%, qui est d’autant plus étroit qu’on a d’observations
Modèle de Cox
- Modèle de régression adapté aux données censurées : compare plusieurs groupes et permet de dire s’il existe
une différence statistiquement significative entre eux
- Permet aussi la prise en compte de facteurs de confusion dans des analyses multivariées. Donne des résultats
en risque relatif instantané (Hazard Ratio).

Résultats et conclusion
- Ce qui est important à regarder ici, c’est la force et précision de la prédiction du devenir du patient
Biais
Facteurs de confusion Biais de mesure
- Correspondent aux autres facteurs pronostiques - Concerne la mesure des facteurs pronostiques ou du
(connus ou potentiels). Pris en compte dans l’analyse CDJ : dépend beaucoup d’un biais de suivi +++
Biais de sélection - Attention aux taux moyens, qui apportent peu
d’information au final (peut cacher des grandes
- Correspond à des patients inclus à des stades
variations de pronostic) : seul bon moyen = courbe
différents de la maladie
Précision du pronostic
- Sur les études avec suivi précoce, les données sur la gauche de la courbe sont souvent très précises (grand
échantillon), tandis que celles à droite (queue de courbe) souffrent de beaucoup de perdus de vue, de décès…
o La queue de courbe est donc toujours moins précise

13
LCA – ETUDES CAS-TEMOINS
- Recherche si un FdR est associé de façon significative à une maladie (plus précisément, si l’expo à un FdR était
plus fréquente chez des patients atteints d’une maladie). Ne permet pas de calculer une prévalence

- Type d’étude et population étudiée


- Il s’agit d’une étude observationnelle et étiologique (analytique). L’exposition au FdR est toujours rétrospective
Population étudiée
-
- Le recrutement doit se faire sans connaissance ou non de l’exposition au FdR étudié
Cas Témoins
- Peuvent être issus de l’enregistrement de tous les - Vérifier qu’ils n’ont pas la maladie étudiée
cas sur une période et une zone donnée : permet - Dans l’idéal, doit être représentatif de la pop d’où est
d’être plus représentatif de la pop G issue les cas étudiés
- Les cas incidents sont ceux inclus peu de temps - Peut aussi venir de la pop G, de patient hospit…
après le diagnostic (possible surreprésentation des chaque mode à des avantages et des inconvénients
stades précoces), à l’inverse des cas prévalents, qui
sont inclus longtemps après le diagnostic
L’appariement
- Permet de contrôler à priori certains facteurs de confusion en formant des paires selon certains facteurs
- Par ex, on peut apparier un homme de 50 ans témoin avec un homme de 50 ans cas (en général, on fait par
strates de 5-10 ans, sauf en pédiatrie). Un cas peut être apparié à plusieurs témoins : augmente la puissance
- Demande des tests statistiques particuliers. Utilisable dans les études de cohorte (exposés/non exposés)

Matériel et méthodes
- CDJ : correspond à la maladie étudiée. Juste s’assurer que les témoins ne soient pas malades
- Facteur de risque
- Attestation rétrospective, donc erreurs de mesure +++ liées à un biais de mémoire : type de biais de mesure
- Parfois simple imprécision : erreur aléatoire donnant un bruit de fond (cause une perte de puissance à l’étude)
- Peut être une sous/sur-estimation de l’exposition. Ballec si biais non différentiel, mais en pratique, les cas
surestiment beaucoup plus leur exposition (souvent parce que le FdR est déjà +/- connu). Rarement : l’inverse
- Les données peuvent aussi être tirées de registre et non déclaratives : exclue le biais de mémoire
- /!\ au mécanisme du FdR : un TTT débuté 15 J avant la survenue d’un cancer est difficilement incriminable, de
même qu’un TTT arrêté 6 mois avant une rhabdomyolyse
Analyse statistique
- La mesure d’association est donnée par un Odd Ratio ou un rapport de côtes (techniquement, pourrait être
calculé pour n’importe quelle étude à l’inverse du RR)
- OR = [exposés/malades] x [non exposés/non malade]/[exposés/non malades] x [non exposés/malades]
o Correspond à cas exposés/non exposés divisés par les témoins exposés/non exposés

14
Résultats et conclusion
- L’OR est un bon estimateur du RR si la prévalence de la maladie est faible dans la pop étudiée (on pourra
l’interpréter presque comme un RR si prévalence de 8%, pas si 40%). Soupçon de causalité = critères de Hill
- Biais
- Biais de sélection des témoins Biais de sélection de cas
- Chercher s’il n’y a pas un élément pouvant modifier - Difficulté en l’absence de registre : si on prend des
l’exposition cas prévalents et que le FdR favorise des formes
- Par ex, si on choisit des patients en service d’HGE et sévères, on aura une expo plus faible chez les cas (les
que le FdR est nutritionnel, ils n’auront pas la même autres étant déjà morts), et inversement…
nutrition qu’en pop G ou même qu’au cours de leur Biais de confusion
vie : pourra sous-estimer l’expo
- Pris en compte à l’appariement et au moment de
Biais de mesure l’analyse par ajustement selon les F. de confusion
- Lié à une mauvaise restitution de l’exposition - /!\ : pas besoin d’ajuster si facteur d’interaction,
juste présenter les résultats en fonction du FdI

Cas particuliers
Cas témoin nichée dans une cohorte
- Nested case-control study : forme particulière où les cas et témoins viennent d’une même cohorte
- On fait la cohorte, et à la fin, on fait un groupe de cas avec ceux ayant développé la maladie, et on tire au sort
un groupe de témoin.
- Permet ainsi de supprimer le biais de mémoire (le recueil du FdR précède la maladie) et le biais de sélection.
Donne un niveau de preuve plus proche d’une étude de cohorte, mais en moins cher
- Par ex : suivi de 7500 femmes pendant 4 ans. Prise de sang initiale, avec congélation des sérums. A la fin,
seulement 350 femmes ont eu une fracture : on peut récupérer les sérums pour faire des analyses, et on a besoin
de faire seulement 700 tests au lieu d’en faire 7500
- Une cas-témoin faite sur une grande base de données, type celle de l’AM, est considérable comme une étude
nichée dans une cohorte
Etudes cas croisés
- Enquête où un cas est son propre témoin : on compare l’exposition du sujet juste avant un évènement avec une
exposition plus ancienne (à distance). Mesure l’effet d’une exposition intermittente
- Limite les biais liés à la sélection du témoin
Etudes cas cohorte
- Lors de la création d’une cohorte, sélection aléatoire d’une sous-cohorte. On compare tous les cas incidents de
toute la cohorte, et on garde en témoin seuls ceux de la sous-cohorte

15
LCA – TESTS DIAGNOSTIQUES
- Outils classants les patients en malades/pas malades. Doit être le plus reproductible (fiable : % de concordance,
κ) et exacte (valide – accuracy : VPN/P, Se/Sp). Peut comprendre des imageries, questionnaires
o Sont comparés à un Gold standard qui permet normalement le diagnostic de certitude
o On ne peut pas parler d’efficacité pour un test diagnostique, sauf si on l’étudie dans un essai clinique

Type d’étude et population


- Etudes souvent transversales (sujets malades ou pas à l’inclusion), avec un temps d’étude court : le test de
référence et celui évalué doivent mesurer la même chose (suivi parfois pour confirmer le statut des patients)
o Lorsque le Gold Standard est invasif, il n’est pas éthique de le proposer à des sujets sains (éventuellement
si test évalué +) : suivi pour faire l’assertion à posteriori du caractère sain des sujets
o En l’absence de Gold Standard : le seul outcome possible est clinique, demande une étude prospective
Schéma d’étude
Statut des patients connu Statut inconnu
- Recrutement selon le statut malade ou non - Recrutement fait sans connaissance de la maladie.
- Risque ++ de biais de sélection car le groupe des Les groupes sont constitués à posteriori après avoir
malades est souvent sélectionné et non représentatif passé les deux examens indépendamment
de toutes les formes de la maladie - Permet d’avoir un échantillon représentatif d’une
o De même pour les non malades, qui peuvent population sélectionnée (nota pour la prévalence)
différer de la pop G à qui on proposera le test - Limite ++ les biais de sélection
- Impossible de calculer les valeurs prédictives -
- En pratique : on fait une étude où le statut est connu
(prévalence imposée par la sélection)
initialement (on valide la perf diagno), puis on fait une
- Méthode souvent utilisée au début du dèv d’une
étude avec statut inconnu (valide dans la pop étudiée)
méthode diagnostique
- Population étudiée
- Doit refléter celle à qui le test sera proposé en pratique : les non malades doivent représenter ++ cette pop
- Malades : doivent représenter tous les stades de la maladie (être sûr que le test ne rate pas certaines formes)

Matériel et méthodes
Test évalué (intervention/FdR)
- Doit être bien défini et strictement reproductible entre individus (en intra et inter-examinateurs), toujours avec
la même méthode. Le faire le plus proche possible de la mesure par le Gold Standard
- Doit être fait en insu du résultat du Gold Standard, sinon risque de biais de mesure (difficile si cas/témoin)
Gold standard
- Est considéré comme exact à 100% (même si pas forcément vrai en pratique) : parfois carrément imparfait, d’où
l’intérêt du suivi prospectif ; dans ce cas, importance ++ de le faire en insu du test évalué
o Dans le cas où le test évalué serait meilleur que le Gold Standard : cas difficile, demandant bcp d’études

Analyses statistiques
Valeurs intrinsèques du test
- Normalement indépendantes du contexte, c’est-à-dire non influencé par le risque de base de la pop ; mais
peuvent quand même dépendre de certaines caractéristiques des malades (Se) ou sains (Sp)
- Besoin que le résultat soit dichotomique (oui/non) ; à défaut, besoin de fixer un seuil, qui permet, selon sa
valeur, de modifier la Se/Sp du test (représenté sur la courbe ROC)
o Si maladie grave avec TTT efficace : faux négatif non acceptable, d’autant plus si maladie rare (viser la
Sensibilité ++) ; et inversement si TTT agressifs et maladie fréquente
o ROC : abscisse = 1-Sp ; ordonnée = Se. L’intérêt du test est calculé par l’AUC : si 0,5 ou en-dessous, le
test n’apporte rien (l’AUC peut permettre de comparer plusieurs tests
- Sensibilité : % de test positif chez les malades ; si malade, alors test positif (= VP / [VP + FN])
- Spécificité : % de test négatif chez les non malades ; si non malade, alors test négatif (= VN / [VN + FP])
16
Valeurs prédictives
- Dépendent des valeurs intrinsèques et surtout de la prévalence de la maladie dans la pop étudiée : inclue le
contexte dans lequel le test est fait : si patient sympto, forte prévalence de la maladie donc hausse des VP, et
inversement si contexte de dépistage (prévalence plus faible, donc moins de tests positifs)
- VPP : % de malade chez les tests positifs (M+/T+ = VP / [VP + FP]) ; si test positif, alors malade (inversement
pour VPN = VN / [VN + FN])
Rapport de vraisemblance
- Vraisemblance d’un résultat chez un malade comparé au même résultat chez un non malade. Dépend des
caractéristiques intrinsèques du test
Calcul des rapports Intérêt
- Vraisemblance positive : correspond à la proba - Indépendants de la prévalence de la maladie et
d’avoir un test positif chez les malades (Se) sur la permettent de quantifier l’info apportée par le test
proba d’avoir un test positif quand on n’est pas - Possibilité de passer de la probabilité pré-test à celle
malade (1-Sp) → LR+ = Se / [1-Sp] post-test via le nomogramme de Fagan (on utilise le
o Valeur discriminante pour affirmer le diagno LR+ si test positif, et le LR- si test négatif)
o Important si LR+ > 10, acceptable si > 5 - Possibilité de combiner les rapports de
- Vraisemblance négative : proba d’avoir un test vraisemblance car permettent le calcul de la proba
négatif chez les malades (1-Se) sur la proba d’avoir un post-test à partir de la pré-test (à partir de la
test négatif chez les non malades (Sp) prévalence)
o LR - = [1-Se] / Sp
o Valeur discriminante pour éliminer le diagno
o Important si LR - < 0,1, acceptable si < 0,2
- Nombre de sujets nécessaires
- Le calcul prend en compte la sensibilité attendue du test. Besoin notamment de déterminer le nombre de sujets
malades et non malades
Reproductibilité du test
-
- Utilisation d’indices de concordance. On peut mesurer le % de concordance, mais le plus souvent on utilise le
coefficient κ qui prend en compte la concordance due au hasard (sinon, tendance à surestimer la concordance)
o κ = [concordance observée – attendue] / [1 – concordance attendue]. Si = 0, concordance due au hasard.
Plus il se rapproche de 1, plus la concordance est bonne

Résultats et conclusion
- /!\ : les paramètres représentant la situation clinique sont surtout les VP : un test à faible VPP donnera un
nombre non négligeable de faux positifs. L’intérêt est surtout d’estimer la probabilité post-test
- La Se et la Sp sont données avec l’IC 95%
Biais
Biais de sélection Biais de mesure
- Surtout lié à un défaut de validité externe - Survient si mesure non réalisée en insu : biais majeur
- Malades : non représentatifs des malades en général si on connaît le statut malade ou non du patient
(ex : mammographie testée uniquement chez des - Idem, dans une moindre mesure, quand on fait la
patientes avec tumeur palpable) mesure par le Gold Standard (surtout si ce dernier est
- Non malades : non représentatifs de la population un peu merdique)
- Risque ++ si design cas-témoin : la population des cas
est souvent sursélectionnée (avec souvent des cas
surtout prévalents). Les phases initiales ont souvent
tendance à surestimer un nouveau test

17
18

Vous aimerez peut-être aussi