Académique Documents
Professionnel Documents
Culture Documents
1
2
LCA - INTRODUCTION
- Eléments à prendre en compte : validité interne (biais), externe (reproductibilité, et inférence statistique :
extrapolation à la pop), pertinence pour la pratique et cohérence avec les autres données de la littérature
3
Descriptive Types d’étude épidémiologique
Analytique - Descriptive (non explicative) : transversale (prévalence), cohorte (incidence)
Selon
Diagnostique - Etudes comparatives (analytiques) : cas témoin ou cohorte d’exposé/non-exposé
l’objectif
D’efficacité (étiologique) ou cohorte de malade (pronostique) ; facteur non maitrisé
Pronostique - Etude observationnelle randomisée = essai clinique (maîtrise du facteur)
Grade A (niveau 1) Grade B (niveau 2) Grade C
Transversale
Essai randomisé Essai randomisé (faible Niveau 3 : cas-témoin
Selon le Longitudinale
(forte puissance), puissance), étude non Niveau 4 : rétrospective, série
schéma Cas-témoin -méta-analyse ; randomisée bien menée, de cas, étude descriptive,
Randomisé
analyse de décision cohorte étude comparative biaisée
5
Analyse multivariée
- Facteur intermédiaire : causé par l’exposition et causant le CDJ (ex : TTT anxiolytique augmentant le risque de
chute, et chute causant des fractures : chute = intermédiaire)
- Facteur de confusion : associé à l’exposition et au CDJ sans être intermédiaire (« véritable cause » d’une
association entre l’expo et le CDJ, car également associé à l’exposition)
o Pour un unique facteur de confusion, on peut utiliser l’ajustement de Manterl-Haenszel : estime un
OR/HR ajusté sur le FdC, en faisant une moyenne de l’OR/HR de chaque strate, et en la comparant à
l’OR/HR brut. S’ils sont proches, ce facteur n’est pas un FdC (de moins en moins utilisé : on préfère les
modèles de régression multivariés)
- Facteur d’interaction : modifie l’association entre l’expo ou le CDJ. Dans une analyse stratifiée, l’association
sera différente selon la strate (tandis que pour un FdC, les strates font disparaître l’association)
Méta-analyses
- La validité interne se juge sur celle des essais qu’elle inclut. Etablir en amont la procédure de sélection des
essais, en s’assurant notamment de rassembler tous les sujets d’intérêt portant sur l’étude
- Biais de publication : les études concluantes ont tendance à être plus souvent publiées que les non concluantes.
Besoin de rechercher ce biais
- Se fait via la base de données Cochrane. Peut inclure des études non encore sorties
Placebo et nocebo
- Placebo : l’effet dépend de la caractéristique qu’il mime, du moins initialement. Des placebos de paliers 1 ont
été ressentis comme moins efficaces que des placebos de paliers 2 (mais non maintenu à long terme)
o L’effet placebo est populationnel tandis que la réponse placebo est évaluée au niveau individuel
o Purs si aucun effet pharmaco ; impurs si présence d’un effet, mais pas dans l’indication utilisée
- Nocebo : composante négative, le plus souvent somnolence, céphalées et troubles digestifs. Cas de syndromes
de sevrage décrits
-
6
LCA – ESSAIS CLINIQUES
- Dans la majorité des cas : essai de supériorité (parfois de non-infériorité). Parfois juste descriptif (phase I)
Type d’étude
- Essai contrôlé randomisé = seul adapté (souvent dans le cadre d’une phase 3), avec un groupe intervention et
un groupe contrôle (recevant soit un placebo, soit le TTT de référence)
Rôle du groupe contrôle
- Permet de s’assurer que le résultat observé n’est pas dû à l’évolution naturelle de la maladie, à l’effet placebo
(importance de l’aveugle pour éviter le biais différentiel), ou à l’effet de TTT concomitants (recueillir)
- Régression à la moyenne : phénomène lié aux critères d’inclusions utilisant un seuil. Par ex, si on inclut sur la
TA, on peut inclure des patients ayant une TA normale mais qui, au moment de l’inclusion, vont avoir une mesure
artéfactuelle avec une HTA les faisant intégrer l’étude. Lors de l’essai, ils diminueront la TA moyenne
o Si c’est une erreur aléatoire et pas d’inclusion, la TA finale sera sous-estimée idem dans les deux groupes
Randomisation
- L’allocation des patients dans chaque groupe est entièrement faite par hasard : les 2 groupes doivent être
comparables ; par table de nombre au hasard, séquence informatique…
- L’allocution dans les groupes est le plus souvent en 1 :1 (clause d’ambivalence). Parfois, le ratio est 2 :1 pour
augmenter le nombre de patient traités pour avoir plus d’info sur la tolérance (et améliore le recrutement…)
Assignation secrète Comparabilité initiale
- Correspond à la clause d’ignorance : celui qui inclut - Les caractéristiques des patients sont dans le 1er
le patient ne peut pas savoir dans quel groupe il sera tableau de l’article, avec toutes les infos importantes
intégré (évite qu’il puisse « choisir » les groupes) (/!\ aux caractéristiques non renseignées)
- Meilleure méthode : randomisation centralisée par - La comparaison se fait à l’œil : pas de test stat, sauf
un centre tiers attribuant les patients si petit effectif (test possible pour s’assurer de
- Toute méthode où celui qui inclut peut savoir dans l’absence de différence significative)
quel groupe sera le patient n’est pas bonne - Des fluctuations sont possibles pour des groupes de
faible effectif : vérifier qu’elles vont dans le même
sens pour les deux groupes
Double insu
- Permet d’éviter la modification du comportement du patient Types de randomisation
et du médecin (ou en tous cas, de façon non différentielle) : - Simple : séquences de nombre, risque de
maintien la comparabilité pendant le suivi déséquilibre si faible effectif
o Simple insu : seul le patient est en aveugle (/!\ : doit être - Par blocs : permet de s’assurer que le même
levé si EI grave) nbre de patient est attribué dans chaque grpe
o Triple insu : le statisticien effectuant les analyses est (par ex, si blocs de 4 : 2 dans chaque grpe)
aussi en aveugle (de préférence, toujours vérifier qui est - Stratifiée : utilisée pour s’assurer que des
précisé en aveugle) facteurs prono importants sont bien répartis
- Besoin que le placebo et le TTT testé soient identiques (si dans chaque grpe (une strate = une liste de
impossible, par ex avec un injectable et un PO : utiliser deux randomisation). Permet l’analyse sous-grpe
placebos). Parfois impossible (comparaison de TTT hospit vs - Par minimisation : algorithme limitant les
ambulatoire, chirurgie, kiné, EI visibles ++ d’un TTT) déséquilibres sur les facteurs importants,
o Dans ce cas, s’assurer que le médecin en charge de la utiles en petits groupes (onco ++)
mesure du critère de jugement soit en aveugle.
Schéma d’essai randomisé
- En parallèle : chaque groupe reçoit soit le TTT, soit le placebo, et on analyse
- En cross-over : idem, mais en échange les groupes dans la 2e partie d’étude ; la randomisation porte sur l’ordre
dans lequel on reçoit le TTT. Besoin d’un wash-out (temps sans TTT) pour éliminer l’effet du 1er
o La 1ère analyse permet de comparer les 2 TTT, la 2e de comparer la séquence de TTT
o Augmente la puissance de l’étude ; mais le CDJ doit pouvoir être mesuré plusieurs fois de façon
indépendante, l’effet du TTT doit être réversible, la maladie ne doit pas évoluer pendant le wash-out,
les perdus de vus ne peuvent être comptés, et il ne doit pas y avoir d’effet d’apprentissage
-
7
Matériel et méthodes
Population étudiée
- Validité externe : les critères d’inclusion/non inclusion sont pertinents si la pop recrutée correspond à celle q
ciblée en dehors de l’essai. Estimable sur le flow chart : si bcp de patients screenés mais non inclus, sursélection
- Les grpes doivent rester comparables jusqu’à la fin; principale risque = attrition (avec CDJ non mesurable) ;
chercher s’il y a une attrition différentielle entre les 2 grpes (nbre, carac …) : biais de sélection, ↘ puissance
o /!\ : si différence dès l’inclusion, devra être prise en compte dans une analyse multivariée.
Analyse en intention de traiter Analyse per protocole
- Analyse tous les patients randomisés, qu’ils aient - On n’analyse que les patients suivant le protocole
reçu ou non le TTT, suivi ou non le protocole… - A tendance à surestimer l’efficacité du TTT
- Aura tendance à diminuer la diff entre les groupes o Exclut les patients ayant arrêté pour EI, parce
(plus proche de la vraie vie) que leur TTT ne leur semblait pas efficace…
- /!\ : possible que si on a le CDJ pour tous les patients o /!\ : vérifier la flow chart (absence d’exclusion)
- Pour les vrais perdus de vue : gestion de données
manquantes nécessaire (reste un biais d’attrition) Maintien de la comparabilité = ITT
Critère de jugement
Critères de jugement composites
- Pertinence : /!\ critères intermédiaires (de substitution - Constitués de plusieurs évent (type AVC + IDM +
ou surrogate). Permettent une durée d’étude plus courte décès) : le patient a présenté le CDJ s’il a eu au
avec un recrutement moindre, mais ne traduisent pas tjrs moins un de ces évènements
l’effet clinique associé (voire parfois l’inverse) - Permettent un gain de puissance pour un même
- Si plusieurs CDJ, préciser le principal (éviter d’en avoir effectif, et peuvent être pertinents dans certaines
plusieurs : augmente α) situations (prévention des FdR CV par ex)
- Pour les critères mous ou demandant un jugement - Par contre, ne permet pas de conclure sur un des
clinique, on peut utiliser un comité d’adjudication éléments du critère séparément (un peu comme
indépendant, ou à défaut faire une évaluation en double/ on ne peut pas conclure sur un sous-groupe)
triplet pour s’assurer de la reproductibilité des critères
o /!\ : plus le critère est compliqué à valider (nbx examens…), plus le risque de perdus de vue est fort
- Biais de classement : limité par le double-insu ; mais s’assurer les modalités de suivi des 2 groupes soit identique
Analyse statistique
- Portent en premier sur le CDJ principal. Passent en général par une analyse descriptive, puis une analyse uni ou
bivariée, puis multivariée pour les facteurs de confusion potentiels (pas besoin si bonne randomisation)
ITT – Gestion des données manquantes Analyse en sous-groupe
- Problème posé quand le CDJ ne peut être mesuré - Analyse du CDJ selon l’âge, le sexe, les ATCD…
- Imputation multiple : on attribue le CDJ selon les - Doivent être prédéfinies, et peuvent permettre
caractéristiques du perdu de vue d’émettre des hypothèses à explorer par d’autres
- Worse case scenario : considère les données du bras études, mais jamais ne permet de conclure
expérimental comme des échecs, et celles du bras - Lié une inflation du risque α (plus de chances que le
placebo comme des succès résultat significatif d’un sous-groupe soit due au
o Diminue ++ la différence entre les bras, hasard car on fait plus de test statistique)
restrictive, donc peu utilisée - Souvent présenté sous forme de forest plot
- Last observation carried forward : on prend la Nombre de sujets nécessaires
dernière valeur dispo pour le patient (ex : si suivi à
- Fait à priori, basé sur une hypothèse détaillée. Si
M6 et M12 et qu’on a que M6, on reprendra la valeur
impossible en amont, doit être vérifié à posteriori
de M6). Fréquente, mais non recommandée
- Comprend dans son calcul la puissance attendue, et
Résultats de tolérance la durée de suivi de TTT si critère non censurée (si
- Souvent mal rapportée dans les essais : mais l’étude dure plus longtemps, on aura un nombre
manquent svt de puissance car les EI sont plus rares d’évent plus important)
- L’absence de diff stat significative ne permet pas de - Pour une étude de non infériorité, prendra aussi en
conclure à une bonne tolérance du TTT compte la marge de non infériorité
8
Critère binaire Critère continu Critère censuré
Analyse Moyenne + écarts type ou Courbe Kaplan-Meier
Fréquence, %
descriptive Médiane + quartiles ( (médiane de survie)
Chi2 (paramétrique) Student (para)
Test du log rank
Analyse uni Fisher (non para) Wilcoxon ou Mann Whitney
Modèle de Cox univarié
ou bivariée RR brut ou régression (non paramétrique)
(HR brut)
logistique univariée (OR brut) ANOVA ou ANCOVA
RR ajusté
Analyse Comparaison des survies
Régression logistique Régression linéaire
multivariée Modèle de Cox (HR ajusté)
multivariée (OR ajusté)
- Critère binaire : CDJ à J30 (mort/pas mort) ; Critère continu : Dlr, TA, QdV… ; Critère censuré : temps nécessaire
pour avoir un critère binaire (jours avant AVC, décès… modélisé par une courbe de survie)
Résultats et conclusion
- Les tests statistiques permettent d’obtenir le petit p ou l’IC95. Si la différence observée n’est pas significative
statistiquement, on ne peut pas conclure qu’il n’existe pas de différence (peut être dû à un manque de puissance
par ex, même si peu probable si effectif > NSN, gde étude…)
Biais
- Sélection différentielle : survient sur un défaut de randomisation ou sur une attrition (à tjrs rechercher)
- Biais de mesure : mesure du CDJ différente dans les deux groupes, à risque ++ si critère mou en ouvert
- Biais de suivi : suivi différent entre les 2 groupes, à risque si essai en ouvert (double insu ++)
- Biais de confusion : maîtrisé par le groupe contrôle et pris en compte dans les analyses multivariées
Conclusion
- Discute de la validité interne et de la significativité des résultats : répondent-ils à la problématique ?
Formes particulières
Essai de non-infériorité
- Proposé pour des médicaments pas plus efficace, mais avec moins d’EI, moins chers, plus pratiques…
- Dans un essai de supériorité, l’absence de différence entre les traitements ne permet pas de conclure à leur
équivalence (puisqu’il peut aussi être moins bien).
- Impossible de montrer une stricte équivalence : on montre alors qu’ils ne sont pas trop différents
o On définit une borne de non-infériorité (marge « tolérée » où le médicament peut être moins efficace).
o L’IC95 devrait se trouver dans cette marge. Possible essai d’équivalence où on définit borne inf et sup
Transformation en supériorité Conduite de l’étude
- Ne pose pas de problème si une analyse en ITT a été - Besoin de faire une analyse en ITT et per protocole,
faite en plus du per protocole puisque là l’ITT aura tendance à réduire la différence
- L’inverse est plus compliqué : il faut qu’une borne de entre les TTT, et donc à favoriser la non-infériorité
non infériorité soit définie avant le début de l’essai, o S’assurer que les deux concordent, même si le
que le design soit approprié, que l’essai soit assez per protocole est plus pertinent
sensible, et que les auteurs montrent que le TTT de Choix de la borne
rèf a montré son efficacité habituelle
- Plus elle est petite, plus le nombre de patient
o Plus simple de concevoir d’emblée une non
nécessaire sera élevé. A l’inverse, plus elle est large,
infériorité
moins il sera pertinent de parler de non infériorité
Etudes quasi-expérimentales
- Utilisées pour les programmes de santé publique (dépistage) ou quand une randomisation n’est pas possible
- Comparaison de la fréquence d’un évènement dans un seul groupe, soit avant/après (possible avec groupe
témoin), soit à un autre groupe d’un autre centre (ici/ailleurs)
- Cas du dépistage : permet une avance au diagnostic menant à une guérison : s’exprime en gain de survie pour
le dépistage vs l’absence de dépistage. Essai contrôlé randomisé = rèf, mais difficile à mettre en place car effet
plus dilué (besoin de gros effectifs, avec long suivi…). L’analyse se fait en intention de dépister (= ITT)
9
LCA – COHORTE ETIOLOGIQUE
- Ensemble de personnes suivies pour lequel le recueil du facteur de risque est fait avant la survenue du CDJ
- Une cohorte peut être descriptive (incidence d’un évent, prévalence, pronostic… sans recherche d’asso à un
autre facteur), étiologique (FdR d’un évent) ou pronostique (taille d’une tumeur influence la survie ?)
Matériel et méthodes
Critères de jugement
- Mêmes exigences que pour une étude clinique. Il doit être mesuré en aveugle de l’expo au FdR (sauf si critère
dur, type décès). Sinon : risque de biais de mesure (si on sait qu’un patient est exposé, on peut avoir tendance à
le suivre plus souvent). Le suivi doit être suffisamment long (sa durée fait partie du CDJ)
Cohorte prospective Cohorte exposés/non exposés
- CDJ précisé avant le début de l’étude : méthode de - Surveiller le biais de suivi car le fait d’être exposé le
recueil parfaitement adaptée (précisé dans l’étude), modifie souvent (meilleur suivi par le MT, la
permet de limiter le biais de mesure médecine du travail…) : biais de recueil/suivi +++
Cohorte historique
Facteur de risque
- Peu de risque de biais de mesure différentiel, mais
- Pas de différence pour les cohortes prospectives ou
possible biais de suivi à cause du FdR
exposés/non exposés (peu de biais possible)
o L’examinateur peut être influencé en sachant
- Historique : biais possible si l’investigateur sait qui a
qui a le FdR
développé la maladie
- Le recueil du CDJ peut être prospectif
-
10
Biais
- La moins biaisée des études non interventionnelles (dans l’ordre : cohorte prospective > historique > exposés/
non exposés > cas témoin niché dans une cohorte > cas témoin incident > cas témoin prévalent)
De sélection De mesure
- A l’inclusion : biais différentiel possible pour les - Recueil déclaratif : les patients peuvent mentir et
expo/non exposés (définir les critères d’inclusion ++) sous-estimer le FdR (sujet tabou) ou sur-estimer (si
- Pendant le suivi : perdus de vue ++, surtout si à cause indemnisé). Corrigé par un recueil fiable, standardisé
de la maladie (demande un suivi rigoureux) - Recueil de la maladie différents entre les 2 groupes
De confusion (suivi différent : tous les cas chez les exposés vs que les
- Idem que pour une étude clinique symptos chez les non exposés par ex)
Analyses statistiques
- Le calcul du nombre de sujets nécessaires se base aussi sur la puissance (qui est toujours au moins > 80%), et
sur la valeur du risque relatif attendu en hypothèse par rapport à l’incidence connue de population générale
Mesure d’association Modèle de régression
-
- Estimée par un RR avec IC95%, comparant le % de - Permet d’estimer le risque relatif, le plus souvent par
maladie chez les exposés et les non exposés régression logistique (la variable à expliquer Y
o /!\ : ne pas prendre la valeur absolue du nombre représente un event à 2 réponses : oui/non)
de malades : les grpes n’ont pas la même taille ! o Donnera un Odd ratio et pas un RR
- On peut faire selon plusieurs niveaux d’exposition : - La régression logistique mesure l’association entre
la catégorie de référence (RR = 1) sera la moins expo l’event et le FdR en prenant en compte les F. de confu
o Par ex : RR d’ADK pulm selon la quantité de cig/j o Les FdC sont considérés comme d’autres
o Permet de déduire un effet dose (RR croissant variables explicatives (XFDR ; Xâge ; Xsexe…)
avec l’exposition) si les IC ne se chevauchent pas o Si on a qu’une seule variable explicative, c’est
o Si les IC se chevauchent : besoin d’un test stat une régression univariée avec RR brut (crude)
pour voir si la tendance est significative, fait par o Si plusieurs variables : régression multivariée,
un Chi2 donnant le p tendance le RR est ajusté en enlevant l’influence des FdC
- Si on fait des analyses de survie (temps avant
l’event), l’analyse se fait sur des personnes-
années/mois via un modèle de Cox, qui donne un HR
Résultats et conclusion
- La conclusion doit porter sur le résultat le moins biaisé, issu de l’analyse multivariée (même si peut être remis
en cause par la non prise en compte de FdC majeurs).
- Une fois qu’on est sûr du résultat et de sa pertinence, il faut chercher un lien de causalité (s’il existe, la
suppression du FdR peut faire espérer la réduction de la maladie).
Critères de Hill
- Permettent de renforcer la présomption de causalité (puisque faire un essai clinique randomisé pour ça est pas
très très éthique askip)
Critères internes Critères externes
-
- Forte intensité de l’association : RR/OR/HR élevé - Concordance avec de précédentes études
- Existence d’une relation dose-effet significative - Plausibilité biologique : connaissance physiopath
- Spécificité de la relation entre l’exposition et la pouvant étayer la conclusion
maladie (pas d’autre FdR imputés) - Concordance avec des études in vitro/vivo
- Chronologie : FdR survient avant la maladie - Diminution de l’incidence de la maladie quand
suppression de l’exposition au FdR
11
LCA – COHORTE PRONOSTIQUE
- Etudie l’association entre un facteur et l’évolution de la maladie : facteur pronostique
Matériel et méthodes
Critère de jugement
- Si le CDJ est mou/soumis à un jugement clinique : l’aveugle de l’évaluateur est toujours nécessaire quant à
l’exposition ou non au facteur pronostique. Le suivi doit être long, jusqu’à survenue attendue de l’event
- Le suivi peut être plus rapproché si un médecin sait qu’un patient a un facteur de mauvais mojo
Facteur pronostique
- Variés : démographiques (âge, sexe…), liés à la maladie (stade TNM, marqueur infla…), une patho associée…
- Peuvent prédire un event positif (survie, guérison…) ou négatif (décès tout cause ou spécifique, complication…)
- Causalité non nécessaire ; il suffit juste d’avoir une corrélation assez forte
12
Méthodes d’analyse de survie
- Deux méthodes non-paramétrique : l’analyse actuarielle (presque plus utilisée) et la méthode de Kaplan-Meier
- Toujours indiquer à intervalle régulier le nombre de patients encore suivis dans l’étude
Analyse actuarielle Méthode de Kaplan-Meier
- Life-table estimate : données représentées par - Product-limit estimate : intervalles non définis à
intervalle de temps (par ex, tous les 10 J) priori, mais par les instants où on observe l’évent
- Donne une courbe avec le nbre de patients vivants (donc inégaux)
tous les 10 J : ainsi, un patient décédé à J1 et J9 seront o Proba de survie égale entre chaque palier
sur le même point de la courbe ; et pas de diff entre - Donne un aspect en marche d’escalier de la courbe
un sujet suivi 21 et 29 jours - En cas de donnée censuré : ajout d’un petit trait sur
- Réservée à de grands échantillons la courbe (pas une marche d’escalier)
Comparaison entre plusieurs groupes
- Méthodes permettant de comparer la survie de plusieurs groupes indépendants
- Test du log rank : estime le nombre d’évent attendu sur la période étudiée, puis le compare pour chaque
intervalle de temps dans chaque groupe. Test le plus souvent utilisé
- Test de Wilcoxon : idem que le log rank, mais pondère en fonction du nombre attendu et observé d’évent
- Les taux observés sont estimés par un IC 95%, qui est d’autant plus étroit qu’on a d’observations
Modèle de Cox
- Modèle de régression adapté aux données censurées : compare plusieurs groupes et permet de dire s’il existe
une différence statistiquement significative entre eux
- Permet aussi la prise en compte de facteurs de confusion dans des analyses multivariées. Donne des résultats
en risque relatif instantané (Hazard Ratio).
Résultats et conclusion
- Ce qui est important à regarder ici, c’est la force et précision de la prédiction du devenir du patient
Biais
Facteurs de confusion Biais de mesure
- Correspondent aux autres facteurs pronostiques - Concerne la mesure des facteurs pronostiques ou du
(connus ou potentiels). Pris en compte dans l’analyse CDJ : dépend beaucoup d’un biais de suivi +++
Biais de sélection - Attention aux taux moyens, qui apportent peu
d’information au final (peut cacher des grandes
- Correspond à des patients inclus à des stades
variations de pronostic) : seul bon moyen = courbe
différents de la maladie
Précision du pronostic
- Sur les études avec suivi précoce, les données sur la gauche de la courbe sont souvent très précises (grand
échantillon), tandis que celles à droite (queue de courbe) souffrent de beaucoup de perdus de vue, de décès…
o La queue de courbe est donc toujours moins précise
13
LCA – ETUDES CAS-TEMOINS
- Recherche si un FdR est associé de façon significative à une maladie (plus précisément, si l’expo à un FdR était
plus fréquente chez des patients atteints d’une maladie). Ne permet pas de calculer une prévalence
Matériel et méthodes
- CDJ : correspond à la maladie étudiée. Juste s’assurer que les témoins ne soient pas malades
- Facteur de risque
- Attestation rétrospective, donc erreurs de mesure +++ liées à un biais de mémoire : type de biais de mesure
- Parfois simple imprécision : erreur aléatoire donnant un bruit de fond (cause une perte de puissance à l’étude)
- Peut être une sous/sur-estimation de l’exposition. Ballec si biais non différentiel, mais en pratique, les cas
surestiment beaucoup plus leur exposition (souvent parce que le FdR est déjà +/- connu). Rarement : l’inverse
- Les données peuvent aussi être tirées de registre et non déclaratives : exclue le biais de mémoire
- /!\ au mécanisme du FdR : un TTT débuté 15 J avant la survenue d’un cancer est difficilement incriminable, de
même qu’un TTT arrêté 6 mois avant une rhabdomyolyse
Analyse statistique
- La mesure d’association est donnée par un Odd Ratio ou un rapport de côtes (techniquement, pourrait être
calculé pour n’importe quelle étude à l’inverse du RR)
- OR = [exposés/malades] x [non exposés/non malade]/[exposés/non malades] x [non exposés/malades]
o Correspond à cas exposés/non exposés divisés par les témoins exposés/non exposés
14
Résultats et conclusion
- L’OR est un bon estimateur du RR si la prévalence de la maladie est faible dans la pop étudiée (on pourra
l’interpréter presque comme un RR si prévalence de 8%, pas si 40%). Soupçon de causalité = critères de Hill
- Biais
- Biais de sélection des témoins Biais de sélection de cas
- Chercher s’il n’y a pas un élément pouvant modifier - Difficulté en l’absence de registre : si on prend des
l’exposition cas prévalents et que le FdR favorise des formes
- Par ex, si on choisit des patients en service d’HGE et sévères, on aura une expo plus faible chez les cas (les
que le FdR est nutritionnel, ils n’auront pas la même autres étant déjà morts), et inversement…
nutrition qu’en pop G ou même qu’au cours de leur Biais de confusion
vie : pourra sous-estimer l’expo
- Pris en compte à l’appariement et au moment de
Biais de mesure l’analyse par ajustement selon les F. de confusion
- Lié à une mauvaise restitution de l’exposition - /!\ : pas besoin d’ajuster si facteur d’interaction,
juste présenter les résultats en fonction du FdI
Cas particuliers
Cas témoin nichée dans une cohorte
- Nested case-control study : forme particulière où les cas et témoins viennent d’une même cohorte
- On fait la cohorte, et à la fin, on fait un groupe de cas avec ceux ayant développé la maladie, et on tire au sort
un groupe de témoin.
- Permet ainsi de supprimer le biais de mémoire (le recueil du FdR précède la maladie) et le biais de sélection.
Donne un niveau de preuve plus proche d’une étude de cohorte, mais en moins cher
- Par ex : suivi de 7500 femmes pendant 4 ans. Prise de sang initiale, avec congélation des sérums. A la fin,
seulement 350 femmes ont eu une fracture : on peut récupérer les sérums pour faire des analyses, et on a besoin
de faire seulement 700 tests au lieu d’en faire 7500
- Une cas-témoin faite sur une grande base de données, type celle de l’AM, est considérable comme une étude
nichée dans une cohorte
Etudes cas croisés
- Enquête où un cas est son propre témoin : on compare l’exposition du sujet juste avant un évènement avec une
exposition plus ancienne (à distance). Mesure l’effet d’une exposition intermittente
- Limite les biais liés à la sélection du témoin
Etudes cas cohorte
- Lors de la création d’une cohorte, sélection aléatoire d’une sous-cohorte. On compare tous les cas incidents de
toute la cohorte, et on garde en témoin seuls ceux de la sous-cohorte
15
LCA – TESTS DIAGNOSTIQUES
- Outils classants les patients en malades/pas malades. Doit être le plus reproductible (fiable : % de concordance,
κ) et exacte (valide – accuracy : VPN/P, Se/Sp). Peut comprendre des imageries, questionnaires
o Sont comparés à un Gold standard qui permet normalement le diagnostic de certitude
o On ne peut pas parler d’efficacité pour un test diagnostique, sauf si on l’étudie dans un essai clinique
Matériel et méthodes
Test évalué (intervention/FdR)
- Doit être bien défini et strictement reproductible entre individus (en intra et inter-examinateurs), toujours avec
la même méthode. Le faire le plus proche possible de la mesure par le Gold Standard
- Doit être fait en insu du résultat du Gold Standard, sinon risque de biais de mesure (difficile si cas/témoin)
Gold standard
- Est considéré comme exact à 100% (même si pas forcément vrai en pratique) : parfois carrément imparfait, d’où
l’intérêt du suivi prospectif ; dans ce cas, importance ++ de le faire en insu du test évalué
o Dans le cas où le test évalué serait meilleur que le Gold Standard : cas difficile, demandant bcp d’études
Analyses statistiques
Valeurs intrinsèques du test
- Normalement indépendantes du contexte, c’est-à-dire non influencé par le risque de base de la pop ; mais
peuvent quand même dépendre de certaines caractéristiques des malades (Se) ou sains (Sp)
- Besoin que le résultat soit dichotomique (oui/non) ; à défaut, besoin de fixer un seuil, qui permet, selon sa
valeur, de modifier la Se/Sp du test (représenté sur la courbe ROC)
o Si maladie grave avec TTT efficace : faux négatif non acceptable, d’autant plus si maladie rare (viser la
Sensibilité ++) ; et inversement si TTT agressifs et maladie fréquente
o ROC : abscisse = 1-Sp ; ordonnée = Se. L’intérêt du test est calculé par l’AUC : si 0,5 ou en-dessous, le
test n’apporte rien (l’AUC peut permettre de comparer plusieurs tests
- Sensibilité : % de test positif chez les malades ; si malade, alors test positif (= VP / [VP + FN])
- Spécificité : % de test négatif chez les non malades ; si non malade, alors test négatif (= VN / [VN + FP])
16
Valeurs prédictives
- Dépendent des valeurs intrinsèques et surtout de la prévalence de la maladie dans la pop étudiée : inclue le
contexte dans lequel le test est fait : si patient sympto, forte prévalence de la maladie donc hausse des VP, et
inversement si contexte de dépistage (prévalence plus faible, donc moins de tests positifs)
- VPP : % de malade chez les tests positifs (M+/T+ = VP / [VP + FP]) ; si test positif, alors malade (inversement
pour VPN = VN / [VN + FN])
Rapport de vraisemblance
- Vraisemblance d’un résultat chez un malade comparé au même résultat chez un non malade. Dépend des
caractéristiques intrinsèques du test
Calcul des rapports Intérêt
- Vraisemblance positive : correspond à la proba - Indépendants de la prévalence de la maladie et
d’avoir un test positif chez les malades (Se) sur la permettent de quantifier l’info apportée par le test
proba d’avoir un test positif quand on n’est pas - Possibilité de passer de la probabilité pré-test à celle
malade (1-Sp) → LR+ = Se / [1-Sp] post-test via le nomogramme de Fagan (on utilise le
o Valeur discriminante pour affirmer le diagno LR+ si test positif, et le LR- si test négatif)
o Important si LR+ > 10, acceptable si > 5 - Possibilité de combiner les rapports de
- Vraisemblance négative : proba d’avoir un test vraisemblance car permettent le calcul de la proba
négatif chez les malades (1-Se) sur la proba d’avoir un post-test à partir de la pré-test (à partir de la
test négatif chez les non malades (Sp) prévalence)
o LR - = [1-Se] / Sp
o Valeur discriminante pour éliminer le diagno
o Important si LR - < 0,1, acceptable si < 0,2
- Nombre de sujets nécessaires
- Le calcul prend en compte la sensibilité attendue du test. Besoin notamment de déterminer le nombre de sujets
malades et non malades
Reproductibilité du test
-
- Utilisation d’indices de concordance. On peut mesurer le % de concordance, mais le plus souvent on utilise le
coefficient κ qui prend en compte la concordance due au hasard (sinon, tendance à surestimer la concordance)
o κ = [concordance observée – attendue] / [1 – concordance attendue]. Si = 0, concordance due au hasard.
Plus il se rapproche de 1, plus la concordance est bonne
Résultats et conclusion
- /!\ : les paramètres représentant la situation clinique sont surtout les VP : un test à faible VPP donnera un
nombre non négligeable de faux positifs. L’intérêt est surtout d’estimer la probabilité post-test
- La Se et la Sp sont données avec l’IC 95%
Biais
Biais de sélection Biais de mesure
- Surtout lié à un défaut de validité externe - Survient si mesure non réalisée en insu : biais majeur
- Malades : non représentatifs des malades en général si on connaît le statut malade ou non du patient
(ex : mammographie testée uniquement chez des - Idem, dans une moindre mesure, quand on fait la
patientes avec tumeur palpable) mesure par le Gold Standard (surtout si ce dernier est
- Non malades : non représentatifs de la population un peu merdique)
- Risque ++ si design cas-témoin : la population des cas
est souvent sursélectionnée (avec souvent des cas
surtout prévalents). Les phases initiales ont souvent
tendance à surestimer un nouveau test
17
18