Vous êtes sur la page 1sur 5

Mthodologie

Guide de lecture critique dun essai thrapeutique


Michel Cucherat
Service de biostatistiques, Hpitaux de Lyon et EA 3637, Universit Lyon 1, Facult RTH Laennec, BP 8071, 69376 Lyon Cedex 08 <michel.cucherat@upcl.univ-lyon1.fr> La lecture critique dun compte rendu dessai thrapeutique pour la pratique mdicale pour but de dterminer si les rsultats prsents apportent la dmonstration de lintrt clinique du traitement valu. La rponse cette question passe par lvaluation de la validit interne de lessai (ralit statistique du rsultat et absence de biais) et par lapprciation de la pertinence clinique de leffet mis en vidence (pertinence de la question pose, reprsentativit des patients inclus, taille du bnce, balance bnce/risque). Mots cls : essai clinique, lecture critique, interprtation des rsultats

our le praticien, lobjectif de lanalyse dun article rapportant un essai thrapeutique est dvaluer de manire critique son rsultat avant de le mettre, ventuellement, en application. Il sagit de rpondre la question : La balance bnce/ risque de ce traitement est-elle suffisamment tablie et cliniquement pertinente pour justier son utilisation courante ? Et chez quels types de patients ? Pour cela, il convient danalyser trois dimensions :

la validit interne du rsultat : Le rsultat est-il rel ? Non biais ? sa cohrence externe : Le rsultat est-il concordant avec les autres connaissances disponibles sur le sujet (physiopathologiques, pharmacologiques, pidmiologiques) et avec les rsultats des autres essais dj raliss ?

Linterprtation des rsultats dun essai thrapeutique consiste donc analyser sil est licite de rpondre par laffirmative ces trois groupes de questions ou si, au contraire, il existe des points conduisant mettre des rserves sur la ralit et/ou la pertinence du rsultat considr. Dans ce dernier cas, un nouvel essai devra lever ces rserves. Ce guide de lecture reprend les grandes questions que lon doit se poser lors de la lecture critique dun essai clinique dont les rsultats sont prsents comme pouvant conduire une modication des pratiques1.
1

mt
Tirs part : M. Cucherat

sa pertinence clinique et sa reprsentativit : Ce rsultat reprsente-t-il un bnce clinique intressant en pratique, avec une balance bnce/ risque favorable ? Quels types de patients sont concerns ?

Les essais ne dbouchant pas sur des rsultats conclusifs ne peuvent pas tre utiliss pour suggrer un changement de la pratique. Leur lecture critique nest pas du champ de la pratique mdicale mais plutt de la recherche thrapeutique. Pour ces essais, la question principale qui se pose est : Est-ce que labsence deffet statistiquement signicatif est le tmoin dune absence de bnce ou dun manque de puissance ? Lenjeu est de dterminer sil est ncessaire de refaire un essai ventuellement plus puissant ou conu de manire diffrente...

doi: 10.1684/met.2006.0036

354

mt, vol. 12, n 5-6, septembre-dcembre 2006

Quel est le rsultat mis en avant par les auteurs ?


Lanalyse critique porte plus sur le rsultat mis en avant par lauteur de lessai comme apport original de son travail que sur lessai lui-mme. En effet, un rsultat peut tre fragile car, par exemple, issu dune analyse en sousgroupe alors que lessai tait irrprochable au plan mthodologique. Cest donc bien lanalyse du rsultat mis en avant qui permet didentier ce problme et non pas stricto sensu lanalyse de lessai.

Quelle est la validit interne de ce rsultat ?


Face un essai considr comme conclusif par les auteurs, il est important de sassurer que le rsultat est exact, cest--dire statistiquement rel et sans biais. La mthode utilise pour produire ce rsultat est-elle able et en mesure de reter avec exactitude la ralit de lefficacit du traitement ?

effet. La prsence de biais expose au risque de conclure tort lefficacit du traitement tudi. Si on nest pas tmoin de la ralit du droulement de lessai, lexistence de biais est impossible dterminer. En revanche, on peut utiliser des garde-fous an de contrler au mieux ces biais, et notamment en vriant que les principes mthodologiques garantissant labsence de biais ont t correctement mis en uvre. Dans ce cas, lessai est labri de biais potentiels et il ne fait pas courir le risque de conclure tort lefficacit du traitement. La recherche de biais repose sur la rponse une question fondamentale : existe-t-il une diffrence entre les deux groupes (autre que les traitements compars) qui pourrait faire apparatre une diffrence au niveau du critre de jugement en dehors de tout effet du traitement (en dautres termes, le principe de causalit est-il respect) ? En effet, lessai comparatif est expos quatre grands types de biais : biais de slection, biais de suivi, biais de mesure, biais dattrition. Les questions cls poses pour la recherche de ces biais potentiels sont les suivantes.
Existe-t-il un groupe contrle : prise en compte des facteurs de confusion ?

Quelle est la ralit statistique du rsultat ? La diffrence est-elle statistiquement signicative (ou la non-infriorit est-elle statistiquement signicative, sil sagit dun essai de non-infriorit) [1] ? Le p est-il infrieur 5 % (ce qui autorise conclure un effet non nul avec un risque derreur d au hasard faible) ? Est-il possible dexclure une ination du risque alpha lie une rptition des tests [2], cest--dire : Le rsultat avanc a-t-il t obtenu sur le critre de jugement principal dni a priori lissue dune seule comparaison statistique, ou est-il obtenu aprs ralisation de nombreux tests sur des critres secondaires ? Est-il possible dexclure des mesures multiples du critre de jugement (mesures rptes au cours du temps) ? Le rsultat avanc est-il issu de lanalyse effectue avec la totalit de la population de lessai et non pas dune analyse en sous-groupe ? Si des analyses intermdiaires ont t ralises, une mthode de contrle de lination du risque alpha a-t-elle t utilise ? Le rsultat est-il suffisamment labri des biais ? La ralit statistique du rsultat ne met pas labri de biais potentiels pouvant survenir au cours de la ralisation pratique de lessai [3]. Il convient donc de vrier si la mthodologie employe met bien lessai labri des biais. Pour lessai thrapeutique concluant, un biais est une situation conduisant des rsultats en faveur de lefficacit du traitement tudi alors que celui-ci est en ralit sans

Existe-t-il un groupe contrle ? Leffet du traitement est-il dtermin par rapport ce groupe contrle ? Ou, en dautres termes, lessai rpond-il au principe de comparaison ?
Est-il possible dliminer un biais de slection : lessai est-il randomis ?

Un biais de slection survient quand il a t possible de slectionner des patients particuliers dans le groupe du traitement tudi par rapport ceux du groupe contrle. De ce fait, il est possible quil existe une diffrence pronostique entre les deux groupes des patients qui fera apparatre une diffrence au niveau du critre de jugement mme en labsence deffet du traitement tudi. Les patients ont-ils t rpartis de faon alatoire entre les groupes de traitement ? Est-ce que la mthode de randomisation garantit limprvisibilit du traitemen ? Linvestigateur est-il bien dans lignorance du traitement qui sera allou ? [4] Existe-t-il des diffrences dans les caractristiques de base entre les groupes ? Ou, en dautres termes, lessai rpond-il au principe de comparabilit initiale des groupes ?
Est-il possible dliminer un biais de ralisation ou de mesure : lessai est-il ralis en double aveugle ou avec des procdures laveugle concernant le suivi et lvaluation ?

Un biais de ralisation est susceptible de survenir lorsquil est possible de prendre en charge les patients de manire diffrente entre les deux groupes (en particulier au niveau des traitements concomitants). Un biais de mesure survient lorsque le critre de jugement peut tre

mt, vol. 12, n 5-6, septembre-dcembre 2006

355

Mthodologie

mesur ou recherch de faon diffrente entre les deux groupes. Lessai a-t-il t ralis en double aveugle ? Si lessai est en double aveugle, la nature du traitement attribu chaque patient est-elle masque de faon adquate ? Si lessai a t ralis en ouvert, le critre de jugement est-il un critre dur , cest--dire objectif (la mortalit tant le critre le plus dur) ? (Dans ce cas, un biais de mesure est vit mais pas un biais de ralisation.) Les critres de jugement ont-ils t valids par une procdure centralise et en aveugle ? Est-ce que les arrts de traitement, les dviations aux protocoles et les traitements concomitants ont t recueillis et sont convenablement documents ? Le recours aux traitements concomitants a-t-il t identique dans tous les groupes ? Les taux de dviation au protocole sont-ils similaires dans les deux groupes ? Les taux darrt du traitement de ltude sont-ils similaires dans les deux groupes ? Lvaluation du critre de jugement est-elle faite de la mme faon quel que soit le traitement reu ? Ou, en dautres termes, lessai rpond-il au principe de comparabilit secondaire ?
Lessai est-il ralis en intention de traitement ? Est-il possible dliminer un biais dattrition ?

prsent lvnement sils sont dans le groupe traitement standard . Si le critre de jugement principal est quantitatif, les donnes manquantes ont-elles t remplaces, par exemple par la dernire valeur mesure disponible (mthode LOCF, de langlais last observation carried forward) ?

Quelle est la validit mthodologique ? Ce rsultat est-il issu dune dmarche hypothticodductive ? Cest--dire que lhypothse teste a bien t formule avant la ralisation de lessai. Ou, au contraire, lhypothse a-t-elle t formule au vu des rsultats, hypothse qui navait pas t gnre lors de la conception du protocole ? Lobjectif de lessai est-il clairement prcis dans lintroduction ? Lhypothse est-elle justie par des publications antrieures lors de la conception de lessai ?

Quelle est la cohrence externe ?


Le rsultat est-il conrm par dautres essais ? La discussion prsente-t-elle les rsultats des autres essais adressant la mme question ? La mta-analyse de ces essais montre-t-elle une absence dhtrognit ? Le rsultat est-il cohrent avec les connaissances fondamentales (physiopathologiques, tudes dobservation, etc.) ?

Ce biais est moins connu mais tout aussi important, ce dautant pour les essais en ouvert. Le biais dattrition peut apparatre ds lors que les patients analyss ne correspondent pas aux patients randomiss, du fait de lexclusion de patients, de lexistence de perdus de vue ou de donnes manquantes. Il est donc important de sassurer que toutes les prcautions ont t prises pour viter la survenue de ce biais. Il convient de noter que les rgles de contrle du biais dattrition dans lessai de non-infriorit sont diffrentes [1]. Ce qui suit ne sapplique qu lessai de supriorit. Lanalyse a-t-elle t ralise en intention de traiter, cest--dire sur tous les patients randomiss [5] ? Notamment sil sagit dun essai de non-infriorit, lanalyse est-elle conrme par lanalyse per protocole, cest--dire excluant les patients pour lesquels le protocole na pas t suffisamment bien suivi pour permettre une estimation able de lefficacit des traitements ? Quelle est la robustesse du rsultat vis--vis des patients non valuables ? Si le critre de jugement principal est binaire, les rsultats bass sur lhypothse du biais maximum par exemple sont-ils donns ? Rappelons que le biais maximum consiste considrer les patients non valuables comme ayant prsent un vnement sils sont dans le groupe nouveau traitement et comme nayant pas

Quelle est la pertinence clinique ?


Les principes mthodologiques et statistiques permettent de valider la abilit dun rsultat, mais la signicativit clinique et son applicabilit aux patients vont rendre ce rsultat pertinent ou non pour le soin. Le rsultat apporte-t-il un progrs thrapeutique, cest-dire reprsente-t-il un bnce clinique intressant en pratique ? quels types de patients est-il gnralisable en pratique ?

Quelle est la pertinence de lobjectif de lessai ? Lobjectif de lessai correspond-il une question thrapeutique relle, sans rponse satisfaisante actuellement ? La question clinique est-elle relle ? Correspond-elle une entit nosologique posant un rel problme pour les patients ou la sant publique ? Quelle est la pertinence des traitements compars ? Leffet a-t-il t dtermin par rapport un comparateur adapt, placebo ou traitement de rfrence valid ? Si

356

mt, vol. 12, n 5-6, septembre-dcembre 2006

des traitements ayant dmontr leur efficacit existent, la question thrapeutique qui se pose nest plus de connatre lefficacit des nouveaux traitements par rapport au placebo mais de dmontrer quils apportent un plus par rapport aux meilleurs traitements disponibles. Si lessai est contre placebo, nexiste-t-il vraiment aucun traitement ayant fait la preuve de son efficacit contre placebo ? Si lessai est contre traitement de rfrence, ce traitement a-t-il montr son efficacit dans des essais thrapeutiques ? Est-il bien utilis de faon optimale et valide (dose, schma posologique, adaptation, surveillance) ?

Quelle est la pertinence du critre de jugement ? Le critre de jugement du rsultat mis en avant est-il cliniquement pertinent et correspond-il lobjectif thrapeutique du traitement ? Cest--dire est-ce un critre clinique et non pas un critre intermdiaire [6] ? Si le critre est composite, a-t-il une cohrence clinique ? Toutes les composantes sont-elles inuences de la mme manire [ou le rsultat global sur le critre composite nest-il obtenu que par un effet sur les composantes les moins cliniquement pertinentes (les plus molles )] ?. Les modications des critres de jugement secondaires sont-elles cohrentes et conformes aux hypothses physiopathologiques ? Quelle est la pertinence de la taille de leffet ? Le rsultat de lessai correspond-il un effet suffisamment important au point de vue clinique ? Leffet apporte-t-il un service mdical suffisant au patient (cest--dire rsout-il de manire substantielle le problme du patient ou sagit-il seulement dun effet non nul mais ne modiant que trs superciellement ltat du patient) ? La prcision de lestimation (donne par lintervalle de conance 95 %) est-elle suffisante pour liminer un effet trop petit pour tre cliniquement pertinent [7] ? Quelle est la pertinence des patients inclus ? Le rsultat obtenu est-il gnralisable aux patients vus en pratique ? La dnition de la pathologie utilise dans lessai est-elle conforme aux critres diagnostiques habituels, bass sur des mthodes diagnostiques habituelles et couramment disponibles ? Compte tenu des critres dinclusion et dexclusion, et de la description de la population incluse, ny a-t-il pas eu une slection excessive des patients ? Les patients sont-ils reprsentatifs de ceux qui sont vus en pratique mdicale courante ? Daprs les analyses en sous-groupe, leffet du traitement est-il constant quelles que soient les caractristiques

des patients ? Attention ne pas surinterprter les rsultats des analyses en sous-groupe : ces analyses permettent de sassurer de faon descriptive que les rsultats sont toujours dans le mme sens et quil ny pas de variation notable de leffet du traitement (interaction) en fonction des caractristiques des patients, mais ne permettent pas de conclure sur un sous-groupe en particulier. lissue de cette analyse, il convient de dnir clairement la population cible du traitement en se basant la fois sur les critres de slection de ltude et sur les patients effectivement inclus. Si un essai na pas inclus certains types de patients qui taient pourtant ligibles daprs les critres de slection, ces patients ne peuvent pas tre considrs dans la dnition de la population cible.

Quelle est la pertinence du contexte de soins ? Le traitement a-t-il t utilis dans un contexte de soins similaire celui de la pratique quotidienne ? ct des traitements valus dans lessai, les patients taient-ils traits conformment ltat de lart actuel ? lessai sest-il droul par-dessus ( on top ) la meilleure stratgie thrapeutique actuelle ? Effets indsirables et balance bnce/risque Ce point est primordial pour valuer la pertinence clinique dun rsultat. ce stade, on est a priori mme de rpondre la question du bnce apport par le nouveau traitement. Cela pose alors lpineux problme de savoir si le traitement est sr. La balance bnce/risque est-elle acceptable ? Est-ce que le risque li aux effets indsirables est acceptable compte tenu de la maladie traite ? Le critre de jugement intgre-t-il directement les effets dltres ? Cest le cas par exemple avec la mortalit. Si une rduction de mortalit est dmontre, la balance bnce/risque est demble favorable mme si le traitement induit des effets indsirables srieux (ceux-ci ne contrebalancent pas le bnce). Cependant, mme dans ce cas, le prol de scurit du traitement est important, par exemple pour choisir entre plusieurs traitements efficaces. Concernant les effets dltres mesurables, les principaux effets dltres du traitement sont-ils rapports ? La frquence de ces effets indsirables ne contrebalance-telle pas la totalit du bnce ? En dehors des vnements rapports, que sait-on des donnes externes, notamment de pharmacovigilance sur les vnements indsirables rares (rarement observs au cours dun essai thrapeutique) mais graves, voire fatals ? La balance bnce/risque est-elle plus favorable que celle dautres traitements dj existants ? Cest--dire le bnce est-il suprieur celui des alternatives thrapeutiques sans surcrot de risque ? Ou le bnce est-il du mme ordre que celui des autres traitements valids mais avec une meilleure tolrance ? Dans ce dernier cas, le

mt, vol. 12, n 5-6, septembre-dcembre 2006

357

Mthodologie

gain en tolrance soit tre parfaitement bien dmontr et tre cliniquement pertinent compte tenu du bnce apport.

Rfrences
1. Mismetti P, Laporte S, Cucherat M. Les essais de non-infriorit. MT 2005 ; 11(4) : 278-81. 2. Laporte S, Cucherat M. Multiplicit des tests statistiques au cours dun essai clinique : plus on cherche, plus on trouve. MT 2006 ; 12(3).

Conclusion
Lorsque, lissue de cette analyse, aucune rserve mthodologique nest raisonnablement possible et que le rsultat obtenu est vritablement cliniquement pertinent, le traitement tudi a fait la preuve quil apporte un bnce clinique substantiel aux patients de la population cible et il peut donc tre envisag de manire systmatique en pratique de soins (chez ces mmes patients).

3. Mismetti P, Laporte S. Mthodologie des essais cliniques : pourquoi et pour qui ? Les notions essentielles une lecture critique. MT 2003 ; 9(3) : 68-72. 4. Laporte S, Quenet S, Mismetti P. La randomisation. MT 2003 ; 9(4) : 187-91. 5. Chabaud S, Cucherat M. Lanalyse en intention de traiter et analyse per protocole. MT 2004 ; 10(5) : 350-5. 6. Kassai B, Gueyffier F, Boissel JP. Critres intermdiaires et critres de substitution. MT 2006 ; 12(2) : 96-103. 7. Quenet S, Laporte S, Cucherat M. Intervalle de conance. MT 2004 ; 10(2) : 113-6.

358

mt, vol. 12, n 5-6, septembre-dcembre 2006

Vous aimerez peut-être aussi